在近三十年的發展中,Linux 先后衍生出了眾多發行版本,也就是基于 Linux 內核的操作系統,婦孺皆知的 Android 系統自不必說,我們耳熟能詳的 Ubuntu、CentOS 與 Debian 等常見的版本主要用于系統服務器,也有Kali、BackBox 這類專門用于信息安全的版本,此外還有 Fedora、OpenSUSE、麒麟和深度等各種各樣的發行版。如此眾多并且功能專注不同的 Linux 發行版本,本已讓人見怪不怪,但是當聽說還有一種專為視力障礙人士而生的 Linux 時,還是讓人興奮與驚奇。
看這個圖片,再結合eGuideDogLinux 這個操作系統名字,相信熟悉 Linux 的讀者馬上就能明白其中的含義。Linux 標志是一只企鵝,而導盲犬能夠為視障人士服務,給他們帶去光明,這個圖片作為項目 logo,寓意 eGuideDog 是為視障人士定制的 Linux 操作系統。
查閱相關資料之后,我們對 eGuideDog Linux 的誕生背景與開發者產生了濃厚的興趣,并相信這也會為讀者帶來一些感動與啟示,于是我們采訪了項目作者黃冠能。本文由采訪整理而成。
eGuideDog,Linux 界的導盲犬
百度百科上對于視障的解釋是:視覺障礙簡稱視障,廣義而言,如果個人需透過輔助器具如眼鏡、放大鏡等才能看清楚東西,就稱為視障者,也就是說視障其實不等于完全看不見。既然本文講計算機操作系統,那么以使用計算機為例,視障可以分為兩種,一種是只能看見比較大的字,需要借助放大鏡軟件把屏幕內容局部區域放大顯示來操作計算機,也就是視障中的“弱視”;另一種是完全看不見——全盲,需要借助讀屏軟件來操作計算機,讀屏軟件會把屏幕焦點所在的內容通過語音合成軟件輸出。
總結起來,使用放大鏡和讀屏軟件就基本上是視障人士操作計算機僅有的方式了。相比之下,能夠使用放大鏡進行閱讀的視障人士在使用計算機時遇到的困難可能沒有全盲者那么復雜。全盲視障者主要是通過鍵盤快捷鍵在屏幕上不同窗口、菜單、按鈕等區域之間進行切換,同時讀屏軟件會把獲得的焦點上的文字讀出來,讓文字以語音的形式被消化。對于大段的文字,會有快捷鍵控制上一行、下一行等導航瀏覽。這其中主要涉及到文字轉語音、人機交互等關鍵技術。
其實在 Windows、Mac 和 Linux 中,都有放大鏡軟件和讀屏軟件,只是一般沒有需求,我們也就不會關注到。像 Windows 環境有一款著名的開源讀屏軟件NVDA,Ubuntu 上也有讀屏軟件 Orca。
eGuideDog Linux 是在上游 Ubuntu 基礎上專門為視障人士定制的操作系統,同時也是第一個專門針對中國視障人士而做的 Linux 發行版。它集成了一系列專為視障人士設計和改造的應用程序,包括中文語音合成引擎、天氣查詢軟件、輸入法、讀屏軟件等,使得視障人士也能夠像明眼人一樣使用 Linux 的各種功能,體驗互聯網的精彩。
“但是它并不是一款創新型產品,并非以一種前所未有的方式讓視障人士使用計算機,而只是幫助中國視障人士跨越使用 Linux 的障礙。”黃冠能解釋,其實國外也有一些類似的項目,比如 Vinux Linux。
中國的視障人士使用 Linux 會遇到兩個比較大的難題,一個是語言問題,目前流行的 Linux 發行版本其實也有一些自帶讀屏軟件的,甚至軟件中心也有一些為視障人士設計和改造的應用供下載,但是對中文支持并不友好。如前邊所說,Ubuntu 上有讀屏軟件 Orca,所以如果懂英文,當讀屏軟件將文字信息以英文讀出時能夠聽懂,那么視障者使用 Ubuntu 就能夠很好地對計算機進行操作,然而前提是要能聽懂英文。反過來說,其實就是Linux 環境下,普遍缺乏對中文語音合成軟件、中文輸入法等工具的讀屏支持,或者功能并不強大。
另一方面,系統友好性問題。還是以 Ubuntu 為例,由于它畢竟不是針對視障人士專門設計的,那么系統不會在一啟動的時候就提供讀屏功能,也就意味著視障者不可能像明眼人一樣從頭到尾清楚系統當前的狀態。然而這初始的一步是很重要的,如果視障者不能從一開始就清楚系統當前所處的狀態,那么對于后邊的操作都很不利。最簡單的情況是,操作者根本不知道系統有沒有在啟動的時候出了問題卡在某處做自我檢查,而檢查的時間多長也沒法確定,也就是與系統處于“失聯”狀態。
eGuideDog 有力地彌補了這兩個大問題,這也正是它的價值。
至于為什么是做一個命令行的 Linux 而不是做類似 Windows 以可視化界面為主的操作系統,黃冠能表示:“從技術的角度來看,我之所以認為視障人士使用 Linux 更有好處,是因為覺得命令行更適合視障人士使用,圖形界面在實現過程中難免有讀屏軟件無法訪問的情況。”
例如圖形界面中某個按鈕用一個圖片來顯示,沒有描述文本,或者該按鈕無法用鍵盤快捷鍵來獲取焦點,那么讀屏軟件也無能為力。然而,在命令行里這樣的問題是不存在的,命令行里純文字,那么它就能被一字一詞地讀出來。
現實生活中視障者也確實困惑于此類問題,他們反反復復寫信希望各主流軟件改進軟件可訪問性,促使讀屏軟件不斷升級去支持新的圖形界面設計。然而,思考一下根本性問題,視障人士本身不能夠,也不需要圖形化界面“花花世界”的感受,那么這樣不斷去迭代圖形系統中的讀屏軟件可訪問性,不僅治標不治本,還造成了不必要的成本開銷。
緣起
“我讀本科的時候,很喜歡自由軟件,對操作系統怎么實現很著迷,夢想著有一天可以發布一個自己制作的 Linux,那幾年,我一直嘗試使用各個版本的 Linux,包括 Gentoo 和 LFS,也嘗試去讀操作系統的源碼,包括 Minux 和《萊昂氏 UNIX 源代碼分析》”,談及初衷,黃冠能表示:“2006年研究生期間,12月份要做畢業論文,我當時覺得花幾個月時間去寫一篇學位論文只為拿一個學位,很浪費生命。我想了個可以一直繼續做下去的題目,而不僅僅為了學位,我要做一個給盲人用的瀏覽器。”
黃冠能的想法是用 Perl 語言寫一個命令行界面的瀏覽器,支持語音接口,并引入一些智能的分析邏輯,例如將用戶自動定位到主要內容區域、抽取內容摘要等。
此時,eGuideDog 項目正式誕生。“沒有什么大情懷,我也不是因為很系統地了解中國視障群體的信息之后才決定去做這個項目,這完全是因為當時的技術能力驅動的吧。而且事實上,我在兩年后還停止了這個瀏覽器的開發維護。”
黃冠能說他其實并沒有仔細去調查中國有多少視障人士,他們年齡分布如何,可能會使用計算機的年輕人占比具體有多少,他只是簡單地說一切緣于一次畢業論文,緣于一個不想浪費生命的想法,然而,他還是很明白中國約2000萬視障人士在互聯網時代的不便,而且還在不斷地“浪費”著他自己的生命去持續做著這件事,一做就是10余年。
一個人的路途
eGuideDog 項目開始后,所有的事情都落到黃冠能一個人身上,他說:“這個項目只有我一個人在長期業余地在做,偶爾會有人給 Ekho TTS(Text To Speech)貢獻新的聲音。”
在這個過程中,他的主要工作圍繞在解決中文用戶特有的問題這個大方向上,他也表示雖然 eGuideDog 是基于 Ubuntu 的操作系統,但是他所做的工作其實不需要對 Ubuntu 系統層面進行修改。
中文語音合成軟件
我發現沒有開源的中文語音合成軟件,于是計劃朝著這個方向進行研發。我讀本科的時候除了修得計算機學位,還修了英語。我的英語在畢業的時候是通過了專業八級的,可以說,我對語言學頗感興趣,并且有一定敏感的。于是,我開始對語音合成器 eSpeak 做粵語支持,并在之后幾年不斷花時間去完善和修訂粵語詞典。粵語是我的第一母語。
eSpeak 的模型決定了它發音比較生硬,像個機器人,讀中文時也像個外國人在讀。于是我決定做 Ekho TTS,后來陸續支持了粵語、普通話、詔安客語、韓語(不完整)、藏語、雅言、廣東臺山話。我發現,在所有操作系統平臺中,Ekho 貌似是唯一支持藏語的 TTS,可能是因為用戶太少,商業軟件也不愿意花資源去制作吧。
輸入法讀屏
除了 TTS(Text To Speech),eGuideDog Linux 另一個需要解決的問題是輸入法讀屏。Linux 下的讀屏軟件 Orca 一開始是不支持中文輸入法讀屏的,為了解決這個問題,我嘗試 hack Orca 和輸入法框架 IBus,我已經不記得我做了多少嘗試。我一直只是業余地做 eGuideDog 項目,沒有那么多精力去精通一個又一個開源軟件,做這個輸入法讀屏支持是讓我比較煩惱的。
我也不記得為了區分同音字,當時是怎樣把 ibus-pinyin 的代碼更改了,現在讓我再做一次恐怕做不出來,我讓它在顯示候選字的時候把每個字都組個詞讀出來,讓視障人士知道候選字具體是哪個。
過了兩年,ibus-pinyin 的接口從 Python 2 升級到 Python 3,相關修改要重新實現,我當時又痛苦地 hack 了一次。再過了兩年,Orca 終于能把輸入法控件部分讀出來了,后來又做了一些改進,使得 Orca 可以支持了中文輸入法讀屏。
編寫教程
用戶使用 eGuideDog Linux 之前很可能是完全沒有 Linux 基礎的,這一點很正常,現在如果不是黑客、程序員等專業人員需要,很少有人會知道 Linux,大家對于電腦的操作習慣很主要是基于 Windows。市面上也沒有教視障人士怎樣使用 Linux 的教程,因此我需要編寫一些基本的教程來幫助他們了解 Linux 的一些使用。
第一版的《Linux盲人教程》是在2015年編寫的,這個教程有文字和錄音講解。視障用戶其實是可以訪問文字內容的,因為我假設用戶已經懂得怎樣通過讀屏軟件使用 Windows。如果這一點假設不成立,那么這個教程就需要教用戶怎樣使用鍵盤,鍵盤上有些什么鍵,這不是我需要做的事情。
這個版本的錄音做得并不好,它基本上只是把文字讀出來,而沒有做更形象的演示。不過即便是這樣也是很花時間的,因為我并不是一個口齒伶俐的播音員,要把整個過程做得清晰流暢也花了不少時間。錄制過程主要使用了 Audacity 音頻處理軟件。我覺得未來的教程應該像做慕課(MOOC)一樣做。
收到用戶問題反饋之后,我也在不斷編寫新的教程文檔,未來一段時間我會基于 LPI(Linux Professional Institute)的大綱內容去編寫更系統的 Linux 教程,目前已經整理了一部分在我的個人博客里。
2013年7月,Ekho TTS 終于發展到可以對接 Linux 讀屏軟件的程度,輸入法讀屏的問題得到解決,黃冠能一直欠缺的 Linux 定制打包的相關知識也在這個時候補上了。于是他正式推出了 eGuideDog Linux 發行版。在此之后,每當 Ubuntu 推出一個新的 LTS 版,黃冠能就跟進發布一個新的 eGuideDog 版本,目前編號為0.5的最新版已經是第五個版本。
“總的來說,我所做的研發工作主要是實現了 Ekho TTS、實現中文輸入法的讀屏支持,然后把整個安裝和使用流程都走一遍,把有訪問困難的地方做調整配置,并編寫相關教程。另外,Ubuntu 及相關開源軟件本身有不少 bug,我需要不時去聯系開源社區相關維護人員去商討解決的辦法。”黃冠能總結。
此外,eGuideDog 項目中還包括了eGuideDog 獎學金、WebAnywhere、WebSpeech等部分,這些不屬于操作系統本身,但是在整個項目中也意義重大。
eGuideDog 獎學金
eGuideDog 獎學金是一個試探性的項目,目前還沒有產生什么效果,也還沒有視障人士來正式申請。我希望通過這個獎學金,可以把一些編寫教程的工作交由視障者群體本身來完成,畢竟他們更加深知自己的體驗需求,可以把教程做得更好。
同時我希望可以在這個過程中認識一些技術比較好的視障人士,挖掘他們的能力,并不斷深造。也許這個獎學金的獲得者就是一個人才庫,將來社會條件成熟到能夠為視障群體提供一些 Linux 相關的工作機會的時候,那么這里就有一些現成的專業人才。
WebAnywhere
WebAnywhere 是過去美國華盛頓大學的一項研究,為了讓盲人可以在一臺沒有安裝任何特殊軟件的計算機上瀏覽網頁。這個軟件本身是一個網站,一個可以為用戶代理訪問其它網站的網站,并提供語音輔助。對于盲人來說,沒有安裝讀屏軟件的電腦是完全不能使用的。但如果有了這個軟件(網站),盲人就可以用一個普通的電腦上網瀏覽資料。
這個項目是開源的,于是我為這個軟件添加了多國語言支持的機制,并且在2010年的時候購置了一***立的服務器主機為中文用戶提供服務。過了兩年,由于覺得沒有什么人在實際使用,于是停止了維護。雖然停止了維護,但我覺得這項技術還是很有價值的,它沒有實際應用起來也許只是時機不成熟,希望之后可以有機會重新啟動它。
WebSpeech
WebSpeech 的誕生來自于英國的一個項目,當時有個英國公司在投標一個英國政府的無障礙項目,做一個給視障人士用的電子圖書館網站。項目的經理找我來幫助開發語音相關的功能,以及一些電子文檔格式轉換工具。
于是我做了 WebSpeech,WebSpeech 是一個 JavaScript 庫,可以為網站提供語音支持,技術上一定程度上借鑒了 WebAnywhere。據我了解,中國政府網站一般要求提供無障礙技術的支持,而這其中有部分網站背后是有使用 WebSpeech 技術的,同時也有不少其它需要用到語音功能的應用會用到這個庫。我自己平時寫一些帶語音功能的電子書之類的小應用也經常用到這個庫。
其實隨著項目的一步步發展, eGuideDog 對于黃冠能而言已經不再像最開始那樣只是“純技術上的實現某個功能”了,他逐漸寄希望于 eGuideDog,“希望它可以為中國的視障人士使用 Linux 掃除障礙”,更具體的,他所做的一切是為了讓視障人士用戶從插入安裝盤開始,能夠獨立地、比較順暢地完成安裝并且0障礙使用。
eGuideDog 項目雖然得到過不少人的支持,但是實際上并沒有志愿者加入到長期維護的隊伍中。除了技術上一個人在堅持,黃冠能也表示,項目并沒有得到過多少資金支持,極少數的志愿者捐助的小小金額甚至遠不足以彌補服務器的開銷。
然而,“這條路只有我一個人的情況,這都在我當初的風險預測范圍內”,黃冠能很堅定地說:“我打算花我個人幾十年的時間來開展這個項目。我覺得花我一個人幾十年的時間能為幾千萬人的生活帶來重要改善是非常值得的。”
道阻且長
一個人的路途并不好走,這條路上困難重重。除了前邊提到的研發上遇到的困難,還有整個市場反饋的問題。雖然經過了這么多年的發展,eGuideDog Linux 系統的各方面都在不斷進步,整個生態也朝著好的方向發展,但是擺在面前的現實是,目前eGuideDog Linux 的用戶還是很少,總結起來有幾個方面的原因:
驅動不足
可以自由使用 Linux 對于視障人士來說并不是很必要的需求,或許他們使用計算機只是需要看個視頻、刷刷論壇,但拋開這些日常生活娛樂需要,計算機對于他們工作上的作用并不大,黃冠能認為,在眾多類型的殘障中,失明的障礙算是比較好就業的,遠的算命不說,近的可以看到盲人正骨、說書、演奏和寫作等名家倍出。失去“就業”動機,就使得“視障人士使用計算機”的命題意義大減,這成了使用 eGuideDog 人數不多的一大原因。
入門門檻高
Linux 相比 Windows 和 macOS,在日常生活中的普及程度并不高,黃冠能認為目前來看 Linux 始終都是極客專用的系統,最多也只是會慢慢成為程序員的必修課。它的專業性比較高,需要經過一定程度系統性地學習才能掌握,別說視障人士用起來會有困難,就連一般程序員都望而生畏。
宣傳不足
對 eGuideDog 項目的宣傳是明顯不足的。黃冠能表示,他一個人在維護著這一個項目,雖然平時有訂閱視障人士相關的期刊,有關注個別視障團體,偶爾還會接觸來自大陸、港臺及外國的視障人士,但是他很難有精力和條件去對視障群體的具體信息進行調查與研究,同時也無法去做相應的宣傳工作。雖然無奈,但這是目前的困難。
使用人數不多,并不能很好地反映出視障人士不需要,對于黃冠能來講,這是因為生態、宣傳上做得還不夠。他希望拓寬視障人士的就業場景,讓他們可以在互聯網時代也能通過電子機器展現自己的智慧;他也希望通過不斷完善系統和各種軟件的使用體驗,并且做出更好的學習資料,讓視障人士更加深刻地體會到 Linux 的美妙,而不是對其敬而遠之。
道阻且長,然而黃冠能沒有放棄。他說當他看到一位還在讀小學的小朋友在使用 eGuideDog Linux 的時候,雖然很憐憫他的不幸,但是也覺得他很了不起,“一個有視力障礙的小朋友在讀小學的時候就想到用 Linux,那么將來他肯定會很了解 Linux,至少是熟透它的基本操作,這對于他日后的生活和發展有很大的幫助。”黃冠能說。
他也了解到有使用者希望通過學習 Linux 去從事服務器維護相關的工作,在周圍人告訴他這不現實的時候,他將盲人王永德研發永德讀屏軟件的事跡科普了一翻。黃冠能說這些都讓他看到了堅持做 eGuideDog 這件事情的意義。
有視障朋友曾經略帶偏激地告訴黃冠能,表示專門做給視障人士的軟件大多缺乏維護,并不能長久。他覺得這是現實存在的問題,就連知名的 Vinux目前也處于停滯的境況,Vinux 社區最近一封討論郵件的內容是去年 Vinux lead develper 離開團隊。但是正如黃冠能所說,他想做的 eGuideDog 是要花費他數十年去堅持的。
具體到接下來的工作計劃,黃冠能表示主要有3個方面:
繼續維護軟件,修復一些 TTS 崩潰的問題,根據用戶反饋做一些修改,也許會做些語音質量改進的工作。
重新編寫 Linux 教程,在原有教程的基礎上補充更完整的內容,讓視障人士用戶更容易上手 eGuideDog。
繼續推廣 eGuideDog 獎學金,希望從中培養一些優秀的學員。
道阻且長,我們希望黃冠能的堅持能收獲更多,eGuideDog 這只導盲犬能不斷帶領更多人走向光明。
-
Linux
+關注
關注
87文章
11227瀏覽量
208922
原文標題:Linux 界導盲犬 eGuideDog 的光明之路
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論