谷歌眼鏡通過增強現(xiàn)實療法幫助自閉癥兒童理解面部表情。
想象一下這個場景:快到晚飯時間了,小吉米呆在廚房里。他媽媽正忙著把晚飯端上飯桌,并且她把所有餐具都堆放在了廚房的操作臺上。患有自閉癥的吉米則希望把餐具擺放得更加整齊,當他媽媽在爐子旁時,他便小心翼翼地開始把每一把餐叉、餐刀和湯勺放回餐具抽屜的槽里。突然,吉米聽到一聲喊叫。他媽媽聲音很大,她的臉色看起來不一樣了。但他還在繼續(xù)收拾著餐具。 現(xiàn)在想象一下,吉米戴著一種特殊的谷歌眼鏡,這是谷歌在2013年推出的一款增強現(xiàn)實頭戴設備。當他抬頭看著他媽媽時,頭戴顯示器亮起一個綠框,提示吉米他“發(fā)現(xiàn)了一張臉”。當他盯著他媽媽的臉看時,一個表情符號跳出來,告訴吉米:“你發(fā)現(xiàn)了一張生氣的臉?!庇谑?,他會思考為什么他媽媽會生氣。也許他應該停下收拾餐具,去問問她。 我們的團隊已經(jīng)花了6年的時間來研究這項針對自閉癥兒童的輔助技術,孩子們把這項技術稱為“超級眼鏡”。我們的系統(tǒng)為孩子在家中提供行為療法,這是最初學習社交技能的地方。該系統(tǒng)使用眼鏡外置攝像頭記錄孩子與家人之間的互動;然后我們的軟件會檢測到這些視頻中的人臉,并解讀他們表達的情緒。通過一個應用程序,看護人可以查看自動剪輯的社交互動視頻。 多年來,我們已經(jīng)對原型進行了改進,并通過臨床試驗證明它的療效:我們發(fā)現(xiàn),使用這款眼鏡可以增加孩子們的眼神交流和社交參與感,還可以提高他們對情緒的識別能力。我們在斯坦福大學的團隊與本文作者之一丹尼斯?沃爾(Dennis Wall)的分拆公司Cognoa合作,為“超級眼鏡”贏得了“突破性療法”的稱號,該項技術迅速獲得了美國食品藥品管理局(FDA)的批準。我們的目標是進入健康保險計劃,以此來支付該項技術作為增強現(xiàn)實治療療法的費用。 當谷歌眼鏡第一次作為消費類設備出現(xiàn)時,許多人認為不需要使用它。面對慘淡的評價和銷量,谷歌2015年停止了消費版產(chǎn)品的生產(chǎn)。但當該公司于2017年攜帶該設備的二代產(chǎn)品——“企業(yè)版眼鏡”重返市場時,許多行業(yè)開始看到了它的潛力。在這里,我們將講述我們如何利用這項技術為自閉癥兒童提供一種看世界的新方式。
當吉米戴上眼鏡時,他很快就習慣了視野邊緣的頭戴顯示器(棱鏡)。當吉米開始與家人進行互動時,這個眼鏡就會將視頻數(shù)據(jù)發(fā)送到看護人的智能手機上。我們的應用程序配有最新的人工智能(AI)技術,可以檢測人臉和情緒,并將信息發(fā)送回眼鏡。當檢測到人臉時,頭戴顯示器的邊框就會亮起綠色,然后顯示器通過表情圖形、表情符號或書面文字來識別面部表情。用戶還可以選擇從眼鏡內的骨傳導揚聲器獲取音頻暗示(一種識別情緒的聲音),該揚聲器通過頭骨向內耳發(fā)送聲波。該系統(tǒng)可以識別7種面部表情,包括快樂、憤怒、驚訝、悲傷、恐懼、厭惡,還有蔑視——我們標記為“失望”,這樣對孩子更友好一些。它還能識別中性的表情。
為了鼓勵孩子們佩戴“超級眼鏡”,這款應用程序目前提供了兩款游戲:“捕捉微笑”——孩子試圖從他人身上引發(fā)出快樂或另一種情緒;“猜猜表情”——人們表現(xiàn)各種情緒,然后讓孩子們猜出是哪種情緒。這款應用程序還會記錄會話中的所有活動,并標記社交活動的瞬間。這讓吉米和他媽媽能夠一起觀看他們在廚房里出現(xiàn)矛盾的視頻,這會促使他們討論究竟發(fā)生了什么事情,以及下次他們如何避免這樣的情況發(fā)生。
“超級眼鏡”系統(tǒng)的三大要素——人臉檢測、情感識別和App回顧,可以幫助自閉癥兒童邊戴邊學。鼓勵孩子們去尋找社交互動,使得他們了解人臉是有趣的,意識到可以從面部表情中收集有價值的信息。但是眼鏡并不需要永久佩戴。孩子們每周在自己家里做幾次20分鐘的治療,目前整個干預療程為6周。孩子們能很快學會如何察覺他們社交伙伴的情緒,然后,在他們獲得社交自信心后,就不再使用眼鏡了。
我們的系統(tǒng)旨在改善一個嚴重的問題:孩子們只能接受有限的強化行為治療。盡管有證據(jù)表明這種療法可以減少甚至消除自閉癥的核心癥狀,但孩子們必須在8歲之前就開始接受這種療法,才能真正見效。目前診斷的平均年齡是4至5歲,等待治療可能會超過18個月。其部分原因是,自1990年以來,美國自閉癥兒童的診斷人數(shù)猛增了600%,現(xiàn)在大約每40個孩子中就有一個患有自閉癥;而在亞洲和歐洲的一些地區(qū),增長卻沒有如此劇烈。
由于需要治療的兒童人數(shù)與能夠提供治療的專家人數(shù)之間的不平衡越來越嚴重,因此我們認為,臨床醫(yī)生必須尋求以分散方式擴大規(guī)模的解決方案。我們認為,不能一切都依賴專家,幫助所有這些兒童所需的工具,如數(shù)據(jù)采集、監(jiān)控和治療工具,必須交到患者及其父母的手中。
為自閉癥兒童提供原位輔助學習的努力可以追溯到20世紀90年代,當時麻省理工學院的教授羅莎琳德?皮卡德(Rosalind Picard)設計了一個帶有耳機和顯示情緒提示的微型計算機系統(tǒng)。然而,當時的可穿戴技術既笨重又突兀,情緒識別軟件也很原始。而如今的可穿戴設備(例如谷歌眼鏡)都很低調,而且我們擁有了強大的人工智能工具,它們利用了大量關于面部表情和社交互動的公開數(shù)據(jù)。━━━━谷歌眼鏡的設計是一項驚人的壯舉,工程師基本上把智能手機裝進了一個類似眼鏡的輕型框架中。這種形狀因子給開發(fā)者帶來了一個有趣的挑戰(zhàn):我們必須在電池壽命、視頻流性能和熱量之間做出權衡。例如,在設備上處理數(shù)據(jù)產(chǎn)生熱量過多,會自動觸發(fā)操作回調。當我們嘗試在設備上運行計算機視覺算法時,該系統(tǒng)會自動降低捕捉視頻的幀速率,嚴重影響快速識別情緒和提供反饋的能力。 我們的解決方案是通過Wi-Fi將谷歌眼鏡與智能手機配對。眼鏡可以捕捉視頻,將視頻流傳輸?shù)绞謾C,并向佩戴者傳遞反饋信息。手機可以進行人臉檢測與跟蹤、特征提取、面部表情識別等繁重的計算機視覺工作,并存儲視頻數(shù)據(jù)。
但是,“眼鏡到手機”的視頻流也有自己的問題:雖然眼鏡能以正常的分辨率捕捉視頻,但我們只能以低分辨率進行傳輸。因此,我們編寫了一個協(xié)議,將眼鏡新檢測到人臉的圖像放大,這樣視頻流信息就足夠詳細,可用于我們的視覺算法。
我們的計算機視覺系統(tǒng)最初是使用現(xiàn)成的工具。軟件流水線由人臉檢測器、人臉跟蹤器和人臉特征提取器組成;一個經(jīng)過標準數(shù)據(jù)集和我們自己數(shù)據(jù)集訓練的情緒分類器接收數(shù)據(jù)。在我們剛開始開發(fā)流水線時,在移動設備上運行能夠處理實時分類任務的深度學習算法還不可行。但在過去的幾年里,我們取得了顯著的進步,現(xiàn)在我們正在研發(fā)一款升級版的“超級眼鏡”,它配有深度學習工具,可同時進行人臉跟蹤和情緒分類。
這次升級不是一項簡單的任務。情緒識別軟件主要用于廣告行業(yè),用于衡量消費者對廣告的情緒反應。我們的軟件在幾個關鍵點都有所不同。首先,它不是用于計算機,而是用于可穿戴和移動設備,因此我們必須將它的內存和處理要求降到最低。可穿戴形狀因子也意味著,不是通過穩(wěn)定的網(wǎng)絡攝像頭捕捉視頻,而是通過孩子們佩戴的移動攝像頭捕捉視頻。我們已經(jīng)添加了圖像穩(wěn)定器來處理視頻的抖動,人臉檢測器要頻繁地初始化,找到在場景中突然改變位置的人臉。
失效判定也是一個嚴重的問題。例如,一個商業(yè)情緒識別系統(tǒng)可能聲稱有98%的準確率;這樣的統(tǒng)計數(shù)據(jù)通常意味著該系統(tǒng)對絕大多數(shù)人效果都很好,但始終無法識別小部分人的表情。這種情況對于研究人們觀看廣告的總體情緒可能是合適的,但對于“超級眼鏡”,這個軟件必須經(jīng)常解讀孩子與同一個人的互動情況。如果這個系統(tǒng)持續(xù)識別失敗的兩個人碰巧是孩子父母,這個孩子就太不走運了。 我們已經(jīng)開發(fā)了一些自定義的方法來解決這些問題。在我們的“中性減法”方法中,系統(tǒng)首先記錄某個人中性表情的臉。然后,軟件根據(jù)檢測到的該人當前顯示的臉和記錄的中性估值之間的差異,對該人的表情進行分類。比如,系統(tǒng)可能學會,爺爺僅僅眉頭緊鎖,并不意味著他總是生氣。我們還在進一步研究機器學習技術,該技術可快速為每個用戶軟件實現(xiàn)個性化。制造一個穩(wěn)健的人機交互系統(tǒng),讓用戶沒有太多挫敗感,是一個相當大的挑戰(zhàn)。我們正在試驗幾種游戲化校準過程的方法,我們認為“超級眼鏡”系統(tǒng)必須具有適應能力,才能取得商業(yè)成功。 我們從一開始就意識到這個系統(tǒng)是不完善的,于是設計了反饋來反映這一現(xiàn)實。綠框人臉檢測功能最初是為了緩解挫敗感:如果系統(tǒng)沒有跟蹤到朋友的臉,至少用戶知道這一點,并且不會等待永遠不會出現(xiàn)的反饋。然而,隨著時間的推移,我們開始認識到綠框自身就是一種干預治療,只要佩戴者看到一張臉,綠框都會提供反饋,對于患有自閉癥系列障礙的兒童,這種行為會有明顯不同。━━━━為了評估“超級眼鏡”,我們在過去6年里進行了3次研究。第一次研究是在我們的實驗室里,有一個非常初級的原型,用來測試患有自閉癥的兒童戴上谷歌眼鏡后會有什么樣的反應,以及他們會接收到什么樣的情緒提示。接下來,我們制作了一個完整的原型,并開展了一次設計試驗,在這個試驗中,自閉癥孩子的家庭把這些設備帶回家?guī)讉€星期。我們定期與這些家庭進行互動,并根據(jù)他們的反饋對原型進行修改。 用手中這臺精心修改的原型樣機,我們開始對設備的功效進行嚴格的測試。我們進行了一項隨機對照試驗,其中一組兒童接受典型的居家行為療法,而另一組兒童則接受這種療法外加使用“超級眼鏡”。我們使用了4組常用自閉癥研究測試,尋找情緒識別和更廣泛的社交技能的改善。正如我們在2019年《美國醫(yī)學會小兒科期刊》(JAMA Pediatrics)上發(fā)表的論文中所述,在一組測試中,干預組表現(xiàn)明顯優(yōu)于對照組。
我們還請家長告訴我們他們注意到了什么。他們點評技術功能、用戶挫折感以及他們希望看到的新功能,他們的觀察幫助我們改進了原型的設計。我們居家設計試驗開始時的一封電子郵件就很引人注目。這位家長報告說自己的小孩立即有了顯著的改善:“在通過谷歌眼鏡互動過程中,他實際上正在看著我們……就好像他身上的開關被打開了一樣……謝謝你們!!!我兒子正看著我的臉?!?/p>
這封郵件非常鼓舞人心,但聽起來好得令人難以置信。然而,在我們的研究中,關于增加眼神交流的評論一直存在,我們在一份設計研究的出版物中記錄了這個有趣的反饋。時至今日,我們仍能從“照明開關”參與者小組那里聽到類似的故事。 我們相信“超級眼鏡”系統(tǒng)是有效的,但說實話,我們真的不知道為什么有效。我們還無法確定導致增加眼神交流、社交參與度和情緒識別的主要行為機制是什么。這一未知為我們目前的研究提供新的信息。情緒識別反饋對孩子的幫助最大嗎?還是我們的設備的主要功效是通過綠框吸引人們對臉的注意力?或者我們只是提供了一個平臺來增加家庭內部的社交互動?這個系統(tǒng)是以同樣的方式幫助所有的孩子,還是以不同的方式滿足不同人群的需求?如果我們能夠回答這些問題,那我們干預治療的設計就能更有針對性和個性化。 由丹尼斯?沃爾創(chuàng)立的初創(chuàng)公司Cognoa,目前正致力于將我們的“超級眼鏡”原型轉變?yōu)榭蛇M入醫(yī)生處方的臨床療法。在2019年2月美國食品藥品管理局認定該項技術為“突破性療法”,這將加快獲得健康保險公司監(jiān)管批準和接納的進程。Cognoa公司的增強現(xiàn)實療法將適用于大多數(shù)類型的智能手機,它不僅與谷歌眼鏡兼容,還將與即將上市的新品牌智能眼鏡兼容。在另一個項目中,該公司正在開發(fā)一種數(shù)字工具,醫(yī)生可以用它來診斷只有18個月大的兒童,這可使這些兒童在大腦發(fā)育的關鍵時期準備接受治療。 最終,我們認為我們的治療方法還可以用于自閉癥以外的問題兒童。例如,針對語言障礙兒童,或者被診斷患有注意力缺陷多動障礙的孩子,我們可以為他們設計游戲和反饋。我們正在設想用各種普遍存在的人工智能設備為用戶提供治療,并反之推動技術改進的良性循環(huán);這些設備在輔助學習的同時,還可以捕捉數(shù)據(jù),幫助我們了解如何更好地進行個性化治療。在這個過程中,甚至還可以對各種失調癥獲得新的科學見解。最重要的是,這些設備將能夠幫助家庭掌握自己的治療和家庭動態(tài)。通過“超級眼鏡”和其他可穿戴設備,他們將看到未來的方向。
-
增強現(xiàn)實
+關注
關注
1文章
712瀏覽量
44925 -
谷歌眼鏡
+關注
關注
0文章
119瀏覽量
25948
原文標題:讓情緒更加透明
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論