機器現在可以識別憤怒、恐懼、厭惡和悲傷,而情感檢測已從一個研究項目發展到價值200億美元的產業。
檢測程序能通過讀取面部表情和行為發現潛在的***嗎?這是美國交通安全管理局(TSA)2003年提出的一個假設,在開發這個項目時,他們咨詢了舊金山加利福尼亞大學心理學榮譽退休教授保羅·艾克曼(Paul Ekman)。幾十年前,艾克曼(Ekman)已經開發出了一種識別細微面部表情的方法,并將它們映射到相應的情緒上,這種方法被用來訓練“行為檢測人員”——掃描臉部觀察是否有欺騙的跡象。
但當該計劃于2007年推出時,卻面臨種種問題,比如警察利用該技術經常錯誤的逮捕嫌犯,更令人擔憂的是,該計劃據稱涉嫌種族歧視。
此后,艾克曼(Ekman)試圖與美國交通安全管理局的項目脫離關系,聲稱他的方法被誤用了,但分析人士認為,該計劃的失敗是因為艾克曼(Ekman)的一個過時科學理論;即情緒可以通過面部的分析客觀地推斷出來。
近年來,科技公司已經開始使用艾克曼(Ekman)的方法來訓練從面部表情中檢測情感的算法,一些開發人員聲稱,自動情緒檢測系統不僅比人類更好地通過分析面部表情洞察真實的情緒,而且這些算法也將適應檢測我們內心的感受,極大地改善了我們與電子設備的交互。
但是許多研究情感科學的專家擔心這些算法會再次失敗,基于錯誤的科學對我們的生活做出高風險的決定。
01
價值200億美元的大生意
情感檢測科技需要兩種技術:計算機視覺,用于精確識別面部表情。機器學習算法,用于分析和解釋這些面部特征表達的情感內容。
行人檢測攝像頭正在工作 圖/紐約時報
第二步通常采用一種名為監督學習的技術。通過這種技術,一個算法被訓練出來識別它曾經見過的東西。基本的想法是,如果你在“happy”(“快樂”)這個標簽下顯示出成千上萬張笑臉的圖像,當它看到一張上面有笑臉的新照片時,會再次把它識別為“happy”(“快樂”)。
研究生拉娜·艾爾·卡利歐比(Rana el Kaliouby)是最早開始試驗這種方法的研究人員之一。2001年,從埃及來到劍橋大學攻讀計算機科學博士學位后,她發現自己花在電腦上的時間比花在與其他人相處的時間更多。她認為,如果她能教電腦識別自己的情緒狀態并做出反應,那么沒有家人和朋友在身邊時,她也不會那么孤獨了。
卡利歐比(Kaliouby)博士階段的其余研究都致力于解決這個問題。最終,她開發出了一種設備,可以幫助患有亞斯伯格綜合癥(Asperger syndrome)的兒童閱讀面部表情并做出相應的反應。她稱其為“情感助聽器”。
2006年,卡利歐比(Kaliouby)加入麻省理工學院的情感計算實驗室,在那里,她與實驗室主任羅莎琳德·皮卡德(Rosalind Picard)一起,繼續改進和完善這項技術。此后,2009年,她們共同創辦Affectiva公司,面向市場銷售“人工情感智能”。
一開始,Affectiva將她們的情感檢測技術作為一種市場研究產品出售,為廣告和產品做出實時的情感反應,他們找到了諸如瑪氏(Mars),家樂氏(Kellogg’s)和哥倫比亞廣播公司(CBS)這樣的客戶。如今,亞馬遜、微軟和IBM也將“情感分析”作為他們的面部識別產品之一,許多較小的公司,如Kairos 和Eyris也已經開始崛起,提供類似的服務。
除了市場研究以外,情感檢測技術現在還被用于監控和檢測駕駛員的身體損傷,測試視頻游戲的用戶體驗,以及幫助醫療專業人士評估患者的健康狀況。
卡利歐比(Kaliouby)目睹了情感檢測從一個研究項目成長為一個價值200億美元的行業。她相信該行業將繼續發展壯大。卡利歐比(Kaliouby)預言,在不久的將來,這項技術將無處不在,并整合到我們所有的設備當中,能夠“利用我們內在的、潛意識的、時時刻刻的反應”。
02
囊括87個國家750萬張人臉的數據庫
與大多數機器學習應用程序一樣,情感檢測的進展取決于訪問更高質量的數據。
展會上的面部識別軟件 圖/路透社
Affectiva公司表示,他們的情感數據存儲庫包含來自87個國家的750多萬張面孔,其中大部分是從收看電視或每天上下班行人的選擇性錄像中收集的。
目前,利用該技術可以將面部表情翻譯成對應的情緒,例如,如果他們看到眉毛低垂,嘴唇緊閉,眼睛凸出的面容,就會貼上“憤怒”的標簽。然后,這個帶有標記的人類情緒數據集就會被用來訓練算法,該算法會學習如何將皺眉頭的臉與憤怒、微笑的臉與幸福等等聯系起來。
這種標注方法,在情感檢測行業中被許多人認為是衡量情感的黃金標準,它是由保羅·艾克曼(Paul Ekman)和弗里森(Wallace V Friesen)于20世紀80年代開發的一款名為“情感面部動作編碼系統”(Emfacs)衍生而來。
這個系統的科學根源可以追溯到20世紀60年代,當時艾克曼(Ekman)和兩位同事假設世界上存在六種普遍的情緒——憤怒、厭惡、恐懼、幸福、悲傷和驚訝——這些是我們與生俱來的情緒反應,可以通過分析面部肌肉運動在所有身處不同文化的人群中檢測到。
為了驗證這一假設,他們向全世界不同地區的人群展示了面部照片,要求他們辨別他們所看到的情緒。他們發現,盡管存在巨大的文化差異,人類還是會將相同的面部表情與相同的情感匹配在一起。對于美國的銀行家和巴布亞新幾內亞的半游牧獵人來說,眉毛低,嘴唇緊閉,眼睛凸出的臉都意味著“憤怒”。
此后的二十年里,艾克曼(Ekman)利用他的發現開發了一種識別面部特征并將其映射到對應情緒的方法,潛在的前提是如果一個人的普遍情緒被觸發,那么一個相關的面部動作就會自動地出現在臉上。即使那個人試圖掩飾情緒,真實的本能感覺也會“泄露”出來,因此懂得觀察的人可以捕捉到對方的情緒。
整個20世紀后半葉,這個理論被稱之為經典情感理論,開始主宰情感科學。艾克曼(Ekman)為他的情感檢測方法申請了專利,并開始將其作為訓練項目出售給CIA、FBI、海關和邊境保護局以及TSA,真實情感可讀的觀念甚至滲透到了大眾文化之中,構成了電視劇Lie to Me的理論基礎。
然而,眾多研究情感本質的科學家和心理學家對經典理論和埃克曼(Ekman)的相關情感檢測方法提出質疑,近年來,東北大學心理學教授麗薩·費爾德曼·巴雷特(Lisa Feldman Barrett)提出了一個強烈且持久的批評。
巴雷特(Barrett)在研究生時期首先遇到了經典理論,她需要一種客觀測量情感的方法,于是發現了艾克曼(Ekman)的方法。在回顧文獻時,她開始擔心潛在的研究方法有缺陷。具體地說,她認為通過給人們提供預選的情感標簽來匹配照片,艾克曼(Ekman)無意中“已經有了預設的答案”。
巴雷特(Barrett)和一組同事通過重新運行艾克曼(Ekman)的測試來檢驗這個假設。但他們不提供標簽,讓測試者自由地描述自己所看到圖像中的情緒,具體面部表情和具體情緒之間的關系直線下降。
從那時起,巴雷特(Barrett)發展了自己的情感理論,在她的著作《情感是如何產生的:大腦的秘密生活》(How Emotions Are Made: the Secret Life of the Brain)中得以闡述,她認為,大腦中沒有由外部刺激觸發的普遍情緒,相反,每一次情感體驗都是由更基本的部分構成的。
她寫道:“情感是你身體物理特性的結合,是一個靈活的大腦,可以連接到所處的任何環境中,是你的文化和教養提供了這種環境,情感是真實的,但在客觀意義上不是說分子或神經元是真實的,與金錢一樣真實,這不是幻覺,而是人類一致同意的產物。”
巴雷特解釋說,把面部表情直接映射到所有文化和環境中的情緒,這么做是沒有意義的,一個人生氣時可能會皺眉,而另一個人可能會向敵人禮貌地微笑,因此,評估情緒最好理解為一種動態實踐,包括自動認知過程、人與人的互動、具體經驗和文化能力。她說,“這聽起來很費勁,但確實如此。”卡利歐比同樣認為“情感是復雜的。”
這就是為什么她和她在情感研究所的團隊一直努力提高數據豐富性和復雜性的原因。
除了使用視頻而不是靜止圖像來訓練他們的算法外,他們還嘗試捕捉更多的背景數據,比如聲音、步態以及人類感知之外的面部細微變化,她相信更好的數據將意味著更準確的結果,一些研究甚至聲稱機器在情感檢測方面已經優于人類。
但據巴雷特所說,這不僅與數據有關,而且與數據如何被標記有關,情感檢測公司和其他情感檢測公司用來訓練算法的標記過程,只能識別巴雷特所說的“情感刻板印象”,就像表情符號一樣,這些符號符合我們文化中普遍的情感主題。
紐約大學人工智能研究所的聯合主任梅雷迪思·惠特克(Meredith Whittaker)認為,基于艾克曼過時的科學構建機器學習應用程序不僅僅是一種糟糕的實踐,還會轉化為真正的社會危害。
她說:“你已經看到招聘公司使用這些技術來衡量應聘者是否是一個好員工,你還可以看到用于學校的實驗性技術,以觀察學生在課堂上是忙碌、無聊還是憤怒。卡利歐比表示,“這些信息可以用來阻止人們獲得工作或改變他們在學校的待遇和評估方式,如果分析并非十分準確,那將會是一種傷害。”
卡利歐比也敏銳地意識到建立不同數據集的重要性。她說:“我們要確保訓練這些算法時,訓練數據是多樣化的,我們需要代表白種人、亞洲人、膚色較深的人,甚至是戴頭巾的人。”這就是為什么研究團隊要從87個國家收集數據的原因。
通過這個過程,他們注意到在不同的國家,情感表達似乎呈現出不同的強度和細微差別。例如,巴西人用寬而長的微笑來表達幸福,而在日本,微笑并不表示幸福,而是表示禮貌。情感分析解釋了這種文化差異,增加了對系統的另一層分析,匯編了卡里歐比所說的“基于種族的基準”,編纂了關于不同種族文化中如何表達情感的假設。
但正是這種基于種族等標記的算法判斷讓惠特克(Whittaker) 擔心情緒檢測技術暗示了自動化面相的未來。事實上,已經有公司對某人成為犯罪分子的可能性進行了預測。
最近幾項研究還表明,面部識別技術更容易產生傷害少數族裔群體的偏見,去年12月發表的一篇文章顯示,與白人相比,情感檢測技術顯示出黑人臉上的負面情緒更多。
卡利歐比認為,情感系統確實有一個種族分類器,她承認,這項技術目前并非萬無一失。
-
數據庫
+關注
關注
7文章
3767瀏覽量
64283 -
計算機視覺
+關注
關注
8文章
1696瀏覽量
45930 -
機器學習
+關注
關注
66文章
8382瀏覽量
132444
原文標題:87個國家 750萬張臉部表情 一個價值200億美金的AI大生意
文章出處:【微信號:smartman163,微信公眾號:網易智能】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論