今天的報告分三個部分——人機交互的內(nèi)涵外延、人機交互中知識問題、如何在交互中應用知識。從內(nèi)涵的角度,人機交互是認知智能展現(xiàn)的窗口;人工智能技術改變世界的途徑,其中包括通過交互控制這種改變和提供人機互動的模態(tài);人機交互是人工智能技術落地,改變我們生活和各種形態(tài)必要的而且是最重要的途徑。只有通過人和機器的交互,才能控制人工智能帶來技術上、生活上的各種變化,而避免人工智能“暴走”的風險。人工智能的外延角度,人機交互可以理解為落地的應用,最典型的是人機對話,如客服;其次有智能信息管理,例如語義信息查詢等,在這個數(shù)字經(jīng)濟時代,信息智能管理或者是語義管理越來越重要;還有人機協(xié)同,比如輔助駕駛或者機器人助理,人們越來越感受到機器助理生活在你身邊。代表性的有SIRI。還會有各種APP給你做查詢、做規(guī)劃、做方案等。
知識相關問題可以分為兩個方面,一是常識性知識;一個是領域相關知識。常識性知識中包括知識認知問題和建模算法問題。從認知角度上講,做計算的利用知識,更多看到光明的一面。然而從社會學的角度有很多不同的聲音(不是誰對誰錯的問題)。
下面這張圖是多倫多大學Frank Rudzicz教授報告中的截圖。SIRI實際的反饋,被認為是AI倫理問題的例子。因為這些例子批評SIRI,我認為是不公平的,SIRI不可能回答這種問題。因為,系統(tǒng)沒有足夠的知識支持她回答這么深層語義的問題。
從算法的角度。大家都知道帶來這次人工智能春天的主要是基于統(tǒng)計學的機器學習算法。然而統(tǒng)計學有偏差。如下圖所示。
She is a doctor and he is a nurse這句話沒有問題。但是,其內(nèi)容可能會影響系統(tǒng)輸出可信度,原因來自于訓練語料。這是法律專家認為人工智能有性別歧視問題給出的例子。第二個例子是關于四川料理是不是辣的問題。這樣的問題在機器對話中,往往叫做上下文不一致性問題。但是我認為這個是一個常識性問題。因為,不知道四川料理以辣為主的人,也會犯這樣的錯誤。
關于領域相關知識我想強調(diào)數(shù)據(jù)與知識庫構建兩個問題。現(xiàn)在是大數(shù)據(jù)時代,大數(shù)據(jù)的這一波熱潮興起在人工智能之前,包括移動互聯(lián)網(wǎng)帶來大數(shù)據(jù)時代,但是我們做知識相關實際項目時,它真的不見得是大數(shù)據(jù),有時可能沒有大數(shù)據(jù)。給一個例子如下圖所示。
無法確定數(shù)據(jù)標注方法是最大的問題。
另一個問題是知識圖譜構建問題,其中包括如何構建、評價和更新知識圖譜,和誰去做知識圖譜構建這件事情。作為學術研究者,總覺得應該是企業(yè)懂業(yè)務的人構建知識圖譜。但是實際上行不通,企業(yè)業(yè)務專家的業(yè)務邏輯和我們想建的知識圖譜的邏輯不(完全)一致。因此,只有雙方坐下來反復、深入溝通,才可能完成。
知識應用有兩大方向——建模過程中融入知識和在系統(tǒng)框架中利用知識。
在建模中如何融入知識,包括知識表示、知識推理影射,以及多路徑融合和知識動態(tài)分析。這里介紹幾個我們課題組博士生的工作。論文列表如下:
舉一個例子,TransG模型。目前最通用的知識三元組表示方法是用向量關系表示實體關系,一個頭向量,一個尾向量,還有中間的關系向量。事實上,知識表達關系內(nèi)涵特別豐富,例如,a part of這個關系,一個城市是一個國家的部分,一個椅子腿是桌子的部分.....用一個向量去表示是非常困難的。博士生所提出的混合高斯的方法可以比較好地解決這類問題。
另一個例子是2013年發(fā)表在SIGIR的工作,討論如何從動態(tài)變化的社交媒體內(nèi)容上挖掘動態(tài)的、有時效性的知識。比如這是奧巴馬,隨著不同的時間在互聯(lián)網(wǎng)上尋找他相關的最熱的話題,對這個話題進行描述,展示相關內(nèi)容。如下圖所示。最開始就是奧巴馬參加選舉,有各種各樣的話題。他連任時又有一些新的話題。這也是一個圖譜概念,把知識跟互聯(lián)網(wǎng)上的信息關聯(lián)起,不停獲取和更新知識。
在建模時融合知識的另一類工作是以生成模塊為背景的工作。如:
對生成語句的控制。“我非常餓”,在不同的情況下,可以給出不同的語句。這就是一種對機器的控制。我們希望機器人能被人控制的。對機器人的評價有“智能”和“智障”,有些用戶說“我寧愿機器智障,也不想讓他抽風”。因此,能夠控制機器的輸出,控制其語音行為、控制風險是非常重要的。
另一個工作是情緒化對話生成。控制機器表達的情緒,讓機器人可以更生動一些。也是通過控制機器的語言,進而控制其動作。另一個例子是個性化的對話生成。例如下圖,這個寶寶叫旺仔,是一個3歲、喜歡玩游戲和彈琴的男孩。這個工作生成的系統(tǒng)可以控制輸出內(nèi)容,不僅僅是迎合用戶的問題,而是有自己的基本原則。
最后一部分是如何在系統(tǒng)架構中通過知識,迭代學習。還沒有很好的論文發(fā)表主要考慮如何將環(huán)境數(shù)據(jù)、語義理解和知識圖譜維護這三個環(huán)節(jié)聯(lián)合建模。
結(jié)論:知識是必須的,知識缺失的系統(tǒng)無法達成人類對智能系統(tǒng)的期待。知識是可用的,某種意義上已經(jīng)能夠支持開放領域、特定領域多種信息服務。知識相關研究遠遠不夠,知識表示、知識融合、知識評估等有極大的發(fā)展空間。研究不是孤立的,知識的研究與多種信息處理技術息息相關。例如數(shù)據(jù)采集、語義計算、語義理解、推理等、等。簡而言之“任重道遠”。
-
人機交互
+關注
關注
12文章
1200瀏覽量
55320 -
人工智能
+關注
關注
1791文章
46845瀏覽量
237537
原文標題:CIIS2018演講實錄丨朱小燕:人機交互中知識問題
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論