2012年5月蘋果發布SIRI,帶來了一種全新的交互方式——人機自然語言交互。SIRI帶來了截然不同的用戶體驗,加上蘋果公司的夸大宣傳,很多人驚呼人工智能時代要來了。
然而很多年過去了,人機自然語言交互依然不是主流的交互方式。
2016年3月谷歌機器人阿爾法狗戰勝人類圍棋大師李世石,又一次讓人們對人工智能充滿了希望。2016年國內很多人工智能和機器人企業拿到了投資。
我們看到機器學習技術的廣泛應用確實為我們帶來了很多改變。比如語音識別和圖像識別的準確率更高了。
盡管投資人、用戶以及政府都對人工智能充滿了期望,應該看到目前的進步都還只是量變,并沒有達到質變。
于是我們看到很多拿到投資的企業很快就變得平庸了,不再能讓我們眼前一亮。
人工智能時代,終究還沒有到來。
我以前在我的朋友圈討論過這個話題:什么是人工智能時代的正確打開方式?
我認為唯有人機交互方式的變革才能帶來行業的質變,唯有鍵盤和觸摸屏的交互變成全自然語言的交互,人工智能時代才會到來。
最初的電腦沒有操作系統,各家的軟硬件不兼容。有了操作系統,才形成了軟硬件相互協作的格局,讓更多企業參與到IT行業中來了。
但最初的操作系統是命令化操作,只有專業人士才能記住那些復雜的命令,于是電腦成了“奢侈品”,普及困難。
后來有了視窗操作系統,電腦成了辦公工具,很快進入了各個企業、政府、學校,成了辦公室必不可少的裝備。后來互聯網普及后,電腦開始進入家庭,成了游戲工具。
最初的手機是按鍵操作的。后來有廠商造出來可以替代計算機辦公和打游戲的智能手機。當時的諾基亞和黑莓手機都非常棒,能支持移動辦公,帶來了很多便利。
但直到觸摸屏手機出現,移動互聯網時代才到來了,才達到了質變。
那么有沒有什么能替代移動互聯網的東西呢?我認為只有新的交互方式產生了,新的互聯網時代才會來臨。這種新的交互方式就是人機自然語言交互。
觸摸屏交互和鼠標鍵盤交互存在的問題主要有以下幾點:
第一、菜單式操作,能容納的功能有限。大多數人在手機上安裝的APP不會多于100個,大多數人即便在電腦上安裝的軟件數量也不會多于100個。因為太多了查找起來就很困難。我們大多數人手機里的電話號碼不會多于1000個,微信里的好友很多人連5000個都沒有加滿。這都是受限于操作系統需要通過菜單展示信息。
第二、需要人理解機器。過去計算機要輸入漢字是件很困難的事情。我們上學時最流行的是五筆字型輸入。需要參加培訓才能學會這種輸入法?,F在也需要通過各種輸入法去解決漢字輸入的問題。這就需要我們理解輸入法的規則。過去很多軟件操作都很復雜,需要經過培訓成為專業人士用戶才能使用?,F在盡管軟件都智能了很多,但一些軟件還是需要人們去學習才能掌握它的使用方法。
第三、需要近距離操作,占用手和眼。無論鍵盤鼠標還是觸摸屏,都需要近距離操作,需要手眼配合。因此在用計算機和電腦的時候,我們就不能干別的事情。另外,也因為近距離操作,限制了人們的使用場景。例如,必須有電源,有辦工桌安放電腦等等。
SIRI讓我們看到了一個新的機會,就是人機交互方式變革的機會。如果可以語音和機器交互,那鍵盤鼠標觸摸屏就都不需要了。我們可以通過語音交互讓機器為我們服務。手和眼被解放了出來,而且我們不再需要理解機器的規則。機器有成千上萬的功能,它根據我們說的話去理解我門的意圖,提供令我們滿意的服務。我們可以語音告訴機器人我們要買的東西,它幫我們完成購買和支付。我們可以語音告訴機器人出差的時間和目的地,機器人幫我們訂票和訂酒店,然后反饋結果給我們。我們可以告訴機器人我們要吃什么東西,機器人自動幫忙叫外賣并完成付款。我們可以語音駕駛汽車,只要告訴汽車我要去哪里就可以了。我們不需要知道機器有哪些功能,我們只需要按自己的習慣表達,機器人會自動去匹配它的功能。這樣,即便機器有千千萬萬的功能,也不會讓我們使用上感到困難。
為什么SIRI不能實現以上功能呢?很多時候,那些SIRI一類機器人更像個智障。
其實人機自然語言交互需要的不僅僅是自然語言處理,而是一個系統,一個大腦。語言處理的過程就是思辨的過程。我說“吃”,你不知道我說的啥意思,但我說話的對象就能聽得懂。因為他從我這里獲得的信息比你多,他能綜合各個信息通過思辨來理解我的意圖。語言本身是模糊的,甚至矛盾的。說“是”也許表達的是否定,說“快樂”也許表達的是傷心。只有通過思辨才能理解一句話。機器要理解人就需要機器具備思辨能力,思辨能力就是智慧。如果像寫普通程序那樣寫人工智能程序,不會讓機器擁有思辨能力。
其次,只有機器擁有了相應的知識才能解決相應問題。但人類的知識是個無限集,是非常非常龐大的。只有通過UGC的模式,讓每個參與者都為機器人提供知識,才能保證機器人擁有無限多的知識。如果需要通過訓練來讓機器人擁有知識,那普通用戶是無法參與的。
另外,語言是流動的是模糊的。一個詞在現代包含的意思和在古代不一定完全相同。一句話在不同的場合含義都不一樣。要理解語言,不是理解字面,而應當去理解文字背后的語義。如果把語言當成處理對象,那就錯了。
最后,很多人用菜單式的系統結構做人機自然語言交互的系統,這就錯了。人機自然語言交互的系統是平行結構的。如果有菜單,用戶就要去理解菜單,那就不是智能了。應該是機器人理解人,根據人的意圖去平行調用各種功能模塊。對于平行結構,我們的定義是所有功能都在第一級別。想進入一個功能就進入,不想進入不能進入,想退出就退出,不想退出就不能退出。
我們氖星智能經過很多年的研究,我們的DSA-nlp算法已經相對成熟了,我們能讓機器在最大程度上理解用戶意圖,能理解上下文,能讓對話變得自然流暢。
我們的目標是成為新的流量入口,人機自然語言交互時代的流量入口。各家大廠都在推智能音箱,都是在爭這個入口。但能取勝的,一定是交互最流暢的。我們擁護先進的人機自然語言交互技術,一定能在這個市場擁有自己的地位。
因為我們研究了十多年的NLP技術,我們能處理上下文,我們的系統結構是平行結構,我們提出了人機自然語言交互的四個標準:差異性、同一性、模糊性、一致性。差異性就是機器人能理解語言之間的細微差異,比如“你干嘛”和“你干嘛的”。同一性就是能理解兩句話語義是相同的,比如“你公司在哪里”和“貴司地址是什么地方”。模糊性是指當語音識別把“甲硝唑是什么”識別成了“早上做是什么”的時候也能正確處理。一致性是指機器真正理解了語義,前后說的話不矛盾。我們嚴格按照這四個標準在建設我們的系統。我們可以保證我們的機器人對用戶輸入理解的準確率可以很高,保證人機對話可以自然流暢。
我們推出了氖星智能平臺www.neonstar.cn,能讓每個用戶建立自己的機器人。比如,你是個醫院,你建個機器人回答健康問題。你是個律師事務所,你建個機器人回答用戶法律問題。你是個駕校,你建個機器人回答關于汽車駕駛問題。我們平臺已經有不少機器人了。他們一起為用戶解答各種各樣的問題。我們開發了氖星知道APP(以下是氖星知道下載地址:http://www.naistar.com/download/zhidao-release-signed.apk),用戶提問,機器人搶答。未來幾年我們氖星知道的用戶數會突破1億。
快來我們平臺建立自己的機器人,在人工智能時代提前布局吧!這里才是通往人工智能時代的真正入口。
-
機器人
+關注
關注
210文章
28205瀏覽量
206524 -
觸摸屏
+關注
關注
42文章
2290瀏覽量
115996 -
人工智能
+關注
關注
1791文章
46858瀏覽量
237556
原文標題:快來看!這里才是通往人工智能時代的真正入口!
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論