語音交互無論是人與人溝通,還是AI人工智能時代人與機器人互動以及機器人與機器人之間的交互等都是最為基礎重要的一種方式。
對于今天AI人工智能時代基本的平臺載體--機器人來說,人機語音交互必須首先具有的主要功能之一。
盡管國內的科大訊飛,百度以及目前最為火爆的國外Chat GPT已經在人機語音交互技術上不斷地進行突破,特別是Chat GPT給人的體驗感。相信人機語音交互近年來市場化的應用會帶來較大的變革與突破。但這多年實際市場上幾乎人機語音交互仍然還停留在最為初級還不足以支撐一個基本完整場景下的人與人交互的效果。
我們通過2016年至今2000臺左右機器人不同產業領域場景實際市場上的反饋以及人機語音交互市場化要求的不斷探索已基本上找到并驗證過的方法與路徑。
首先我們回歸分析日常人與人語言交流的場景狀況。其主要特點如下:
1交談的主要內容話題:無論是初次見面還是相識后的交流,基本上都是群體(行業/公司/朋友/親戚等)內的相關的內容。
2內容的屬性:大部分溝通的內容中是不便對外界完全可公開的。也就是說具有一定范圍群體的私密性。
3內容的范圍延展性: 交談的內容有些是已發生的;有些是計劃要做的;有些是即興而說的。
4內容的頻次與關聯性:前后交流的內容話題基本上關聯度比較高;前后之間交流內容的跨度不大,內容頻次較高。
5公共話題內容:交流中也會涉及到與話題引發的公眾內容,也就是可以對任何人不存在隱私的內容。
6交互的時長與內容跨度:一般交流的時間與交談內容的跨度不會很大。
然后我們再來分析一下人機語音交互內容的主要方法:
目前主流方法就是通過對相關大數據的訓練并賦予模型深度學習的辦法。當然效果要好就需要有大量的相關數據資源以及技術團隊包括資金的支撐。
最后的結論與正確的做法路徑
1 我們從上述方法與人與人溝通的主要特點對比不難看出:目前主流做法訓練出的人機語音交互還是不能支撐替代人與人實際交流溝通場景的主要內容。
2 正確的做法就是:基于訊飛/百度/Chat GPT基礎上+自有系統上的數據庫(這個才是支撐交互溝通內容的主要部分)而且這個數據庫的內容也必須由用戶/相關人自己隨時根據實際需要來完善增添。
3我們近2年來通過上述辦法開發的人機語音交互軟件,通過實際用戶的使用體驗以及與別家的對比;效果非常明顯;用戶體驗感強;愿意使用,評價較高。當然我們會繼續按此思路不斷完善升級軟件。
-
機器人
+關注
關注
210文章
28191瀏覽量
206505 -
人機語音
+關注
關注
0文章
3瀏覽量
7142
發布評論請先 登錄
相關推薦
評論