人機交互的前世今生
自從人類發明了計算機,就持續面臨著一個問題:我們到底應該如何與機器交互?
在計算機的發展歷史上,隨著技術的進步,發生過幾次大的交互模式的演進:近年來的轉變大致可以概括為以鼠標/鍵盤為主的交互模式轉換為以觸摸和語音為主的交互模式。
由此,我們可以預測人機交互的發展趨勢,主要體現在:
交互理念方面,機器從被動接受信息到主動理解信息,以及從滿足基本功能到強調用戶體驗;
交互設備方面,機器輸入、輸出的方式更加自然化、內容多樣化。
顯然,不管是理念的轉變還是設備的升級,我們和機器的交互方式上經歷了一個從人適應機器,到機器適應人的過程。
語音交互解決人機交互痛點
語言是什么?是人類最牛逼的發明,是人類進化的產物。
人類通過語言,能夠把對世界的理解,想傳遞的信息,壓縮成一串很短的文字輸入給對方,對方聽完以后,能根據這些文字,還原事件、圖像,以及情感。
鼠標/鍵盤本質上不是一種交互方式,而是一種輸入設備,真正的交互方式其實是以語言為載體的“命令”。
正如微軟創始人比爾?蓋茨如所言:“人類自然形成的與自然界溝通的認知習慣和形式必定是人機交互的發展方向”。
隨著人工智能技術的發展,自然語言交互必定是實現“命令自然化”的關鍵突破口。語言聲學技術為人機交互注入了智能屬性,交互不再是精確的“指令”。
在上世紀出現Google、百度等搜索引擎的時候,交互還是單向的,但出現智能手機之后我們的交互變成了雙向。比如蘋果的交互史,在剛開始做出來第一代iPhone的時候并沒有語音交互的能力,但經過市場調研之后發現有75%的用戶都希望有語音控制。于是,在后面兩代iPhone加入了語音控制,但到后面發現實際使用的用戶竟然不到5%,蘋果經過總結之后發現不僅僅是語音,還必須有自然語言交互。
正如我們對自然語言處理技術的應用場景的想象,關鍵在于足夠自然,人工智能永遠都在追趕最高的自然智能。
信息文明走向智能文明 ,機器需適應人類的自然語言體系,然后完成任務。
語音識別+聲紋識別:人機交互這么做就對了!
以智能音箱為例,需要其不再是基于幾個關鍵詞來反饋結果,而是能夠理解用戶的語言指令,完成一項完整的任務。
一方面,語音交互將使智能音箱跳出了傳統的“命令式交互系統”,你可以說“為我播放一首爵士樂”、“為我查一下明天的天氣”等這類不再精確的指令。機器擁有理解人類語言、分析語言意圖,進行更多的決策的可能。
另一方面,語音技術的進展使得我們可以遠距離控制設備。在移動互聯網時代,用戶需要更為方便自然的人機交互方式。當互聯網從個人電腦向移動終端遷移,人們在走路、開車、吃飯時都可以通過互聯網獲取信息、完成任務,語音交互的非接觸性,解放了雙手,成為了快捷方便的方式。
“萬物互聯”時代下的人機交互:以用戶為中心,使產品主動為受眾的提供服務
隨著5G的發展和互聯網技術的不斷成熟,人類已經進入到了一個萬物互聯的“大連接”時代,“大連接”的目的是為了讓人類的生活更加美好,更加便利。
設備被賦予的大量連接,連接為交互建立了通道。交互通道建立后的下一步,是用人工智能技術為“大連接”時代賦能。
語音交互遠距離控制的特性,極大地增加了可交互設備的數量,有利于智能設備的快速普及。
在未來全面智能化、萬物互聯的生活中,真實使用場景總是有多個聲源和環境噪聲疊加,比如經常會出現周邊噪聲干擾和多人同時說話的場景。
想象一下,如果所有的智能設備都在同一時間點被觸發,“隨意”的為用戶展示信息,身處其中的大家可能會立刻瘋掉。這時候,用聲紋識別技術讓智能設備可以識別“主人身份”就顯得格外重要(語音識別是識別你說的話,而聲紋識別是指識別說話的人是誰)。未來更多的智能設備上面將配有聲紋識別,更將大大的提高設備的安全性。
快商通聲紋識別:讓智能設備認識你,聽懂你
以前的語音交互大多是服務為主,以產品為核心,是根據產品找用戶。
目前,作為聲紋身份認證與智能語音交互解決方案提供商,快商通推出以用戶為中心的智能交互解決方案:
通過遠場聲紋識別技術,讓智能設備能夠自然快速識別用戶身份,從而時刻感知用戶需求的本質來源,記憶用戶行為習慣和各類偏好。通過自然語言交互,分析用戶語言背后的真實意圖,并隨之快速作出合理的反應,并能在之后的生活中不斷地進行調整。
方案集成聲紋識別、聲學處理、自然語言處理、深度神經網絡等核心AI智能技術,以唯一性和安全性為基礎,打造“人性化”的人機交互,解決智能設備的誤觸發及個性化服務痛點:
快商通原創的語音與聲學處理技術能夠保證機器能夠聽得準真實環境下人的聲音,使智能設備在充滿噪聲干擾和多人同時說話的場景中,仍然能保持95%以上的識別準確率,同時處理多人聲紋身份識別的問題。
智能設備們除了能只被特定成員喚醒外,還能根據不同成員的習慣和喜好進行個性化推薦。唯有你能在你的整個智能生活的中心隨心所欲。
快商通是一家以人工智能技術為核心的創新型科技公司,專注于聲紋識別與自然語言處理技術的研發與創新,完全自主知識產權的聲紋識別技術達到世界領先水平。
目前,快商通已為大量終端設備廠商提供優質的遠場聲紋識別與語義理解技術支持。用戶可在不同場景下通過遠場語音交互。進行自然語言交互,享受科技給生活帶來的便利。未來,將攜手人工智能生態鏈上下游合作伙伴,持續推進更自然、更智能、更人性化的人機交互發展,讓人工智能更好的服務人類。
快商通技術方案優勢:
1.復雜場景下的身份識別與喚醒:結合聲源定位和前端聲學處理技術,解決誤觸發,交互過程自然高效。
2.深層次理解:結合場景、世界知識和歷史交互信息,再對語義、語用和情感進行深層次理解,提升能交互效率和機器決策準確度。
3.擬人式對話:在系統的輸出側,能夠以高逼真度、高自然度、和高準確度度的擬人形象、用詞、和表達方式來和用戶交互,就能大大減小對用戶感知能力的要求。
4.個性化交互:與不同人交互時,智能設備提供的交互方式和內容是用戶所感興趣的。
發布評論請先 登錄
相關推薦
評論