【嘉德點(diǎn)評】三星發(fā)明的可以完成精準(zhǔn)語音識別任務(wù)的語音識別助手,在交互時無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此,可以簡便且準(zhǔn)確地采用語音識別方式來實(shí)現(xiàn)交互任務(wù)。
集微網(wǎng)消息,在2019年,三星就曾預(yù)告過新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進(jìn)行對話,并有一定的感知能力。NEON的網(wǎng)站上宣傳其外觀和行為都像真實(shí)的人類,能夠表現(xiàn)出情感和智慧,而據(jù)相關(guān)消息,三星最終將隨三星Galaxy S21 Ultra獨(dú)家發(fā)售這款數(shù)字助手。
數(shù)字助手首先也是一款手機(jī)助手軟件,目前,智能手機(jī)能夠提供各種類型的應(yīng)用服務(wù),其中就包括手機(jī)助手軟件,用戶可以通過語音、文字等方式與智能手機(jī)之間進(jìn)行交互,智能手機(jī)通過該語音識別助手軟件識別語音后,提供對應(yīng)的應(yīng)用服務(wù)。
智能手機(jī)識別語音的功能可以有三種方式:交互任務(wù)型、知識問答型及閑聊型。其中,交互任務(wù)型語音識別方式使得用戶可以通過直接的語音輸入,由智能手機(jī)識別該語音,完成與智能手機(jī)的應(yīng)用服務(wù)之間的交互意圖,而無需進(jìn)行多次語音識別界面的操作。
但是,智能手機(jī)提供的交互任務(wù)型語音識別方式對用戶來說,使用率并不高,這是因?yàn)橛脩粼谕ㄟ^語音操控智能手機(jī)時,存在以下缺點(diǎn):1)公眾場合不適合使用語音,有隱私問題;2) 智能手機(jī)處于嘈雜的遠(yuǎn)程環(huán)境下,語音識別的效果不佳;3)因?yàn)橛脩舭l(fā)音不準(zhǔn)確,形同意思的表述方式多樣等因素,語音識別和語音理解的準(zhǔn)確率還需要提高;4)有些用戶不習(xí)慣使用智能手機(jī)提供的語音識別界面。
那么,智能手機(jī)該如何在這些條件下簡便且準(zhǔn)確地采用語音識別方式實(shí)現(xiàn)交互任務(wù)呢?為此,三星在2019年9月27日申請了一項(xiàng)名為“一種采用語音識別方式實(shí)現(xiàn)交互任務(wù)的方法及系統(tǒng)”的發(fā)明專利(申請?zhí)枺?01910921533.6),申請人為三星電子(中國)研發(fā)中心和三星電子株式會社。
根據(jù)該專利目前公開的資料,讓我們一起來看看這項(xiàng)應(yīng)用于智能設(shè)備的語音識別方法及系統(tǒng)吧。
如上圖,為該專利中發(fā)明的采用語音識別方式實(shí)現(xiàn)交互任務(wù)的方法流程示意圖,首先,系統(tǒng)會基于當(dāng)前環(huán)境進(jìn)行語音識別來得到文本以及語義信息,基于得到的文本以及語義信息,來確定對應(yīng)的上下文信息,且劃分不同的場景,基于不同的場景來在系統(tǒng)中匹配不同的語音技能推薦表。
這種利用語音技能推薦表的方式,可以更加準(zhǔn)確的應(yīng)對不同的場景,通過事先準(zhǔn)備好豐富的語料庫,就可以非常人性化的與用戶進(jìn)行對話以及完成相應(yīng)的操作。而當(dāng)要實(shí)現(xiàn)交互任務(wù)時,則會根據(jù)語音技能推薦表執(zhí)行智能手機(jī)的交互任務(wù)。同時,由于是智能助手主動分析用戶所處場景,并主動提供相關(guān)的操作服務(wù),因此無需用戶主動發(fā)起語音喚醒,而是由語音助手主動為用戶提供相關(guān)服務(wù),只需用戶進(jìn)行選擇即可。
如上圖,為這種采用語音識別方式實(shí)現(xiàn)交互任務(wù)的方法子流程圖,當(dāng)用戶喚醒語音助手插件模塊時,語音助手插件模塊被觸發(fā),該模塊通知語言輸入信息采集模塊啟動信息采集,信息采集模塊通過上下文感知模塊獲取到當(dāng)前的環(huán)境信息,再向語音助手插件模塊發(fā)送請求,來獲取從用戶語音識別得到的文本,以及做自然語言理解后的語義信息。
之后,語言輸入信息采集模塊將采集到的文本、語義信息及當(dāng)前的環(huán)境信息傳輸給語言技能生成模塊,由此來生成語言技能庫,并通知語言技能推薦模塊。
語言技能推薦模塊在特定情況下可以啟動,將大量不同的上下文劃分到若干類場景中,對每個場景生成相應(yīng)的語言技能推薦表。
如上圖,為在手機(jī)上使用語言技能推薦表的展示圖,該款語音助手插件模塊為Bixby,當(dāng)每次都調(diào)用Bixby時,都會顯示出語言技能推薦表,并且場景不同,該語言技能推薦表中的推薦技能偶讀不同。
例如,經(jīng)過學(xué)習(xí)后,如果用戶打開手機(jī)并且喚醒了Bixby,則就可以觸發(fā)語言技能推薦表的展示,當(dāng)用戶選擇某條推薦的語言技能時,將該語言技能推薦表中的文本用作用戶語言輸入識別的結(jié)果,以完成后續(xù)用戶的指令。
以上就是三星發(fā)明的可以完成精準(zhǔn)語音識別任務(wù)的靜默式語音識別助手,其在實(shí)現(xiàn)交互任務(wù)時,基于當(dāng)前環(huán)境下對語音識別得到文本以及語音信息,在交互時無需發(fā)出語音,僅通過用戶少量選擇操作就可以完成復(fù)雜的交互任務(wù),因此可以簡便且準(zhǔn)確地采用語音識別方式來實(shí)現(xiàn)交互任務(wù)。
責(zé)任編輯:xj
-
三星電子
+關(guān)注
關(guān)注
34文章
15856瀏覽量
180929 -
語音助手
+關(guān)注
關(guān)注
7文章
235瀏覽量
26793
發(fā)布評論請先 登錄
相關(guān)推薦
評論