數(shù)字化時(shí)代風(fēng)口常立,身處潮起浪涌的技術(shù)圈,越能從前沿動(dòng)態(tài)中感受行業(yè)動(dòng)態(tài)與趨勢。在這個(gè)融合物理與虛擬的全新時(shí)代,由AI驅(qū)動(dòng)的AI助手如同互聯(lián)網(wǎng)時(shí)代的PC,移動(dòng)互聯(lián)網(wǎng)時(shí)代的智能手機(jī),成為我們進(jìn)入智能時(shí)代的超級(jí)入口。
在主題為“未來經(jīng)濟(jì),數(shù)字優(yōu)先”的2020騰訊全球數(shù)字生態(tài)大會(huì)上,AI行業(yè)內(nèi)的專業(yè)人士集中討論了AI助手演進(jìn)的最新成果。作為智聯(lián)網(wǎng)時(shí)代人機(jī)交互入口,AI助手在AI賦能下帶來行業(yè)解決方案,以AI語音交互能力為核心,結(jié)合知識(shí)圖譜、IP虛擬形象、全雙工等優(yōu)勢能力的打造,對(duì)傳統(tǒng)對(duì)話機(jī)器人做全方位升級(jí),讓AI助手也能具備社會(huì)人的屬性。
簡單來說,就是AI助手能夠滿足更多個(gè)性化、場景化、情感化的需求,在“工作崗位”上幫助企業(yè)提升效率、節(jié)約成本、增強(qiáng)效果,而這一切,離不開AI語音助手從技術(shù)層面為AI助手“大開腦洞”。
結(jié)合騰訊智能平臺(tái)副總裁李學(xué)朝在論壇上以“騰訊云小微,打造數(shù)字員工助力行業(yè)升級(jí)”為主題的演講,讓我們走進(jìn)AI技術(shù)賦能下AI助手的技術(shù)和應(yīng)用升級(jí)。
全雙工交互實(shí)現(xiàn)AI助手自然對(duì)話,打造情感化的語音交互
從技術(shù)層面來看,實(shí)現(xiàn)AI助手的對(duì)話交互難度并不大,面對(duì)一般指令如“今天的天氣怎么樣”,或者是執(zhí)行一些簡單的任務(wù),如播放音樂等,每一次問答都屬于語音交互的范疇。
但是如何讓交互變交流,打造自然流暢的對(duì)話體驗(yàn),更符合真實(shí)業(yè)務(wù)場景的需求,就需要在技術(shù)端通過技術(shù)創(chuàng)新賦予AI助手有情感的靈魂。
為此,騰訊云小微AI語音助手提供了解決方案,以全領(lǐng)域、全雙工實(shí)現(xiàn)全業(yè)務(wù)場景覆蓋,以ASR+NLP雙向拒識(shí)判斷極大降低錯(cuò)誤響應(yīng)概率(誤識(shí)率 《 0.01 且 拒識(shí)率 《 0.1),以流式語義+語義VAD在低延遲下真正做到邊聽邊思考,共同組成AI助手自然對(duì)話的基礎(chǔ)。
其中全雙工交互可以做到一次喚醒實(shí)現(xiàn)多輪連續(xù)自由對(duì)話,并且可以隨時(shí)打斷,AI助手也可以準(zhǔn)確拾取相關(guān)指令并作出正確反饋。相較于“單工”和“半雙工”技術(shù),可以做到雙向?qū)崟r(shí)交流。單一場景下的全雙工交互技術(shù)比較好理解,例如播放音樂時(shí)可以連續(xù)指令“現(xiàn)在播放的這首歌是什么名字”、“幫我收藏這首歌“等等。
而在全領(lǐng)域人機(jī)交互中,人們的對(duì)話可能穿插著很多議題,不受場景的限制實(shí)現(xiàn)自然交互。面對(duì)任務(wù)型+問答型+閑聊的全業(yè)務(wù)場景,如在車載環(huán)境中,騰訊云小微車載語音助手能夠根據(jù)車內(nèi)收音的音區(qū)判別發(fā)出指令的用戶,同時(shí)結(jié)合背景噪音的識(shí)別、多人聊天背景音等環(huán)境音的識(shí)別分析,拾取用戶跟車機(jī)對(duì)話的指令,回答用戶所需。
與此同時(shí),騰訊云小微AI語音助手實(shí)現(xiàn)的AI助手還整合了語音交互、自然語言理解、聲紋識(shí)別、圖像識(shí)別等AI能力,面向不同場景復(fù)雜噪聲針對(duì)性提升技術(shù)能力,不斷提高復(fù)雜噪聲環(huán)境下喚醒率、語音識(shí)別準(zhǔn)確率及意圖理解準(zhǔn)確率,為用戶提供自然、豐富的交互服務(wù)。其中以ASR+NLP雙向拒識(shí)判斷為技術(shù)特點(diǎn),極大降低錯(cuò)誤響應(yīng)概率,誤識(shí)率《 0.01且拒識(shí)率《 0.1。
另外在自然交流中從聽懂到準(zhǔn)確表達(dá),還需要AI助手在流式語義處理方式取得突破,騰訊云小微AI語音助手能夠以200毫秒為單位上傳語音,讓云端大腦能夠做到邊聽邊想,同時(shí)結(jié)合場景和上下文預(yù)測用戶語義,提前思考怎么回復(fù),在低延時(shí)特性下從加快響應(yīng)的速度。
知識(shí)圖譜提升AI助手生產(chǎn)力,成為AI語音助手進(jìn)步的階梯
在大會(huì)中,李學(xué)朝對(duì)AI助手的專業(yè)拋出了這樣的觀點(diǎn),“人工智能不是人工智障,云小微的知識(shí)圖譜能力作為機(jī)器人的大腦,將專業(yè)知識(shí)網(wǎng)狀串聯(lián)起來,不僅直線思考,還能推理、判斷,提供更加專業(yè)的業(yè)務(wù)服務(wù)。”
其實(shí)對(duì)于AI領(lǐng)域來說,知識(shí)圖譜的重要性在現(xiàn)在、未來都不言而喻。知識(shí)圖譜對(duì)于人工智能的重要價(jià)值在于,知識(shí)是人工智能的基石。機(jī)器可以模仿人類的視覺、聽覺等感知能力,但這種感知能力不是人類的專屬,動(dòng)物也具備感知能力,甚至某些感知能力比人類更強(qiáng),比如狗的嗅覺。
如何讓AI助手具備認(rèn)知能力,從而有效提升生產(chǎn)力?騰訊云小微的做法值得思考,在程序設(shè)計(jì)上詳細(xì)展示了AI助手的“成長”經(jīng)歷。
一是通過知識(shí)抽取,構(gòu)建行業(yè)知識(shí)圖譜。為了讓AI助手更深刻的理解行業(yè)知識(shí),云小微知識(shí)圖譜平臺(tái)支持從行業(yè)數(shù)據(jù)中抽取出行業(yè)知識(shí),助力行業(yè)伙伴構(gòu)建行業(yè)專屬的知識(shí)圖譜。如在旅游行業(yè),AI導(dǎo)游福大人身為內(nèi)閣大學(xué)士,不僅能跟游客閑聊互動(dòng),還能為游客推薦個(gè)性化的游覽路線,講解景點(diǎn)文物,暢聊歷史趣聞軼事。在大數(shù)據(jù)的支持下,源源不斷的旅游行業(yè)知識(shí)圖譜和資源數(shù)據(jù)涌入AI導(dǎo)游福大人的通用知識(shí)庫,讓AI助手在行業(yè)服務(wù)中發(fā)揮顯著作用。
二是通過知識(shí)融合,打破行業(yè)知識(shí)孤島。為了打破各行業(yè)間的知識(shí)孤島,云小微以自有的海量通用知識(shí)為中心,通過實(shí)體鏈接、屬性融合等多種知識(shí)融合技術(shù),連接各行業(yè)的知識(shí)圖譜。如在AI助手的客服應(yīng)用落地中,騰訊云小微AI語音助手重視知識(shí)圖譜的作用,將文本模式分類拆分為知識(shí)庫檢索、服務(wù)售前、服務(wù)售后等模式,檢索為功能性檢索,售前、售后可根據(jù)問題回答策略轉(zhuǎn)向人工模式。其中分層模塊的搭建上注重知識(shí)庫的基礎(chǔ)搭建,使得模塊分工明確,流程簡單。
三是通過知識(shí)關(guān)聯(lián),整合行業(yè)資源數(shù)據(jù)。通過知識(shí)關(guān)聯(lián)將多源異構(gòu)的行業(yè)資源鏈接到知識(shí)圖譜中,形成知識(shí)大腦,賦予數(shù)字員工更豐富的能力。這一點(diǎn)AI助手利用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系,把行業(yè)知識(shí)、資源數(shù)據(jù)與通用圖譜進(jìn)行關(guān)聯(lián),形成知識(shí)大腦,讓AI助手成為具備問答、可視化、數(shù)據(jù)治理、主動(dòng)服務(wù)等能力的知識(shí)圖譜平臺(tái)。
因此在不同領(lǐng)域,AI技術(shù)將碎片化、多模態(tài)的數(shù)據(jù)經(jīng)過抽取、融合、關(guān)聯(lián)后形成知識(shí)圖譜,高效利用原始數(shù)據(jù),進(jìn)而支撐數(shù)據(jù)推理、模型應(yīng)用分析,真正實(shí)現(xiàn)專業(yè)能力的提升。
虛擬形象賦予AI助手個(gè)性化特征,讓人機(jī)交互體驗(yàn)耳目一新
隨著人工智能水平的不斷進(jìn)步,AI早已不再是冷冰冰的科技,而是演變成為能幫助人類享受智慧生活、守護(hù)情感世界的好幫手。其中AI助手所實(shí)現(xiàn)的數(shù)字員工如虛擬導(dǎo)游、虛擬客服、虛擬老師,以豐富的 IP 形象庫+細(xì)膩的情感呈現(xiàn)讓AI助手帶來的人機(jī)交互體驗(yàn)更為形象生動(dòng)。
比如在AI助手形象塑造上,通過騰訊云小微AI語音助手提供的虛擬形象服務(wù),騰訊云小微AI語音助手提供了包括從語音的識(shí)別到形象輸出的全鏈條完整方案。客戶可以根據(jù)實(shí)際使用場景的需要,來選擇不同的方案落地。如果對(duì)形象有要求,騰訊云小微支持為企業(yè)打造專屬的2D3D形象;騰訊云小微還與騰訊海量的IP資源進(jìn)行授權(quán)合作,企業(yè)可以結(jié)合熱門IP,打造更加有特色的數(shù)字化服務(wù),引發(fā)更多的關(guān)注及話題。
如在虛擬客服的應(yīng)用中,AI助手通過AI自動(dòng)預(yù)測表情、實(shí)時(shí)處理唇形,語音合成技術(shù),使得效果逼真足以媲美真人;提供50+種不同男女聲音色,個(gè)性化音色定制能力,王者榮耀妲己、李白定制語音包;采用業(yè)內(nèi)領(lǐng)先的算法,優(yōu)化不同場景中的語音音色,以及語音識(shí)別、語義理解等智能交互技術(shù),讓AI語音助手發(fā)聲更為自然。
如果對(duì)情感呈現(xiàn)有要求,通過AI助手細(xì)膩的情感化呈現(xiàn)技術(shù)方案,虛擬人的情緒可以表現(xiàn)在跟用戶互動(dòng)過程中的肢體動(dòng)作、面部表情以及聲音情緒等上面,讓虛擬人的表現(xiàn)更加情感化。
如在本次大會(huì)上亮相的《鏡·雙城》中的女主那笙,從動(dòng)漫世界走進(jìn)論壇現(xiàn)場,化身為能說會(huì)道,還能思考,推理判斷,業(yè)務(wù)能力超強(qiáng)的AI助手,通過表情、動(dòng)作一邊說話一邊表達(dá)情緒,讓機(jī)器人的服務(wù)不再冷冰冰,而是更加立體、有溫度。
擁抱數(shù)字化未來,專業(yè)、自然、形象的AI助手擁有怎樣的“未來密碼”?
從前沿科技到行業(yè)落地有多遠(yuǎn)?在數(shù)字化浪潮中,一個(gè)專業(yè)、自然、形象的AI助手無疑會(huì)成為行業(yè)升級(jí)的可靠助力,隨著5G高帶寬與實(shí)時(shí)運(yùn)算的不斷增強(qiáng),AI助手的應(yīng)用場景還將進(jìn)一步得到激活。
正如李學(xué)朝對(duì)未來的展望所言,“騰訊云小微會(huì)持續(xù)發(fā)力優(yōu)勢賽道,結(jié)合場景打造產(chǎn)品化能力,在出行、政務(wù)、文旅、教育等行業(yè),通過我們技術(shù)-產(chǎn)品-場景化方案,優(yōu)化企業(yè)成本結(jié)構(gòu),挖掘產(chǎn)業(yè)新價(jià)值,打造產(chǎn)業(yè)新動(dòng)能。”
利用越來越自然的人機(jī)交互方式,AI助手結(jié)合IP虛擬形象和語音交互,成為文旅、在線教育、客服等領(lǐng)域的常客,豐富生動(dòng)的形象還可以在深度開發(fā)中實(shí)現(xiàn)性格的定制,提升服務(wù)價(jià)值。
作為全面鏈接智能的新生態(tài),AI助手利用自身強(qiáng)大的AI能力幫助行業(yè)為用戶提供從需求到服務(wù)被滿足的智慧鏈接。如在虛擬客服的應(yīng)用中,AI助手更加智能,更懂用戶需求,即時(shí)、流暢的應(yīng)答,極大的提升了用戶的使用體驗(yàn)。同時(shí)還能通過算法的優(yōu)化為出行生活增添便利,幫助用戶在細(xì)微瑣事上完成決策,用“信息便利”減少“身體能量消耗”,讓精力用到更值得的地方。
未來,AI助手還將持續(xù)為產(chǎn)業(yè)互聯(lián)提供新動(dòng)能,不斷助力企業(yè)提升服務(wù)水平,為消費(fèi)者帶來更好的使用體驗(yàn)。
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1200瀏覽量
55321 -
AI
+關(guān)注
關(guān)注
87文章
30146瀏覽量
268419 -
語音交互
+關(guān)注
關(guān)注
3文章
283瀏覽量
27983
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論