智能語音交互技術(shù)是指通過語音識(shí)別、語音合成和自然語言理解等技術(shù),實(shí)現(xiàn)人與機(jī)器之間自然語言的交流和互動(dòng)。隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語音交互技術(shù)也越來越多的在日常工作、生活中應(yīng)用,智能語音交互的出現(xiàn)不僅僅大量節(jié)省了人工的工作時(shí)間提高了工作效率,為人們工作生活帶來便利的同時(shí),也改變著人類學(xué)習(xí)、生活、娛樂、工作和出行的方式。
在眾多的智能語音交互使用場(chǎng)景中,人機(jī)自然對(duì)話是智能語音交互技術(shù)最為普遍的場(chǎng)景之一。智能語音交互技術(shù)首先將人的語音信號(hào)轉(zhuǎn)化為機(jī)器能夠理解和處理的文本信息,然后通過深度學(xué)習(xí)和自然語言處理技術(shù)識(shí)別出人類的意圖和情感,并根據(jù)對(duì)話模型輸出對(duì)應(yīng)的文本信息,再將由機(jī)器生成的文本信息轉(zhuǎn)化為自然流暢的語音音頻進(jìn)行播報(bào),從而解決人們的提出的問題。在實(shí)際的應(yīng)用案例中,我們以標(biāo)貝科技經(jīng)手的某企業(yè)可視化門鈴實(shí)現(xiàn)人機(jī)自然對(duì)話的案例為分析對(duì)象,標(biāo)貝科技為大家一起解讀智能語音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話的過程。
首先需求企業(yè)的企業(yè)背景介紹:需求方公司是一家日本生產(chǎn)影像與信息產(chǎn)品的綜合性公司,在全球擁有200家子公司,企主要產(chǎn)品包括照相機(jī)及鏡頭、數(shù)碼相機(jī)、打印機(jī)、復(fù)印機(jī)、傳真機(jī)、掃描儀、廣播設(shè)備、醫(yī)療器材及半導(dǎo)體生產(chǎn)設(shè)備等,在全球擁有較高的知名度。
其次,在解決用戶問題前,我們需要了解客戶的需求場(chǎng)景:
需求場(chǎng)景一:為提高企業(yè)內(nèi)部溝通效率,企業(yè)需要對(duì)企業(yè)內(nèi)部使用的可視化門鈴增加智能語音交互功能;
需求場(chǎng)景二:為提升員工工作體驗(yàn),需要可視化門鈴語音播報(bào)的音色盡可能還原真人音色;
需求場(chǎng)景三:現(xiàn)有設(shè)備不能準(zhǔn)確朗讀企業(yè)內(nèi)各型號(hào)設(shè)備的復(fù)雜參數(shù),需要提升其設(shè)備的識(shí)別準(zhǔn)確率。
此外,在了解用戶使用場(chǎng)景后,我們需要了解企業(yè)現(xiàn)有產(chǎn)品在人機(jī)對(duì)話中存在需要解決的問題/痛點(diǎn)。
問題一:現(xiàn)有設(shè)備的語音合成系統(tǒng)閱讀準(zhǔn)確率較低,經(jīng)常讀錯(cuò)專業(yè)術(shù)語和產(chǎn)品型號(hào),信息傳遞出現(xiàn)錯(cuò)誤,導(dǎo)致溝通效率低,嚴(yán)重影響了工作效率和員工使用體驗(yàn)。
問題二:設(shè)備合成音色無感情色彩、機(jī)械化。現(xiàn)有可視化門鈴語音播報(bào)是標(biāo)準(zhǔn)機(jī)械音,缺乏情感表達(dá),導(dǎo)致員工使用體驗(yàn)差。
針對(duì)客戶的場(chǎng)景需求和使用痛點(diǎn),標(biāo)貝提供以下解決方案和產(chǎn)品來解決用戶產(chǎn)品在使用過程中存在的問題/痛點(diǎn)。
針對(duì)語音合成系統(tǒng)閱讀準(zhǔn)確率低的問題:對(duì)該企業(yè)提供的專業(yè)術(shù)語文本(包含數(shù)字、符號(hào)等)對(duì)原有的語言模型進(jìn)行優(yōu)化,將語音合成系統(tǒng)的閱讀準(zhǔn)確率提升至百分百。
針對(duì)音色無感情色彩、機(jī)械化的問題:標(biāo)貝科技為該企業(yè)提供篩選專業(yè)化的聲優(yōu)音色,并提供專業(yè)錄音棚,通過采集和標(biāo)注音色庫為客戶量身打造專屬音色。為了使音色播報(bào)更加自然,標(biāo)貝科技綜合利用聲學(xué)和語言學(xué)參數(shù),使用算法使音色更加真實(shí)飽滿音質(zhì),播報(bào)時(shí)聲音抑揚(yáng)頓挫、富有表現(xiàn)力,
最后,為了使該企業(yè)員工使用更加方便,采用了集成嵌入式版本,這樣即使在離線情況下,設(shè)備仍可實(shí)現(xiàn)人機(jī)自然對(duì)話的能力。
該企業(yè)的設(shè)備實(shí)現(xiàn)人機(jī)交互工期共3個(gè)月,在該產(chǎn)品交付并使用一段時(shí)間后,內(nèi)部使用反饋如下:
- 語音合成系統(tǒng)準(zhǔn)確率達(dá)到百分之百,使得內(nèi)部溝通效率得到明顯提升,節(jié)省了員工的大量溝通時(shí)間,大大的提升了員工的溝通效率。
- 定制的語音播報(bào)音色接近自然人聲,親切自然,減少了陌生感,播報(bào)準(zhǔn)確,進(jìn)一步提高了信息傳達(dá)的質(zhì)量。
- 定制的TTS系統(tǒng)成功集成到客戶的嵌入式設(shè)備中,并持續(xù)收集用戶反饋,使音色和朗讀功能得到不斷優(yōu)化。
以上是關(guān)于標(biāo)貝科技的語音智能交互技術(shù)應(yīng)用實(shí)際案例,標(biāo)貝科技是專業(yè)的AI語音交互和AI數(shù)據(jù)服務(wù)商,擁有豐富的智能語音交互項(xiàng)目落地執(zhí)行經(jīng)驗(yàn),完善的數(shù)據(jù)采標(biāo)技術(shù),可同時(shí)滿足語音交互、數(shù)據(jù)采標(biāo)、個(gè)性化定制解決方案的客戶需求。以上所列出的案例也僅僅是標(biāo)貝科技眾多實(shí)施案例之一,更多的實(shí)際應(yīng)用案例請(qǐng)隨時(shí)關(guān)注我們哦~
-
智能家居
+關(guān)注
關(guān)注
1926文章
9523瀏覽量
184373 -
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1725瀏覽量
112565 -
人工智能
+關(guān)注
關(guān)注
1791文章
46896瀏覽量
237666 -
語音合成
+關(guān)注
關(guān)注
2文章
87瀏覽量
16140
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論