?

首頁: 電子電路圖,電子技術(shù)資料網(wǎng)站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設(shè)計、新的設(shè)計構(gòu)想等可下載的電子資料！

電子技術(shù)應(yīng)用: 電子技術(shù)應(yīng)用頻道 -- 為電子工程師提供電子產(chǎn)品設(shè)計所需的技術(shù)分析、設(shè)計技巧、設(shè)計工具、測試工具等技術(shù)文章！

電子元器件: 專業(yè)的電子元器件平臺 -- 及時發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機(jī)電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術(shù)論壇: 構(gòu)建電子工程師交流的平臺 -- 在交流中進(jìn)一步學(xué)習(xí)設(shè)計技巧、規(guī)劃技術(shù)人生、提升自我價值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅(qū)動程序單片機(jī)編程數(shù)值算法/人工智能

您的位置：電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

人機(jī)交互的核心對話系統(tǒng)

大小：0.8 MB 人氣： 2017-09-29 需要積分：1

推薦 + 挑錯 + 收藏(0) + 用戶評論（0）

前往下載地址

分享到:

標(biāo)簽：機(jī)器人(199020)對話系統(tǒng)(2153)

　　語音作為互聯(lián)網(wǎng)的一種入口方式，正在侵入我們的生活，人機(jī)交互的核心——對話系統(tǒng)，對交互的應(yīng)用至關(guān)重要，人腦與機(jī)器智能的結(jié)合，能夠突破現(xiàn)有技術(shù)瓶頸嗎？

　　從整個交互系統(tǒng)接入用戶的輸入信息開始，包括語音、人臉、多模態(tài)情感相關(guān)的信息，我們在對話系統(tǒng)里面對輸入的信息進(jìn)行理解，通過這個對話部分以后產(chǎn)生輸出，最后用文字也可以用語音合成展現(xiàn)出來，這就是整個流程，其中我們關(guān)注的最主要的是語音部分以及對話系統(tǒng)部分，其他的多模態(tài)今天的分享不會涉及太多。

　　國內(nèi)研究語音相關(guān)的團(tuán)隊主要包括科研院所、語音技術(shù)公司以及互聯(lián)網(wǎng)公司三部分：

　　科研院所主要包括高校和科學(xué)院，比如科學(xué)院里有聲學(xué)所、自動化所，高校里面研究比較多的清華、北大、西工大、科大、上海交大等，這些都是在語音圈里占有較高位置的老牌隊伍。

　　語音技術(shù)公司包括我們比較熟悉的科大訊飛、云知聲、極限元、思必馳等。

　　互聯(lián)網(wǎng)公司包括BAT、搜狗等擁有強(qiáng)大的語音技術(shù)團(tuán)隊來支撐著其本身的很多業(yè)務(wù)。

　　人機(jī)交互的核心對話系統(tǒng)

　　在應(yīng)用對話系統(tǒng)時，首先從語音輸入開始要有一些前端處理，包括硬件和軟件的前期處理；接下來是語音內(nèi)容，說話人識別等相關(guān)的內(nèi)容進(jìn)行判別，對話系統(tǒng)根據(jù)輸入信息來進(jìn)行對話邏輯的分析，以及對應(yīng)語言的產(chǎn)生，最后由語音合成系統(tǒng)來合成語音，在這里重點介紹一下前端處理、語音識別、說話人識別語音合成等相關(guān)技術(shù)。

　　前端處理技術(shù)的研究進(jìn)展

　　前端處理包括回升消除、噪聲抑制、混響抑制等技術(shù)，剛開始時研究前端處理的人員并不多，近年來特別是ECHO的推出，把一些遠(yuǎn)場的問題融入到語音識別等系統(tǒng)中，所以這部分的研究在這幾年興起比較快，語音識別的研究從一些簡單的數(shù)據(jù)如手機(jī)的錄音擴(kuò)展到遠(yuǎn)場的語音識別，這些促進(jìn)了前端處理技術(shù)的發(fā)展，在語音圈里做前端處理比較牛的應(yīng)該是陳景東老師。

　　人機(jī)交互的核心對話系統(tǒng)

　　回聲消除：回聲消除在遠(yuǎn)場語音識別中是比較典型功能，最典型的應(yīng)用是在智能終端播放音樂的時候，遠(yuǎn)場揚(yáng)聲器播放的音樂會回傳給近端麥克風(fēng)，此時就需要有效的回聲消除算法來抑制遠(yuǎn)端信號的干擾，這是在智能設(shè)備如音響、智能家居當(dāng)中都需要考慮的問題。比較復(fù)雜的回聲消除系統(tǒng)，近端通過麥克風(fēng)陣列采集信號，遠(yuǎn)端是雙聲道揚(yáng)聲器輸出，因此近端需要考慮如何將播出形成算法跟回聲消除算法對接，遠(yuǎn)端需要考慮如何對立體聲信號相關(guān)。

　　人機(jī)交互的核心對話系統(tǒng)

　　噪聲抑制：噪聲抑制可以有多通道的也可以有單通道的，今天主要介紹單通道噪聲抑制，單通道語音增強(qiáng)通過DNN的方法進(jìn)行增強(qiáng)，語音信號是有一個諧波結(jié)構(gòu)的，通過加入噪聲這個諧波結(jié)構(gòu)會被破壞掉，語音增強(qiáng)的主要目的就是抬高波峰，降低波谷，這個訓(xùn)練對DNN來說是比較容易的。但是也有實驗研究表明，基于DNN的語音增強(qiáng)對濁音段效果會比較好，但對輕音段效果并不是很好，語音的濁音段有顯著諧波結(jié)構(gòu)，因此要有目的去訓(xùn)練這個模型。

　　人機(jī)交互的核心對話系統(tǒng)

　　混響抑制：聲音在房間傳輸過程中經(jīng)過墻壁或者其他障礙物的反射后到達(dá)麥克風(fēng)，從而生成混響語音，混響的語音會受到房間大小、聲源麥克風(fēng)的位置、室內(nèi)障礙物等因素的影響，大多數(shù)的房間內(nèi)混響時間大概在200–1000毫秒范圍內(nèi)，如果混響時間過短，聲音會發(fā)干，枯燥無味，不具備清晰感，混響時間過長會使聲音含混不清，需要合適的聲音才能圓潤動聽。

　　前端處理涉及的內(nèi)容比較多，除了前面提到的還包括多說話人分離、說話人移動過程中的聲音采集、不同的麥克風(fēng)陣列結(jié)構(gòu)、各種噪聲和房間模型如何更好的建模等。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

下載地址

不能下載？請通知我們

人機(jī)交互的核心對話系統(tǒng)下載

普通下載普通下載

用戶評論

發(fā)表評論即可獲得積分！ 詳見積分規(guī)則

發(fā)表評論

用戶評論

評價:好評中評差評

發(fā)表評論，獲取積分！請遵守相關(guān)規(guī)定！

or

注冊會員

游客:

分享你我的電子世界

上傳我的電子資料

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

人機(jī)交互的核心對話系統(tǒng)

下載地址

人機(jī)交互的核心對話系統(tǒng)下載

相關(guān)電子資料下載

用戶評論

發(fā)表評論

分享你我的電子世界

實用電子設(shè)計資料下載

源碼下載排行

熱門詞