高清語音也被稱為寬帶語音,是一種能為蜂窩網(wǎng)絡(luò)、移動電話和無線耳機傳輸高清、自然語音質(zhì)量的音頻技術(shù)。與傳統(tǒng)的窄帶電話相比,高清語音很大程度上提高了語音質(zhì)量,減少了聽覺負擔。
通信產(chǎn)業(yè)鏈上的所有網(wǎng)絡(luò)和設(shè)備都需支持高清語音才能體現(xiàn)出該技術(shù)的優(yōu)點。到2011年6月為止,18個國家運營的20種蜂窩網(wǎng)絡(luò),以及33家領(lǐng)先的手機品牌都已支持高清語音。通過部署自適應(yīng)多速率寬帶(AMR-WB)語音編碼,GSM, WCDMA(UMTS)和LTE蜂窩網(wǎng)絡(luò)中已經(jīng)引入了高清語音。此外, 通過使用改良的子帶編碼(mSBC)語音編解碼技術(shù),無線藍牙耳機也開始支持高清語音,將免提通話與高語音質(zhì)量結(jié)合在了一起。
高清語音的優(yōu)點同樣可以在現(xiàn)有網(wǎng)絡(luò)中體現(xiàn)出來。隨著窄帶網(wǎng)絡(luò)和設(shè)備向高清語音過渡,一種名為帶寬擴展(BWE)的語音處理技術(shù)可以用來在接收終端設(shè)備上模擬類似于高清語音的通話質(zhì)量,為不支持高清語音的設(shè)備提供了一個折中的解決方案。
從窄帶到高清語音
傳統(tǒng)電話系統(tǒng)的帶寬被限制在大約300Hz到3.4kHz的音頻頻率范圍內(nèi)(圖表1),這一范圍通常被稱為窄帶語音。盡管現(xiàn)在的電話系統(tǒng)是數(shù)字式的,但其還是傳承了與傳統(tǒng)模擬系統(tǒng)相同的帶寬。從語音質(zhì)量的角度來看,窄帶語音缺乏自然語音保真度,常常被形容為單薄和模糊不清。盡管如此,窄帶頻率范圍內(nèi)完整語句的語音辨別度大概是99%。
高清語音在采樣頻率為16kHz時音頻帶寬大約為50Hz至7kHz,因此與窄帶語音相比具有更清晰的語音信號。雖然寬帶語音并沒有顯著提高語音清晰度,但是窄帶范圍之外的3.4kHz至7kHz提高了單詞中的摩擦音(例如f、s和th) 的識別度。寬帶語音能夠提供更加自然真實的語音,在主觀音頻質(zhì)量方面比窄帶語音有了顯著的提高。高清語音擴展出的50Hz至300Hz的低頻降低了窄帶語音尖細的特點,而擴展出的高頻則提高了發(fā)音清晰度。
在主觀語音質(zhì)量聽力測試中,寬帶語音在平均意見得分(MOS)中得到4.5分,而窄帶語音則為3.2分(1分為質(zhì)量差,5分為優(yōu)秀)。寬帶語音質(zhì)量的提高減少了聽力負擔和聽者的疲勞,特別是當聽者處于嘈雜的環(huán)境下。移動網(wǎng)絡(luò)運營商Orange在其網(wǎng)站上提供了一個音頻樣本作為高清語音優(yōu)點的例證。2010年6月Orange公司所做的另一項調(diào)查進一步向終端用戶證明了高清語音的價值:
96%的客戶對高清語音通話表示滿意;
86%的測試者表示,兼容高清語音將是他們未來購買手機時的一個選擇標準;
76%的測試者愿意更換手機以獲得高清語音功能。
此外,2006年愛立信和T-Mobile進行的用戶試用調(diào)查也證實了高清語音的優(yōu)點。在150個抽樣用戶中,超過70%的人認為使用了高清語音手機后通話質(zhì)量更好,在嘈雜的環(huán)境中對話質(zhì)量有所提高。
使用高清語音需要語音通信系統(tǒng)中的所有環(huán)節(jié)都支持寬帶語音頻率范圍。采用高清語音技術(shù)的關(guān)鍵是在蜂窩網(wǎng)絡(luò)和手持電話中協(xié)同部署AMR-WB編解碼。作為一種寬帶語音編碼,AMR-WB的有效音頻帶寬是窄帶編碼AMR-NB的兩倍。要完成一個高清語音通話,基站和手持電話之間協(xié)同傳輸以AMR-WB編碼的語音,在這一過程中沒有進行語音修改或從終端到終端的轉(zhuǎn)換編碼。如果高清語音連接無法實現(xiàn),系統(tǒng)就會取而代之使用窄帶AMR-NB編碼。
擴展語音帶寬
可以預(yù)計,在引入高清語音的過程中,通信系統(tǒng)中的某些環(huán)節(jié)會因無法支持而將語音轉(zhuǎn)換為窄帶頻率,這實際上是在降低語音質(zhì)量,增加聽力負擔。人工帶寬擴展(BWE)通過在通信系統(tǒng)的終端環(huán)節(jié)為窄帶語音信號加入人工生成的語音內(nèi)容,彌補在傳輸過程中損失的高頻和低頻語音內(nèi)容。通過這種方法,BWE將高清語音的優(yōu)勢拓展到了窄帶和過渡的混合帶寬的語音通信系統(tǒng)中。
BWE算法使用產(chǎn)生語音的聲源過濾模型來估算和產(chǎn)生擴展頻率范圍內(nèi)的語音內(nèi)容。根據(jù)該模型,語音是由一個聲源(例如聲帶)再加上一個模擬聲道的模型產(chǎn)生的。BWE算法根據(jù)窄帶語音估算出一個寬帶聲源模型,然后利用該模型的參數(shù)估算出其丟失的寬帶頻率內(nèi)容。在實際應(yīng)用中,BWE獨立于源編碼和發(fā)送路徑處理過程的,因此它可以與傳統(tǒng)的窄帶和混合帶寬的電話網(wǎng)絡(luò)共存。
BWE主要應(yīng)用于藍牙耳機和免提設(shè)備。在這些設(shè)備的接收終端上,窄帶CVSD編碼語音信號首先進行解碼,然后經(jīng)過BWE的處理產(chǎn)生給受話方的擴展帶寬語音信號。BWE也可以應(yīng)用在高清語音電話網(wǎng)絡(luò)上,將語音信號擴展到帶寬為14kHz的超寬帶(SWB)頻率范圍。
高清語音和音效增強
將高清語音和音效增強處理方法(如噪聲抑制(NS),回聲消除(AEC) )結(jié)合在一起可以改善在噪聲環(huán)境下的語音清晰度,并可以提高整體通話質(zhì)量。噪聲抑制技術(shù)能夠分析摻雜了噪音的對話,并清除噪音,增加語音辨別度。 噪聲抑制算法通過大量頻點估算出噪聲功率譜密度,然后將噪聲從對話出抽取出來。與窄帶的處理相比,寬帶噪聲抑制在計算噪聲頻譜時包含了更多的頻點數(shù)據(jù)來壓縮擴展頻率范圍內(nèi)的噪聲。除噪聲抑制外,回聲消除處理方法能消除發(fā)話者和麥克風之間的聲音耦合所產(chǎn)生的回音信號?;芈曄?a target="_blank">工作原理是從麥克風接收到的信號中分離出一個經(jīng)過過濾和延遲的副本?;芈曄夹g(shù)能夠計算出寬帶語音中的自適應(yīng)過濾系數(shù)。
藍牙耳機中的高清語音
由于當前藍牙耳機已經(jīng)成為免提移動通話的流行配置,因此它們能夠兼容高清語音是十分重要的。這一功能已經(jīng)通過藍牙m(xù)SBC語音編解碼器變?yōu)楝F(xiàn)實。
藍牙高級音頻分發(fā)模型(A2DP)規(guī)定使用子帶編碼(SBC)為強制音頻編解碼系統(tǒng),以保證手持電話和耳機間的互操作性。SBC是一種低復(fù)雜度的編解碼技術(shù),壓縮比率適中,支持16kHz, 32kHz, 44.1kHz和48kHz的采樣率,也因此成為藍牙高清語音的當然之選。對于16kHz的寬帶語音而言,SBC能以64kbps數(shù)據(jù)速率對其進行4:1的壓縮。但是,當SBC編碼幀通過藍牙傳輸時,它可能與底層藍牙數(shù)據(jù)包不相匹配。因此,mSBC編解碼技術(shù)被開發(fā)用于匹配SBC和藍牙數(shù)據(jù)包,并于2011年5月被定義為 Bluetooth Hands-Free Profile 1.6中的強制編解碼方式。
在編解碼性能方面,mSBC可與ITU-T G.722相媲美,這一寬帶語音編解碼系統(tǒng)通常被用來作為新編解碼系統(tǒng)的質(zhì)量評判參考。一般來說,mSBC在無差錯語音信號方面的客觀音頻質(zhì)量得分比G.722更高。mSBC編碼系統(tǒng)也在多重編碼/解碼通道方面保持了比G.722更高的平均語音質(zhì)量水平。
小結(jié)
與傳統(tǒng)窄帶語音傳輸相比,高清語音提供了十分優(yōu)秀的語音質(zhì)量,減少了在嘈雜環(huán)境中的聽力負擔。在聽力測試和用戶試用中,高清語音都表現(xiàn)出了顯著優(yōu)勢??梢酝ㄟ^在蜂窩網(wǎng)絡(luò)和手持電話中部署AMR-WB語音編解碼系統(tǒng)、在藍牙耳機中部署mSBC語音編解碼系統(tǒng)來實現(xiàn)高清語音。此外,手持電話和耳機中采用噪聲抑制和回音消除等語音處理算法能夠使高清語音體驗更佳。隨著網(wǎng)絡(luò)運營商和設(shè)備生產(chǎn)商逐漸將高清語音引入消費市場,藍牙耳機上的帶寬擴展處理方法能夠?qū)⒏咔逭Z音的優(yōu)點帶給窄帶和混合帶寬的蜂窩網(wǎng)絡(luò)用戶。
-
藍牙耳機
+關(guān)注
關(guān)注
19文章
5660瀏覽量
58891 -
高清語音
+關(guān)注
關(guān)注
0文章
5瀏覽量
8195
原文標題:高清語音技術(shù)(WBS)及其在手機和藍牙耳機中的實現(xiàn)
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論