音箱行業有著悠久的歷史,但是在過去十多年里,傳統的音箱行業面臨著極大的市場困境,例如藍牙音箱剛出現各個廠商便直接殺成了一片紅海。而2015年隨著智能音箱的涌現,特別是亞馬遜的Echo、京東的叮咚、阿里的小飛,不僅對外展現出了智能音箱行業百花齊放的局面,也使沉悶的音箱市場看到了突破性發展的希望。但是,隨著這些巨頭們的集體涌入,這也讓在智能音箱行業摸爬滾打的創業者倍感艱難。
音箱特別是中高端音箱,本來就是強調品牌且技術門檻較高的領域。而智能音箱將聲學設計、無線技術、語音識別、遠場拾音、語義分析等眾多技術融合在一起,不僅技術更為復雜,而且更加依賴音樂內容平臺的支持,這些諸多因素都是創業者需要直面解決的難題。當然,技術還是其中的根本
當將語音識別算法接入到設備時,務必要保證設備的音頻通路具有足夠的質量。因此對設備進行音頻測試,以評估能夠影響語音識別性能的音頻前端的音頻參數。如下要點對語音識別至關重要:
自然聲音
合適的增益
良好的信噪比
一致的響應,信號不能包括如下信息: 自動增益控制 AGC 啟動響應 直流偏置過大
適當的頻響 (高低滾降,理想平滑,沒有混跌)
二、測試設備
帶有錄音軟件的被測試設備
音頻測試儀器:CD機,均衡器,音箱,人工嘴和聲壓計
帶分析工具的PC機(CoolEditor、Audition、Audacity和Wavesurfer等)
三、音頻文件
正常音頻文件:用于主觀判斷音頻質量和增益設置以及信噪比;
大增益文件:用于判定削波時的增益設置;
1K-sine增益Sweep文件0~105dB:用于評估削波,決定最大數值和判定AGC存在與否;
0~8K/16K掃頻文件:用于測試設備的頻響和混跌;
四、測試項目
1. 主觀聽音
用質量好的耳機去聽設備的音質,從而發現一些非正常聲音;比如:雜音、諧波和共振等;
音頻路徑上過多的信號處理可能導致聲音畸變為人造聲,不符合正常自然聲音,會對軟件識別造成很大困難。
2. 增益評估
設備在各種使用場景下,務必保持增益的設置不要使信號削波;削波會嚴重降低識別性能,必須禁止。
95dB的聲音應該剛好填滿16bit音程;
3. 信噪比
靜默值作為底噪,聲音波形的中部作為信號;尤其注意某些記錄將具有數據實際值為零的引導/拖尾部分,不要使用這部分作為靜默測量;麥克風單體的信噪比,除了本身規格書之外,在實際產品中收到電路噪聲影響很大,尤其注意模擬麥克風bias電源。
信號比:S/N>30對于識別是良好的比值,大于20也是可行的;如果小于20的話,則說明音頻路徑上太吵了導致很難識別成功。
4. 自動增益控制AGC
AGC的存在,當音頻信號的幅度增大時,它通常表現為增益逐步減小。它會影響識別效果,所以得關閉此功能,類似的有自動電平控制寄存器ALC等。
同時部分功放帶有動態調節音量的功能,務必關閉此項功能,否則嚴重影響AEC效果;所有的動態調節都務必在AEC采樣點之前進行,具體如下圖示意:
5. 啟動瞬態Startup transients
音頻系統經常在錄音命令下達后,需要一段時間才能真正啟動操作,這導致了啟動瞬態;如果這主要包括低頻的話,將不會對識別造成影響,因為識別器中有低通濾波器。
然而試圖消除瞬態的話,將信號鉗位在零電平上超過幾十毫秒的話,會嚴重影響識別。在這種情況下,最好完全跳過音頻,而不是將此錯誤信息發送給識別器。
上圖中紅色框中125ms的啟動瞬態,應該跳過。
6. 直流偏置過大DC offset
直流偏置可以看作是靜音信號在零信號線上高于或者低于的信號;
如果偏移量為滿刻度限制的百分之幾或者更少,是沒有問題的;
但是如果超過10%則需要糾正,很大的偏移將導致不對稱削波。
7. 頻響曲線Response curve
為了隔絕麥克分錄音到其他雜音,麥克風需要與喇叭足夠近,大致2.5cm處錄音。
檢查FFT大小設置為2048個采樣點,采樣窗口設置為Blackmann Harris;
理想的頻率響應曲線在頂端220Hz和3200~3900Hz之間的幾分貝內是平坦的,差值一般控制在10dB以內是可以接受的(16K采樣率的為6400Hz~7400Hz)如下圖所示:
頻響曲線是個慢慢的漸變過程,如果個別區域出現急劇變化,應該重點關注并研究,音頻可能存在其他問題。
8. 混疊Aliasing
當超過采樣速率的一半(奈奎斯特極限)的信號被允許進入模數轉換器(ADC)時,出現混疊現象。如下為ES7210調試初期出現的混疊現象:
混疊是影響識別的一個重大因素,必須消除混疊;
故ADC需要有抗混疊處理,例如抗混疊濾波器等。
當錄音系統增加輸入信號的泛音時,會出現諧波失真;
AEC對信號失真是非常敏感的,音頻通路的整體諧波失真需要控制在5%以內,故從麥克風到功放到揚聲器和音腔,均需要嚴格控制;除了單體品質之外,尤其注意功放和揚聲器的功率匹配、阻抗匹配和頻率匹配;
如下圖為1K-sine信號的頻譜圖,有奇次諧波、偶次諧波:
如下圖為8K-sweep信號的頻譜圖,有奇次諧波、偶次諧波:
諧波失真越小越好,一般要求最好是小于3%。
評論
查看更多