音頻/語音用戶接口(VUI)是未來人機交互的一個重要的新興趨勢,將越來越多地用于智能家居控制、樓宇自動化、智能零售、聯接的汽車、醫療等物聯網垂直領域,這涉及語音觸發、識別、處理技術,同時設計人員還面臨如何提高能效的挑戰。針對本地和云端,安森美半導體都有相應的VUI方案,提供先進的語音觸發、識別、處理、控制等功能,具備出色的計算能力和能效,確保卓越的用戶體驗。
VUI架構及分類
圖1是基于麥克風陣列的高級語音接口架構,本地處理需要進行說話人跟蹤、語音增強,其中涉及波束成形、喚醒詞檢測、聲源定位、降噪、語音檢測等技術,云端方案則涉及自然語言處理。其后,指令還需通過音頻播放功能播放出來,同時需進行回聲消除。
本地VUI以預存的詞或句為識別單位,說話人可以是特定用戶也可以是非特定用戶,而云端VUI基于人工智能進行語義理解和語音合成,說話人是非特定用戶。本地VUI通過藍牙聯接網絡,而云端VUI通常通過WiFi聯接。本地VUI的功耗和信息泄露的風險相對更低,云端VUI具有更高的識別率和擴展性。相對而言,本地VUI比云端VUI的功耗低。設計人員可根據特定應用需求決定是用本地VUI方案還是云端VUI方案。
本地VUI方案
根據本地VUI方案的特點,它必須能進行雙向語音通信,能識別非特定用戶語音,支持充足的指令和多種語言,可靈活擴展,最好把波束成形和降噪等技術集成到單個芯片上以降低成本和減小占位。如安森美半導體的單芯片方案LC823450,含雙Cortex-M3核,集成數字信號處理(DSP)用作語音前端處理,SRAM提供1656k字節內存,無需配備輔助內存芯片,含兩個數字麥克風I/F接口、兩個數模轉換器,包括回音消除、降噪等先進功能,具備極高擴展性、小占位,功耗超低,若結合生態系統合作伙伴的語音控制技術如Sensory的TrulyHandsfree,支持喚醒詞和語音命令的定制,適用于家居自動化和音樂播放的語音交互。
圖2所示為本地VUI方案的一個示例應用框圖及評估板。采用安森美半導體的超低功耗音頻處理單芯片LC82345X、麥克風預放大器FAN3852、低壓降穩壓器(LDO)NCP170、同步PWM開關降壓穩壓器NCP3170、單聲道音頻功率放大器NCP2823。安森美半導體憑借在電源管理的經驗和專知,使這方案實現超低功耗,這是此方案與其他競爭對手方案相比的一個優勢。現有的方案雖然未集成WiFi、藍牙雙模的模塊,但安森美半導體已收購了WiFi領袖Quantenna,已具備相關技術,未來會考慮將WiFi模塊也集成進去。
云端VUI方案
從應用場景來看,云端VUI除了進行語義理解和語音合成,還可推送各種服務,如智能語音助手除了可播放音樂、講故事,還支持智能零售,如打車、叫外賣等。當前云端VUI的一個痛點是工作頻率較高,需外接存儲器和閃存,耗電量大,物料單(BoM)成本高。安森美半導體的音頻DSP系統單芯片(SoC)LC823455方案很好地解決了這些痛點問題,集成4M RAM,無需外部存儲,除了CPU核外還含波束成形、降噪、回音消除功能,集成預實現的音頻硬件(模數轉換器、數模轉換器及功放),降低BoM成本,因降低時鐘頻率從而提供功耗優化的MCU,功耗超低,提供穩定的聯接和極高擴展性,寬廣的封裝陣容支持各種音頻產品,如音樂播放器、錄音器、智能家電、WiFi/藍牙音箱等。
圖3所示為智能音箱參考設計框圖,此參考設計基于LC823455,有4個ONA101V和1個ONA40功放,含USB-C PD源/汲接口,支持Strata平臺,設計人員只需將此評估板插入裝有Strata的電腦,即可自動識別并開始下載相關的所有文檔及配套資料,包括原理圖、布板、測試報告、用戶指南等,同時出現圖形用戶界面(GUI),顯示所有相關參數和選項供工程師開始評估,幫助加快和簡化開發。此參考設計目前支持亞馬遜Alexa語音服務,安森美半導體也在同中國國內一些語音服務商接洽,未來也會支持國內語音助手。這方案最顯著的一個優勢也是超低功耗,經過將其與競爭對手方案的功耗進行測試,安森美半導體的方案功耗約為競爭對手方案功耗的一半。
安森美半導體的移動及智能音箱音頻技術/知識產權
安森美半導體具備豐富的知識產權支持移動及智能音箱的設計開發,包括音頻處理系統、D類功放、麥克風預放大、高性能音頻開關,提供具競爭力的優勢助力設計人員設計出具競爭優勢的產品。
在音頻處理系統方面的競爭優勢包括小的PCB占位、高度集成的SoC(CPU+DSP+音頻)、集成ARM Cortex-M3雙核、專有的32位DSP。
在D類功放方面,支持小于10 W、10W至30 W,針對大于30 W的應用僅提供樣品。其中小于10 W的功放尺寸小,采用模擬輸入,10W至30W的功放支持數字接口,提供最佳的動態范圍、增益誤差漂移。
對于麥克風預放大,安森美半導體的方案采用最小的標準間距WLCSP封裝將模擬音頻轉換為數字音頻,支持不同的傳感器接口。
音頻開關方面,安森美半導體提供最小阻抗/面積的耗盡型開關。
周邊技術:USB Type-C和D類功放
USB Type-C使每個端口都能成為電源、數據、視頻或音頻端口,大大地方便了用戶,將越來越多地用于各種電子應用,如語音交互。安森美半導體提供完整的USB Type-C方案陣容支持音頻應用的開發,包括供電、復用音頻信號、信號開關、接口保護等,具有最小的占位、超低靜態功耗,集成豐富的保護功能。
智能音箱等新興音頻應用對功放的要求越來越高,安森美半導體針對性地開發出了一系列10 W以上功率等級的D類功放產品線,結合陶瓷封裝技術、CMOS電路技術及可針對不同應用定制的功率MOSFET技術,提供低熱阻、高頻互聯、高功率密度、低噪聲(《70 uV)、低總諧波失真(THD《0.03%)等優勢。以ONA101V為例,這是一款單通道數字輸入D類功放,動態范圍105 dB,帶喇叭采樣數字輸出功能,該功能實時采樣所驅動喇叭的電壓和電流,可使用微控制器上運行的算法來計算喇叭特性。這些參數可用于計算喇叭電阻、回響、溫度等。根據這些值,可以創建算法來執行一系列任務,從而實現喇叭保護、范圍擴展等功能。
總結
語音交互正日漸流行,語音識別和自然語言處理技術是VUI的基礎,安森美半導體提供本地VUI方案和云端VUI方案,集成波束成形、回音消除、降噪等先進的語音處理技術、超低功耗電源管理及USB Type-C、D類功放等周邊器件,并攜手生態鏈合作伙伴,大大降低BoM成本,同時具備出色的計算能力和超低功耗,提供極佳的用戶體驗。
-
安森美半導體
+關注
關注
17文章
565瀏覽量
60963 -
音頻技術
+關注
關注
1文章
138瀏覽量
24636 -
智能音箱
+關注
關注
31文章
1783瀏覽量
78499
發布評論請先 登錄
相關推薦
評論