在設計智能音箱和其他語音功能的設備,例如可穿戴設備、可聽覺設備時,開發(fā)者面臨的首要挑戰(zhàn)是如何讓麥克風準確有效地檢測 “Alexa ”和 “Hey Google ”等喚醒詞,以便在云端處理。
當DSP Group推出支持語音的語音系統(tǒng)級芯片(SoC)DBM10時,EDN向該公司SmartVoice芯片的產(chǎn)品經(jīng)理Yosi Brosh提出了這個問題。這款基于DSP和神經(jīng)網(wǎng)絡(NN)加速器的雙核SoC,針對電池設備中的語音和傳感器處理進行了優(yōu)化,如可聽、可穿戴設備、真正的無線立體聲(TWS)耳機和智能家居遙控器等。
上圖:用于語音智能產(chǎn)品的DBM10芯片宣稱的采用平臺方式,具有全面的軟件框架支持。
Brosh表示,像亞馬遜網(wǎng)絡服務(AWS)這樣的云平臺對在芯片上配置寄存器不感興趣。相反,這些云服務關注的是語音算法如何高效檢測喚醒詞。Brosh說“他們希望算法能夠檢測到喚醒詞,而不需要工程師花費大量時間研究和配置芯片上的寄存器。”
因此,DSP Group開發(fā)了一個API,使語音檢測算法很容易集成到云服務中。他補充道;“在某種程度上,云服務提供商的語音算法成為芯片的黑匣子。”
通常的做法是,設備制造商發(fā)布帶有麥克風設置的軟件代碼,并告訴算法提供商如何在麥克風驅動中集成算法。以DSP Group的DBM10芯片為例,它使用語音固件采集音頻,使語音采集算法的集成變得高效簡單。
DSP Group一直在與十幾家云公司密切合作,其中包括阿里巴巴、亞馬遜、百度、谷歌和三星,同時在其芯片上移植他們的語音算法。據(jù)Brosh介紹,該公司在某些情況下還提供一套完整的軟件。
該芯片能夠為系統(tǒng)設計人員提供簡單的部署路徑,Brosh表示,公司對運行在DBM10語音接口芯片上軟件的支持一直提供到生產(chǎn)層面,“系統(tǒng)工程師不需要編寫一行代碼”。
這就是為什么DSP Group稱其DBM10芯片為完整解決方案的原因。該SoC通過通用DSP和名為nNetLite的神經(jīng)網(wǎng)絡處理器對音頻算法以及傳感AI算法進行了優(yōu)化。除此以外DSP Group還提供運行在Wi-Fi芯片上用于與DBM10芯片進行通信的額外驅動程序。
SoC還具有跨平臺的工具鏈,支持所有常用的人工智能(AI)和機器學習(ML)框架,以簡化算法部署。工程師們可以開發(fā)、訓練和測試算法,然后將算法以標準格式保存,工具鏈會將其提取并創(chuàng)建一個圖像,下載到SoC中。
上圖:nNetLite編譯器可以快速優(yōu)化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。
該SoC的外形尺寸很小,只有4平方毫米,可以進入像智能手表這樣的極小設備。同樣,在SoC的神經(jīng)網(wǎng)絡nNetLite引擎上運行的始終處于開啟狀態(tài)的wake word算法只消耗幾微瓦的電能。
編輯:lyn
-
語音
+關注
關注
3文章
384瀏覽量
37997 -
算法
+關注
關注
23文章
4601瀏覽量
92649 -
云服務
+關注
關注
0文章
811瀏覽量
38871
原文標題:簡化云服務的語音檢測算法部署
文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論