小米的聲學(xué)語音技術(shù)目前已經(jīng)實(shí)現(xiàn)全面自研,并在自研部分領(lǐng)域持續(xù)領(lǐng)先,聲學(xué)語音技術(shù)已迎來全新時(shí)代。
據(jù)了解,小米聲學(xué)語音的 4 項(xiàng)技術(shù)實(shí)現(xiàn)了業(yè)內(nèi)突破,分別是語音交互實(shí)現(xiàn)“情感化”、AIoT 放音技術(shù)升級、就近喚醒全新升級、兩麥陣列喚醒新策略。
語音交互實(shí)現(xiàn)“情感化”:小米 AI 實(shí)驗(yàn)室在“情感數(shù)據(jù)量有限”的前提下,通過不同聲學(xué)模型、不同聲碼器組合最終上線自然、擬人效果的情感 TTS(Text to speech,人工語音合成),成為業(yè)內(nèi)首家情感化 TTS 大規(guī)模落地的企業(yè)。
此次小米小愛同學(xué) Art 全面支持情感化語音交互,基于有限但類型不同的情感音頻數(shù)據(jù)(如開心、關(guān)心、害羞、驚訝等),通過不同技術(shù)訓(xùn)練并迭代聲學(xué)模型,最終支持情感 TTS 合成并實(shí)現(xiàn)“小愛同學(xué)”音色情感化、擬人化。未來,小米語音將升級此技術(shù)——支持情感 TTS 實(shí)時(shí)合成。
AIoT 放音技術(shù)升級:首次實(shí)現(xiàn)一句話全屋同步播放相同音頻功能。據(jù)悉,小米小愛音箱 Art 是首款可以實(shí)現(xiàn)語音支持全屋播放的設(shè)備。用戶直接對小愛同學(xué)說“全屋播放 XXX”,無需提前在 App 端進(jìn)行手動設(shè)置,即可實(shí)現(xiàn)一句話語音交互。
就近喚醒全新升級:業(yè)內(nèi)首次上線跨設(shè)備關(guān)閉鬧鐘功能。此次小米小愛音箱 Art 就近喚醒全新升級,可支持跨設(shè)備關(guān)閉鬧鐘。遠(yuǎn)處的音箱鬧鐘響了,喚醒近處的音箱可以直接關(guān)閉遠(yuǎn)處的鬧鐘。此功能在業(yè)內(nèi)首次上線,小米小愛音箱 Art 也是首款支持該功能的產(chǎn)品。
兩麥陣列喚醒新策略:兼顧低功耗與高性能,高效降噪,獲得干凈人聲。小米小愛音箱 Art 同步支持兩麥陣列喚醒技術(shù)。在麥克風(fēng)陣列方面,小米采用兩麥盲源分離降噪前端,通過盲源分離、降噪、回聲消除等技術(shù),在多聲源的嘈雜環(huán)境、音箱自身播放音樂時(shí),都能結(jié)合語音增強(qiáng)技術(shù),消除噪音的強(qiáng)干擾,獲得干凈、準(zhǔn)確的人聲音頻。
目前,小米 IoT 平臺連接的智能硬件數(shù)已達(dá)到 2.5 億臺,音箱出貨量已經(jīng)達(dá)到 2200 萬臺。
責(zé)任編輯:tzh
-
音箱
+關(guān)注
關(guān)注
36文章
639瀏覽量
67750 -
AI
+關(guān)注
關(guān)注
87文章
30172瀏覽量
268433 -
小米
+關(guān)注
關(guān)注
69文章
14326瀏覽量
143869
發(fā)布評論請先 登錄
相關(guān)推薦
評論