轉載自36氪
"第三代芯片擁有更高算力、高度集成、性能新高三大特點。"
發布會直播回放:
http://zb.laoyaoba.com/watch/108046167月28日下午,人工智能(AI)語音芯片公司「啟英泰倫」發布第三代智能語音芯片,包括CI130X和CI230X兩大系列,內置第三代自研技術平臺BNPU(腦神經網絡處理器),廣泛覆蓋高性能、低成本端側語音和端云融合語音等應用。
BNPU作為啟英泰倫構建智能語音芯片產品的底層核心,如今已升級到第三代,除了延續其在二代語音識別ASR、聲紋識別等方面的技術優勢外,還支持單麥深度學習降噪技術、命令詞自學習2.0版本。
更重要的是,它實現了兩大核心技術突破,一是增加了離線自然語言語義處理,支持離線NLP;二是增加雙麥深度人聲分離技術,無需記住任何命令詞,同時具備識別能力和理解能力,支持用戶以自然的方式隨心和設備交互。
啟英泰倫的產品+技術演進路線
與上一代產品相比,第三代芯片擁有更高算力、高度集成、性能新高三大特點。
算力方面,CI130X系列芯片采用BNPU 3.0和支持DSP指令擴展的RISC CPU雙核架構,主頻為240MHz,擁有更靈活的計算性能、更強的可編程性,支持高并行向量運算,同時還有640KB系統SRAM。
集成度方面,該系列芯片集成了雙路ADC、兩路MIC接口、三路LDO以及常見的MCU通用接口等,可滿足各類語音識別應用。
性能方面,第三代芯片幾乎可以裝載所有前端信號處理算法,支持端側TTS(從文本到語音)。
CI1306芯片框圖及應用
啟英泰倫創始人兼CEO何云鵬談道,語音設備的應用環節和場景十分復雜,不同設備工作的分貝強度也有所差異,既要普遍適應不同環境,也要適應不同用戶的個性化表達方式和表達特點。
因此,第三代芯片根據不同應用和客戶需求,將CI130X和CI230X兩大系列進行了系列化封裝。
在語音處理能力上,CI1301、CI1302、CI1303系列支持離線遠場語音識別,準確率超98%,支持更強的噪聲適應和口音泛化能力,并支持語音降噪、深度學習降噪、回聲消除、本地自學習等算法;CI1303和CI1306則在聲源定位、波束成形、盲源分離等傳統算法上增加了端側NLP;CI2305和CI2306的語音處理能力分別與CI1302、CI1306相同,其中CI2306支持離線語音+在線語音+AIoT功能。
整體來看,第三代芯片解決方案不管是針對廚房煙機、掃地機器人等70dB以上的高噪環境,還是客廳電視類人聲、會場、賣場等多人場景,都能實現良好的識別和適應性。
啟英泰倫的第三代智能語音芯片特點
除此之外,啟英泰倫為了幫助客戶實現敏捷開發,加速產品落地,還推出了新一代語音AI平臺,擁有在線開發、在線支持、在線資料、算法API接口四大模塊,支持零代碼開發、即時生成NLP模型、本地語音合成/開發等功能,并支持10000個用戶同時開發。
啟英泰倫語音AI平臺框架
從2015年成立至今,啟英泰倫直接或者間接服務的B端客戶已超過5000家,平臺開發者超過1萬名,在校AI學員超過10萬名,離線語音方案行業的年裝機量則超過2000萬,呈快速增長之勢。
何云鵬提到,啟英泰倫的發展戰略分為三個階段。在第一個階段,首先解決自然的人機交互,“這是機器人發展的前提條件和基礎,語音語言是最自然直接的交互方式。”他說,公司通過第一階段努力,要讓所有設備得到語音交互的升級,在設備終端就進行十分便捷的自然交互,讓設備聽得清、聽得懂。
在第二階段,則是讓所有終端設備高度智能化,更好地為人們提供服務,其主要技術特征在于具備多模態感知交互,以及能夠在端側進行理解和決策,甚至還能自我成長學習。
隨著機器人在人們生活中普及,也將進入到更高級的階段,何云鵬將其稱之為“守護精靈”。其技術特點是將智能語音從所有智能設備中抽象出來,成為人們日常生活的全方位管家、百科老師、健康衛士,甚至是知心朋友。“我們的終極目標是打造跨設備、跨時空,打破虛擬世界和現實世界壁壘的產品。”他說。
-
語音芯片
+關注
關注
12文章
1724瀏覽量
36398
發布評論請先 登錄
相關推薦
評論