進入 2019 年,AI技術的場景落地和商用化會成為一個更迫切的議題,但語音識別已是所有 AI 技術中最成功的領域,眼前有四大 AI 語音公司思必馳、云知聲、Rokid 、出門問問不約而同投入“造芯”運動,開始押寶自制 AI 語音芯片,開啟第二戰場。
(來源:思必馳)
“融資”與“造芯”成為 AI 創業公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資后,即透露與某芯片巨頭進行 AI 芯片的研發,如今答案揭曉,思必馳旗下的芯片設計公司“深聰”獲得“國家隊”中芯國際旗下的股權管理公司中芯聚源投資,同時中芯國際也為深聰打造第一顆 AI 語音芯片。
“百箱大戰”時代開啟, AI 語音芯片熱度火到“互撕”?
基于深度學習(Deep Learning)的語音識別技術很快成為 AI 創業界的流量擔當,尤其 2017 年 Amazon 一口氣推出多款 Echo 系列產品,開始了國內“百箱大戰”的年代,更讓相關 AI 語音企業迎來一陣小高潮,不少同性質公司更是明爭暗斗陷入“互撕”局面,反映該市場的火熱程度。
根據 Canalys 估計,2017 年全球智能音箱出貨量突破 3000 萬臺,2018 年出貨量預計是超過 5600 萬臺,全球前四大品牌廠為 Google、Amazon、天貓、小米。再者,2017 年全球智能音箱用戶量排名前五名是美國、英國、德國、中國、加拿大,但 2018 年中國可望躍居第二名。
除了音箱之外,智能家居、汽車市場很多應用場景的硬件也會陸續加入語音智能化的功能,讓 AI 語音技術的應用場景增添無限想像空間。
光是 2018 年就有三家 AI 語音創業公司發表相關芯片,包括云知聲發表面向 AIoT 市場的 UniOne 芯片、出門問問的 AI 語音芯片模組“問芯”Mobvoi A1、 Rokid 的 AI 語音芯片 KAMINO 18,思必馳透露要進入自制芯片領域已有一段時間,4 日才正式對外揭露具體戰略細節。
中芯國際助陣,思必馳“造芯”如虎添翼
不同于云知聲、Rokid 進入芯片自制領域,都是在公司內部成立獨立部門進行研發,思必馳 2018 年初成立子公司“深聰”,2019 年初推出的第一顆產品是 AI 語音芯片深聰 TAIHANG 芯片。
(來源:思必馳)
思必馳扶植的深聰之所以引起業界注意,是因為思必馳的“造芯”之路找來國內半導體巨頭中芯國際助力,旗下的投資公司中芯聚源加入成為創始股東之一。再者,思必馳對深聰的持股比重超過 50%。
思必馳自制的首顆 AI 語音芯片,就是由中芯國際操刀,以 40 納米工藝打造,約莫是 2017 年中啟動該芯片項目后,在 2018 年 8 月進行流片,11 月芯片出來后,現在處于采集樣本階段,預計 2019 年中將進入風險試產,該顆芯片拔劍出鞘的速度十分快,幾乎把需要 6 個季度的工作,縮短為 3 個季度完成。
深聰 TAIHANG 芯片面向智能家居、智能終端、車載、手機、可穿戴設備等各類終端設備,基于雙 DSP 架構,內部集成 codec 編解碼器,以及大容量的內置存儲單元,再者,該芯片也采用了指令集擴展和算法硬件加速的手段,相較于傳統通用芯片具有 10X 以上的效率提升。
深聰聯合創始人吳耿源表示,在芯片戰略上是兩步走,因為背后強大的需求力道驅動,第一顆芯片不單是求快,講求 time-to-market,也專注低功耗、單向反饋、實現算法加硬件融合優化的想法。
同時,深聰內部已經開始第二顆芯片的規劃,是專用芯片加特定架購,雙向溝通更能達到軟硬件融合、深度優化的功效提升,以軟件需求來定義芯片架構,再用架構去反饋算法,同時,算法也會優化硬體架構,等于是彼此做到雙向溝通。預計該顆芯片將在 2019 年下半年流片,2020 年量產。
從“通用”到“專用”,這是一條怎么樣的心路歷程?
從通用芯片到量身打造專用芯片的過程,想必有一番思考、摸索與探尋,吳耿源接受 DT 君專訪時娓娓道來。
圖 | 深聰聯合創始人吳耿源(來源:思必馳)
吳耿源分析,思必馳是一家滿十歲的企業,這幾年趕上 AI 崛起的浪潮,過去多年的技術積累獲得發力的機會,目標戰場是物聯網,第一個應用場景是智能音箱,一切有了很美好的揭幕,但坦白說,智能音箱終究“me too”產品,Amazon 已經在前開路。
思必馳的智能音箱初期用過很多家芯片大廠的通用芯片,但隨著產品線逐漸成長茁壯后,許多問題逐一浮現 。畢竟,通用芯片功能再怎么強大,落地到 AI 場景上會有削足適履之感,加上很多目標市場越來越明確、消費者群聚效應展現后,特制化芯片的需求因此誕生 。
AI 芯片在市場上有兩路的提供者,早幾年都是通用芯片的天下,像是高通、聯發科等,這些巨頭在芯片戰略上,較為著眼于商業利益價值,但是,很多 AI 應用場景都屬于細分賽道,要通用芯片巨頭“削足適履”,會比較不切實際。
這些芯片巨頭當然也會想要“染指”AI 市場,但這個市場和他們過去擅長的游戲規則有落差,以前是巨頭們設計出什么樣的芯片,客戶就要乖乖接受,但 AI 市場是反其道而行,要透過使用者來定義產品,再由把需求反饋給算法,靠算法實現 。
但是,傳統芯片巨頭無法緊密地直接觸碰市場需求,或是內部沒有強大的算法團隊或數據(Data)做后援,在 AI 領域要成功,算法、數據、正確地定義市場都是關鍵。
因此,近幾年起算法公司開始切入“造芯”運動,也提供給算法公司實現垂直整合布局的機會,更重要的是,通過“造芯”來確保產品的差異化和核心價值凸顯出來。
吳耿源表示,思必馳從算法公司跨入產品,再垂直整合成一個平臺,上下串連系統,在云端(Cloud)、邊緣(Edge)兩端都有布局,關鍵就是欠缺一個硬件芯片去擔任執行的角色,而 AI 領域是軟件定義芯片,初期用市面上通用芯片時,也發現算法與芯片對接的過程,有很多文化融合的問題。
舉個例子,當算法遇到芯片,發生的第一個沖突是算法的改朝換代速度遠快于芯片的工藝技術。
一般而言,從定義產品到芯片誕生于世,大概要“懷胎”兩年(24 個月),中間經歷設計、流片、試產、改版、升級、量產,每一個階段慢慢磨練,中間經歷的循環以“季度”為單位來計算。
反觀在算法的世界里,每周都在改,循環可能是以“周”作為單位,若將算法與芯片擺在同一家企業中,彼此步伐不一致的問題會產生明顯的內部矛盾與沖突。
思必馳從算法、產品、平臺、系統整合布局到整個生態系統,現在加入深聰自制 AI 語音芯片,布局齊全后,將跨出智能音箱這個“me too”市場,進入AIoT領域,包括 TV 盒子、白色家電、智慧家庭、故事機等。當物聯網遇上 AI,商機無可限量。
多模式人機交互是理想桃花源
吳耿源進一步指出,光是語音 AI 技術就還有很大的精進空間,現在的智能音箱的溝通仍需經過“喚醒”的程序,其實是“人工弱智”,要做到自然人機交互,當中的技術突破就需要算法的大幅增進,其中一個關鍵的元素是聲紋。
市面上的智能音箱只能識別出說話的內容,再針對問題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因為必須要在明確對象的情況下進行,唯有做到“聞聲即可識人”,不需要“喚醒”這個多余的動作,這才是真正的 “ SMART ” 。
吳耿源進一步解釋,AI 語音芯片在應用場景的廣度上,絕對不單是音箱領域,還包括物聯網、智慧家庭、車載市場等,更進一步場景是多模生態,當下 AI 是最好的時代,天時、地利、人和,AI 時代正在騰飛、國家關注造芯、加上軟件、硬件、人和的融合。
現在的 AI 技術場景分別在語音、視覺兩大領域有不錯的起步和成功的場景落地,但卻都是各自表現,所謂的多模生態是指聲覺、視覺、五官、手勢、觸摸等獨立的功能融合在一起,實現自然的多模式人機交互。
AI 技術領域的前方是無人區,只能摸著石頭過河,每一步都是挑戰,但也處處是驚喜。
更重要的是,這是一個國內最有機會與美國科技先驅并行的領域,AI 技術的“ 造芯 ”運動是日正當中,想想海思追趕高通也花了超過十年,才造就今日的江湖地位,國內發展 AI 技術有應用場景做后盾,要打造出一家巨星級的企業,這一劍肯定不用磨到十年!
-
語音芯片
+關注
關注
12文章
1724瀏覽量
36401 -
ai技術
+關注
關注
1文章
1257瀏覽量
24249
原文標題:中國4大AI語音公司掀起“造芯運動”:國家隊中芯國際正式入場,行業洗牌在即
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論