作者 | 杭瑩
來源|羊城晚報
2015年-2016年,生物識別行業的十年老兵李亞桐感知到AI技術正在點燃行業熱潮。人臉識別、人像技術成為“風口上的豬”,學術界、產業界都開始走出來進行創新創業。
創業潮自然也波及到了李亞桐的內心。但他想做點不一樣的。“既然刷臉可以,那么刷聲音行不行?”“遠程業務過分發達后,是否會帶來弊端?”帶著這些問題和外界啟發,李亞桐開始探索聲紋識別。而故事的結果,是他與張偉彬博士、陳東鵬博士兩位合伙人一起創立了深圳市聲揚科技有限公司(下稱“聲揚科技”)。
聲揚科技三位聯合創始人:CTO陳東鵬博士(左)、總經理張偉彬博士(中)、董事長李亞桐(右)聲揚科技的總部就在深圳香港中文大學深圳研究院內,當羊城晚報記者來到這里時,只覺樓宇間的科研與沉穩風,實在和聲揚科技的氣質相配的很。
聲揚科技以聲紋識別技術為“語音安全底座”,自研全棧智能語音技術,覆蓋前端聲學信號采集、語音信號處理到后端特征提取識別全流程。其團隊集結了來自清華、復旦、香港科技大學、香港中文大學、康奈爾等全球頂尖高校的技術人才,核心產品線涵蓋金融聲紋反欺詐、智慧公安音頻分析及智能座艙終端語音等領域,在政府機構和大型企業中得到了廣泛應用,市場占有率持續領先。
用聲音DNA進行身份識別
走進聲揚科技,入口的展廳墻上掛著一副發展藍圖。聲揚科技聯合創始人、董事長李亞桐告訴羊城晚報記者,6年前公司從原先的辦公點搬到這里,但這幅圖一直沒有變過。藍圖上的內容,就是以音頻處理和語音分析為核心,提供基于語音技術的信息安全服務。
聲紋識別服務,在當時還未有人能實現大規模商業化應用。2018年聲揚科技首次與合作伙伴一起完成了印度尼西亞的居民養老金提取遠程聲音確認項目,可以稱得上是首創。當然,在這背后,年輕的團隊經歷了太多挑戰。
聲揚科技聲紋識別技術惠及250萬印尼老人足不出戶領取養老金語音分析技術如何在客戶需要的場景下進行優化?用戶如何使用產品?交互設計怎樣才能更符合使用習慣?這些是橫在研發技術端的實際問題。而在這之外的,是一個新鮮事物要如何讓客戶相信它是可靠的、并且愿意為之買單。
在國內,相似的應用從有產品雛形到項目初次落地,用了兩年多時間。當聲揚科技的語音分析技術嵌入到對方的產品模塊或部署于后臺系統后,系統可以通過聲紋識別來驗證說話人的身份,又通過聲音的活體檢測,來識別電話中的對方是否為真人聲音而不是錄音,以達到身份驗證和生存性驗證的效果。
商業化在海外和國內都獲得大型客戶成功驗證后,李亞桐和團隊獲得了極大的信心。在聲紋識別技術的基礎上,團隊進一步研發出了2個產品,分別為“VoiceKEY”和“VoiceDNA”。顧名思義,KEY即聲音像鑰匙一樣可以進行登錄解鎖,DNA即聲音身份識別,當身份造假時可以用聲音DNA進行檢測。
由此,聲揚科技在國內的業務主線也開始明確。
撬動人工智能的信息安全應用
2018年開始,聲揚科技開始和公安系統合作,幫助公安、司法部門的刑事偵查、專業鑒定等任務進行信息采集、識別、鑒定、聲音數據清洗和處理等。
截至目前,聲揚科技已和全國超200個省市縣級公安機關合作。聲揚科技有一個專門的團隊,隨時奮戰在一線,協助全國各地公安部門解決工作中遇到的各類聲音識別技術問題。
而另一方面,VoiceDNA也應用到了金融安全維度。“‘VoiceDNA’具備身份驗證、黑名單識別、團伙欺詐識別、多頭檢測等反詐能力,適用于貸前反欺詐、 惡意客訴識別、反催收中介識別等場景。”李亞桐表示。目前,聲揚科技和中國工商銀行、中國農業銀行、中國人壽等都有合作。據了解,聲揚科技為工商銀行總行聲紋識別產品項目的唯一供應商,2020年6月起在陜西、四川等四個分行上線,1年內阻止了經濟損失兩千萬元,讓工商銀行業務審核效率提升了125倍。
公共安全和金融安全,成為聲揚科技信息安全業務的兩條大腿,這兩個板塊的需求是快速增長狀態的。“當前我們的經濟發展速度太快了,在這個過程中會涌現出無數的問題,需要依靠技術手段進行精準識別、以保護居民和國家的財產安全。”李亞桐保守估計道,人工智能在安防領域的應用市場規模是萬億級別的,而聲揚科技如今撬動的還只是冰山一角。
憑借著在技術端的不斷攻堅克難,聲揚科技也被深圳市認定為深圳市“專精特新”中小企業,并成為了廣東省人工智能聲紋工程技術研究中心、國家高新技術企業。
不斷開拓終端語音需求
2023年,我國汽車產銷量分別完成3016.1萬輛和3009.4萬輛,同比分別增長11.6%和12%,產銷量連續15年穩居全球第一。其中,新能源產銷分別完成958.7萬輛和949.5萬輛,同比分別增長35.8% 和37.9%,市場占有率達到31.6%。
新能源汽車市場的的蓬勃發展,讓聲揚科技團隊嗅到了另一絲商機。2019年,聲揚科技開始開辟智能座艙產品線,為車企提供智能座艙的語音信號處理技術。“能夠被國內新能源頭部車企選中,體現了我們作為專業廠商的技術優勢。而對人聲進行分析處理,本來就是我們最擅長的事。”他說。
通過“VoiceKEY”、“JustVoice”系統的搭載,新能源汽車可以實現聲紋開鎖,藍牙通話過程中的聲源定位、回聲消除、智能降噪等。“麥克風錄入的聲音是疊加在一起的。如何在嘈雜的環境音、空調聲等各種聲波中將噪聲部分摘除,只保留人聲、且不影響聲音音質。就像在一盆清水中滴入一滴紅墨水后,要將其再撈出來一樣。”李亞桐向記者描述了這個過程。
而對汽車來說,不同車型內部結構不同,反射混響也都各有差異,需要針對不同車型進行差異化參數調整。截至2023年底,聲揚科技智能座艙累計量產授權已超過220萬輛乘用車、定點30余款車型,在同期國內新能源汽車總產量的占比超過11%。
應用場景的不斷拓展,背后是研發的不停嘗試與創新。據李亞桐透露,聲揚科技每年的研發成本占據營收的50%以上。
在聲揚科技的官方介紹里,有一句話是“做大模型的耳朵”。對此,李亞桐解釋道,當大模型強大的軟件能力與這些硬件結合時,人機交互的模式也將被重構,“語音對話式交互”將是最主流的方式之一,這令很多現有的終端產品,都值得用大模型重做一遍,從而直接為大模型的“耳朵”——語音數據的采集工具(如麥克風陣列)及相關的終端語音帶來了新的增量需求,而這恰好是聲揚科技的強項。
今年3月,聲揚科技完成了由青島某地方國資平臺出資及部分老股東跟投的新一輪融資,為2023年以來低迷的AI語音一級市場中的一抹亮色。據了解,本輪融資將主要用于以安防為核心的傳統業務市場拓展,以及大模型應用生態所催生的終端語音產品矩陣的研發布局。
-
聲紋識別
+關注
關注
3文章
140瀏覽量
21502 -
聲紋支付
+關注
關注
0文章
5瀏覽量
2425 -
聲揚科技
+關注
關注
0文章
28瀏覽量
2745 -
大模型
+關注
關注
2文章
2322瀏覽量
2479
發布評論請先 登錄
相關推薦
評論