多數(shù)語音技術已經(jīng)進入穩(wěn)步爬升期,智能語音賽道進入成熟發(fā)展期。
中國語音產(chǎn)業(yè)聯(lián)盟發(fā)布的《2020-2021中國語音產(chǎn)業(yè)發(fā)展白皮書》,2020年我國智能語音市場規(guī)模達到217億元,同比增長31%。2021年,我國智能語音產(chǎn)業(yè)市場規(guī)模預計達到285億元,各種應用正在迎來需求拐點,進入需求爆發(fā)期,主要立足于日常生活的消費級應用場景,市場規(guī)模將超過700億元;而服務于特定場景的企業(yè)級應用場景,由于疫情等原因市場需求正在不斷擴大,預計將超千億規(guī)模。
隨著賽道的規(guī)模的不斷擴大,智能語音技術也逐漸趨于成熟。北京市專精特新企業(yè)普強信息技術(北京)有限公司(下稱「普強」)早在2009年便切入了智能語音賽道,成為當前賽道重要的賽車手之一?!钙諒姟故且患乙哉Z音大數(shù)據(jù)分析、智能語音識別、語音合成和自然語言處理技術為核心的人工智能企業(yè)。業(yè)務涵蓋了智慧金融、智慧政務、智能汽車等多個消費級與企業(yè)級應用場景,為超過500家企業(yè)提供語音驅(qū)動的人工智能大數(shù)據(jù)解決方案。
進入成熟發(fā)展的智能語音
2011年,Siri應用到iPhone4s上,通過語音識別等技術將手機變成了一臺“智能機器人”。智能語音作為人工智能中最成熟的核心技術之一,被大多數(shù)人認為是人工智能的重要入口?!钙諒姟笴PO蒲瑤認為,智能語音技術通過了近十年的研究與發(fā)展,目前已經(jīng)到了成熟期。
從學術角度來看,多數(shù)語音技術已經(jīng)進入穩(wěn)步爬升期,智能語音賽道進入成熟發(fā)展期。隨著深度學習以及大數(shù)據(jù)技術的不斷發(fā)展,已有的語音識別等智能語音技術已經(jīng)進入生產(chǎn)成熟期,逐步進入商業(yè)化應用。
不少新興的智能語音技術如情感人工智能也有了很大程度的進步,進一步推動了智能語音市場的擴大與商業(yè)化進程。
從商業(yè)角度來看,蒲瑤表示:“智能語音現(xiàn)在正處于商業(yè)變現(xiàn)的階段,無論是智能語音公司還是AI公司,都要找到自己的‘賺錢方式’。”技術的成熟推動了商業(yè)應用的落地。
疫情發(fā)生之前,隨著人工智能技術不斷發(fā)展,智能語音的應用場景已經(jīng)在呼叫中心、金融、車載等領域得到應用;在疫情帶來的機遇下,無接觸交互需求催生出智能語音更廣泛的應用場景和更多落地需求,像:智慧金融、智慧政務、智慧辦公、智慧旅游等。
?
“定制”的開源技術適配多場景應用
智能語音的產(chǎn)品目前主要以兩種形式呈現(xiàn),分別是行業(yè)解決方案和平臺化技術輸出。前者是需要深耕垂直領域,對于垂直行業(yè)有深度的認知,與企業(yè)進行深度合作;后者是通過API(應用程序編程入口)等技術為企業(yè)提供技術支持,而不少頭部智能語音企業(yè)便是以此切入智能語音賽道。
深耕智能語音賽道13年的「普強」基于自主研發(fā)的語音識別、語義理解、語音合成、大數(shù)據(jù)挖掘等底層AI 技術,以及累計的超過90,000個行業(yè)模型,為金融、教育、大健康等行業(yè)提供“「普強」AI能力平臺”。
以AI能力平臺為基礎,「普強」開發(fā)了多款標準化產(chǎn)品。
“‘千尋’實時坐席助手”以實時語音轉(zhuǎn)寫引擎為支撐,通過實時轉(zhuǎn)譯與對話內(nèi)容信息提取,實現(xiàn)實時知識輔導、實時彈屏告警等功能,約束客服行為、提升客戶滿意度。
“‘千尋’離線語音分析系統(tǒng)”基于「普強」多年來累計的大數(shù)據(jù)以及行業(yè)模型,為客戶提供關鍵詞檢索、數(shù)據(jù)篩選、聚類分析等功能,為企業(yè)提供數(shù)字化運營策略支撐。
擁有底層ASR語音識別引擎能力與非結構化數(shù)據(jù)分析技術可以為“‘千察’語音質(zhì)檢系統(tǒng)”提供精準的質(zhì)檢結果,提高工作效率。
除了可以為企業(yè)提供一站式服務,「普強」AI能力平臺還可以通過API技術讓企業(yè)進行二次開發(fā)。既有了平臺化技術輸出的普適性,也擁有了行業(yè)解決方案的獨特性。
以智能語音為基石,「普強」的產(chǎn)品涉及了多種應用場景。蒲瑤介紹道,“在車載應用場景中「普強」也實現(xiàn)了廣泛應用,「普強」與世界十大汽車企業(yè)之一的某汽車廠商的合作車輛,已在今年年初實現(xiàn)落地量產(chǎn)?!?/p>
在智慧座艙軟件方面,「普強」擁有自主研發(fā)的全棧語音核心技術,可以為汽車廠商提供“芯+端+云”一體化車載解決方案與定制化的智能網(wǎng)聯(lián)車機系統(tǒng)。軟、硬降噪消回聲技術、全雙工技術、實時智能聆聽技術、離線語音識別、多輪語音交互等功能使智慧駕駛擁有更加流暢的語音交互與APP生態(tài)及操作體驗。
基于「普強」自主研發(fā)的全棧語音核心技術,「普強」還推出了“‘千行意’車載語音助手”,為客戶提供通訊、導航、電臺、娛樂等40+種服務。通過降噪芯片及算法,除了為客戶提供清晰語音通話外,利用云端的語音識別、語義理解和CP/SP接入,進行大數(shù)據(jù)分析、用戶畫像和個性化學習后為客戶提供多種應用服務。
「普強」的創(chuàng)始人何國濤自幼在澳門長大,因此帶有澳門“特質(zhì)”的「普強」推出了具有特色的粵語語音識別?;浾Z承接著古代漢語的許多特點,在詞匯、語法、發(fā)音上都和普通話有明顯區(qū)別。例如,相較于普通話的四個聲調(diào),粵語中擁有完整的九韻六調(diào),這為粵語的語音識別帶來了一定的技術難度?!啊钙諒姟故禽^早推出粵語智能語音識別的企業(yè),甚至還能識別‘港普’口音”,蒲瑤介紹道。
同時,旅游業(yè)作為澳門的重點發(fā)展行業(yè),「普強」近期也在澳門開展了智慧旅游解決方案。與澳門的美高梅與永利兩大頭部酒店企業(yè)建立合作,通過語音系統(tǒng)與技術提升酒店行業(yè)運營效率,降低運營成本,實現(xiàn)產(chǎn)業(yè)升級。
?
智能語音生態(tài)不斷升級
據(jù)德勤2021年發(fā)布的《中國智能語音市場分析》,未來智能語音的產(chǎn)業(yè)情境將會以人機交互、技術輸出、搜索革新和同步信息四個方面體現(xiàn)。蒲瑤認為,未來的智能語音會提供兩方面的功能,一是讓生活更加便捷,二是通過人機交互減輕人工的重復勞動。智能語音交互是大眾接觸科技最普遍的渠道,而隨著語音生態(tài)系統(tǒng)積極合作,智能語音將賦能多形態(tài)智能終端。
而在技術層面,蒲瑤則認為目前已經(jīng)到了一個緩坡的發(fā)展階段,“按之前的規(guī)律大約是10年左右技術會有一個質(zhì)的飛躍”,目前的智能語音賽道上沒有容易突破的問題,尤其是在自然語言理解方面。「普強」選擇了產(chǎn)學研的發(fā)展路線,與澳門大學、澳門旅游學院和澳門科學技術發(fā)展基金聯(lián)手打造了粵澳跨境產(chǎn)學研基地,為未來突破自然語言理解與人機交互難題提供了技術保障。
同時,智能語音賽道的參與者不斷入局,同質(zhì)化不斷加劇,而競爭也愈演愈烈。如何成為賽道的破局者,形成自己獨有的競爭力,已成為各企業(yè)的無可避免的難題。作為一家專精特新企業(yè),「普強」未來也將繼續(xù)“專”于智能語音賽道,“精”于智能語音產(chǎn)品的精細制作與快捷易用,以“專精特新”深挖行業(yè)痛點,真正抓住客戶需求,打造「普強」的商業(yè)模式?! ?/p>
評論
查看更多