世界機器人大會由北京市人民政府、工業和信息化部、中國科學技術協會主辦,在北京亦創國際會展中心舉行。大會論壇邀請了中、德、美、日、韓等國知名專家、企業家就機器人前沿科學研究、技術發展路線及戰略政策制定等問題開展高水平的學術交流和探討
10月24日上午,由中國電子學會承辦的《迎接人工智能與機器人時代論壇》如期舉行,IEEE R&A中國北京大區主席/北京航空航天大學教授王田苗、真格基金創始人徐小平、國家科技部技術中心研究員劉進長等出席論壇。哈工大機器人研究所所長趙杰、思必馳首席科學家/上海交通大學教授俞凱、美國北卡羅來納大學教授蕭靜等業界權威學者專家進行了論壇主題演講,展望了人工智能時代與機器人領域的未來發展。
圖 思必馳首席科學家俞凱分享現場
思必馳首席科學家/上海交通大學俞凱教授就《智能語音技術步入認知時代》為主題進行了分享。俞凱教授表示,互聯網發展使信息搜索向移動端遷徙,口語對話交互成為移動信息搜索的新習慣,思必馳的核心技術側重于端到端的非配合自然口語交互系統,專注為智能車載、智能家居、智能機器人領域提供語音交互方案。為了滿足人性智能交互新需求,思必馳推出了極富表現力的多種合成音,從標準男女聲、名人音合成、童聲,到個性快速合成、小說閱讀、歌聲合成等,可實現個性化定制。
俞凱教授表示,人工智能的重要突破點在算法上,深度學習算法成為重要的突破口。思必馳與上海交大成立的聯合實驗室也在智能語音研究領域取得了較大進展,推出的VDCNN算法模型在降噪處理上表現出不可取代的優勢,相比于傳統語音模型僅使用1至2層卷積層,思必馳通過堆疊較小的卷積層和池化層,將語音模型中的卷積層的深度提高到了10層以上。利用小卷積核更加精細的局部刻畫能力和頻率不變性描述,能夠更好地在語音模型的內部實現了聲學自動降噪的能力。該模型在噪聲環境語音識別的業界基準庫Aurora4上,取得了7.09%的詞錯誤率。相比于世界其他機構目前10%左右的最好結果,有一個大幅度的明顯優勢,在抗噪語音識別上是一個新的里程碑。
俞凱教授指出,自然口語交互中存在不確定性,語音是處理不確定性的高效管道,不確定性在情景理解和多輪交互中可以有效的減少甚至消除。思必馳深耕垂直場景下的語義理解技術,通過數據收集及分析,可追蹤用戶意圖,更準備進行場景交互。智能語音正在經歷著從感知智能向認知智能的過渡,在智能語音感知智能上,機器能夠接受信息,采集數據,輔助人類完成任務。而一旦實現過渡,認知智能就能夠使機器聽懂語音并主動思考給予人類反饋。
演講中,俞凱教授強調原始技術創新的重要性。對于產品應用公司而言,工程化是重點,在借助Google、Facebook開源的研究技術之后,能夠很快實現技術應用落地。但是,對于像思必馳這樣的技術平臺公司而言,基層的技術研究與原始創新成為企業生存的關鍵。正因如此,思必馳強調科研工作的重要性,致力于打造更人性化的語音交互方案。
正如俞凱教授所言,思必馳確實不斷通過技術創新帶給大家驚喜。如,2015年10月,思必馳針對國內智能車載市場推出AIOS For Car對話操作系統,2016年6月升級至AIOS3.0版本新增7大功能,2016年10月升級至AIOS3.1版本,新增【one-shot一把手】功能,成為國內首家實現該功能技術落地及市場應用的企業,合作客戶JADO遠界系列智能后視鏡新發布的二代產品即應用該升級版功能。除軟件解決方案外,思必馳同樣提供軟硬一體化解決方案,“環形6+1遠場麥克風陣列”是國內首款投諸市場應用的7麥方案,實現360度全角度拾音與5米遠場交互,與亞馬遜echo的環形7麥又異曲同工之妙,思必馳環麥方案迅速投入到了國內智能機器人、智能音箱、家居中控等智能硬件產品中,受到市場青睞。
思必馳作為國內唯一一家專注智能硬件領域的語音公司,將憑借著近10年的技術積淀及專注性,為垂直領域打造更專業的語音交互方案,讓未來人機交互更有用、更有趣。
-
機器人
+關注
關注
210文章
28216瀏覽量
206577 -
人工智能
+關注
關注
1791文章
46879瀏覽量
237616 -
智能語音
+關注
關注
10文章
781瀏覽量
48711
發布評論請先 登錄
相關推薦
評論