近日,憑借自研BERT+WWM+MT的單模型,小i機器人在國際權威機器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中排名全球第三。深耕行業(yè)18年,這家國產AI公司認為認知智能才是AI未來競爭的核心,并快速推進產業(yè)化應用——在商用智能客服領域,行業(yè)市場占有率已超過80%。
一家中國人工智能技術公司成立長達十八年之久,還在成長期趕上了第三次AI浪潮。
作為有著這樣背景的小i機器人對未來AI發(fā)展有著更成熟且明確的方向:
認知智能是人工智能未來競爭的核心。
而認知智能技術需要多向積累,技術和應用互生互補。除18年產業(yè)應用經驗外,小i機器人在AI技術方面仍在不斷突破:
憑借最新研究成果——BERT+WWM+MT的單模型,在由斯坦福大學發(fā)起的國際權威機器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中排名全球第三,超越人類平均水平。不同于前兩名企業(yè)+學校的聯(lián)合模式,小i完全是由研究院團隊獨立完成;
分別實現(xiàn)了基于機器學習和深度學習方法的各個NLP基礎能力模塊,覆蓋了詞法分析、句法分析、語義分析、篇章分析等基礎技術的能力;
參加情感計算國際標準建設,并在其中擔綱重要角色。
另外,不同于近幾年成立的AI公司,小i早就開始推進認知智能商業(yè)化——小i機器人以開辟智能客服這一典型AI應用場景為基礎,在金融、汽車、醫(yī)療等數(shù)個行業(yè)均有布局,其中商用智能客服領域,其行業(yè)市場占有率已超過80%。
邁向認知智能的技術底氣:自研BERT+WWM+MT的單模型,NLP權威測試全球第三
現(xiàn)在大家習慣將人工智能分為三個臺階,計算智能、感知智能和認知智能,認知智能位于AI金字塔結構的頂部。
目前計算智能與感知智能,機器已經可以媲美甚至超越人類,但認知智能方面與人之間依然存在差距。
認知智能是人工智能發(fā)展的未來趨勢。
認知智能涉及到語義理解、知識表達、聯(lián)想推理、智能問答、自主學習。人工智能的一個重要目標就是希望機器能夠與人類進行更加自然高效的交流,希望機器讀懂人類深奧的語言,同時以一種我們習慣的方式進行交互。
其中,使機器讀懂人類深奧的語言、同時也是認知智能方面最典型的任務就是閱讀理解。
2019年7月,小i機器人研究院團隊在由斯坦福大學發(fā)起的國際權威機器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中,憑借最新研究成果——BERT+WWM+MT的單模型,以EM(精準匹配率)和F1(模糊匹配率)超越人類平均水平的優(yōu)異成績排名第三。
此次在考慮Whole Word Masking的BERT預訓練模型基礎之上,小i引入輔助任務如NewsQA等數(shù)據(jù)集,采用多任務學習的思路來改進現(xiàn)有模型的效果,進一步提升模型的最終預測評價指標(主要為Exact Match和F1值)。
具體來看,小i分別對目標任務和輔助任務中的答案集合進行長度頻率統(tǒng)計,以及各自訓練一個語言模型,來綜合判斷輔助任務中的數(shù)據(jù)樣本與目標任務中的數(shù)據(jù)樣本之間的相關性。
最后將這個相關性指標進一步引入到模型訓練過程中損失函數(shù)Loss的計算過程中,以充分利用并學習到來自目標任務和有關輔助任務中的知識,從而最終提升模型的預測效果。
小i機器人參賽模型在此次比賽中獲得EM指標 (精準匹配率)達到88.650,F(xiàn)1指標(模糊匹配率)達到94.393的成績。
排名前兩位的谷歌大腦和Facebook人工智能研究部門都選擇了與高校聯(lián)手進行挑戰(zhàn),而小i機器人則是完全獨立參加比賽。
SQuAD被譽為自然語言處理領域金字塔尖的比賽,旨在促進智能搜索引擎的發(fā)展。
國際機器閱讀理解評測SQuAD自2016年發(fā)布以來,共吸引了包括谷歌、微軟亞洲研究院、IBM研究院、阿里巴巴達摩院、上海交通大學等眾多國內外知名研究機構和高校參加。
而在實際應用中,小i也把機器閱讀理解的最新研究成果應用于有關產品和實際項目中。例如,在小i機器人開發(fā)的Bot開放平臺中,集成了基于機器閱讀理解的能力。
除此之外,小i機器人分別實現(xiàn)了基于機器學習和深度學習方法的各個NLP基礎能力模塊,覆蓋了詞法分析、句法分析、語義分析、篇章分析的基礎技術的能力,上述的機器閱讀理解即為其中的能力之一。
小i機器人創(chuàng)始人、董事長兼CEO袁輝曾表示:感知、思考、運動三部分構成了人工智能,其中最核心的是擁有思考力的“大腦”,也就是認知智能,它決定著人工智能的水平高度。當機器的認知能力獲得重大突破,AI的應用度和滲透力就會更強。
小i機器人創(chuàng)始人、董事長兼CEO 袁輝
正因如此,小i機器人一直堅持“大腦”研發(fā)。
目前,小i機器人已在上海、貴陽、深圳、南京、香港、美國硅谷設立6大研發(fā)中心,與華東師范大學、香港科技大學、中國科學院軟件所等建立聯(lián)合實驗室。在自然語言處理、深度語義交互、機器學習和大數(shù)據(jù)等認知智能相關以及圖像、語音識別等核心技術上擁有全面、自主的知識產權。
推動情感計算國際標準建設,將情感量化成機器能理解的數(shù)值
在認知智能中,除當下熱門的各項NLP能力外,小i機器人專攻另一獨特技術方向——情感計算,即將人類情感量化成機器可以理解的數(shù)值。
事實上,認知智能的發(fā)展分為語言理解、分析推理,以及人格和情感三個層次,情感可以說是AI金字塔頂尖中的頂尖,是AI最終需攻克的難關之一。
情感計算的概念早在1997年由MIT媒體實驗室Picard教授提出,她指出情感計算是與情感相關,來源于情感或能夠對情感施加影響的計算。
但在用戶界面中的對情緒交互信息的表示方式,仍缺乏規(guī)范化和統(tǒng)一的標準,使得人機交互中對用戶情緒信息的理解、處理,以及情緒的回饋呈現(xiàn)等過程存在差異,阻礙了情感計算用戶界面的應用和發(fā)展。
2013年著手研究情感計算以來,小i機器人在 2017年作為牽頭單位之一提交了國際上第一個有關情感計算的國際標準ISO/IEC 30150-1《信息技術 情感交互 第一部分:模型》,這也是中國在該領域的首個國際標準。此標準也在今年8月正式通過國際標準草案(DIS)投票。
事實上,情感計算的應用前景相當廣闊,用戶與計算機系統(tǒng)之間依然存在情緒和表達上的障礙,如果制定相關國際標準,將有利于實現(xiàn)情感計算用戶界面的應用推廣。
今年8月,小i機器人聯(lián)合中國電子技術標準化研究院和中國科學院軟件研究所三家共同提交了ISO/IEC 30150-11《信息技術 情感計算用戶界面 Part 11:情緒表示》和ISO/IEC 30150-2 《信息技術 情感計算用戶界面 Part 2:情感特性》。
深耕行業(yè)18載,崛起之路是偶然也是必然
認知智能技術需要多向積累,技術和應用互生互補,螺旋上升。小i很早就入局智能機器人行業(yè),在這方面已有深厚的積累。
2001年,小i機器人在上海成立,但它最早出現(xiàn)在大眾視野是在2004年。那一年,小i機器人出現(xiàn)在MSN和QQ這兩大社交軟件上。憑借此次合作,小i機器人用戶達到近一億人次,同時,此舉讓小i積累起了龐大的中文語義庫。從那以后,小i機器人開始進入聊天機器人和AI領域。
自2008年江蘇移動i8智能客服上線后,小i打開了企業(yè)智能客服的大門。
此后,小i在智能客服領域迎來爆發(fā)期,合作對象也拓展到聯(lián)想、聯(lián)通、建行、招行等大型互聯(lián)網、電信和金融機構。它們的機器人均使用了來自小i機器人的技術作為支撐。
除此之外,通過技術和資源的開放,小i還試圖激活AI時代開發(fā)者潛力,共享AI紅利,同時也使生態(tài)體系建設初具規(guī)模。
小i機器人發(fā)布了新一代智能Bot開放平臺,集合了Chatting Bot、FAQ Bot、Discovery Bot三大核心能力以及深度學習、知識管理、知識學習、計算機視覺、知識融合等基礎能力。
目前,平臺支持智能客服場景的直接使用,為企業(yè)和開發(fā)者提供機器人服務無縫轉人工服務以及通過智能學習構建知識庫的完整使用閉環(huán)。除此之外,企業(yè)和開發(fā)者還可通過標準接口獲得各類定制服務。
以智能客服為突破口,走出一條真正的“產業(yè)化之路”
在人工智能的浪潮中,客服被認為是最先被取代的一類人群。傳統(tǒng)的人工客服往往都是高密集性勞動,而智能客服可很好地改進成本高、服務效率低等問題。
人工智能技術有望在智能客服領域率先完成商業(yè)化落地。根據(jù)Gartner預測,2020年左右85%的客服服務都將由人工智能完成。
在小i的生態(tài)產業(yè)落地領域當中,智能客服是主要業(yè)務方向之一。
據(jù)了解,小i機器人在智能客服實現(xiàn)過程中,技術層面主要分為三塊:一是自然語言處理和理解技術,二是需要機器人掌握根據(jù)上下文進行推理的能力,三是在不同領域中,利用人和機器的協(xié)作,半自動化地構建各行各業(yè)的知識體系。
作為國內智能客服領域的開拓者,小i在商用智能客服領域,行業(yè)市占率已經超過了80%。
如今,小i機器人的業(yè)務涉及電信運營商、銀行、證券行業(yè)、互聯(lián)網金融、機場、電商、汽車、3C、醫(yī)院、房地產、酒店、手機、物流、餐飲等各行各業(yè)。
從技術、產品到解決方案、服務體系、再到生態(tài)建設,小i機器人這18年來穩(wěn)扎穩(wěn)打,為業(yè)界踏出了一條真正的“產業(yè)化之路”。
-
機器人
+關注
關注
210文章
28191瀏覽量
206505 -
人工智能
+關注
關注
1791文章
46845瀏覽量
237535
原文標題:這個基于BERT的單模型,NLP權威測試全球第三!小i機器人押注認知智能再發(fā)威
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論