90分鐘超時放送、1.4萬字干貨解讀,這位人工智能行業的稀缺女將,究竟返校說了啥?7月2日,浙江大學第二期“互聯網+”創新創業大講堂準時“云端”開課,百度集團副總裁吳甜作為本期主講嘉賓為學弟學妹們帶來《人工智能技術的實踐與創新》的分享。
時值畢業季,百度吳甜以浙大師姐的身份開啟了在線講堂,以百度的工作為例,生動又系統的講解了人工智能技術的實踐與創新,幫助學弟學妹們加深對人工智能行業的了解,并解答了關于AI技術發展的專業問題。在線收聽的浙大師生們頻頻向這位新晉“技術流主播”雙擊點贊,不少參與者在收聽分享后,紛紛表示不過癮,希望師姐“加更”。
近十年,人工智能逐漸走入人們的視野,成為大熱風口,但在此之前,吳甜就已經專注于人工智能領域多年,且見證了NLP等基礎技術的快速發展。此次,吳甜從百度AI技術展開,詳細介紹了百度大腦的技術布局,從領先性及易用便捷角度介紹了作為重要開發工具的深度學習平臺飛槳,以及語義理解技術解決方案文心ERNIE和智能對話定制與服務平臺 UNIT,并圍繞新冠疫情帶來百度AI在戰疫方面的突出表現。在分享最后,吳甜也針對聽課群體的特點,描繪了深度學習開發者的學習地圖,介紹了AI Studio學習實踐社區、各類AI大賽、億元算力支持、AI人才認證、就業、PPDE計劃等百度在AI人才培養方面的諸多舉措,希望幫助更多學弟學妹通過飛槳的社區和平臺能夠與更多的開發者交流,收獲成長。
百度天然具有AI基因,百度大腦是百度AI技術多年積累和業務實踐的集大成者。吳甜介紹,百度大腦由基礎層、感知層、認知層和平臺層以及AI安全組成。基礎層為大數據、算法以及算力的支撐;感知層包括語音、視覺以及AR、VR等能力;認知層主要包括自然語言處理和知識圖譜;平臺層包括飛槳、百度大腦開放平臺等,助力AI應用創新;此外還有AI安全技術進行保駕護航。
語音技術作為重要的基礎技術,一直保持高速發展,吳甜用視頻案例為大家展示了語音技術的發展水平。基于百度自主研發的SMLTA 流式多級截斷注意力模型,語音識別準確度大幅提升。2019年百度輸入法發布會上,一段中英混雜的“職場rap”被百度輸入法準確識別,語音識別已達到中英文自由切換均可高質量識別的水平。在一段“調戲”小度音箱的視頻中,打開小度的極客模式,不僅不需重復“小度小度”喚醒詞,小度還可以準確區分對話與需求,而這正是全雙工免喚醒能力的體現,在此能力下,人機交互越來越順暢。吳甜還為大家播放了多種不同風格的音頻,而這些可以媲美人聲的音頻都是由AI語音合成,并通過風格和音色遷移技術實現的。
小浦、移娃等數字人小姐姐的出現,收獲了現場一大波點贊。在談到虛擬形象合成技術時,吳甜播放了一段數字人合集視頻,來自百度智能云與浦發的小浦、中國移動的移娃、澎湃的小菲等虛擬數字人都源于相同的虛擬形象合成技術,但形象風格各不相同,在百度技術的支持下虛擬數字人“女團”也將走入更多行業。
除了類比人的感知能力的語音視覺技術,還有類比人認知能力的語言與知識技術。
吳甜詳解了基于知識圖譜的視頻理解,在感知技術提取特征的基礎上,融合了知識推理和計算,對整個視頻的內容有更深度的理解。此外,語言和知識技術在醫療行業的應用,也可以在輔助診療、合理用藥、病歷質控等場景起到切實的幫助作用。百度研發的ERNIE全面刷新了NLP多項任務的效果,機器同傳方面,百度先后提出了一系列新模型,在語音容錯、平衡質量與時延、語篇翻譯連貫性和端到端同傳模型等方面取得突破,并研發了高質量、低時延的機器同傳系統。在疫情特殊時期,支持了多場遠程會議直播的同聲傳譯。
“深度學習框架在技術棧當中的位置類似于操作系統的位置。因為它向下和芯片、指令集的設計相關,向上和大量的應用場景是非常相關的。”在介紹了各種技術成果后,吳甜帶領大家將目光轉向AI開發平臺及工具層面。百度的深度學習平臺飛槳是國內首個開源開放、技術領先、功能完備的產業級深度學習平臺,包含核心框架、基礎模型庫、端到端開發套件以及工具組件,具有開發便捷的深度學習框架、超大規模深度學習模型訓練技術、多端多平臺部署的高性能推理引擎以及產業級開源模型庫,四大技術優勢。近期,飛槳還針對旺盛的產業需求推出了企業版,包含零門檻AI開發平臺EasyDL,以及面向大企業的全功能AI開發平臺BML。
此外,吳甜還著重提到了飛槳的預訓練+遷移技術。她介紹,飛槳提供了許多基于百度大數據所訓練出來的預訓練模型,這些網絡結構復雜的大模型與特定場景中的小數據量進行遷移學習之后,可以形成非常出色的場景模型。比如,口罩人臉檢測模型正是基于ICCV19 Wider Challenge人臉檢測競賽冠軍底座模型,加上真實口罩數據微調實現的。在垃圾分類場景中,飛槳也起到了提高效率、準確率的作用。據吳甜介紹,采用飛槳的目標檢測和圖像分割模型,可以實現塑料瓶的細分以及塑料瓶中心點的檢測,使垃圾分揀更準確高效,同時通過Paddle Lite,可以高效部署集成到垃圾分揀的產線上。在武漢的一家垃圾分揀廠,采用了這樣一套技術解決方案后,分選效率從93%左右提升到了97%以上,替代了4-6個操作工人的人力成本。
NLP的研發范式也已進入以預訓練+微調的全新時代,依托于ERNIE的技術突破,百度推出了語義理解技術解決方案,旨在讓企業簡單、高效靈活地定制開發最領先的NLP模型。目前,文心通過飛槳企業版EasyDL、BML為企業提供平臺化服務。以百度Feed流應用為例,文心ERNIE技術解決方案,使得視頻推薦的相關性提升了8%,更好地滿足了用戶需求。
吳甜還介紹了可以幫助使用者快速構建專屬對話產品的對話平臺百度UNIT。她從任務式對話和問答對話等方面深入淺出地展示了UNIT在定制對話過程中起到的作用。針對不同的對話需求,UNIT均提供了相應的技術與功能支持。同時,在對長對話的理解處理,與語音技術的融合方面,UNIT也做了很多工作。以智能客服為例,UNIT不僅能聽懂用戶的訴求,還能基于與用戶的對話分析發掘用戶深度的訴求。
在疫情期間,百度與合作伙伴,生產了一系列的AI抗疫產品,比如社區疫情防控系統、疫情問答機器人、地鐵口罩檢測等等,快速實現了應用落地,為疫情防控提供了及時有力的幫助,用科技創造了價值。
同時,百度一直致力于打造AI學習社區。比如AI Studio為廣大開發者的學習與實訓,提供了超過45萬個精選項目,億元免費算力;算法賽、創意賽、產業賽三大類型賽事全年無休,以賽促學,近一年累計舉辦50多場,這些對于學生群體進行開發帶來便捷。
分享最后,浙大學子踴躍提問,吳甜一一解惑,分享了關于醫療AI、通用型NLP、強化學習等方向的見解。吳甜認為,AI需要跟行業自身的問題結合進去,通過飛槳等平臺、工具與行業場景相結合,在應用中不斷迭代。關于人工智能的邊界問題,吳甜表示“人工智能技術與應用越來越廣泛結合,在能夠定義問題的場景中發揮出了其價值,但有如通用對話系統是通向通用人工智能的重要技術突破,這個突破還未真正到來”。
-
百度
+關注
關注
9文章
2257瀏覽量
90258 -
人工智能
+關注
關注
1791文章
46872瀏覽量
237598 -
ai技術
+關注
關注
1文章
1258瀏覽量
24249
發布評論請先 登錄
相關推薦
評論