精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度智能語音交互的產業化成果豐碩,推進語音技術應用落地

牽手一起夢 ? 來源:電科技 ? 作者:辛雯 ? 2020-09-16 15:20 ? 次閱讀

9月15日,AI領域的行業盛會“百度世界2020”大會于線上隆重召開,一大波硬核技術襲來:百度創始人、董事長兼CEO李彥宏與總臺央視主持人康輝“虛擬人”亮相、顛覆搜索形態的“度曉曉”、沒有駕駛員的“全自動駕駛”、各行各業賦能案例……既有硬核技術,又有“接地氣”的落地應用。

在當天的百度大腦分論壇上,百度語音首席架構師賈磊重點講解了百度端到端語音交互技術。他表示,百度語音交互技術持續迭代升級,已發展成為基于深度學習技術的端到端的語音識別和語音合成技術。在語音識別層面,百度推出端到端信號聲學一體化建模的技術,語音合成方面,最新的Meitron和單人千面合成個性化技術亮相。同時交出了百度語音技術最新成績單:日均調用量超過155億次,廣泛應用在移動端、智能家居、和語音IoT等場景,智能語音產業化成果豐碩。

會上,賈磊分別從語音識別和語音合成兩個技術維度詳解了百度語音技術的發展迭代和最新成果。在語音識別方面,百度語音識別技術持續創新,從2012年首推深度學習技術,到2019年在業內首先把注意力模型應用于在線語音識別,推出流式多級的截斷注意力模型 SMLTA;再到如今全面進化為端到端的信號聲學一體化建模技術,在助力百度自身業務發展的同時,更好地賦能多場景、多產業應用。

百度智能語音交互的產業化成果豐碩,推進語音技術應用落地

作為百度語音識別技術的最新成果,端到端的信號聲學一體化建模技術很好地解決了傳統數字信號處理和語音識別級聯系統的各種問題,拋棄了各自學科的學科假設,通過端到端的建模,大幅提升了遠場語音識別率。

據賈磊介紹,端到端的信號聲學一體化建模技術由模型波束技術和模型AEC技術組成。前者進化為多分區融合的模型波束建模技術,在國際上由百度首次提出,較單分區技術進一步提升識別性能15%以上;后者是升級為基于雙LOSS實值掩蔽的模型AEC技術,可以解決設備有非線性情況下的回波消除問題,使得設備即使在播放音樂的時候,也能夠進行成功的打斷和高精準的語音識別。

此外,賈磊還在會上介紹了百度今年推出的端側全雙工語音交互技術。據他介紹,百度端側全雙工語音交互技術將復雜的建模過程轉化為3個端到端的深度學習過程,即信號聲學一體化建模、聲學語言一體化建模以及語義置信一體化建模。通過端到端的建模,該技術能夠將整個復雜的端側交互轉變成若干個深度學習計算,使得依靠一顆AI芯片就能完成端側的全雙工語音交互,從而大幅度提升車載手機等語音交互性能,顯著改善用戶體驗。

而在語音合成方面,百度自2013年啟動語音合成研發,歷經參數合成、拼接合成、深度學習語音合成和端到端的語音合成,到如今全新升級為包含個性化、多風格多角色、單人千面的語音合成系統,百度語音合成技術始終處于升級迭代中。

會上,賈磊依次介紹了百度語音合成技術的最新成果——個性化TTS,多風格、多角色,單人千面。個性化TTS是個性化定制的Meitron語音合成系統的最新演進,是基于子帶分解和GAN_loss的端側神經網絡聲碼器,也是業內首個在手機端多人通用的端側的基于神經計算的聲碼器。個性化TTS相較于傳統的基于信號處理和參數的聲碼器,ABX提升可以達到65:35,其已應用于地圖導航,目前每日的導航播報超過1億次。

多風格、多角色的語音合成,則是針對娛樂內容產業(例如小說)中存在的多個角色交替、多種情感需求并存的播報需求而研發的新技術。此前,用單一音色播報缺乏表現力,播報語音和文字本身的角色情感不一致,用戶長時間聽感到單調疲倦。百度通過深度學習技術對小說文本進行分析,判斷出角色、身份、情感,再借助多風格、多角色語音合成技術去合成小說中的聲音,從而實現聲音自然流暢、情感表現力豐富、用戶體驗優美的效果。

針對一個發音人需要用不同風格播報文本的應用場景,百度推出單人千面語音合成技術。該技術能夠把說話人的語音、文本、風格、內容、音色都進行分離,在進行語音合成的時候自由組合,從而能夠讓一個發音人同時去播報新聞、小說、脫口秀、讀書、詩歌等不同風格。

“百度智能語音交互的產業化成果豐碩,目前百度智能語音的日均調用量超過155億次,廣泛應用于移動端、智能家居、智能車載、智能服務以及語音IoT,極大地提高了中國社會的智能化程度。”賈磊表示。語音技術作為百度大腦的重要AI能力之一,不但應用于百度搜索、百度輸入法、百度地圖、小度音箱等百度系列產品,更通過百度大腦AI開放平臺廣泛賦能眾多行業和場景的合作伙伴。未來,百度還將持續創新升級語音交互技術,推進語音技術應用落地,助力更多產業智能化轉型升級。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 百度
    +關注

    關注

    9

    文章

    2257

    瀏覽量

    90258
  • 智能家居
    +關注

    關注

    1926

    文章

    9516

    瀏覽量

    184321
  • IOT
    IOT
    +關注

    關注

    186

    文章

    4178

    瀏覽量

    196238
收藏 人收藏

    評論

    相關推薦

    百度世界2024公開課完美結束

    近日,以“應用來了"為主題的百度世界2024在上海召開。當天下午,百度世界33節線下AI公開課在上海世博中心開講,33位來自百度內部的高階技術人員、外部行業專家及一線高校講師,為開發者
    的頭像 發表于 11-22 09:54 ?154次閱讀

    百度將發布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內置先進的人工
    的頭像 發表于 11-11 14:50 ?337次閱讀

    百度智能云推出“千帆行業增強版”

    在近日于北京舉辦的2024智能經濟論壇上,百度集團執行副總裁、百度智能云事業群總裁沈抖分享了百度在人工
    的頭像 發表于 05-30 09:30 ?549次閱讀

    智能語音交互技術如何助力設備實現人機自然對話

    隨著現代人工智能在各行業的普及,智能語音交互技術也越來越多的在日常工作、生活中應用,智能
    的頭像 發表于 05-23 15:16 ?683次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>交互</b><b class='flag-5'>技術</b>如何助力設備實現人機自然對話

    智能語音交互技術如何助力設備實現人機自然對話

    智能語音交互技術是指通過語音識別、語音合成和自然語言理解等
    的頭像 發表于 05-23 15:14 ?358次閱讀

    百度智能云攜手烏鎮共建AI數據產業基地

    近日,百度智能云與桐鄉市烏鎮大數據高新技術產業園區簽署合作協議,雙方將發揮各自優勢,以人工智能標注產業為基礎,共建
    的頭像 發表于 04-01 16:12 ?608次閱讀

    東莞與百度簽署戰略合作協議,推動人工智能的全場景應用落地

    3月22日,東莞市人民政府與百度簽署戰略合作協議,雙方將緊密圍繞人工智能產業發展,充分發揮百度在 AI 算法、云計算、大數據、自動駕駛技術
    的頭像 發表于 03-25 10:05 ?810次閱讀

    東莞市與百度合作推動人工智能的全場景應用落地

    3月22日,東莞市人民政府與百度簽署戰略合作協議,雙方將緊密圍繞人工智能產業發展,充分發揮百度在 AI 算法、云計算、大數據、自動駕駛技術
    的頭像 發表于 03-25 10:05 ?571次閱讀
    東莞市與<b class='flag-5'>百度</b>合作推動人工<b class='flag-5'>智能</b>的全場景應用<b class='flag-5'>落地</b>

    首屆百度智能云全球生態大會,4月9日成都見!

    為了加快人工智能的發展步伐,進一步推動大模型產業的實際落地,促進AI原生應用的全面繁榮,百度智能云將于2024年4月9日在成都舉辦首屆“
    的頭像 發表于 03-12 09:43 ?609次閱讀

    【有獎】 百度智能目推出首款多模態 AI 模組,應用場景有獎征集!

    他來了,他來了 大模型時代悄然到來 百度首款大模型落地的硬件產品 目多模態AI模組LUCA系列正式亮相 目LUCA深度集成百度
    的頭像 發表于 02-26 15:19 ?516次閱讀

    華為智能座艙與百度地圖簽署生態合作協議 共創導航出行新體驗

    此次簽約,百度地圖和華為智能座艙將在智能座艙領域共同打造車機版百度地圖,將手機端百度地圖的豐富體驗延伸到車端,包括車道級導航、紅綠燈倒計時、
    的頭像 發表于 01-19 15:50 ?635次閱讀

    語音數據集:智能語音技術的燃料與推動力

    隨著人工智能技術的不斷進步,語音技術作為人機交互的重要方式,正在逐漸滲透到我們的日常生活中。而語音數據集作為
    的頭像 發表于 12-29 11:11 ?381次閱讀

    語音數據集:開啟智能語音技術的新篇章

    隨著人工智能技術的飛速發展,語音數據集在推動智能語音技術的進步中發揮著越來越重要的作用。語音數據
    的頭像 發表于 12-29 11:06 ?634次閱讀

    語音數據集:AI語音技術的靈魂

    一、引言 在人工智能領域,語音技術被譽為“未來人機交互的入口”,而語音數據集則是AI語音
    的頭像 發表于 12-14 14:33 ?979次閱讀

    離線語音識別技術:掌控未來的語音交互

    離線語音識別技術的核心優勢在于其獨立性和實時性。在沒有網絡連接的情況下,設備依然能夠迅速識別用戶的語音指令,實現各種功能。這使得語音交互更加
    的頭像 發表于 12-13 11:12 ?552次閱讀
    離線<b class='flag-5'>語音</b>識別<b class='flag-5'>技術</b>:掌控未來的<b class='flag-5'>語音</b><b class='flag-5'>交互</b>