去年 11 月的互聯(lián)網(wǎng)大會期間,搜狗與新華社聯(lián)合發(fā)布全球首個AI合成主播一經(jīng)亮相,引起了人們對“AI+媒體”的廣泛討論。如今,搜狗 AI 合成主播不斷更新迭代。
2 月 19 日,在新華社新媒體中心與搜狗公司戰(zhàn)略合作簽約儀式上,搜狗公司與新華社新媒體中心聯(lián)合發(fā)布了站立式 AI 合成主播,這次新的 AI 合成主播從過去的“坐著播新聞”升級成結(jié)合肢體動作的“站立式播報”,標(biāo)志著“搜狗分身”技術(shù)再次取得突破。
據(jù)了解,初代 AI 合成主播由“搜狗分身”技術(shù)打造,這項技術(shù)讓機器首次做到逼真的模擬人類說話時的聲音、嘴唇動作和表情,并且將三者自然匹配,創(chuàng)造出人類的 AI 分身,進而幫助人類提高信息表達和傳遞的效率。
那此次發(fā)布的站立式 AI 合成主播又開拓了哪些“技能”?據(jù)搜狗方面介紹,新版的 AI 合成主播采用了“搜狗分身”的 WaveRNN 波形建模技術(shù),可以實現(xiàn)逼真的語音合成效果,讓 AI 的聲音更具有真實情感和表現(xiàn)力。而在圖像生成方面,新版的 AI 合成主播實現(xiàn)了更加逼真的表情生成、自然的肢體動作以及嘴唇動作預(yù)測等能力,而且還讓 AI 合成主播“動”了起來,這提升了合成主播的表現(xiàn)力。
什么是“搜狗分身”技術(shù)?它誕生于搜狗“自然交互+知識計算”的人工智能理念之下,能夠利用搜狗的 AI 能力,從圖像表情,聲音語言習(xí)慣,邏輯思維等層面對 AI 進行擬人化訓(xùn)練,然后克隆制造人類的 AI 分身,進而幫助人類提高信息表達和傳遞的效率。
搜狗方面表示,隨著“搜狗分身”技術(shù)能力的不斷提高,AI 合成主播的定制周期也大為降低,合成效果和穩(wěn)定性也有著顯著提升。值得一提的是,此次發(fā)布會同時發(fā)布了首個 AI 合成女主播,這是“搜狗分身”技術(shù)持續(xù)復(fù)制不同類型、不同特點 AI 合成主播能力的一個體現(xiàn)。目前,僅靠少量用戶真實音視頻數(shù)據(jù),搜狗即可快速定制出高逼真度的分身模型,幫助媒體在融媒體轉(zhuǎn)型、新聞時效性、跨語種傳播能力等領(lǐng)域升級。
搜狗 CEO 王小川介紹,作為 AI 合成主播的技術(shù)核心,“搜狗分身”技術(shù)未來還將應(yīng)用于娛樂、醫(yī)療、健康、教育、法律、金融等多個領(lǐng)域,通過提供個性化的行業(yè)解決方案,為不同職業(yè)賦能,提升整個社會的信息生產(chǎn)力。
據(jù)悉,目前首批入職新華社的一中一英兩位 AI 合成主播,已生產(chǎn) 3400 余條新聞報道,累計時長達 10000 多分鐘,參與了包括第五屆世界互聯(lián)網(wǎng)大會、首屆進博會、2019 春運、春節(jié)等報道,成為中國人工智能與傳媒業(yè)大膽融合并付諸規(guī)模化應(yīng)用的典型案例。
-
搜狗
+關(guān)注
關(guān)注
0文章
90瀏覽量
13920 -
AI
+關(guān)注
關(guān)注
87文章
30239瀏覽量
268480
原文標(biāo)題:搜狗分身技術(shù)再進化,讓AI合成主播“動”起來
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論