精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

科大訊飛語音翻譯新技術路線上再獲突破

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-05 17:14 ? 次閱讀

科大訊飛日前在全球最具影響力的口語機器翻譯評測比賽IWSLT中,獲得了語音翻譯端到端模型評測的冠軍,還成為英德口語翻譯任務中唯一受邀做Oral report的參賽團隊。端到端技術是當前語音翻譯的研究前沿,科大訊飛聯合優化語音識別和機器翻譯的新技術路線,理論上更具前景,一旦技術研究成功,將為翻譯機器性能的提升帶來極大促進。

提問:語音翻譯涉及哪些步驟?

你或許會說,語音識別和機器翻譯——沒錯,傳統的語音翻譯通常采用語音識別和機器翻譯級聯的方式實現,對輸入語音先進行語音識別得到文本結果,然后再基于文本進行機器翻譯,這也是當前語音翻譯采用的主流方法。

不過,由于口語句子中含有大量非規范語言現象,例如重復、省略、顛倒,以及語義邏輯不清,斷句困難等問題,導致后續機器翻譯帶來嚴重的挑戰。此外,復雜環境下語音識別受發音人口音、環境噪聲,以及和語言中存在的同音詞、易混淆詞等復雜音素的影響也存在著識別錯誤,對最終機器翻譯性能也可能帶來影響。

因此,實際應用系統中,通常會在語音識別和機器翻譯之間增加一個語音識別后處理模塊,通過對識別結果進行規整、斷句、順滑、標點預測,甚至糾錯來盡可能地減小口語化和識別錯誤的影響。

不過,受語音和語言復雜性的影響,截止到目前為止,這些問題并沒有被真正解決。

在剛剛結束的2018年國際口語機器翻譯評測比賽(International Workshop on Spoken Language Translation,IWSLT)中,科大訊飛團隊在端到端模型(End-to-End Model)的評測比賽中,以顯著優勢奪得第一名。該獎項也是科大訊飛今年在各項國際競賽中的第9個“世界冠軍”。

端到端語音翻譯技術路線,是通過構造一個完整的神經網絡模型,聯合優化語音識別、識別后處理和機器翻譯,建立源語言語音信號到目標語言文字的映射關系,進而實現從原始語音到目標譯文的翻譯。

這提供了一種解決語音翻譯的新思路,而且從目前看是初步可行的。一旦技術研究成功,理論上可以讓語音翻譯更準更快,未來也將為翻譯機器性能的提升帶來極大促進。

國際頂級口語機器翻譯評測比賽 IWSLT,推動語音翻譯新方向

IWSLT是國際上最具影響力的口語機器翻譯評測比賽之一,重點關注口語,實現語音到文本的翻譯,從而解決人和人交流的問題。

到目前為止,IWSLT已經舉辦了15屆,吸引了全球70多家科研團隊的參與。IWSLT針對語音翻譯實際應用面臨的難題,通過每年設定一些研究任務,并向外界提供公開的數據集合和評測交流機會,吸引了來自全球的科研團隊參與,對于推動語音翻譯技術創新和知識共享具有重要的意義。

除了科大訊飛,IWSLT 2018吸引了世界各地多所機器翻譯領域的知名大學及研究所參加,包括英國愛丁堡大學(University of Edinburgh)、美國約翰霍普金斯大學(JHU)、德國卡爾斯魯厄理工學院(KIT)、意大利Bruno Kessler 基金會(FBK)、芬蘭赫爾辛基大學(Helsinki),以及國內的阿里巴巴、搜狗等。

本次比賽包括兩個主要任務,一是英語到德語演講場景下的語音翻譯任務;二是巴斯克語到英語的低資源文本翻譯任務。

其中,在英語到德語的語音翻譯任務上,主辦方在今年提出了兩種評測方案:

傳統路線,也即語音識別、識別后處理、機器翻譯分而治之,稱之為基線模型(baseline Model);

端到端模型(End-to-end Model),將語音識別、識別后處理和機器翻譯統一起來聯合優化,能夠在一定程度上避免傳統基線模型中存在的識別錯誤擴散等問題,是一種新的思路,理論上更具前景。

端到端模型是當前口語翻譯研究領域的前沿,隨著深度學習的進步,研究人員開始探索通過構造一個完整的神經網絡模型,建立語音信號到目標文字的映射關系。

該方法通過將語音識別、識別后處理和機器翻譯統一起來聯合優化,為解決傳統級聯方案分而治之中存在的難題提供了一種新的思路。例如,2017年Interspeech會議上,谷歌研究人員就將該方法應用到西班牙到英語的語音翻譯任務上,取得初步成效。

引入這一新的評測方案,也體現了IWSLT主辦方引導科研探索,推動語音翻譯技術不斷進步的努力。

科大訊飛勇于挑戰新路線,端到端語音翻譯獲得第一

科大訊飛參與了口語翻譯的兩種評測,并且是唯一參與端到端模型這種新技術路線的中國團隊。不僅如此,科大訊飛還作為唯一受組委會邀請的語音翻譯任務參賽團隊、進行Oral report,向與會人員分享兩種技術路線研究所采用的方法,對促進語音翻譯新技術的進步具有重要作用。

因為語言和語音本身的復雜性,新技術路線對統一建模需要很強的語音處理能力和調序能力,加之語言本身受到口語表達、環境噪聲的干擾,所以端到端技術路線要實現從原始語音到目標文本的翻譯,就是難上加難。

值得一提,賽事提供的公開數據集合中,能夠為端到端模型方法提供直接的有監督數據是小規模的。要在3個月的時間里,在小規模數據上構建一套高性能的端到端語音翻譯系統,非常具有挑戰性。

基于語音和機器翻譯上雄厚的技術積累,訊飛研究團隊針對端到端語音翻譯任務開展了探索性研究,最終在英德語音翻譯任務的端到端模型評測方案上獲得了第一名(與第二名BLEU分數拉開9個百分點,一般而言,提升3個百分點就能明顯體會到系統的優劣差異)。

不僅如此,在基線模型評測中,科大訊飛也取得了第二名的好成績。

“比賽的成績只是一方面,我們看重的是在源頭技術、新技術上進行探索,”科大訊飛的研究人員表示。

“我們參加了本次IWSLT評測的語音翻譯任務,在基于傳統的基線模型中,針對語音識別文本結果和機器翻譯訓練數據源語言文本風格不匹配問題,提出了對源語言文本逆變換以適配識別風格的方法,提高了語音翻譯的魯棒性。在端到端模型中,提出了基于DenseNet和BiLSTM編碼,以及基于自注意力機制解碼的端到端建模方案。實驗結果表明,盡管當前端到端模型的效果低于傳統方法,但從結果來看也證明該方法具有一定的可行性,整體系統框架也更加簡潔優雅,有望為語音翻譯提供一種新的解決思路。”

客觀評價語音翻譯端到端技術,數據將是一大瓶頸和障礙,因為語音識別的數據已積累了上十萬小時、機器翻譯的數據搜集也達到千萬甚至上億,但端到端的模型,需要專門的語音到文本的句對,這方面的數據目前積累不夠,若要商業化,還需要更大的數據支撐。

對此,科大訊飛研究團隊表示,“由于語音翻譯任務的復雜性以及訓練數據搜集的困難,無論傳統的基線模型方案還是最新提出的端到端語音翻譯方案,在實際應用中都還面臨一系列的難題,需要學術界和產業界共同努力。”

至于端到端的新技術,“如果能減少對有監督語音翻譯平行數據的依賴那是最好不過,而且這存在一定的可能性,例如可以嘗試借用現有的語音識別訓練數據和機器翻譯訓練數據,我們正在努力探索。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    38

    文章

    1724

    瀏覽量

    112548
  • 機器翻譯
    +關注

    關注

    0

    文章

    139

    瀏覽量

    14873
  • 科大訊飛
    +關注

    關注

    19

    文章

    789

    瀏覽量

    61187

原文標題:語音翻譯也能端到端?深度學習這條路有戲!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    科大飛發布飛星火4.0 Turbo大模型及星火多語言大模型

    近日,科大飛正式推出了其最新研發成果——飛星火4.0 Turbo大模型。這一發布不僅標志著科大飛在人工智能領域的又一次重大
    的頭像 發表于 10-24 13:58 ?322次閱讀

    科大飛發布星火超擬人數字人

    了語義貫穿的“口唇-表情-動作”的超擬人數字人生成。這一技術突破,使得數字人在表達情感和動作時更加真實、自然,如同在和真人進行對話一般。 在科大飛的演示中,我們可以看到由大模型生成
    的頭像 發表于 10-24 11:03 ?377次閱讀

    科大飛AI總部園區正式啟用

    近日,安徽省科技創新領域迎來又一重大里程碑,科大飛AI總部園區(飛小鎮)正式宣告啟用,標志著這一集前沿科技、創新研發與高端人才于一體的智慧高地正式揚帆起航。此次啟用,不僅為安徽省乃至全國的科技創新版圖增添了濃墨重彩的一筆,也
    的頭像 發表于 09-03 16:06 ?573次閱讀

    科大飛星火大模型新添功能,語音臺歷即將面世

     4月26日,科大飛宣布飛星火大模型V3.5春季更新,新增功能包括:支持長文本、長圖文、長語音的大模型,首推星火圖文識別大模型,能夠快速識別并學習多種類型的海量知識,提供更為專業、
    的頭像 發表于 04-28 11:30 ?465次閱讀

    科大飛創新推出長文本、長圖文、長語音大模型,解決落地難題

    近期,科大飛推出了首個支持長文本、長圖及語音大數據處理的大模型,該系統融合了多元化數據源,包括海量文字、圖片以及會議音頻等,能為各行業場景提供專業化、精準化的答案。
    的頭像 發表于 04-28 09:32 ?357次閱讀

    科大飛華中總部已封頂 年內交付使用

    科大飛華中總部已封頂 年內交付使用 科大飛華中總部位于武漢經開區車谷資本島,投資額50億;計劃建成科大
    的頭像 發表于 04-16 14:49 ?1466次閱讀

    科大飛成立未來科技公司

    科大飛成立未來科技公司 日前科大飛成立未來科技公司,名稱是浙江科未來科技有限公司,注冊資本達3000萬元,浙江科
    的頭像 發表于 02-20 11:56 ?1057次閱讀

    科大飛發布“飛星火V3.5”:基于全國產算力訓練的全民開放大模型

    科大飛,作為中國領先的智能語音和人工智能公司,近日宣布推出首個基于全國產算力訓練的全民開放大模型“飛星火V3.5”。
    的頭像 發表于 02-04 11:28 ?1461次閱讀

    科大飛發布星火語音大模型

    科大行業資訊
    北京中科同志科技股份有限公司
    發布于 :2024年01月31日 09:17:28

    舒適打字體驗與強大功能合一:科大飛AI智能鍵盤D1的優勢解析

    標題:舒適打字體驗與強大功能合一:科大飛AI智能鍵盤D1的優勢解析 一、強大的AI功能提升工作效率 科大飛AI智能鍵盤D1是一款集成了多種AI功能的鍵盤,包括
    的頭像 發表于 01-03 11:04 ?568次閱讀
    舒適打字體驗與強大功能合一:<b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛AI智能鍵盤D1的優勢解析

    科技創新與智能助力:揭秘科大飛智能鍵盤D1的獨特魅力

    魅力,從多個功能角度進行介紹,并探討其適用于年會采購、企業送禮以及辦公采購等場景。 ? 一、語音翻譯:打破語言壁壘 智能鍵盤D1搭載了科大飛自主研發的
    的頭像 發表于 01-03 11:02 ?619次閱讀
    科技創新與智能助力:揭秘<b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛智能鍵盤D1的獨特魅力

    科大飛AI智能鍵盤D1:語音打字AI智能PPT、AI寫作提高辦公效率

    鍵矮軸機械鍵盤的特點,同時集成了智能截圖、語音翻譯語音打字和智能辦公助手等多項功能 ? ? 科大飛旗下星火認知大模型AI智能鍵盤D1,憑
    的頭像 發表于 01-02 14:56 ?1471次閱讀
    <b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛AI智能鍵盤D1:<b class='flag-5'>語音</b>打字AI智能PPT、AI寫作提高辦公效率

    科大飛AI機械鍵盤D1的前瞻性設計:告別傳統,迎接智能化時代

    大模型是 科大飛AI智能鍵盤D1的核心技術,它能夠為用戶提供智能截圖、語音翻譯語音打字、智能
    的頭像 發表于 12-29 16:22 ?786次閱讀
    <b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛AI機械鍵盤D1的前瞻性設計:告別傳統,迎接智能化時代

    AI鍵盤綜合評測:科大飛AI智能鍵盤D1能否成為市場熱門之選?

    科大飛AI智能鍵盤D1憑借其出色的語音翻譯、移動辦公、高續航和三模無縫銜接等功能,成為一款備受關注的產品。對于年會采購、年會禮品、企業送禮以及辦公采購等場景而言,該產品具有極高的適用
    的頭像 發表于 12-29 15:02 ?982次閱讀
    AI鍵盤綜合評測:<b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛AI智能鍵盤D1能否成為市場熱門之選?

    科大飛語音控制模塊怎么用

    科大飛語音控制模塊是一種人機交互技術,它利用語音識別和語音合成
    的頭像 發表于 12-25 13:58 ?1689次閱讀