精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器翻譯的真實水平如何,夢想與現實的距離到底有多遠?

mK5P_AItists ? 來源:lp ? 2019-03-22 14:08 ? 次閱讀

摘要:近年來,機器翻譯等語言智能技術迅猛發展,語言智能技術落地、機器翻譯替代人工、外語教育存廢、外語教學改革等,成為社會熱議話題。外語教育如何將語言智能的挑戰作為轉型的契機更好發展?怎樣理性認識語言智能技術的發展未來?聚焦"語言智能與外語教育協同發展",自動化所宗成慶研究員這樣說......

如何突破語言障礙,讓機器完成不同語言之間的自動翻譯,最終實現任意時間、任意地點、任意語言之間的無障礙自由通信,是人類長期以來的夢想。

近年來,隨著計算機性能的提高,云計算、大數據和機器學習等相關技術迅速發展,人工智能再度崛起,機器翻譯重新成為人們關注的焦點。一時間,機器翻譯系統如雨后春筍般涌現,各種報道隨之呈井噴式爆發,"機器翻譯將取代人類"的說法也時有耳聞。然而,機器翻譯的真實水平如何,夢想與現實的距離到底有多遠?

從低迷到興盛

機器翻譯概念于1947年被提出,隨后成為人工智能研究的核心問題。在70多年的發展歷程中,機器翻譯研究經歷了幾個不同的歷史階段:

從概念提出到1954年美國喬治敦大學(GeorgetownUniversity)在IBM公司的幫助下實現第一個機器翻譯演示系統,可以認為是機器翻譯的初創時期。

1966年,美國國家科學院語言自動處理咨詢委員會(AutomaticLanguageProcessingAdvisoryCommittee,ALPAC)發布題為《語言與機器》的報告,宣稱"目前給機器翻譯研究以大力支持沒有太多的理由","機器翻譯遇到了難以克服的語義障礙",從而導致機器翻譯研究在世界范圍內走向低迷。

20世紀70年代中后期至80年代前期,部分機器翻譯系統在特定領域得到初步應用(如加拿大蒙特利爾大學研制的天氣預報翻譯系統TAUM-METEO)。歐洲共同體實施的歐洲翻譯體系(EuropeanTranslationSystem,EUROTRA)計劃和日本對第五代計算機的研究都對機器翻譯研究給予了支持,機器翻譯研究開始復蘇。

20世紀80年代末期,IBM公司實現了基于噪聲信道模型的統計機器翻譯系統,并在美國國防部高級研究計劃署(ARPA)組織的評測中取得了較好成績,推動了機器翻譯技術的快速發展。尤其進入2000年之后,GIZA++、Pharaoh、Moses等一批開源工具相繼發布,2006年谷歌翻譯正式上線運行,2011年百度翻譯上線,各大公司陸續推出了自己的翻譯系統,整個機器翻譯領域呈現出蓬勃發展、遍地開花的大好局面。

2013年基于神經網絡模型的機器翻譯(簡稱"神經機器翻譯")方法被提出,機器譯文的質量得到大幅提升,并且很多開源工具被相繼公布,機器翻譯技術研究和系統推廣應用均出現前所未有的盛況。統計機器翻譯和神經機器翻譯的基本原理都是基于已有的大規模句子級雙語對照語料進行模型訓練,建立最優的翻譯模型,最終實現從一種語言到另一種語言的翻譯。通常情況下,用于訓練模型的語料規模越大,模型性能表現就越好。

被夸大的技術

機器翻譯技術的進步和系統性能的提升在為人們日常生活和工作帶來更多便利的同時,也為該技術的產業化發展帶來了更多商機。這種空前局面不僅讓人們看到了夢想成真的希望,也點燃了部分人心中按捺不住的欲望。從傳統媒體到新媒體,對機器翻譯技術夸大宣傳的聲音不絕于耳,但一個不可否認的事實卻是,目前的機器翻譯技術尚不成熟,無論是文本翻譯,還是口語翻譯,機器翻譯的質量遠沒有達到令人滿意的水平。

當前所有的商用文本機器翻譯系統普遍存在的問題:

一是錯翻、漏翻和重復翻譯比比皆是,尤其對成語、縮略語、專業術語和人名、地名、組織機構名稱等的翻譯更是招數無幾。

二是難以實現篇章范圍內的指代消解,常常張冠李戴,例如,前面說的是美國與伊朗之間的事情,后面翻譯"美伊兩國"時卻譯成了美國與伊拉克。

三是缺乏足夠的在線優化能力,無法從譯員修改譯文的過程中自動學習和更新翻譯知識,即使譯員對系統給出的某個錯誤譯文反復修改,系統依然照錯不誤。

四是對口語而言,說話人的語氣、重音、語調,甚至肢體語言無法得到充分利用,尤其當說話人的口音較重、用詞過于生僻、話語主題超出先驗知識范圍時,譯文的質量無法保障。

高端翻譯不可取代

我們并不否認機器翻譯技術的進步,正如前文所述,機器譯文的質量已有顯著改善。在日常口語對話中,對于資源較為充分的語言(如英漢、日漢等),在說話場景不是非常復雜、口音基本標準、語速基本正常、使用詞匯和句型不是非常生僻的情況下,口語翻譯的性能基本可滿足正常交流的需要。專業領域的文本機器翻譯在訓練語料較為充分時,譯文準確率可達到80%以上。而對于資源匱乏的語言之間的翻譯(如波斯語或達利語等與漢語之間的翻譯),譯文質量還十分有限。

毋庸置疑,機器翻譯可能替代那些任務重復性較大、翻譯難度較低的低端翻譯人員,如天氣預報查詢、旅館預訂服務、交通信息咨詢等翻譯,但不可能取代高端翻譯(如重要文獻、偉人著作、文學名著等翻譯)人員,更不可能消除翻譯職業。"信、達、雅"是翻譯的終極目標,我們可以預期,未來的機器翻譯系統能夠輔助高端翻譯人員提高翻譯效率,但要實現無須人工干預的高質量全自動翻譯恐怕還是一個愿望。

不得不說的是,任何負責任的科學家和企業界都有責任和義務把技術或產品的真實水平和性能告知公眾,而不是一味地宣揚,甚至為了利益而故弄玄虛。實事求是是一種態度,也是一種品格。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動化
    +關注

    關注

    29

    文章

    5519

    瀏覽量

    79122
  • 機器學習
    +關注

    關注

    66

    文章

    8382

    瀏覽量

    132444
  • 機器翻譯
    +關注

    關注

    0

    文章

    139

    瀏覽量

    14873

原文標題:機器翻譯技術現狀評述與展望 | 行業觀察

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RTOS與Linux到底有什么區別

    很多做嵌入式開發的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區別?
    的頭像 發表于 10-29 09:53 ?340次閱讀

    CMOS運放的輸入阻抗到底有多高呢?

    都說CMOS運放輸入阻抗高,到底有多高呢?可有一個量化指標?
    發表于 09-06 06:59

    求助,這個電路U1A運放同相端的R1電阻到底有什么作用啊?

    想問下這個電路U1A運放同相端的R1電阻到底有什么作用啊?很郁悶。
    發表于 08-27 07:09

    ESP32的BLE最大通信距離多遠

    ESP32-S3官方模塊的藍牙在PCB板載天線,外置天線的不同情況下,125K,500K,1M,2M的不同速率下,通信距離最大可達多遠? ESP32的BLE最大通信距離
    發表于 07-01 07:22

    EWSTM8-2201 or 3101安裝說明上有的說選“是”,有的說選“否”,二者到底有什么區別?對工程什么影響?

    the installation. ......... 安裝說明上有的說選“是”,有的說選“否”,二者到底有什么區別?對工程什么影響?
    發表于 04-28 08:08

    網橋傳輸距離多遠

    網橋(Bridge)是一種早期的兩端口二層網絡設備,用來連接不同網段。網橋的兩個端口分別有一條獨立的交換信道,不是共享一條背板總線,可隔離沖突域。 網橋傳輸距離多遠? 網橋的傳輸距離因傳輸環境和設備
    的頭像 發表于 04-02 15:57 ?1906次閱讀

    ST60 GHz RF收發器能傳輸多遠距離

    看了ST60 GHz RF收發器之后,同時集成發送和接收路徑,想知道ST60能傳輸多遠距離?哪位大神知道!
    發表于 04-02 06:59

    網線到底有多少種連接器

    我們在談論網線的時候,聊得最多的,一定是它的連接器,它在連接過程中扮演著極為重要的角色。網線到底有多少種連接器?本期我們將從工業級使用出發,來看看這根似乎普通的網線,在連接器上有多么努力。
    的頭像 發表于 01-26 10:06 ?573次閱讀

    NUC123的USB外設到底有沒有DMA功能?

    下載最新的TRM 1.07: 在最先前的描述以及USB的寄存器章節都有DMA相關的內容。但是DMA那一章節里的框圖沒有USB外設。同時關于USB外設DMA的用法也沒具體說明。所以USB外設到底有沒DMA功能,若是該怎么用?
    發表于 01-16 08:26

    AD7280AWBSTZ和AD7280ABSTZ之間到底有什么區別?

    替代嗎?在網上找到的兩個芯片的相關數據都是一樣的,AD7280AWBSTZ和AD7280ABSTZ之間到底有什么區別?
    發表于 01-08 06:36

    COB與SMD到底有什么不同?

    COB與SMD到底有什么不同?? COB和SMD是兩種常見的電子元器件封裝技術。它們在電子行業中被廣泛應用,尤其在LED照明領域。雖然它們都用于將芯片連接到電路板上,但它們在封裝技術和應用方面有一些
    的頭像 發表于 12-29 10:34 ?1663次閱讀

    母線槽與電纜到底有何區別?

    母線槽與電纜到底有何區別? 母線槽與電纜是電力傳輸中常見的兩種設備,它們有著各自的特點和應用領域。下面將分別從使用范圍、結構設計、傳輸能力、安裝維護等方面詳細介紹母線槽與電纜的區別。 一、使用范圍
    的頭像 發表于 12-26 14:02 ?1602次閱讀

    到底有哪些原因會導致電樞絕緣阻值為零?

    對電機多大影響,現在這樣用能安全使用多長時間,為什么電樞會是零呢,到底有哪些原因會導致電樞絕緣阻值為零?
    發表于 12-14 08:30

    雷達模塊支持多遠的感應距離

    雷達模塊支持多遠的感應距離? 雷達模塊是一種使用無線電波進行距離測量和目標檢測的設備。它廣泛應用于航空、航天、軍事、車輛導航、智能交通系統等領域。不同類型的雷達模塊可以實現不同的感應距離
    的頭像 發表于 12-12 15:06 ?951次閱讀

    基于機器翻譯增加的跨語言機器閱讀理解算法

    近日,阿里云人工智能平臺 PAI 與華南理工大學朱金輝教授團隊、達摩院自然語言處理團隊合作在自然語言處理頂級會議 EMNLP2023 上發表基于機器翻譯增加的跨語言機器閱讀理解算法 X-STA。通過
    的頭像 發表于 12-12 10:28 ?559次閱讀
    基于<b class='flag-5'>機器翻譯</b>增加的跨語言<b class='flag-5'>機器</b>閱讀理解算法