精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

無需翻譯的無監督復述的新方法:允許從輸入句子生成多樣化、但語義上接近的句子

DPVg_AI_era ? 來源:lq ? 2019-06-29 07:41 ? 次閱讀

無需翻譯的無監督復述的新方法:允許從輸入句子生成多樣化、但語義上接近的句子。模型基于矢量量化自動編碼器(VQ-VAE),可以在單純語言環境中解釋句子。它還具有獨特的功能,即與量化瓶頸并行的殘余連接,可以更好地控制解碼器熵并簡化優化過程。

近年來,研究人員一直在嘗試開發自動復述的方法,復述就是對相同語義的不同表達,例如一句話,可以有一千種說法。這需要從文本中自動抽象語義內容。

由于缺乏可用的復映對標記數據集,目前更多的是使用依賴于機器翻譯(MT)技術的方法,已經被證明非常受歡迎。

理論上來看,翻譯技術可能是自動復述的有效解決方案,因為翻譯技術是從語言實現中抽象出語義內容。例如,將相同的句子分配給不同的翻譯者,最終翻譯出來的內容通常是有差別的,這樣就得到一個豐富的解釋集,在復述任務中可能會非常有用。

盡管許多研究人員已經開發出基于翻譯的自動復述方法,但顯然人類并不需要翻譯才能解釋句子。

基于這一觀察結果,Google Research的兩位研究人員最近提出了一種新的復述技術,可以不依賴機器翻譯的方法。

在預先發表在arXiv上的論文中,他們將這種單語方法與其他翻譯技巧進行了比較(例如監督翻譯和無監督翻譯方法),該論文被引用了47次。

進行這項研究的兩位研究人員Aurko Roy和David Grangier在他們的論文中寫道:“這項工作建議只從未標記的單語語料庫中學習復述模型…為此,我們提出了矢量量化變分自動編碼器的殘差變量。”

Aurko Roy

David Grangier

研究人員介紹的模型基于矢量量化自動編碼器(VQ-VAE),可以在單純語言環境中解釋句子。同時,它還具有獨特的特征(即與量化瓶頸并行的殘余連接),這使得能夠更好地控制解碼器熵、并簡化優化過程。他們的模型只需要在一種語言中使用未標記的數據:即用語言來解釋句子。

研究人員在論文中解釋道:“與連續自動編碼器相比,我們的方法允許從輸入句子生成多樣化、但語義上接近的句子。”

在研究中,Roy和Grangier將他們的模型表現與其他基于MT的方法在復述識別、生成和訓練增強方面的表現進行了比較。

他們特別將這種方法,與在平行雙語數據上訓練的監督翻譯方法、以及在兩種不同語言的非平行文本上訓練的無監督翻譯方法進行了比較。

研究人員發現,他們的單語方法在所有任務中均優于無監督翻譯技術。另一方面,他們的模型和監督翻譯方法之間的比較產生了混合的結果:單語方法在識別和增強任務中表現更好,而監督翻譯方法在復述生成方面表現更好。

研究人員總結道:“總的來說,我們發現在進行復述識別和數據增強方面,單語模型可以勝過雙語模式。單語模型的生成質量要高于基于無監督翻譯的模型,但并不高于基于有監督翻譯的模型。”

Roy和Grangier的研究結果表明,雖然使用雙語并行數據(即文本及在其他語言中的可能翻譯)在產生復述能夠得到更卓越的表現。然而,在雙語數據不易獲得的情況下,谷歌研究院提出的單語模型可能是一種有用的資源或替代解決方案。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1131

    瀏覽量

    40684
  • 谷歌
    +關注

    關注

    27

    文章

    6142

    瀏覽量

    105116
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24649

原文標題:谷歌NLP新方法:無需翻譯,質量優于無監督翻譯模型

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NLPIR語義分析是對自然語言處理的完美理解

    單位,詞語具有特定的語義和內涵。在詞語層次上,詞語語義分析意味著詞語的內涵分析、詞語之間的語義相似度或相關度分析,這是句子分析和篇章語義分析
    發表于 10-19 11:34

    一種在金上生成硫醇封端的SAM的新方法

    一種在金上生成硫醇封端的SAM的新方法 - 應用簡報
    發表于 10-30 11:05

    如何使用MangaGAN新方法生成久保帶人Style的漫畫形象?

    如何使用MangaGAN新方法生成久保帶人Style的漫畫形象?
    發表于 09-27 06:00

    深入挖掘通用句子編碼器的每個組成部分

    是有用的。Cer et. al提出了一種稱為“通用句子編碼器”的模型。在這篇文章中,我將解釋“Universal Sentence Encoder(通用句子編碼器)”背后的核心思想,以及它如何
    發表于 11-02 15:23

    一種改進的句子相似度計算模型

    在基于實例的機器翻譯中,句子相似度計算是實例匹配的有效機制。該文對基于相同詞的句子相似模型作進一步的改進,包括關鍵詞抽取,以及在句子相似度的定義中引入同義詞
    發表于 11-20 15:18 ?9次下載

    英漢機器翻譯中基于模式的譯文生成

    本文介紹一種基于模式的機器翻譯的譯文生成方法,并提出一種句法結構與語義信息相結合的模板匹配算法。最后給出本算法對英語句子進行測試的實驗結果。
    發表于 09-25 16:26 ?15次下載

    漢語句子聯想生成

    在一定的語言環境中漢語詞語之間存在著優先組合搭配關系,據此,在本文中利用互信息、數理統計和人腦聯想記憶的相關理論,設計了一個漢語句子聯想生成器,使用該生成
    發表于 09-26 14:25 ?20次下載

    語義、句式以及變量為基礎的翻譯方法

    模式的基礎上對動詞進行詳細的研究。在對語義進行歸納總結以后,將動詞的語義模式分為三類,再將動詞語義模式庫進行搭建,最后設計出一種以語義、句式以及變量為基礎的
    發表于 11-11 12:00 ?14次下載
    以<b class='flag-5'>語義</b>、句式以及變量為基礎的<b class='flag-5'>翻譯</b><b class='flag-5'>方法</b>

    基于分層組合模式的句子組合模型

    閱讀理解任務需要綜合運用文本的表示、理解、推理等自然語言處理技術。針對高考語文中文學作品閱讀理解的選項題問題,提出了基于分層組合模式的句子組合模型,用來實現句子級的語義一致性計算。首先,通過單個詞
    發表于 12-01 13:38 ?0次下載
    基于分層組合模式的<b class='flag-5'>句子</b>組合模型

    基于LDA模型的句子主題特征

    (extractive)和理解式摘要(abstractive)。抽取式摘要直接原文中抽取重要的句子作為摘要句,而理解式摘要則通過對文章進行句法、語義和篇章結構的分析獲取文檔的意義,再通過自然語言
    發表于 12-14 15:44 ?5次下載
    基于LDA模型的<b class='flag-5'>句子</b>主題特征

    句子相似度計算方法

    在計算詞語語義相似度的基礎上,提出一種以句子中心詞為基準衡量詞語組合相對位置偏移量的句子相似度計算方法。根據詞語詞性和語法規則確定句子中心詞
    發表于 01-25 14:25 ?1次下載

    自然語言的語義表示學習方法與應用

    在獲取句子或文檔的語義表示時,一段話的語義由其各組成部分的語義,以及它們之間的組合方法所確定[8]。由此,一些工作開始嘗試根據
    的頭像 發表于 03-08 14:33 ?7286次閱讀

    一種監督下利用多模態文檔結構信息幫助圖片-句子匹配的采樣方法

    的共現結構信息幫助采樣完成句子-圖片匹配的方法。本文的合作單位是杭州之江實驗室。 ? ? 文章摘要 ? 文章針對監督句子圖片匹配任務。現
    的頭像 發表于 12-26 10:26 ?2111次閱讀
    一種<b class='flag-5'>無</b><b class='flag-5'>監督</b>下利用多模態文檔結構信息幫助圖片-<b class='flag-5'>句子</b>匹配的采樣<b class='flag-5'>方法</b>

    BERT得到最強句子Embedding的打開方式

    不成? nono,你知道這樣得到的句子表示捕捉到的語義信息其實很弱嗎?今天向大家介紹一篇來自于 CMU 和字節跳動合作,發表在 EMNLP2020 的 paper, 詳盡地分析了預訓練模型得到
    的頭像 發表于 12-31 10:10 ?8735次閱讀

    基于句子級上下文的神經機器翻譯綜述

    基于句子級上下文的神經機器翻譯綜述
    發表于 06-29 16:26 ?64次下載