精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于長度感知注意機制的長度可控摘要模型

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-01-06 09:49 ? 次閱讀

以往的長度可控摘要模型大多在解碼階段控制長度,而編碼階段對指定的摘要長度不敏感。這樣模型傾向于生成和訓練數(shù)據(jù)一樣長的摘要。在這篇論文中,作者提出了一種長度感知注意機制(LAAM,length-aware attention mechanism)來適應基于期望長度的編碼。

本文的方法是在由原始訓練數(shù)據(jù)構(gòu)建的摘要長度平衡數(shù)據(jù)集上訓練 LAAM,然后像往常一樣進行微調(diào)。結(jié)果表明,這種方法可以有效地生成具有所需長度的高質(zhì)量摘要,甚至是原始訓練集中從未見過的短長度摘要。

e92b8d12-8d5b-11ed-bfe3-dac502259ad0.png

論文題目:Length Control in Abstractive Summarization by Pretraining Information Selection

收錄會議:

ACL 2022

論文鏈接:

https://aclanthology.org/2022.acl-long.474.pdf

代碼鏈接:

https://github.com/yizhuliu/lengthcontrol

背景

摘要任務目的是改寫原文,在簡明流暢的摘要中再現(xiàn)原文的語義和主題。為了在不同的移動設(shè)備或空間有限的網(wǎng)站上顯示摘要,我們必須生成不同長度的摘要。

長度可控的摘要是一個多目標優(yōu)化問題,包括:

在期望的長度內(nèi)生成完整的摘要

以及根據(jù)期望的長度選擇適當?shù)?a target="_blank">信息

相關(guān)方法

現(xiàn)有的基于編解碼器模型的長度可控摘要可分為兩類:

解碼時的早停

編碼前的信息選擇

解碼過程中的早停方法關(guān)注何時輸出 eos(end of sequence),也就是摘要的結(jié)束標志。有人設(shè)計了專門的方法。這個專門方法是通過在測試期間將期望長度的位置上的所有候選單詞分配 ?∞ 的分數(shù)來生成 eos。這個方法可以應用于任何 seq2seq 模型。然而,這些方法只是簡單地為解碼器增加了長度要求,而忽略了從源文檔編碼內(nèi)容或信息選擇也必須適應不同長度要求的問題。

基于信息選擇的方法分為兩階段。一個突出的例子是 LPAS,在第一階段,從源文檔中提取最重要的l個標記作為所需長度的原型摘要,并在第二階段通過雙編碼器對源文檔和原型摘要進行編碼。一方面,這種兩階段方法會在中間結(jié)果中引入噪聲。另一方面,這些方法的第二階段沒有第一手的長度信息,這削弱了長度控制。

本文方法

在本文中,作者提出了LAAM(長度感知注意機制),它擴展了 Transformer seq2seq 模型,具有根據(jù)長度約束在上下文中選擇信息的能力。

LAAM 重新 normalize 編碼器和解碼器之間的注意力,以增強指定長度范圍內(nèi)具有更高注意力分數(shù)的 token,幫助從源文檔中選擇長度感知信息。隨著解碼進行,增強 token 的數(shù)量將會逐步減少,直到 eos 獲得最高的注意力分數(shù),這有助于在指定長度上停止解碼過程。

LAAM 可以被認為是上一節(jié)兩類方法的混合版本。

同時作者觀察到,在現(xiàn)有訓練集中,不同長度的摘要數(shù)量有很大差異。為了平衡摘要在不同長度范圍內(nèi)的分布,本文提出了一種啟發(fā)式方法:首先定義摘要長度范圍,然后從原文中直接抽取不同長度的摘要,根據(jù)特定指標控制抽取摘要的相關(guān)度,從而創(chuàng)建長度平衡數(shù)據(jù)集(LBD,length-balanced dataset)。

在本文方法中,先從原始的摘要數(shù)據(jù)集創(chuàng)建一個 LBD。之后,在 LBD 上預訓練LAAM,以增強 LAAM 在長度約束下的文本選擇能力。最后,將預訓練后的 LAAM 在原始數(shù)據(jù)集上微調(diào),以學習將所選文本改寫為不同長度的摘要。

當前訓練數(shù)據(jù)集中沒有短摘要,微調(diào)后的模型沒有見過短摘要,所以如果用它生成短摘要的話算是 zero-shot。得益于 LDB 的預訓練,本文的方法可以解決zero-shot情況下的長度控制問題。

本文的主要貢獻:

提出了LAAM(長度感知注意機制)來生成具有所需長度的高質(zhì)量摘要。

設(shè)計了一種啟發(fā)式方法,從原始數(shù)據(jù)集中創(chuàng)建一個LBD(長度平衡數(shù)據(jù)集)。在 LBD 上對 LAAM 進行預訓練后,LAAM 效果能有提升,并且可以有效解決 zero-shot 情況下的短摘要生成問題。

LAAM

e969c8de-8d5b-11ed-bfe3-dac502259ad0.png

上圖是 Transformer 解碼器。

左上方為源文檔輸入:,作為注意力的 Key。

最左側(cè)為模型當前輸出:,作為注意力的 Query,兩者點乘得到注意力矩陣。 注意力矩陣分為兩部分, 負責文本信息選擇, 負責結(jié)束標志選擇

注意力矩陣的第一行加粗了 Top3,第二行加粗了 Top2,第三行加粗了 Top1,對加粗的進行提權(quán),本文通過這種方式向模型傳遞句子剩余預測長度信息。

也會進行提權(quán),并且越接近指定長度,提權(quán)幅度越大,模型也就更容易預測出 eos。

提權(quán)后要進行一次歸一化,不然和不為 1。

這就是本文提出的 LAAM 模型。

總結(jié)

本文方案的整體流程是:

用原始訓練集生成 LBD(長度平衡數(shù)據(jù)集)

在 LBD 上預訓練 LAAM 模型

在原始訓練集上微調(diào) LAAM 模型

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編解碼器
    +關(guān)注

    關(guān)注

    0

    文章

    253

    瀏覽量

    24209
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1205

    瀏覽量

    24649

原文標題:ACL 2022 | 基于長度感知注意機制的長度可控摘要模型

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    示波器小技能:TDR測量線纜長度

    今天用示波器給大家演示一下,如何測試線纜的長度。Chrent設(shè)備連接本次使用的實驗器材:快速邊沿脈沖發(fā)生器小板支持10納秒或更小時基的示波器一臺5V直流電源待測試電纜BNC轉(zhuǎn)接頭首先將設(shè)備和示波器
    的頭像 發(fā)表于 11-21 01:04 ?99次閱讀
    示波器小技能:TDR測量線纜<b class='flag-5'>長度</b>

    測長機在測量長度尺寸方面有哪些優(yōu)勢?

    測長機在測量長度尺寸方面具有以下優(yōu)勢:一、高精度1.分辨力高:測長機通常具有很高的分辨力,能夠精確測量到非常小的長度變化。例如,一些高精度測長機的分辨力可以達到微米甚至納米級別,能夠滿足對精密工件
    的頭像 發(fā)表于 10-25 16:20 ?249次閱讀
    測長機在測量<b class='flag-5'>長度</b>尺寸方面有哪些優(yōu)勢?

    CS1-U DC/AC5-240V磁性開關(guān)長度要求

    磁性開關(guān)的長度要求并非固定不變,而是需要根據(jù)具體的應用場景和安裝環(huán)境進行靈活選擇。在選擇磁性開關(guān)時,除了考慮其長度外,還需要關(guān)注其技術(shù)參數(shù)、工作環(huán)境要求以及安裝間距等因素,以確保其能夠正常工作并滿足實際需求。
    的頭像 發(fā)表于 10-12 18:07 ?136次閱讀

    hdmi線長度不能超過多少米

    HDMI線長度的限制主要與其版本和實際應用場景中的信號衰減有關(guān)。以下是對HDMI線長度限制的詳細解釋: HDMI 1.3版本: 最長長度:20米。這個版本的HDMI線主要適用于家庭或辦公室環(huán)境,其外
    的頭像 發(fā)表于 06-24 10:17 ?7531次閱讀

    【大規(guī)模語言模型:從理論到實踐】- 閱讀體驗

    注意機制的計算復雜度隨著序列長度的增加而迅速增長,這可能會成為模型訓練和推理時的瓶頸。 與計算效率類似,注意
    發(fā)表于 06-07 14:44

    hdmi線纜長度根據(jù)什么決定選擇

    可以達到30米,這足以支持一個1080p的視頻和一個8聲道的音頻信號。 然而,需要注意的是,對于4K分辨率的HDMI線纜,其長度應小于15米,以確保最佳的圖像和音頻質(zhì)量。 在選擇HDMI線纜時,除了考慮長度外,還需要
    的頭像 發(fā)表于 06-06 11:44 ?2368次閱讀

    如何利用實時示波器測量線纜長度

    Reflectometry, TDR)技術(shù),還可以用于測量線纜長度。本文將詳細介紹如何利用實時示波器結(jié)合TDR技術(shù)測量線纜長度的原理、步驟、注意事項以及應用實例。
    的頭像 發(fā)表于 05-27 16:24 ?1242次閱讀

    嵌入式中零長度數(shù)組基本操作方法

    C語言零長度數(shù)組,聽起來可能有點奇怪,因為它沒有分配內(nèi)存空間,無法存儲數(shù)據(jù)。但實際上,零長度數(shù)組在Linux內(nèi)核中隨處可見。 零長度數(shù)組的定義 首先,我們要明白什么是零長度數(shù)組。簡單來
    的頭像 發(fā)表于 05-11 08:49 ?867次閱讀
    嵌入式中零<b class='flag-5'>長度</b>數(shù)組基本操作方法

    3芯M9接口的長度是多少

    德索工程師說道3芯M9接口的長度并不是一個固定值,它取決于具體的產(chǎn)品設(shè)計和制造標準。不同的廠家和不同的應用場景,可能會導致3芯M9接口的長度有所差異。因此,要準確回答這個問題,我們需要首先明確具體的產(chǎn)品和應用背景。
    的頭像 發(fā)表于 04-19 15:05 ?294次閱讀
    3芯M9接口的<b class='flag-5'>長度</b>是多少

    DMA搬運的數(shù)據(jù)長度超過65535怎么處理?

    我有個問題請問下。我現(xiàn)在使用定時器更新事件觸發(fā)DMA,采集1次SPI數(shù)據(jù),使用的是循環(huán)模式。但是我現(xiàn)在采集的數(shù)據(jù)長度需要超過了65535,現(xiàn)在應該怎么處理?DMA搬運的數(shù)據(jù)長度最多是65535
    發(fā)表于 03-29 08:57

    如何提高BLE_MeshLightingLPN的發(fā)送數(shù)據(jù)長度

    (GENERIC_ONOFF_SERVER_MODEL_ID,srcAddress ,GENERIC_ON_OFF_SET_UNACK,generic_Buff, 2,MOBLE_FALSE, MOBLE_FALSE); 數(shù)據(jù)長度小于等于4時可以發(fā)送成功,當發(fā)送大于4個字節(jié)時就會報錯,發(fā)送失敗! 目前設(shè)置都是官方例
    發(fā)表于 03-15 07:20

    你計算過車輛線束的最大繞線長度嗎?

    線束越來越短,是新能源車的“大勢所趨”。在線束長度不斷縮短的背后,是汽車電子電氣架構(gòu)的演變與進化。
    發(fā)表于 03-08 09:38 ?391次閱讀
    你計算過車輛線束的最大繞線<b class='flag-5'>長度</b>嗎?

    導體的電阻與長度和橫截面積的關(guān)系是什么

    電阻是導體對電流流動的阻礙程度的量度,它與導體的長度和橫截面積有著密切的關(guān)系。在一個理想的導體中,電流的流動是由電子在電場中的漂移而形成的。而導體的長度和橫截面積則直接影響了電子在導體中的漂移速率
    的頭像 發(fā)表于 02-26 13:49 ?5071次閱讀

    canfd通信tdcv實測值受總線長度影響嗎

    canfd通信tdcv實測值受總線長度影響嗎? 當涉及到CAN FD通信和總線長度的討論時,總線長度可以對實測值產(chǎn)生一定的影響。在本文中,我將詳細討論CAN FD通信和總線長度之間的關(guān)
    的頭像 發(fā)表于 01-31 13:46 ?866次閱讀

    如何在不拆盤的情況下精準測量電線電纜長度

    電線電纜的長度與電阻是各類行業(yè)中電路設(shè)計和維護的關(guān)鍵參數(shù)之一。電纜長度與電阻成正比,電纜產(chǎn)生的熱量也和電阻成正比,這就意味著同規(guī)格的電纜,電纜越長產(chǎn)生的熱量越多,這些熱量無法及時散發(fā)就會加快電纜老化,縮短電纜使用壽命。
    的頭像 發(fā)表于 12-01 15:17 ?956次閱讀