精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過(guò)Token實(shí)現(xiàn)多視角文檔向量表征的構(gòu)建

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:NLP工作站 ? 作者:劉聰 ? 2022-07-08 11:13 ? 次閱讀

寫(xiě)在前面

今天給大家?guī)?lái)一篇ACL2022論文MVR,「面向開(kāi)放域檢索的多視角文檔表征」,主要解決同一個(gè)文檔向量與多個(gè)語(yǔ)義差異較大問(wèn)題向量語(yǔ)義不匹配的問(wèn)題。通過(guò)「插入多個(gè)特殊Token」實(shí)現(xiàn)多視角文檔向量表征的構(gòu)建,并為了防止多種視角間向量的趨同,引入了「退火溫度」的全局-局部損失,論文全稱(chēng)《Multi-View Document Representation Learning for Open-Domain Dense Retrieval》。

該篇論文與前兩天分享的DCSR-面向開(kāi)放域段落檢索的句子感知的對(duì)比學(xué)習(xí)一文有異曲同工之妙,都是在檢索排序不引入額外計(jì)算量的同時(shí),通過(guò)插入特殊Token構(gòu)建長(zhǎng)文檔的多語(yǔ)義向量表征,使得同一文檔可以與多種不同問(wèn)題的向量表征相似。

8665290c-f08c-11ec-ba43-dac502259ad0.png

并且目前的檢索召回模型均存在一些缺陷:

Cross-encoder類(lèi)模型(BERT)由于計(jì)算量太大,無(wú)法在召回階段使用;

Bi-encoder類(lèi)模型(DPR)無(wú)法很好地表現(xiàn)長(zhǎng)文檔中的多主題要素;

Late Interaction類(lèi)模型(ColBERT)由于使用sum操作,無(wú)法直接使用ANN進(jìn)行排序;

Attention-based Aggregator類(lèi)模型(PolyEncoder)增加了額外運(yùn)算并且無(wú)法直接使用ANN進(jìn)行排序。

867ad496-f08c-11ec-ba43-dac502259ad0.png

模型

868cedd4-f08c-11ec-ba43-dac502259ad0.png

通常向量表征時(shí),采用特殊字符[CLS]對(duì)應(yīng)的向量表征作為文本的向量表征。為了獲取文檔中更細(xì)粒度的語(yǔ)義信息,MVR引入多個(gè)特殊字符[VIE]替代[CLS]。

對(duì)于文檔來(lái)說(shuō),在文本前插入多個(gè)字符[],為了防止干擾原始文本的位置信息,我們將[]的所有位置信息設(shè)置為0,文檔語(yǔ)句位置信息從1開(kāi)始。

對(duì)于問(wèn)題來(lái)說(shuō),由于問(wèn)題較短且通常表示同一含義,因此僅使用一個(gè)特殊字符[VIE]。

模型采用雙編碼器作為骨干,分別對(duì)問(wèn)題和文檔進(jìn)行編碼,如下:

其中,表示鏈接符,[VIE]和[SEP]為BERT模型的特殊字符,和分別為問(wèn)題編碼器和文檔編碼器。

如上圖所示,首先計(jì)算問(wèn)題向量與每個(gè)視角的文檔向量進(jìn)行點(diǎn)積,獲取每一個(gè)視角的得分,然后通過(guò)max-pooler操作,獲取視角中分值最大的作為問(wèn)題向量與文檔向量的得分,如下:

為了防止多種視角間向量的趨同,引入了帶有退火溫度的Global-Local Loss,包括全局對(duì)比損失和局部均勻損失,如下:

其中,全局對(duì)比損失為傳統(tǒng)的對(duì)比損失函數(shù),給定一個(gè)問(wèn)題、一個(gè)正例文檔以及多個(gè)負(fù)例文檔,損失函數(shù)如下:

為了提高多視角向量的均勻性,提出局部均勻性損失,強(qiáng)制將選擇的查詢(xún)向量與視角向量更緊密,原理其他其視角向量,如下:

為了進(jìn)一步區(qū)分不同視角向量間的差異,采用了退火溫度,逐步調(diào)整不同視角向量的softmax分布,如下:

其中,為控制退火速度的超參,為模型訓(xùn)練輪數(shù),每訓(xùn)練一輪,溫度更新一次。注意:在全局對(duì)比損失和局部均勻損失中,均使用了退火溫度。

實(shí)驗(yàn)

如下表所示,MVR方法對(duì)比于其他模型,獲取了更好的效果。

86a9f596-f08c-11ec-ba43-dac502259ad0.png

并且,通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)視角個(gè)數(shù)選擇8時(shí),MVR模型效果最佳。

86d99328-f08c-11ec-ba43-dac502259ad0.png

針對(duì)Global-Local Loss進(jìn)行消融實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)沒(méi)有局部均勻損失和退火溫度時(shí),會(huì)使得效果下降;當(dāng)兩者都沒(méi)有時(shí),效果下降更加明顯;并且一個(gè)合適退火速度,對(duì)訓(xùn)練較為重要。

86ef0b4a-f08c-11ec-ba43-dac502259ad0.png

相比于其他模型來(lái)說(shuō),在文檔編碼階段和檢索召回階段的速度基本沒(méi)有影響,但由于需要存儲(chǔ)多個(gè)視角向量,因此造成存儲(chǔ)空間變大。

8705501c-f08c-11ec-ba43-dac502259ad0.png

并且,對(duì)比了簡(jiǎn)單的句子切割或者等片段截?cái)喾椒ǐ@取一個(gè)文本的多個(gè)向量表征,發(fā)現(xiàn)其效果均不理想,與DCSR一文觀點(diǎn)一致。

87189046-f08c-11ec-ba43-dac502259ad0.png

總結(jié)

該論文為了對(duì)長(zhǎng)文檔更好地進(jìn)行向量表征,引入多個(gè)特殊字符,使其生成「多種不同視角的向量表征」,解決了同一個(gè)文檔向量與多個(gè)語(yǔ)義差異較大問(wèn)題向量語(yǔ)義不匹配的問(wèn)題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3595

    瀏覽量

    134158

原文標(biāo)題:ACL2022 | MVR:面向開(kāi)放域檢索的多視角文檔表征

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    通過(guò)工業(yè)智能網(wǎng)關(guān)實(shí)現(xiàn)中間變量表達(dá)式的快速配置

    ,出現(xiàn)告警可能是多個(gè)變量達(dá)到條件而觸發(fā)的,就需要對(duì)中間變量進(jìn)行配置。 對(duì)此,物通博聯(lián)提供基于工業(yè)智能網(wǎng)關(guān)實(shí)現(xiàn)中間變量表達(dá)式的快速配置操作。用戶可以根據(jù)生產(chǎn)現(xiàn)場(chǎng)的應(yīng)用需求,靈活配置中間變量表達(dá)式,
    的頭像 發(fā)表于 10-08 17:10 ?201次閱讀
    <b class='flag-5'>通過(guò)</b>工業(yè)智能網(wǎng)關(guān)<b class='flag-5'>實(shí)現(xiàn)</b>中間變<b class='flag-5'>量表</b>達(dá)式的快速配置

    量表接入能源監(jiān)測(cè)平臺(tái)實(shí)現(xiàn)遠(yuǎn)程監(jiān)控節(jié)能管理

    在這個(gè)信息化、智能化的時(shí)代,節(jié)能減排已經(jīng)成為全球共識(shí)。如何在保障生活質(zhì)量的同時(shí),最大限度地節(jié)約能源? 熱量表是一種用于測(cè)量供暖或制冷系統(tǒng)中熱能消耗的設(shè)備。通過(guò)加裝塊熱量表,可以精確地
    的頭像 發(fā)表于 07-22 10:42 ?223次閱讀

    通過(guò)工業(yè)智能網(wǎng)關(guān)實(shí)現(xiàn)CJ188水表數(shù)據(jù)采集

    的集中抄表系統(tǒng),是工商業(yè)能耗數(shù)據(jù)采集的協(xié)議通道。 對(duì)此,物通博聯(lián)提供基于工業(yè)智能網(wǎng)關(guān)的CJ188數(shù)據(jù)采集解決方案。通過(guò)將工業(yè)智能網(wǎng)關(guān)通過(guò)串口接入水表、燃?xì)獗怼?b class='flag-5'>量表、冷量表等儀表設(shè)備,
    的頭像 發(fā)表于 06-04 10:32 ?339次閱讀
    <b class='flag-5'>通過(guò)</b>工業(yè)智能網(wǎng)關(guān)<b class='flag-5'>實(shí)現(xiàn)</b>CJ188水表數(shù)據(jù)采集

    請(qǐng)問(wèn)STM8L052R8的USART2中斷向量在哪?

    我現(xiàn)在在使用STM8L052R8,在使用手冊(cè)中介紹有3個(gè)USART串口,但中斷向量表中只有USART1有中斷向量,那么另外兩個(gè)串口不能使用中斷接收嗎?沒(méi)有中斷發(fā)送可以,但沒(méi)有中斷接收,臣妾沒(méi)有辦法用?。≌?qǐng)各位達(dá)人解答一下怎么使用另外兩個(gè)串口?先謝謝了。
    發(fā)表于 05-09 06:33

    先楫6880如何實(shí)現(xiàn)bootload + APP應(yīng)用跳轉(zhuǎn)

    ,通過(guò)boot來(lái)判斷是哪種啟動(dòng)方式。 因此,內(nèi)存管理是保證程序正確運(yùn)行的前提。在實(shí)現(xiàn)bootload跳轉(zhuǎn)的前提無(wú)非兩個(gè)問(wèn)題: (1).app程序跳轉(zhuǎn)的地址。 (2).app程序的中斷向量表。 2.
    發(fā)表于 04-26 16:03

    STM32F103CB將中斷向量表放到RAM后就不正常了,為什么?

    Code284funtion_inram.o(i.USART2_IRQHandler) 然后在main()的開(kāi)始中設(shè)置中斷向量表到RAM中: NVIC_SetVectorTable
    發(fā)表于 04-25 08:08

    請(qǐng)問(wèn)中斷向量重復(fù)定義怎么處理?

    ??梢跃幾g通過(guò),但因?yàn)橹袛?b class='flag-5'>向量表有錯(cuò),程序在SystemClock_Config();后 就跑飛了。 如果去除其中一個(gè)定義,則程序不會(huì)跑飛。請(qǐng)問(wèn)遇到這種情況怎么處理?
    發(fā)表于 03-28 06:45

    STM32F429的工程標(biāo)準(zhǔn)庫(kù)移植到HAL庫(kù)后中斷向量表異常的原因?

    STM32F429的工程標(biāo)準(zhǔn)庫(kù)移植到HAL庫(kù)后中斷向量表異常
    發(fā)表于 03-20 06:02

    stm32cubeide更改ld文件中的Flash偏移和中斷向量表的宏VECT_TAB_OFFSET后,編譯出來(lái)的bin文件與之前不同為什么?

    我用的是stm32cubeide,芯片為STM32G491,修改了ld文件的Flash偏移和中斷向量表的宏VECT_TAB_OFFSET,對(duì)比修改前后的bin文件,發(fā)現(xiàn)有部分地方不同,請(qǐng)問(wèn)這個(gè)是正常的嗎?
    發(fā)表于 03-19 06:16

    鴻蒙開(kāi)發(fā)【編譯構(gòu)建】講解

    編譯構(gòu)建是將應(yīng)用/服務(wù)的源代碼、資源、第三方庫(kù)等,通過(guò)編譯工具轉(zhuǎn)換為可直接在硬件設(shè)備上運(yùn)行的二進(jìn)制機(jī)器碼,然后再將二進(jìn)制機(jī)器碼封裝為HAP/APP軟件包,并為HAP/APP包進(jìn)行簽名的過(guò)程。其中
    發(fā)表于 02-27 17:41

    利用知識(shí)圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動(dòng)的RAG系統(tǒng)(上)

    向量數(shù)據(jù)庫(kù)是一組高維向量的集合,用于表示實(shí)體或概念,例如單詞、短語(yǔ)或文檔向量數(shù)據(jù)庫(kù)可以根據(jù)實(shí)體或概念的向量表示來(lái)度量它們之間的相似性或關(guān)聯(lián)
    的頭像 發(fā)表于 02-22 14:07 ?1045次閱讀
    利用知識(shí)圖譜與Llama-Index技術(shù)<b class='flag-5'>構(gòu)建</b>大模型驅(qū)動(dòng)的RAG系統(tǒng)(上)

    請(qǐng)問(wèn)PSOC4的中斷向量表在哪查看?

    如題,PSOC4的中斷向量表在哪查看?謝謝
    發(fā)表于 02-06 06:22

    什么是中斷向量偏移,為什么要做中斷向量偏移?

    當(dāng)MCU中有兩段或以上程序的時(shí)候(第一個(gè)程序?yàn)橛脩鬊ootLoader程序,其他的為APP程序,這個(gè)在前期視頻《什么是ISP?什么是IAP》中有講過(guò)),APP程序中都需要做中斷向量偏移,那么什么是中斷向量偏移,為什么要做中斷向量
    的頭像 發(fā)表于 01-30 09:47 ?1622次閱讀
    什么是中斷<b class='flag-5'>向量</b>偏移,為什么要做中斷<b class='flag-5'>向量</b>偏移?

    “tc1.3”編譯報(bào)錯(cuò)不允許使用向量表編號(hào)TriCore?怎么解決?

    “tc1.3” TriCore? 不允許使用矢量表編號(hào)
    發(fā)表于 01-22 08:33

    M453VG6AE中斷向量表起始地址是多少呢?一共有多個(gè)中斷向量呢?

    芯片:M453VG6AE 這款芯片中斷向量表起始地址是多少呢?一共有多個(gè)中斷向量呢?
    發(fā)表于 01-17 08:13