国产一区二区三区视频精品_国产精品无码AV在线毛片_中文字幕人成无码

Introduction-現(xiàn)有什么問題、怎么解決

此部分著重介紹了兩個(gè)few-shot NER中的challenge：limited information challenge和knowledge mismatch challenge。前者主要是指樣本數(shù)少，后者是指不同的數(shù)據(jù)集中同一個(gè)實(shí)體可能被分成了不同的類別標(biāo)簽。（比如“America”在Wikipedia被分為geographic , 在 OntoNotes中被分為GPE, 在WNUT17被分為location ）

本文最重要的思想基于這樣一個(gè)假設(shè)：不論是否是未知的實(shí)體類別，都可以用一個(gè)概念集中的若干概念來(lái)描述（all entity types can be described using the same set of concepts）。這樣可以解決knowledge mismatch challenge，而且在給了幾個(gè)少樣本后，可以根據(jù)這幾個(gè)少樣本構(gòu)建新實(shí)體類別到概念集的映射，這樣可以直接用映射后的若干概念識(shí)別實(shí)體，進(jìn)而解決limited information challenge。下圖是實(shí)體類別到概念集的映射舉例。

SDNet: Self-describing Networks for FS-NER

2.1 SDNet核心部分: Mention describing、Entity generation

這部分將主要介紹SDNet怎么進(jìn)行命名實(shí)體識(shí)別的，主要包括：Mention describing（從給的sentence構(gòu)建該實(shí)體的concept description）和Entity generation（根據(jù)給的實(shí)體類型逐個(gè)生成句子中的實(shí)體詞）。

以下圖為例，輸入一個(gè)sentence（以[MD]作為起始符），SDNet將輸出novel series這樣的concept description。輸入一個(gè)以[EG]作為起始符、實(shí)體類別名+相關(guān)的concept description以及待識(shí)別的sentence作為內(nèi)容的文本，SDNet將輸出Harry Potter is creative work.這樣的回答。這兩個(gè)過程分別對(duì)應(yīng)Mention describing和Entity generation。

2.2 模型工作流程

a、預(yù)訓(xùn)練階段

左上角的維基百科上有大量的句子，句子中的人物、地點(diǎn)、公司等都有相應(yīng)的維基百科給的標(biāo)簽和描述。預(yù)訓(xùn)練階段根據(jù)2.1部分介紹的模板，進(jìn)行[MD]和[EG]兩個(gè)任務(wù)的Seq2Seq任務(wù)的訓(xùn)練。

b、微調(diào)與解碼階段

這部分對(duì)應(yīng)于Few-shot NER的少樣本階段。給了一些帶標(biāo)注的少量樣本句子，我們知道了這些句子中那些單詞是實(shí)體部分，把這些實(shí)體部分添加到以[MD]開頭的模板并輸入到SDNet中，模型會(huì)生成這些實(shí)體部分描述，并將生成的描述加入到新類別的概念描述集中，并在預(yù)測(cè)階段輸入添加了新類別的[EG]開頭的模板，根據(jù)生成的結(jié)果判斷待預(yù)測(cè)的句子中哪些單詞部分是該類別的實(shí)體。

以上圖中為例，給的少樣本中Iran是GPE類別的實(shí)體，SDNet先用[MD]開頭的模板生成了Iran是country的描述，將country加入到屬于GPE這個(gè)新類別的概念描述集合中，在預(yù)測(cè)階段用[EG]開頭的模板輸入GPE這個(gè)類別名、其包含的概念描述以及待識(shí)別的句子，生成屬于GPE的實(shí)體詞，完成實(shí)體識(shí)別。

c、Filtering Strategy

在眾多下游任務(wù)中，SDNet可能會(huì)遇到難以生成新實(shí)體類別描述的情況（或者或生成不準(zhǔn)確的描述），因此SDNet在訓(xùn)練階段可以對(duì)于那些不去確定的instance生成other的描述詞。如果給少量樣本生成的描述詞中有0.5以上的other，將在最后的decode階段直接使用新實(shí)體類別名（如GPE）。（實(shí)驗(yàn)部分可以看到這個(gè)策略帶來(lái)了一定的提升）

具體實(shí)現(xiàn)過程將不再贅述，可以看原文的第4部分，有對(duì)預(yù)訓(xùn)練和fintune階段的詳細(xì)介紹。

實(shí)驗(yàn)部分

這種借助先驗(yàn)知識(shí)的方式，在6個(gè)數(shù)據(jù)集上都取得了很好的效果，尤其是對(duì)一些之前的識(shí)別效果一直很差的（比如I2B2），這說(shuō)明這種通用的實(shí)體概念集合在各種類別間是通用的。

評(píng)價(jià)

優(yōu)點(diǎn)：

為少樣本NER引用外部知識(shí)提供了新思路，且提供了可直接使用的，通用的預(yù)訓(xùn)練模型，可以為后來(lái)的研究工作提供參考。

可能的缺陷：

在很多新領(lǐng)域下（尤其涉及到domain transfer）的，可能會(huì)出現(xiàn)很多無(wú)法描述成概念集合的實(shí)體類別，出現(xiàn)大量的other，這時(shí)只能用實(shí)體類別名了，在完全不重疊的領(lǐng)域之間可能效果會(huì)不佳。

另外，預(yù)訓(xùn)練階段使用的維基百科，大量的是事件人物地點(diǎn)等這些廣泛且常用的，面對(duì)實(shí)際應(yīng)用中的非常見實(shí)體類別時(shí)，可能做不到很好的描述。

在大量的語(yǔ)料中進(jìn)行訓(xùn)練，可能出現(xiàn)了“泄露”，當(dāng)然這只是一個(gè)猜測(cè)。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

SDNet

SDNet

+關(guān)注

關(guān)注
0

文章
4

瀏覽量
5622

原文標(biāo)題：ACL2022 | 基于自描述網(wǎng)絡(luò)的小樣本命名實(shí)體識(shí)別

文章出處：【微信號(hào)：zenRRan，微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

ad如何設(shè)置兩個(gè)元器件的距離

在Altium Designer（簡(jiǎn)稱AD）中設(shè)置兩個(gè)元器件之間的距離，主要是通過設(shè)置元器件間的安全間距（Clearance）規(guī)則來(lái)實(shí)現(xiàn)的。這個(gè)規(guī)則定義了元器件之間、元器件與走線之間以及其他設(shè)計(jì)元素

發(fā)表于 09-02 15:31 ?4903次閱讀

觸發(fā)器的兩個(gè)穩(wěn)定狀態(tài)分別是什么

觸發(fā)器作為數(shù)字電路中的基本邏輯單元，具有兩個(gè)穩(wěn)定狀態(tài)，這兩個(gè)狀態(tài)通常用于表示二進(jìn)制數(shù)碼中的0和1。

發(fā)表于 08-12 11:01 ?631次閱讀

雙穩(wěn)態(tài)觸發(fā)器的兩個(gè)基本性質(zhì)是什么

雙穩(wěn)態(tài)觸發(fā)器（Bistable Trigger）是一種具有兩個(gè)穩(wěn)定狀態(tài)的邏輯電路，廣泛應(yīng)用于數(shù)字電路設(shè)計(jì)中。它具有兩個(gè)基本性質(zhì)：記憶性和切換性。一、雙穩(wěn)態(tài)觸發(fā)器的基本概念 1.1 雙穩(wěn)態(tài)觸發(fā)器

發(fā)表于 08-11 10:08 ?555次閱讀

兩個(gè)銅片可以形成原電池嗎

兩個(gè)銅片本身不能形成原電池，因?yàn)樵姵氐墓ぷ髟硪蕾囉?b class='flag-5'>兩個(gè)不同電位的電極材料之間的氧化還原反應(yīng)。

發(fā)表于 05-21 16:23 ?839次閱讀

為什么在交流電橋中至少需要兩個(gè)可調(diào)參數(shù)？

在交流電橋的測(cè)量中，至少需要兩個(gè)可調(diào)參數(shù)的原因與電橋的工作原理、測(cè)量的準(zhǔn)確性以及校準(zhǔn)過程有關(guān)。

發(fā)表于 05-15 17:49 ?1530次閱讀

原電池中的兩個(gè)電極能是相同的嗎？

在原電池的設(shè)計(jì)和運(yùn)作中，兩個(gè)電極是否可以相同，這取決于電池的類型和所需的電化學(xué)反應(yīng)。

發(fā)表于 04-26 17:32 ?1754次閱讀

arcgis中如何關(guān)聯(lián)兩個(gè)屬性表

在ArcGIS中，關(guān)聯(lián)兩個(gè)屬性表是一個(gè)重要的操作，可以通過此操作將兩個(gè)表中的數(shù)據(jù)關(guān)聯(lián)起來(lái)，以便進(jìn)行分析和查詢。下面是詳細(xì)

發(fā)表于 02-25 11:01 ?4009次閱讀

兩個(gè)電位器兩地控制一個(gè)變頻器，如何接線？

兩個(gè)電位器兩地控制一個(gè)變頻器，如何接線？接線方式如下： 1. 首先，明確需要使用的電器設(shè)備。在這個(gè)場(chǎng)景中，我們需要兩個(gè)電位器（即可變電阻器

發(fā)表于 02-05 10:13 ?4899次閱讀

兩個(gè)機(jī)器的時(shí)鐘怎么同步？

多個(gè)機(jī)器的時(shí)鐘保持同步。在本文中，我們將詳細(xì)介紹如何同步兩個(gè)機(jī)器的時(shí)鐘，并討論其原理、方法和實(shí)施。一、時(shí)鐘同步的重要性 1.數(shù)據(jù)一致性：在分布式系統(tǒng)中，確保多個(gè)機(jī)器的時(shí)鐘同步可以保證數(shù)據(jù)在不同機(jī)器上的一致性，

發(fā)表于 01-16 14:26 ?1485次閱讀

ADXRS453能同時(shí)檢測(cè)兩個(gè)方向嗎？

ADXRS453的介紹中說(shuō)可以檢測(cè)兩個(gè)方向X或Y，但是手冊(cè)中只提供了一套速率寄存器RATE0和RATE1，只能用于一個(gè)方向。我的問題是ADX

發(fā)表于 12-29 06:30

如何給C語(yǔ)言中的函數(shù)定義兩個(gè)不同的名字？

最近有位哥問我，如何給C語(yǔ)言中的函數(shù)定義兩個(gè)不同的名字？就是這兩個(gè)名字都是指向同一個(gè)函數(shù)，同一個(gè)地址，而且兩個(gè)名字都可以當(dāng)做函數(shù)來(lái)用的那種。

發(fā)表于 12-19 16:21 ?762次閱讀

電子設(shè)計(jì)中的兩個(gè)不同概念：pcb與pcb封裝

電子設(shè)計(jì)中的兩個(gè)不同概念：pcb與pcb封裝

發(fā)表于 12-11 15:49 ?820次閱讀

如何設(shè)置兩個(gè)路由器使用同一個(gè)Wi-Fi網(wǎng)絡(luò)？

Wi-Fi網(wǎng)絡(luò)。本文將詳細(xì)介紹設(shè)置兩個(gè)路由器使用同一個(gè)Wi-Fi網(wǎng)絡(luò)的步驟和注意事項(xiàng)。第一步：選購(gòu)適合的路由器設(shè)備在設(shè)置兩個(gè)路由器使用同一個(gè)

發(fā)表于 12-11 10:50 ?1.2w次閱讀

兩個(gè)硬盤2個(gè)系統(tǒng)開機(jī)切換

切換兩個(gè)硬盤上的系統(tǒng)是一種常見的行為，可以讓用戶在不同的操作系統(tǒng)之間進(jìn)行切換，以滿足不同的需求。在本文中，我們將詳細(xì)介紹如何配置和使用兩個(gè)硬盤上的系統(tǒng)進(jìn)行切換。本文將分為以下幾個(gè)部分進(jìn)行討論：硬件

發(fā)表于 11-28 15:08 ?7413次閱讀

MMU包含兩個(gè)模塊是什么

的物理地址也有兩部分：PFN和offset，PFN（ Physical frame number）是物理頁(yè)框number，offset和上面虛擬地址的offset相同，是頁(yè)內(nèi)偏移。 2-MMU包含兩個(gè)

發(fā)表于 11-26 15:40 ?614次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

介紹兩個(gè)few-shot NER中的challenge