精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

匯總在事件抽取方向的相關廠商調研結果

深度學習自然語言處理 ? 來源:AI算法小喵 ? 作者:AI算法小喵 ? 2022-07-07 16:03 ? 次閱讀

寫在前面

本篇不具體談技術,主要是匯總在事件抽取方向的相關廠商調研結果。

1. 事件抽取范疇、范式、技術棧

領域范疇:廠商無論是在特定領域(如:法律、金融),還是通用領域,廠商做的都是限定類型的事件抽取。

范式:除標準抽取外(即事件檢測和事件論元識別),還有:僅抽取觸發詞和論元;僅抽取事件類型和論元。在論元抽取上也各不相同,有的僅抽取主體,有的抽取通用屬性(如:時間/地點,或者時間/地點/主體/客體)等。

技術棧:

預訓練語言模型+(BiLSTM)+CRF

預訓練語言模型+MRC

預訓練語言模型+Biaffine

Bert+BiLSTM+Self-Attention+Pointer Network

預訓練語言模型+指針結構+CLN(ConditionalLayerNorm)等

2. 相關廠商匯總

2.1 華為云

領域范疇

華為云/自然語言處理服務接口說明/事件抽取[1]目前只支持金融公告中的會議召開、聘任、辭職、股票增持、股票減持5類事件以及相關要素的抽取。

范式(標準事件抽取)

包括事件檢測(觸發詞抽取事件類型判定) 事件論元識別(論元抽取論元角色判定)

技術棧

未找到直接描述,但找到了華為云作為CCKS 2020篇章事件要素抽取比賽冠軍的方案解析[2],但注意這個比賽不屬于標準的事件抽取。

93cfbf0e-fced-11ec-ba43-dac502259ad0.png

940c94b0-fced-11ec-ba43-dac502259ad0.png

94254078-fced-11ec-ba43-dac502259ad0.png

上圖分別是他們的整體框架圖和子模型圖,他們將這個任務拆解了三個子任務:事件類型預測,事件要素抽取,以及事件表格填充。

值得關注的是在論元提取(要素抽取)階段,除了CRF外,他們也嘗試了MRC(閱讀理解范式)、Biaffine。其中Biaffine思想來自論文Named Entity Recognition as Dependency Parsing[3]。

另外在最后表格填充時,他們也采用了特殊處理。

2.2 百度

領域范疇

百度AI/知識圖譜/事件圖譜/事件屬性抽取[4]從資訊的標題與正文中,抽取事件發生時間、地點、參與者、觸發詞等事件元素。應該未限定領域范疇。

范式和技術棧

未找到直接描述,但可從其報告百度: 事件圖譜技術與應用[5]分析:

通用屬性抽取針對時間、地點、參與者、觸發詞進行抽取,采用的是實體識別常用的預訓練語言模型(ERNIE)+BiLSTM+CRF;

943a5940-fced-11ec-ba43-dac502259ad0.png

自定義論元抽取采用MRC(閱讀理解)方式,將抽取轉換成問答形式,通過問題嵌入要抽取的目標,如某角色的論元,來解耦了模型與事件類型、角色類型的相關部分;

94590fd4-fced-11ec-ba43-dac502259ad0.png

語義角色抽取和目前我實驗所采用的范式一樣,都是層疊指針結構。另外因為不同類型事件有各自的論元角色,如果全部建模到模型中,模型會變得很復雜,所以百度將所有角色分門別類,如主體、客體等等(這里百度稱為語義角色),然后利用多層指針結構同時抽取。

9470645e-fced-11ec-ba43-dac502259ad0.png

需要指出的是,通用屬性抽取的問題是無法靈活地泛化。MRC(閱讀理解方案)的問題則是效率,因為需要對每一個角色都進行單獨提問抽取。

2.3 科大訊飛

無,但科大訊飛有舉辦相關比賽,這里有一份參賽者的分享科大訊飛2020完整事件抽取系統[6]。

范式

非標準的事件抽取,任務包括:抽取觸發詞,主體/客體/時間/地點,判定事件發生狀態的屬性,包括極性、時態。極性分為:肯定、否定、可能;時態分為:過去、現在、將來、其他。

技術棧(pipeline)

觸發詞抽取:Bert+指針結構;特征層面:利用遠程監督增加了已知的所有觸發詞的嵌入。

948fb5e8-fced-11ec-ba43-dac502259ad0.png

主體/客體/時間/地點抽取:Bert+conditionalLayerNorma+指針結構。特征層面:trigger在文本中的位置、其他詞到trigger的位置。

94bc173c-fced-11ec-ba43-dac502259ad0.png

2.4 深擎科技

在他們主頁上沒有找到相關接口,但是找到一篇他們分享的文章結合指針網絡的注意力機制(PAN模型)實現金融領域事件抽取[7]。這篇文章里主要提及了事件主體識別和事件類型判定:

事件類型判定:

金融事件的特征相對明顯,業務術語等很大程度上決定了分類的效果,他們直接采用Fasttext分類模型,在句子級的事件識別任務中達到了95.7%的準確率。

事件主體識別:

采用了基于指針網絡帶注意力機制(PAN,Point Attention Network:Bert+BiLSTM+Self-Attention+Pointer Network)的事件主體識別模型,從文本中找出在事件中充當的主體角色元素。

2.5 冪律智能

94e02780-fced-11ec-ba43-dac502259ad0.png

冪律智能-功能介紹

領域范疇

法律方向,分析對象主要為裁判文書、案件卷宗等法律描述文本

范式(非標準事件抽取)

主要抽取出獨立的包含時間、人物、地點、描述的子事件

技術棧

基于深度學習的序列標注模型,從探測出的事件片段中預測出時間、地點、任務、描述信息

值得注意的是,他們還有一個時間線(類似于事件脈絡),主要是通過提取出的時間標準化比對。

94fd655c-fced-11ec-ba43-dac502259ad0.png

冪律智能事件抽取展示頁面

2.6 云孚語義

有,而且已經有了事件脈絡(原計劃將要做的,別人已經有了),但是目前沒有看到云孚主頁[7]有演示接口,僅看到它的微信公眾號文章中的展示。

9514e4d4-fced-11ec-ba43-dac502259ad0.png

云孚語義-事件脈絡

3.總結

關于事件抽取方向的相關廠商調研內容就到這里了,后續將會出事件抽取方向調研-技術棧篇等相關內容。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 事件
    +關注

    關注

    0

    文章

    12

    瀏覽量

    9919
  • 語言模型
    +關注

    關注

    0

    文章

    508

    瀏覽量

    10245

原文標題:3.總結

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ADS1299用ADS采集數據,ADS可以不抽取看原始得數據嗎?

    1.用ADS采集數據,將時域的數據進行FFT變換,得到頻譜里面看似有 Sinc Filter 抽取,不需要抽取是否可以?ADS可以不抽取看原始得數據嗎? 2.這個和手冊上的頻譜不一樣? 請問這個是什么問題呢?
    發表于 11-20 06:05

    求助,關于AMC1306M25抽取率OSR的疑問求解

    我客戶目前正在評估AMC1306M25,有以下疑問需要解答,可否幫忙確認一下: 圖為官方的例程,兩個都應該指的是抽取率OSR。但是當客戶在第一個函數中填的抽取率為64,到第二張圖中ratio的值
    發表于 11-14 07:09

    aic23b的AD和DA輸入輸出數據總在64000左右,AD設置的是16位,為什么才進來的數都這么大,是不是配置不對?

    你好,aic23b的AD和DA輸入輸出數據總在64000左右,AD設置的是16位,為什么才進來的數都這么大,是不是配置不對? 還有就是,輸入電壓和采樣值之間的對應關系是什么?
    發表于 11-05 06:53

    求助,AD7190關于Σ-Δ ADC其中的抽取濾波器的數據轉換問題求解

    AD7190可以通過模式寄存器的FS[0:9]設置輸出速率, 0-1023的范圍;此時設置的數據速率選擇位是否就是Σ-Δ ADC抽取濾波器的抽取比? 關于抽取濾波器,此時我設置的為1023,那我是否
    發表于 09-09 06:11

    防水和防振動功能2.5 英寸SAS/SATA硬盤抽取盒 非常適合車載數據存儲

    首創的防水和防振動功能 2.5 英寸 SAS/SATA 硬盤抽取盒 – 非常適合車載數據存儲
    的頭像 發表于 08-12 19:16 ?420次閱讀
    防水和防振動功能2.5 英寸SAS/SATA硬盤<b class='flag-5'>抽取</b>盒 非常適合車載數據存儲

    用 AI 解鎖技術調研的新姿勢

    1. 前言 在日常開發中,為了保證技術方案的質量,一般會在撰寫前進行調研。如果先前沒有相關領域的知識儲備,筆者的調研方式一般是先通過搜索引擎進行關鍵字查詢,然后再基于搜索的結果進行發散
    的頭像 發表于 08-05 13:44 ?186次閱讀
    用 AI 解鎖技術<b class='flag-5'>調研</b>的新姿勢

    萬里紅榮獲GoUpSec《數據安全產品及服務購買決策參考》“酷廠商”推薦

    近日,國內知名安全調研機構GoUpSec深入調研了37家國內數據安全“酷廠商”(包括專業廠商和綜合安全廠商),從產品功能、應用行業、成功案例
    的頭像 發表于 06-19 09:26 ?902次閱讀
    萬里紅榮獲GoUpSec《數據安全產品及服務購買決策參考》“酷<b class='flag-5'>廠商</b>”推薦

    ICY DOCK Expresscage MB038SP-B硬盤抽取盒評測

    ICYDOCK最近又推出了一款ExpressCage系列的有趣產品,適用于SoHo、服務器和工業應用。今天,我們將測試這臺ExpressCageMB038SP-B全金屬硬盤抽取盒,該硬盤抽取盒有8個
    的頭像 發表于 05-17 16:20 ?403次閱讀
    ICY DOCK Expresscage MB038SP-B硬盤<b class='flag-5'>抽取</b>盒評測

    2024年儲能相關政策匯總

    2024年儲能相關政策匯總 2024年,儲能政策繼續加碼,2024年儲能產業必將迎來全新發展。本篇文章為大家帶來2024年1-2月各地發布的儲能相關政策,以供參考。 01 安徽省 近日,安徽蕪湖發布
    的頭像 發表于 05-13 17:59 ?1147次閱讀
    2024年儲能<b class='flag-5'>相關</b>政策<b class='flag-5'>匯總</b>

    國產riscv芯片大匯總

    請問有統計國產的riscv芯片的嗎?能匯總一下嗎?
    發表于 04-27 11:53

    Cadence17.4使用問題匯總

    電子發燒友網站提供《Cadence17.4使用問題匯總.docx》資料免費下載
    發表于 03-07 16:33 ?2次下載

    PCB三防工藝缺陷問題匯總

    今天分享是《三防噴涂工藝缺陷問題案例匯總》 資料。
    的頭像 發表于 12-29 10:10 ?879次閱讀
    PCB三防工藝缺陷問題<b class='flag-5'>匯總</b>

    AD9689芯片DDC抽取濾波器進行多芯片同步時使用什么信號進行復位同步?

    AD9689芯片 DDC抽取濾波器進行多芯片同步時使用什么信號進行復位同步?是sysref信號還是什么?datasheet沒有提供說明。
    發表于 12-07 06:43

    關于工業AI應用與人才培養的調研結果

    在這個結果中,有一些指向了“AI是未來方向,需預先技術儲備”,說明重視AI是一種行為,但也同時說明另一個隱藏的可能,即,并非有顯著的需求支撐,而是為了AI而AI的潛在可能。當然,這也并不重要—對于工業場景來說,AI的應用比較零散,一直處于一個初級階段。
    的頭像 發表于 12-05 15:58 ?542次閱讀
    關于工業AI應用與人才培養的<b class='flag-5'>調研</b><b class='flag-5'>結果</b>

    AD9082在5G采樣率下,不同抽取倍數情況下數據有采集錯誤和隆起怎么解決?

    ,混頻到1700M, FDDC不混頻 4、IQ模式, ADC LMFS=8222 以5120M采樣率下采集,數據有錯點和隆起,具體現像為以下3個現像 1、CDDC設置2倍抽取,FDDC設置2倍抽取,采集
    發表于 12-01 07:01