1MUC Data Sets
https://www-nlpir.nist.gov/related_projects/muc/
2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/
3CoNLL-2003
CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創建的,重點關注4個實體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實體) https://www.clips.uantwerpen.be/conll2003/ner/
42010 I2B2
2010 I2B2 NER任務考慮了臨床數據,重點關注臨床問題、測試和治療實體類型
https://www.i2b2.org/NLP/Relations/
5DDIExtraction2013(Drug NER)
重點關注藥品、品牌、集團和藥品n(未批準或新藥)實體類型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html
6CHEMPROT(Similar to 5)
相比5更側重于化學和藥物實體,例如縮寫、配方、家族、標識符等
https://biocreative.bioinformatics.udel.edu/
7 microbiology NER datasets
從PubMed和生物學網站收集,并且主要關注細菌、棲息地和地理位置實體
http://2016.bionlp-st.org/tasks/bb2 (需要FQ訪問)
責任編輯:xj
原文標題:一些NER的英文數據集
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
原文標題:一些NER的英文數據集
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
相關推薦
無論是模電還是數電,理論知識相對來說還是比較枯燥,各種電路原理理解清楚不算容易,換一種生動形象的方式或許會增加一些趣味性,也更容易理解這些知識。下面整理了一些常見的電路,以動態圖形的方式展示。 整流
發表于 11-16 09:26
?199次閱讀
理解模電和數電的電路原理對于初學者來說可能比較困難,但通過一些生動的教學方法和資源,可以有效地提高學習興趣和理解能力。 下面整理了一些常見的電路,以動態圖形的方式展示。 整流電路 單相橋式整流
發表于 11-13 09:28
?210次閱讀
電子發燒友網站提供《LED驅動器應用的一些指南和技巧.pdf》資料免費下載
發表于 09-25 11:35
?0次下載
安裝了PyCharm。接下來,你需要安裝一些用于數據處理和機器學習的庫。在PyCharm中,你可以通過以下步驟安裝庫: 打開PyCharm,創建一個新的項目。 轉到“File” > “Settings
發表于 07-11 10:10
?561次閱讀
各位大佬,咨詢一些關于LED燈具的問題
120W的吸頂燈,用的非隔離式電源,用不到1年,燈具就會閃爍、頻閃或不亮,主要是什么原因造成的?是不是驅動芯片太差?
發表于 07-02 22:33
SolidWorks教育版是一款廣泛應用于工程設計和教育領域的三維建模軟件。它具備直觀易用的操作界面和強大的設計功能,為學生提供了一個學習和實踐的平臺。在本文中,我們將詳細探討SolidWorks教育版的一些基礎知識,幫助初學者
發表于 04-01 14:35
?319次閱讀
555集成芯片盡管在電子應用中具有許多優點,但也存在一些缺點,這些缺點可能在一些特定的應用場景中限制其使用。
發表于 03-26 14:53
?934次閱讀
有關嵌入式之間DSP、ARM、FPGA三者之間和這三款芯片和外部電路之間通信的一些資料,比如說芯片之間的并行通信和芯片和外部電路之間的串行通信,MODBUS、DP、CAN等,一些一些常用的通信協議的
發表于 03-03 18:53
找一些SVG電路原理和功能碼相關的技術說明書,想了解一些SVG的工作原理和工作過程
發表于 02-03 10:13
發自動駕駛論文哪少的了數據集,今天筆者將為大家推薦一篇最新的綜述,總結了200多個自動駕駛領域的數據集,大家堆工作量的時候也可以找
發表于 01-19 10:48
?951次閱讀
芯片: M453VG6AE
我想芯片內部的ROM中存儲一些自定義的數據,該怎么做?
必須要考慮一個問題:如何選址才能防止與APROM,LDROM,配置區地址突沖?
發表于 01-17 06:03
AI或者人工智能自1956年提出至今已有幾十年的歷史。過去的幾十年里面,人工智能的熱度經歷了三次浪潮,第一次提出人工智能之后出現一些新的技術,也應用到了工業生產上,但是很快大家發現所謂的人工智能還不是那么智能,一波浪潮過去之后,
發表于 12-25 11:25
?528次閱讀
請問ADE9153A的autocalibration功能有沒有一些測試數據或性能比較嗎?非常感謝!!
發表于 12-25 07:45
大模型或者句向量在訓練時,使用的語料都是較為通用的語料。這導致了這些模型,對于垂直領域的知識識別是有缺陷的。它們沒有辦法理解企業內部的一些專用術語,縮寫所表示的具體含義。這樣極大地影響了生成向量的精準度,以及大模型輸出的效果。
發表于 12-07 09:41
?1103次閱讀
的事情搞復雜,我希望這些文字能給迷惑中的人們指出一些正確的方向,讓他們少走一些彎路,基本做到一分耕耘一分收獲。
發表于 11-30 09:15
?436次閱讀
評論