精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌重磅發(fā)布自然問題數(shù)據(jù)集

電子工程師 ? 來源:cc ? 2019-01-28 15:27 ? 次閱讀

谷歌重磅發(fā)布自然問題數(shù)據(jù)集(Natural Questions),包含30萬個自然發(fā)生的問題和人工注釋的答案,16000個示例,并發(fā)起基于此數(shù)據(jù)集的問答系統(tǒng)挑戰(zhàn)賽。有望成為自然語言理解領(lǐng)域的SQuAD!

開放領(lǐng)域問題回答(QA)是自然語言理解(NLU)中的一項基準(zhǔn)任務(wù),它的目的是模擬人類如何查找信息,通過閱讀和理解整個文檔來找到問題的答案。

比如,給定一個用自然語言表達的問題“為什么天空是藍色的?”("Why is the sky blue?”),QA系統(tǒng)應(yīng)該能夠閱讀網(wǎng)頁(例如“天空漫射”的維基百科頁面)并返回正確的答案,即使答案有些復(fù)雜和冗長。

然而,目前還沒有可以用于訓(xùn)練和評估QA模型的大型、公開的自然發(fā)生問題(即由尋求信息的人提出的問題)和答案數(shù)據(jù)集。

這是因為構(gòu)建用于QA任務(wù)的高質(zhì)量數(shù)據(jù)集需要大量的真實問題來源,并且需要大量人力來為這些問題尋找正確答案。

為了促進QA領(lǐng)域的研究進展,谷歌今天發(fā)布自然問題數(shù)據(jù)集(Natural Questions, NQ),這是一個用于訓(xùn)練和評估開放領(lǐng)域問答系統(tǒng)的新的、大規(guī)模語料庫,也是第一個復(fù)制人類查找問題答案的端到端流程的語料庫。

Natural Questions數(shù)據(jù)集

NQ的規(guī)模非常龐大,包含30萬個自然發(fā)生的問題,以及來自Wikipedia頁面的人工注釋答案,用于訓(xùn)練QA系統(tǒng)。

此外,NQ語料庫還包含16000個示例,每個示例都由5位不同的注釋人提供答案(針對相同的問題),這對于***的QA系統(tǒng)的性能非常有用。

Natural Questions數(shù)據(jù)集中的示例

由于回答NQ中的問題比回答瑣碎問題(這些問題對計算機來說已經(jīng)很容易解決)需要有更深入的理解,谷歌還發(fā)起了一項基于此數(shù)據(jù)集的挑戰(zhàn)賽,以幫助提高計算機對自然語言的理解。

NQ挑戰(zhàn)賽排行榜

NQ數(shù)據(jù)集包含307K訓(xùn)練示例、8K開發(fā)示例和8K測試示例。

目前,NQ挑戰(zhàn)賽排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成績。在論文中,谷歌證明在長答案選擇任務(wù)上的人類的最優(yōu)成績?yōu)?7% F1,在短答案選擇任務(wù)上人類的最優(yōu)成績?yōu)?6%。

來自谷歌搜索的真實問題

NQ是第一個使用自然發(fā)生的查詢創(chuàng)建的數(shù)據(jù)集,并專注于通過閱讀整個頁面來查找答案,而不是從一個短段落中提取答案。

為了創(chuàng)建NQ,我們從用戶提交給Google搜索引擎的真實、匿名、聚合的查詢開始。

然后,我們要求注釋者通過通讀整個維基百科頁面來找到答案,就好像這個問題是他們自己提出的一樣。注釋者需要找到一個長答案和一個短答案,長答案涵蓋推斷問題所需的所有信息,短答案需要用一個或多個實體的名稱簡潔地回答問題。

對NQ語料庫的注釋質(zhì)量進行評估,顯示準(zhǔn)確率達到90%。

注釋包含一個長答案和一個短答案

研究人員在論文《自然問題:問答研究的基準(zhǔn)》(Natural Questions: a Benchmark for Question Answering Research)中對數(shù)據(jù)收集的過程進行了全面描述,論文已發(fā)表在《計算語言學(xué)協(xié)會會刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ網(wǎng)站上查看更多來自數(shù)據(jù)集的示例。

自然語言理解挑戰(zhàn)

NQ的目的是使QA系統(tǒng)能夠閱讀和理解完整的維基百科文章,其中可能包含問題的答案,也可能不包含問題的答案。

系統(tǒng)首先需要確定這個問題的定義是否足夠充分,是否可以回答——許多問題本身基于錯誤的假設(shè),或者過于模糊,無法簡明扼要地回答。

然后,系統(tǒng)需要確定維基百科頁面中是否包含推斷答案所需的所有信息。我們認(rèn)為,相比在知道長答案后在尋找短答案,長答案識別任務(wù)——找到推斷答案所需的所有信息——需要更深層次的語言理解。

我們希望NQ的發(fā)布以及相關(guān)的挑戰(zhàn)賽將有助于推動更有效、更強大的QA系統(tǒng)的開發(fā)。我們鼓勵NLU社區(qū)參與進來,并幫助縮小目前最先進方法的性能與人類上限之間的巨大差距。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6142

    瀏覽量

    105104
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46859

    瀏覽量

    237580

原文標(biāo)題:NLP新基準(zhǔn)!谷歌重磅發(fā)布開放問答數(shù)據(jù)集,30萬自然提問+人工注釋答案

文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    易華錄“基于北斗數(shù)據(jù)的高精度定位服務(wù)融合應(yīng)用”入選案例

    近期,由開放群島開源社區(qū)牽頭撰寫,中國電子技術(shù)標(biāo)準(zhǔn)化研究院、清華大學(xué)互聯(lián)網(wǎng)產(chǎn)業(yè)研究院聯(lián)合發(fā)起的《2023-2024開放群島開源社區(qū)數(shù)實融合引領(lǐng)場景創(chuàng)新優(yōu)秀案例重磅發(fā)布,涵蓋了三年行動計劃中涉及的十二個關(guān)鍵行業(yè)應(yīng)用場景。易華錄
    的頭像 發(fā)表于 09-04 09:11 ?391次閱讀

    納雷路暢系列TCM873交通流量雷達重磅發(fā)布

    納雷路暢系列TCM873交通流量雷達重磅發(fā)布
    的頭像 發(fā)表于 08-13 11:04 ?488次閱讀
    納雷路暢系列TCM873交通流量雷達<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>

    谷歌發(fā)布革命性AI天氣預(yù)測模型NeuralGCM

    在科技與自然科學(xué)的交匯點上,谷歌公司于7月23日宣布了一項重大突破——全新的人工智能天氣預(yù)測模型NeuralGCM。這一創(chuàng)新成果不僅融合了機器學(xué)習(xí)的前沿技術(shù),還巧妙結(jié)合了傳統(tǒng)氣象學(xué)的精髓,其研究成果已在國際權(quán)威科學(xué)期刊《Nature》上
    的頭像 發(fā)表于 07-23 14:24 ?455次閱讀

    PyTorch如何訓(xùn)練自己的數(shù)據(jù)

    PyTorch是一個廣泛使用的深度學(xué)習(xí)框架,它以其靈活性、易用性和強大的動態(tài)圖特性而聞名。在訓(xùn)練深度學(xué)習(xí)模型時,數(shù)據(jù)是不可或缺的組成部分。然而,很多時候,我們可能需要使用自己的數(shù)據(jù)
    的頭像 發(fā)表于 07-02 14:09 ?1330次閱讀

    請問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會有哪些原因?
    發(fā)表于 05-28 07:27

    谷歌發(fā)布用于輔助編程的代碼大模型CodeGemma

    谷歌發(fā)布了用于輔助編程的代碼大模型 CodeGemma。CodeGemma 基于谷歌今年 2 月發(fā)布的輕量級開源大模型 Gemma,針對 Gemma 的兩個不同參數(shù)規(guī)模的版本 Gemm
    的頭像 發(fā)表于 04-17 16:07 ?634次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>發(fā)布</b>用于輔助編程的代碼大模型CodeGemma

    谷歌推出能制作旅行攻略的AI工具

    谷歌近日發(fā)布了一項令人矚目的新功能,它是一款能夠借助自然語言對話幫助用戶生成旅行行程和出游建議的AI工具。這款工具的推出,標(biāo)志著谷歌在人工智能領(lǐng)域的又一重要突破。
    的頭像 發(fā)表于 03-29 11:08 ?627次閱讀

    谷歌發(fā)布開源AI大模型Gemma

    近日,谷歌發(fā)布了全新AI大模型Gemma,這款模型為各種規(guī)模的組織提供了前所未有的機會,以負責(zé)任的方式在商業(yè)應(yīng)用中進行分發(fā)。
    的頭像 發(fā)表于 02-28 17:38 ?812次閱讀

    谷歌交互世界模型重磅發(fā)布

    谷歌模型
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月28日 09:13:06

    語音數(shù)據(jù):開啟智能語音技術(shù)的新篇章

    隨著人工智能技術(shù)的飛速發(fā)展,語音數(shù)據(jù)在推動智能語音技術(shù)的進步中發(fā)揮著越來越重要的作用。語音數(shù)據(jù)是訓(xùn)練和優(yōu)化語音識別、語音合成等智能語音技術(shù)的關(guān)鍵資源,對于提高語音技術(shù)的準(zhǔn)確性和
    的頭像 發(fā)表于 12-29 11:06 ?634次閱讀

    語音數(shù)據(jù):智能語音技術(shù)的基石與挑戰(zhàn)

    隨著人工智能技術(shù)的飛速發(fā)展,語音技術(shù)已成為人機交互領(lǐng)域的重要突破口。語音數(shù)據(jù)作為支撐語音技術(shù)研發(fā)的核心資源,對于提高語音識別、合成及自然語言處理等技術(shù)的性能具有至關(guān)重要的作用。本文將對語音數(shù)
    的頭像 發(fā)表于 12-28 11:28 ?682次閱讀

    語音數(shù)據(jù):AI語音技術(shù)的靈魂

    提升語音識別和生成能力:語音數(shù)據(jù)為AI模型提供了豐富的語音樣本,通過訓(xùn)練和學(xué)習(xí)這些數(shù)據(jù),AI可以更好地理解和模擬人類的語音特征,從而提高語音識別的準(zhǔn)確性和語音生成的自然度。 促進多
    的頭像 發(fā)表于 12-14 14:33 ?979次閱讀

    大模型數(shù)據(jù):力量的源泉,進步的階梯

    的舞臺 大模型數(shù)據(jù)如廣袤的舞臺,為AI技術(shù)的展現(xiàn)提供了廣闊的空間。這些數(shù)據(jù)規(guī)模龐大,包容萬象,它們是AI進步的基石。無論是自然語言處理、
    的頭像 發(fā)表于 12-07 17:18 ?642次閱讀

    大模型數(shù)據(jù):突破邊界,探索未來

    隨著人工智能技術(shù)的快速發(fā)展,大型預(yù)訓(xùn)練模型如GPT-4、BERT等在自然語言處理領(lǐng)域取得了顯著的成功。這些大模型背后的關(guān)鍵之一是龐大的數(shù)據(jù),為模型提供了豐富的知識和信息。本文將探討大模型數(shù)據(jù)
    的頭像 發(fā)表于 12-06 16:10 ?613次閱讀

    OPT發(fā)布傳感器及運動傳動部件等重磅新品

    OPT帶來全新升級DeepVision3軟件,發(fā)布了傳感器及運動傳動部件等重磅新品。
    的頭像 發(fā)表于 12-04 09:41 ?676次閱讀