精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

微軟谷歌AI模型在SuperGLUE測試中超過人類

我快閉嘴 ? 來源:澎湃新聞 ? 作者:澎湃新聞 ? 2021-01-08 10:53 ? 次閱讀

近日,科技公司谷歌和微軟相繼在一份權威自然語言理解榜單中超越人類的表現,微軟宣稱這“標志著邁向通用人工智能的重要里程碑。”

自然語言理解(Natural Language Understanding,簡稱NLU)任務在人工智能領域歷史悠久,被譽為“人工智能皇冠上的明珠”。由于自然語言本身存在的歧義性或多義性,實現高質量的自然語言理解有相當的難度。

為了衡量人工智能模型的自然語言理解能力,紐約大學、華盛頓大學、Facebook和DeepMind在2019年合作提出一個名為SuperGLUE的人工智能基準測試。SuperGLUE由2018年GLUE演化而來,其語言理解任務難度更大,包括問答、自然語言推理、指代消解和詞義消歧等等。

在最近更新的SuperGLUE上,微軟的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人類基準線(human baseline)。這是人工智能首次在SuperGLUE中表現超越人類。

盡管在SuperGLUE測試上取得令人滿意的結果,但微軟坦言,DeBERTa模型還沒有達到人類智能的自然語言理解水平。人類非常善于利用從不同任務中學到的知識來解決新的任務,這是AI模型需要學習的地方。

排名第一的微軟模型DeBERTa共有15億個參數。在SuperGLUE測試中,單個DeBERTa模型的宏觀平均分(89.9分)超過了人類的表現(89.8分);模型整體得分(90.3分)也超過人類基準線(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同樣超過人類基準線(89.8分)。

在SuperGLUE測試中,人工智能模型被要求回答類似這樣的問題:

已知“這個孩子對疾病產生了免疫力”,問“這是由什么導致的?”請選擇:A.“他避免接觸這種疾病”;或B.“他接種了這一疾病的疫苗”。

這是一個簡單的因果推理任務,人類很容易選出正確答案。但對人工智能模型而言,卻是不小的挑戰。為了得出正確答案,模型需要理解已知條件和選項之間的因果關系。

2021年1月6日,微軟在博客發文詳細介紹此次取得榜首的DeBERTa模型。

DeBERTa全稱Decoding-enhanced-BERT-with-disentangled attention,是一個基于Transformer架構的神經語言模型,采用自監督學習方法對大量原始文本語料庫進行預訓練。DeBERTa的目標是學習通用的語言表達形式,適用于各種自然語言理解任務。DeBERTa主要用到三種新技術,分別是分離注意力機制、增強的掩碼解碼器和用于微調的虛擬對抗訓練方法。

排名第二的T5+Meena技術來自谷歌。谷歌團隊尚未詳細解釋其模型在SuperGLUE創紀錄的原因。但微軟在博客文章中評價稱,谷歌的T5模型由110億個參數組成,相比之下,15億參數的DeBERTa在訓練和維護上更加節能,更容易壓縮并部署到各種程序中。

微軟正在將DeBERTa模型集成到下一代“圖靈自然語言生成模型”(Turing NLRv4)中。下一步,他們準備向公眾公開15億參數的DeBERTa模型及其源代碼。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6572

    瀏覽量

    103963
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237664
  • 自然語言
    +關注

    關注

    1

    文章

    287

    瀏覽量

    13334
收藏 人收藏

    評論

    相關推薦

    微軟GitHub與Anthropic和谷歌合作

    近日,微軟旗下的GitHub宣布了一項重要合作,將Anthropic和谷歌AI模型整合到其代碼助理,為數百萬軟件開發者提供新的
    的頭像 發表于 10-30 16:25 ?153次閱讀

    如何評估AI模型的效果

    SuperGLUE、SQuAD等。這些數據集提供了不同任務上的基準評估,使得不同模型同一任務上的性能可以進行直接比較。 二、多樣性和覆蓋性測試
    的頭像 發表于 10-23 15:21 ?459次閱讀

    微軟谷歌等科技巨頭承諾安全開發AI模型

    近日,微軟谷歌、OpenAI等16家科技巨頭“人工智能(AI)首爾峰會”上達成共識,承諾AI
    的頭像 發表于 05-22 11:25 ?481次閱讀

    微軟將推出自研AI模型

    微軟正在緊鑼密鼓地訓練一款全新的自研人工智能大模型——“MAI-1”。據悉,這款模型規模龐大,足以與谷歌的Gemini和OpenAI的ChatGPT相媲美。
    的頭像 發表于 05-13 11:30 ?640次閱讀

    新火種AI|正面硬剛OpenAI與谷歌微軟竟然偷偷自研出5000億參數大模型

    AI領域,微軟公司一直以其獨到的創新性和前瞻性而聞名。也正因此,它搶先在AI賽道嗅到商機,并極具預判性的投資了OpenAI,使其成為自己
    的頭像 發表于 05-11 11:47 ?534次閱讀
    新火種<b class='flag-5'>AI</b>|正面硬剛OpenAI與<b class='flag-5'>谷歌</b>?<b class='flag-5'>微軟</b>竟然偷偷自研出5000億參數大<b class='flag-5'>模型</b>!

    微軟準備推出新的AI模型谷歌及OpenAI競爭

    據報道,微軟向OpenAI投資超過100億美元后,首次成功訓練了一個名為“MAI-1”的內部人工智能模型。這一模型規模龐大,足以與
    的頭像 發表于 05-08 10:45 ?521次閱讀

    微軟準備推出全新人工智能語言模型

    微軟近期傳出消息,正在秘密研發一款全新的人工智能語言模型,這款模型規模上預計將具備與谷歌和OpenAI等業界巨頭相抗衡的實力。據悉,這款新
    的頭像 發表于 05-08 09:30 ?404次閱讀

    微軟自研AI模型即將問世

    微軟正悄然醞釀一項重大技術突破,據內部消息人士透露,公司正全力訓練一款名為“MAI-1”的自研人工智能大模型。這款模型備受期待,其規模龐大,足以與谷歌的Gemini和OpenAI的Ch
    的頭像 發表于 05-07 14:46 ?452次閱讀

    微軟MSN天氣服務引入全新AI模型

    微軟天氣預測領域取得了突破性的進展,為MSN天氣服務引入了全新的AI預測模型。該模型微軟St
    的頭像 發表于 05-07 09:25 ?536次閱讀

    世界數字技術院發布:生成式AI安全測試標準及大語言模型

    據悉,上述兩款標準主要針對大型模型與生成式AI應用領域的安全檢測設定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌微軟、英偉達、百度、騰訊等多家知名企業,其中,
    的頭像 發表于 04-17 16:51 ?1005次閱讀

    微軟將在PowerToys運用本地AI模型優化粘貼功能

    微軟官方宣布,Build 2024開發者大會上,公司將升級PowerToys,增加基于本地AI模型的高級粘貼功能。
    的頭像 發表于 04-11 11:37 ?349次閱讀

    谷歌發布全新AI基礎世界模型Genie

    谷歌近日宣布推出其最新研發的AI基礎世界模型——Genie。這款模型擁有驚人的110億參數,其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬世界。用戶可以在這個世界
    的頭像 發表于 03-04 14:02 ?716次閱讀

    谷歌AI模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI模型Gemma現已在全球范圍內開放使用。這一重要舉措不僅彰顯了谷歌AI
    的頭像 發表于 02-28 18:12 ?1104次閱讀

    谷歌發布開源AI模型Gemma

    近日,谷歌發布了全新AI模型Gemma,這款模型為各種規模的組織提供了前所未有的機會,以負責任的方式商業應用中進行分發。
    的頭像 發表于 02-28 17:38 ?815次閱讀

    谷歌推出AI擴散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發的“Space-Time U-Net”基礎架構,旨在實現視頻
    的頭像 發表于 02-04 13:49 ?996次閱讀