精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook推出新AI模型,希望給計算機視覺領(lǐng)域帶來一次“革命”   

jf_f8pIz0xS ? 來源:賢集網(wǎng) ? 作者:AI新訊   ? 2021-03-05 13:49 ? 次閱讀

3月5日消息,F(xiàn)acebook的研究人員推出了一種新的AI模型,該模型可以從網(wǎng)上任何未標記圖像的中學習,這是一項突破,盡管該團隊的研究仍處于早期階段,但他們希望給計算機視覺領(lǐng)域帶來一次“革命”。

該模型被稱為SEER(SElf-SupERvised),被饋入了10億張公開可用的Instagram圖像,這些圖像未經(jīng)過手動標記。但是,即使沒有通常在AI算法訓練中使用的標簽和注釋,SEER仍能夠自主地訓練數(shù)據(jù)集,不斷進行學習,并最終在諸如對象檢測之類的任務上達到最高的準確性。

圖片來自Facebook AI

這種被稱為自監(jiān)督學習(self-supervised learning)的方法在AI領(lǐng)域已經(jīng)很成熟:它由可以直接從給定信息中學習的系統(tǒng)組成,而不必依賴經(jīng)過仔細標記的數(shù)據(jù)集來教他們?nèi)绾螆?zhí)行諸如識別照片中的對象或翻譯文本之類的任務。

自監(jiān)督式學習近來引起了很多關(guān)注,因為這意味著需要手工標記數(shù)據(jù)的工作要少很得,這對大多數(shù)研究人員而言是費時費力的工作。無需管理數(shù)據(jù)集的同時,自監(jiān)督模型可以處理更大,更多樣化的數(shù)據(jù)集。

在某些領(lǐng)域,特別是自然語言處理中,該方法已經(jīng)取得了突破。在數(shù)量越來越多的未標記文本上訓練算法已使諸如問答、機器翻譯、自然語言推理等應用程序取得了進展。

相反,計算機視覺尚未完全進入自監(jiān)督的學習革命。正如Facebook AI Research的軟件工程師Priya Gopal解釋的那樣,SEER是該領(lǐng)域的首創(chuàng)。她告訴ZDNet:“與現(xiàn)有的在ImageNet數(shù)據(jù)集上訓練的計算機視覺的自監(jiān)督模型相比,SEER是第一個可以隨機訓練互聯(lián)網(wǎng)上圖像上的完全自監(jiān)督的計算機視覺模型。”

ImageNet是一個大規(guī)模數(shù)據(jù)庫,包含研究人員標記的數(shù)百萬張圖片,并向較大的計算機視覺社區(qū)開放,以促進AI的發(fā)展。

該項目的數(shù)據(jù)庫被Facebook的研究人員用作評估SEER性能的基準,他們發(fā)現(xiàn)自監(jiān)督模型在諸如低空拍攝、物體檢測、分割和圖像分類等任務上優(yōu)于最新的監(jiān)督AI系統(tǒng)。

Goyal說:“通過僅對隨機圖像進行訓練,SEER優(yōu)于現(xiàn)有的自監(jiān)督模型。這一結(jié)果表明,我們不需要像ImageNet這樣的高度精選的數(shù)據(jù)集,對隨機圖像的自監(jiān)督學習就可以產(chǎn)生非常高質(zhì)量的模型。”

隨著自監(jiān)督學習復雜度的提高,研究人員的工作并非沒有挑戰(zhàn)。在文本方面,AI模型的任務是為單詞賦予含義。但是對于圖像,該算法必須決定每個像素如何與一個概念相對應,同時考慮到其在不同圖片中拍攝角度、視圖和形狀的差別。

換句話說,研究人員需要大量數(shù)據(jù),并且需要一個能夠從這種復雜的信息池中推導出所有可能的視覺概念。

為了完成此任務,Goyal和她的團隊從Facebook AI在自監(jiān)督學習中的現(xiàn)有工作中改編了一種新算法,稱為SwAV,該算法將顯示相似的圖像聚集到單獨的組中。科學家還設(shè)計了卷積網(wǎng)絡(luò),也就是一種深度學習算法,算法對人腦中神經(jīng)元的連接模式進行建模,根據(jù)重要性分配給圖像中的不同對象。

至少可以說,借助Instagram的10億張圖片的數(shù)據(jù)集,該系統(tǒng)的規(guī)模很大。Facebook的團隊使用了具有32GB RAM的V100 Nvidia GPU,并且隨著模型尺寸的增加,必須將模型放入可用的RAM中。但是Goyal解釋說,進一步的研究將對確保計算功能適應新系統(tǒng)很有用。

“隨著我們在越來越多的GPU上訓練模型,這些GPU之間的通信需要快速進行。可以通過開發(fā)軟件來解決給定的內(nèi)存和運行時間帶來的挑戰(zhàn)。”她說。

盡管仍有許多工作要做,但是,在可以將SEER應用于現(xiàn)實世界的用例之前,Goyal認為不應低估該技術(shù)的影響。她說:“借助SEER,我們現(xiàn)在可以通過大量隨機的互聯(lián)網(wǎng)上的圖像訓練大型模型,在計算機視覺方面取得更大的進步。”

“這一突破可以實現(xiàn)計算機視覺的自監(jiān)督學習革命,類似于我們在自然語言處理文本中所看到的。”

在Facebook內(nèi)部,SEER可用于各種計算機視覺任務,從自動生成圖像描述到幫助識別違反政策的內(nèi)容。在公司外部,該技術(shù)還可用于圖像和元數(shù)據(jù)有限的領(lǐng)域,例如醫(yī)學成像

Facebook的團隊呼吁開展更多工作,以將SEER推進到其下一階段的開發(fā)。作為研究的一部分,該團隊開發(fā)了一種基于PyTorch的全能庫,用于自監(jiān)督學習,稱為VISSL,該庫是開源的,鼓勵更多的AI社區(qū)成員對該技術(shù)進行測試。

當被問及是否已通知Instagram用戶使用其圖像來訓練SEER或用戶是否有機會選擇其圖像不被用來學習時,Goyal指出,F(xiàn)acebook在其數(shù)據(jù)政策中告知Instagram帳戶持有人,其使用圖片等信息來支持研究,其中包括支持SEER的研究。也就是說,F(xiàn)acebook并不打算分享這些圖片或SEER模型本身,部分原因是該模型可能包含無意識的偏見。

Facebook在一篇博客文章中寫道:“自我監(jiān)督學習一直是Facebook人工智能的重點,因為它使機器可以直接從世界上大量可用的信息中學習,而不僅僅是從專門為人工智能研究創(chuàng)建的訓練數(shù)據(jù)中學習。就像在其他研究領(lǐng)域一樣,自我監(jiān)督學習對未來的計算機視覺有著不可思議的影響。消除了對人工注釋和元數(shù)據(jù)的需要,使計算機視覺社區(qū)能夠處理更大、更多樣化的數(shù)據(jù)集,從隨機公共圖像中學習,并可能減輕數(shù)據(jù)管理中出現(xiàn)的一些偏見。自我監(jiān)督學習還可以幫助在圖像或元數(shù)據(jù)有限的領(lǐng)域(如醫(yī)學成像)對模型進行專門研究。無需人工提前標記,模型可以更快地創(chuàng)建和部署,能夠?qū)焖僮兓那闆r做出更快、更準確的反應。”
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30146

    瀏覽量

    268415
收藏 人收藏

    評論

    相關(guān)推薦

    初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI計算機視覺技術(shù)變革航海安全系統(tǒng)

    總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI計算機視覺技術(shù)變革航海安全系統(tǒng),讓每一次出海變得更安全。
    的頭像 發(fā)表于 09-09 09:32 ?465次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域個重要分支,旨在使計算機能夠像人類樣理解和解釋圖像和視頻中的信息
    的頭像 發(fā)表于 08-14 09:49 ?729次閱讀

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域個重要分支,旨在使計算機能夠像人類樣理解和解釋圖像及視頻中的
    的頭像 發(fā)表于 07-24 12:46 ?621次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是門跨學科的研究領(lǐng)域,它利用計算機和數(shù)學算法來模擬人類
    的頭像 發(fā)表于 07-10 18:24 ?1641次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    引言 計算機視覺門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個
    的頭像 發(fā)表于 07-09 09:25 ?518次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等
    的頭像 發(fā)表于 07-09 09:23 ?794次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域、定義 計算機
    的頭像 發(fā)表于 07-09 09:22 ?407次閱讀

    計算機視覺在人工智能領(lǐng)域有哪些主要應用?

    與分類是計算機視覺的基礎(chǔ)應用之。通過訓練機器學習模型計算機可以識別和分類各種圖像,如動物、植物、物體等。這種技術(shù)在許多
    的頭像 發(fā)表于 07-09 09:14 ?1187次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域個重要分支。 引言 計算機視覺
    的頭像 發(fā)表于 07-09 09:11 ?1147次閱讀

    計算機視覺怎么圖像分類

    圖像分類是計算機視覺領(lǐng)域中的項核心任務,其目標是將輸入的圖像自動分配到預定義的類別集合中。這過程涉及圖像的特征提取、特征表示以及分類器的
    的頭像 發(fā)表于 07-08 17:06 ?510次閱讀

    深度學習在計算機視覺領(lǐng)域的應用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學習作為其中的核心技術(shù)之,已經(jīng)在計算機視覺領(lǐng)域取得了顯著的成果。計算機
    的頭像 發(fā)表于 07-01 11:38 ?678次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域個重要分支,致力于使計算機能夠像人眼
    的頭像 發(fā)表于 06-06 17:17 ?849次閱讀

    計算機視覺的十大算法

    視覺技術(shù)的發(fā)展起到了重要的推動作用。、圖像分割算法圖像分割算法是計算機視覺領(lǐng)域的基礎(chǔ)算法之
    的頭像 發(fā)表于 02-19 13:26 ?1203次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    計算機視覺AI如何識別與理解圖像

    計算機視覺是人工智能領(lǐng)域個重要分支,它致力于讓機器能夠像人類樣理解和解釋圖像。隨著深度學習和神經(jīng)網(wǎng)絡(luò)的發(fā)展,人們對于如何讓
    的頭像 發(fā)表于 01-12 08:27 ?1354次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>:<b class='flag-5'>AI</b>如何識別與理解圖像

    最適合 AI 應用的計算機視覺類型是什么?

    計算機視覺是指為計算機賦予人類視覺技術(shù)目標,從而賦能裝配線檢查到駕駛輔助和機器人等應用。計算機
    的頭像 發(fā)表于 12-18 13:09 ?7180次閱讀
    最適合 <b class='flag-5'>AI</b> 應用的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>類型是什么?