精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

何愷明團隊所在的Facebook AI推出ResNeXt-101模型

DPVg_AI_era ? 來源:lq ? 2019-06-29 07:26 ? 次閱讀

近日,何愷明團隊所在的Facebook AI推出ResNeXt-101模型,利用Instagram上的用戶標記圖片作為預訓練數(shù)據(jù)集,省去了人工標記數(shù)據(jù)的巨額成本,而且使用中只需微調,性能即超越了ImageNet任務的SOTA水平。

目前,幾乎所有最先進的視覺感知算法都依賴于相同的范式:(1)在手動注釋的大型圖像分類數(shù)據(jù)集上預訓練卷積網(wǎng)絡,(2)在較小的特定任務的數(shù)據(jù)集上微調網(wǎng)絡。這個模式已經(jīng)廣泛使用了好多年,并取得了明顯的進展。比如:物體檢測,語義分割,人體姿勢估計,視頻識別,單眼深度估計等。

事實上,如果沒有有監(jiān)督式預訓練,很多方法現(xiàn)在還被認為是一種蠻干 ImageNet數(shù)據(jù)集實際上是預訓練數(shù)據(jù)集。我們現(xiàn)在實際上對數(shù)據(jù)集的預訓練了解相對較少。其原因很多:比如現(xiàn)存的預訓練數(shù)據(jù)集數(shù)量很少,構建新數(shù)據(jù)集是勞動密集型的工作,需要大量的計算資源來進行實驗。然而,鑒于預訓練過程在機器學習相關領域的核心作用,擴大我們在這一領域的科學知識是非常重要的。

本文試圖通過研究一個未開發(fā)的數(shù)據(jù)體系來解決這個復雜的問題:使用外部社交媒體上數(shù)十億的帶有標簽的圖像作為數(shù)據(jù)源。該數(shù)據(jù)源具有大而且不斷增長的優(yōu)點,而且是“免費”注釋的,因為數(shù)據(jù)不需要手動標記。顯而易見,對這些數(shù)據(jù)的訓練將產生良好的遷移學習結果。

本文的主要成果是,在不使用手動數(shù)據(jù)集管理或復雜的數(shù)據(jù)清理的情況下,利用數(shù)千個不同主題標簽作為標記的數(shù)十億幅Instagram圖像進行訓練的模型,表現(xiàn)出了優(yōu)異的傳輸學習性能。在目標檢測和圖像分類任務上實現(xiàn)了對當前SOTA性能的提升。在ImageNet-1k圖像分類數(shù)據(jù)集上獲得single-crop 最高準確率達到了85.4%,AP達到了45.2%。當在ImageNet-1k上訓練(或預訓練)相同模型時,分數(shù)分別為79.8%和43.7%。然而,我們的主要目標是提供關于此前未開發(fā)的制度的新實驗數(shù)據(jù)。為此,我們進行了大量實驗,揭示了一些有趣的趨勢。

表1:圖像分類數(shù)據(jù)集的摘要。每個數(shù)據(jù)集標明數(shù)據(jù)來源和功能(訓練集,驗證集,測試集),圖像數(shù)量I和標簽數(shù)量L。

ImageNet數(shù)據(jù)集和模型

除了標準的IN-1k數(shù)據(jù)集之外,我們還嘗試了包含1420萬幅圖像和22000標簽的完整ImageNet2011完整版本的更大子集。我們構建了包含5k和9k標簽的訓練集和驗證集。

對于5k標簽集組,我們使用現(xiàn)在標準的IN-5k(6.6M訓練圖像)。對于9k標簽集,我們遵循用于構建IN-5k數(shù)據(jù)集的相同協(xié)議,采用下一個最頻繁的4k標簽和所有相關圖像(10.5M訓練圖像)。在兩種情況下,均使用50個圖像進行驗證。

我們使用具有分組卷積層的殘差網(wǎng)絡ResNeXt 。實驗中使用ResNeXt-101 32×Cd,它有101層,32組,組寬分別為:4(8B乘加FLOPs,43M參數(shù)),8(16B,88M),16(36B,193M), 32(87B,466M)和48(153B,829M)。我們認為實驗結果可以推廣到其他架構。

與ImageNet相比,我們使用的Instagram數(shù)據(jù)集可能包含每個圖像的多個標簽(因為用戶指定了多個主題標簽)。每個圖像的平均標簽數(shù)量因數(shù)據(jù)集而異;例如,train-IG-1B-17k每個圖像最多包含2個主題標簽。

實驗結果與性能

表2:使用不同規(guī)模、不同參數(shù)配置的ResNeXt-101模型獲得的不同性能結果比較

圖1:使用不同規(guī)模和參數(shù)配置的ResNeXt-101模型在ImageNet和Instagram標記數(shù)據(jù)集的分類性能的比較

運行實例及相關代碼

# Download an example image from the pytorch websiteimport urlliburl, filename = ("https://github.com/pytorch/hub/raw/master/dog.jpg", "dog.jpg")try: urllib.URLopener().retrieve(url, filename)except: urllib.request.urlretrieve(url, filename)

# sample execution (requires torchvision)from PIL import Imagefrom torchvision import transformsinput_image = Image.open(filename)preprocess = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),])input_tensor = preprocess(input_image)input_batch = input_tensor.unsqueeze(0) # create a mini-batch as expected by the model# move the input and model to GPU for speed if availableif torch.cuda.is_available(): input_batch = input_batch.to('cuda') model.to('cuda')with torch.no_grad(): output = model(input_batch)# Tensor of shape 1000, with confidence scores over Imagenet's 1000 classesprint(output[0])# The output has unnormalized scores. To get probabilities, you can run a softmax on it.print(torch.nn.functional.softmax(output[0], dim=0))

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像分類
    +關注

    關注

    0

    文章

    90

    瀏覽量

    11907
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132409
  • 數(shù)據(jù)集

    關注

    4

    文章

    1205

    瀏覽量

    24644

原文標題:何愷明團隊新作ResNext:Instagram圖片預訓練,挑戰(zhàn)ImageNet新精度

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI模型可以設計電路嗎?

    AI模型
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年01月02日 15:09:29

    Facebook手機明年或上市 采用Firefox OS系統(tǒng)

    Facebook手機一事同Facebook達成了合作協(xié)議,手機在明年下半年推出,并將搭載Firefox OS操作系統(tǒng)。”除此之外,該博客還放出了一張Facebook手機概念圖。圖片中的
    發(fā)表于 12-31 09:04

    Facebook 最新推出的虛擬現(xiàn)實世界,簡直好玩到炸裂

    `導讀:在虛擬世界里互動?這件事可絕對不像聽起來那么無聊。Facebook 今天在自己的開發(fā)者大會F8上推出了虛擬現(xiàn)實社交網(wǎng)絡平臺 Facebook Spaces,簡直好玩到炸裂!可能你還記得在去年
    發(fā)表于 04-21 09:25

    蘋果音箱月產大跌 Facebook智能音箱延至10月

      導讀:亞馬遜公司的Echo智能音箱,被稱為蘋果手機發(fā)售以來科技行業(yè)最重大發(fā)明,全世界幾乎所有的大型科技公司都模仿亞馬遜推出了智能音箱。據(jù)外媒最新消息,Facebook的隱私泄露丑聞影響到了該公司
    發(fā)表于 04-25 09:30

    Facebook智能音箱可能先在國際市場推出 隱私問題受到關注

      導讀:據(jù)外媒報道,據(jù)知情人士稱,Facebook正考慮在國際市場上率先推出其智能音箱產品,以避免因數(shù)據(jù)隱私問題在美國遭到公開審查。此外,這兩款智能音箱將內置一款語音助手,它使用的基礎技術與公司在
    發(fā)表于 05-09 09:29

    如何加速電信領域AI開發(fā)?

    所在的電信領域對開發(fā)者業(yè)務知識要求高,且電信場景多樣化、網(wǎng)絡設備復雜,華為推出的這款電信領域AI開發(fā)平臺到底如何幫助開發(fā)者攻克電信領域AI開發(fā)的障礙?我們或可從
    發(fā)表于 02-25 06:53

    基于暗原色先驗的單幅圖像去霧算法

    這是去霧算法的翻譯版,個人翻譯,原汁原味,簡單易懂。
    發(fā)表于 11-19 15:05 ?10次下載

    Bloomsbury AI團隊加入Facebook團隊,共同構建新的自然語言杜絕假新聞

    當然,本次的收購對于Facebook來說,意義重大,Bloomsbury AI可以幫助其監(jiān)控社交網(wǎng)絡和監(jiān)管虛假新聞和違禁內容。目前,Facebook面臨著用戶隱私泄露、虛假新聞不斷等負面消息,然而,Bloomsbury
    發(fā)表于 07-09 20:02 ?343次閱讀

    Facebook推出ONNX,旨在為不同編程框架的神經(jīng)網(wǎng)絡創(chuàng)建共享模型

    今年9月,Facebook宣布推出“開源神經(jīng)網(wǎng)絡交換”(ONNX),呼吁其他公司加入,旨在為不同編程框架的神經(jīng)網(wǎng)絡創(chuàng)建共享模型。今天,Facebook聯(lián)合AWS和微軟宣布,在合作伙伴的
    的頭像 發(fā)表于 12-28 16:12 ?4226次閱讀

    Facebook構建虛擬空間訓練AI

    近日,Facebook推出一個開源的模擬數(shù)據(jù)集,希望幫助研究人員創(chuàng)建更加真實的AR/VR體驗,最終目的是幫助 AI 了解物理世界的環(huán)境。
    的頭像 發(fā)表于 06-18 17:07 ?3261次閱讀

    Facebook推出新款AI打牌機器人 可打敗專業(yè)對手

    Facebook推出AI 打牌機器人,已經(jīng)獲得了多人協(xié)作性上的全面提升。外媒報道稱,新機器人可在德州撲克和 Go 等流行棋盤游戲上打敗專業(yè)選手。上周五的時候,該公司 AI 研究
    發(fā)表于 12-09 15:10 ?2403次閱讀

    Facebook推出AI模型,希望給計算機視覺領域帶來一次“革命”   

    3月5日消息,Facebook的研究人員推出了一種新的AI模型,該模型可以從網(wǎng)上任何未標記圖像的中學習,這是一項突破,盡管該
    的頭像 發(fā)表于 03-05 13:49 ?1088次閱讀

    耐能團隊上線新款AI模型體驗工具Showroom

    近期,耐能團隊上線了一款新的AI模型體驗工具「Showroom」。
    的頭像 發(fā)表于 05-31 10:35 ?1037次閱讀

    NVIDIA 為全球企業(yè)帶來生成式 AI 推出用于創(chuàng)建大型語言模型和視覺模型的云服務

    AI驅動的應用構建自定義模型 ? 加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023年3月21日 – 為了加速企業(yè)應用生成式AI,NVIDIA今日宣布推出一套云服務,使企業(yè)能
    發(fā)表于 03-22 13:45 ?383次閱讀
    NVIDIA 為全球企業(yè)帶來生成式 <b class='flag-5'>AI</b>  <b class='flag-5'>推出</b>用于創(chuàng)建大型語言<b class='flag-5'>模型</b>和視覺<b class='flag-5'>模型</b>的云服務

    開源大模型FLM-101B:訓練成本最低的超100B參數(shù)大模型

    近期,一支來自中國的研究團隊正是針對這些問題提出了解決方案,他們推出了FLM-101B模型及其配套的訓練策略。FLM-101B不僅大幅降低了
    的頭像 發(fā)表于 09-12 16:30 ?1405次閱讀
    開源大<b class='flag-5'>模型</b>FLM-<b class='flag-5'>101</b>B:訓練成本最低的超100B參數(shù)大<b class='flag-5'>模型</b>