作者 | Meiryum Ali
翻譯 | 火火醬,責(zé)編 | 晉兆雨
出品 | AI科技大本營
計(jì)算機(jī)視覺使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺的目標(biāo)是使人類視覺系統(tǒng)可以實(shí)現(xiàn)任務(wù)自動化。
計(jì)算機(jī)視覺任務(wù)包括圖像采集、圖像處理和圖像分析。圖像數(shù)據(jù)可以采用不同的形式,例如視頻序列,從多個角度的不同的攝像機(jī)查看圖像或來自醫(yī)療掃描儀的多維數(shù)據(jù)。
用于計(jì)算機(jī)視覺訓(xùn)練的圖像數(shù)據(jù)集
Labelme:麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)創(chuàng)建的大型數(shù)據(jù)集,包含187,240張圖像、62,197條帶注釋的圖像和658,992張帶標(biāo)簽的對象。
樂高積木:通過文件夾和使用Blender渲染的計(jì)算機(jī)對大約16700種樂高積木進(jìn)行分類的大約12,700張圖像。
ImageNet:用于新算法的實(shí)際圖像數(shù)據(jù)集。根據(jù)WordNet層次結(jié)構(gòu)進(jìn)行組織,其中層次結(jié)構(gòu)的每個節(jié)點(diǎn)都以成千上萬的圖像進(jìn)行描繪。
LSUN:具有許多輔助任務(wù)的場景理解(房間布局估計(jì)、顯著性預(yù)測等)
MS COCO:COCO是包含200,000多個標(biāo)記圖像的大規(guī)模對象檢測、分割和字幕數(shù)據(jù)集。它可以用于對象分割,上下文識別以及許多其他用例。
哥倫比亞大學(xué)圖像庫:COIL100是一個數(shù)據(jù)集,其中包含360個旋轉(zhuǎn)角度中每個角度成像的100個不同對象。
視覺基因組:視覺基因組是一個數(shù)據(jù)集和知識庫,旨在將結(jié)構(gòu)化圖像概念與語言聯(lián)系起來。該數(shù)據(jù)庫具有詳細(xì)的視覺知識庫,并帶有108,077張圖像的字幕。
Google的開放圖像:“Creative Commons”下900萬個URL的圖像集合,這些URL已用6000多個類別的標(biāo)簽進(jìn)行了注釋。
來自“打開圖像”數(shù)據(jù)集的帶注釋的圖像。 左:Kevin Krejci的《鬼拱門》。右:J B制造的銀制廚房用具。兩個圖像均在CC BY 2.0許可下使用。
Youtube-8M:帶有標(biāo)簽的大規(guī)模數(shù)據(jù)集,由數(shù)百萬個YouTube視頻ID組成,帶有超過3,800多個視覺實(shí)體的注釋。
帶標(biāo)簽的野外面孔:13,000個帶標(biāo)簽的人臉圖像,用于開發(fā)涉及面部識別的應(yīng)用程序。
斯坦福犬類數(shù)據(jù)集:包含20,580張圖像和120種不同的犬種類別,每個類別約有150張圖像。
地點(diǎn):以場景為中心的數(shù)據(jù)庫,其中包含205個場景類別和250萬個帶有類別標(biāo)簽的圖像。
CelebFaces:具有超過200,000張名人圖像的人臉數(shù)據(jù)集,每個圖像帶有40個屬性注釋。
來自CelebFaces數(shù)據(jù)集的樣本圖像。
花卉:在英國常見的花朵圖像數(shù)據(jù)集,包含102個不同類別。每個花類由40至258張圖像組成,這些圖像具有不同的姿勢和光線變化。
植物圖像分析:涵蓋超過一百萬張植物圖像的數(shù)據(jù)集。可以從11種植物中選擇。
家庭對象:一個數(shù)據(jù)集,其中包含來自家庭的隨機(jī)對象,大部分來自廚房、浴室和客廳,這些對象分為訓(xùn)練和測試數(shù)據(jù)集。
CIFAR-10:包含60,000張32×32彩色圖像的大型圖像數(shù)據(jù)集,分為10類。數(shù)據(jù)集分為五個訓(xùn)練批次和一個測試批次,每個批次包含10,000張圖像。
CompCars:包含163種車型,包含1,716種車型,每種車型都標(biāo)有五個屬性,包括最大速度、排量、門數(shù)、座位數(shù)和汽車類型。
室內(nèi)場景識別:非常具體的數(shù)據(jù)集,非常有用,因?yàn)榇蠖鄶?shù)場景識別模型在“外部”效果更好。包含67個室內(nèi)類別,共15620張圖像。
VisualQA:VQA是一個數(shù)據(jù)集,包含有關(guān)265,016張圖像的開放式問題。這些問題需要對視覺和語言的理解。對于每個圖像,至少有3個問題,每個問題10個答案。
原文鏈接:https://hackernoon.com/top-20-image-datasets-for-machine-learning-and-computer-vision-rq3w3zxo
本文由AI科技大本營翻譯,轉(zhuǎn)載請注明出處
譯文鏈接:https://mp.weixin.qq.com/s/aRQXJ2_VP4SHeed6N52CVQ
審核編輯:何安
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1696瀏覽量
45930 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8382瀏覽量
132444
發(fā)布評論請先 登錄
相關(guān)推薦
評論