數(shù)據(jù)平臺(tái) Kaggle 近日發(fā)布了 2017 機(jī)器學(xué)習(xí)及數(shù)據(jù)科學(xué)調(diào)查報(bào)告,這也是 Kaggle 首次進(jìn)行全行業(yè)調(diào)查。調(diào)查共收到超過 16000 份回復(fù),受訪內(nèi)容包括最受歡迎的編程語言、不同國(guó)家數(shù)據(jù)科學(xué)家的平均年齡、不同國(guó)家的平均年薪等。
下面主要看看工具使用方面的結(jié)果。請(qǐng)注意,該報(bào)告包含多個(gè)國(guó)家的數(shù)據(jù),可能存在收集不夠全面的情況,僅供參考。
年齡
從全球范圍來看,本次調(diào)查對(duì)象的平均年齡在 30 歲左右。當(dāng)然,各個(gè)國(guó)家的數(shù)值會(huì)有差異,中國(guó)的機(jī)器學(xué)習(xí)從業(yè)者年齡的中位數(shù)是 25 歲。
全球全職工作者為 65.7% ,其中中國(guó)為 53.% ,美國(guó)占比較高,達(dá) 70.9% 。
Logistic 回歸是除了軍事和國(guó)安領(lǐng)域外,最常用的數(shù)據(jù)科學(xué)研究方法。在軍事和國(guó)防安全領(lǐng)域,神經(jīng)網(wǎng)絡(luò)被使用更多。
在工具語言使用方面,Python是數(shù)據(jù)科學(xué)家使用最多的語言。同時(shí),統(tǒng)計(jì)學(xué)家對(duì) R 語言的忠誠(chéng)度很高。
關(guān)系型數(shù)據(jù)是最常用的數(shù)據(jù)類型,學(xué)術(shù)研究者和國(guó)防安全領(lǐng)域則更親睞文本和圖像。
Git 是他們最常用的代碼共享和托管方式。
Dirty Data (臟數(shù)據(jù))是從業(yè)者遇到的最大障礙。此外,理解不同算法的能力不夠也是困擾數(shù)據(jù)工作者的一大障礙。缺乏有效管理和資金支持,是面臨的兩大外在困境。
有趣的是,只使用 Python 或只使用 R 的都覺得他們做出了正確的選擇。 但是,如果你去詢問那些既使用 Python 也使用 R 的人,推薦使用 Python 的可能會(huì)是 R 的兩倍。
數(shù)據(jù)科學(xué)是個(gè)變化極快的領(lǐng)域,業(yè)內(nèi)人員需要不斷更新知識(shí)體系,才可以在業(yè)內(nèi)保持一定地位,不被時(shí)代淘汰。Stack Overflow Q&A、Conferences 和 Podcasts 是已從業(yè)者經(jīng)常使用的學(xué)習(xí)平臺(tái)。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132407
原文標(biāo)題:2017 機(jī)器學(xué)習(xí)調(diào)查報(bào)告:Python是數(shù)據(jù)科學(xué)家使用最多的語言!
文章出處:【微信號(hào):mcuworld,微信公眾號(hào):嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論