沒有什么比薅 GPU 羊毛更喜聞樂見。
之前有專門教程介紹谷歌資源,需要科學(xué)上網(wǎng)。但最近知乎上又有一套國(guó)產(chǎn)GPU資源的薅羊毛分享,價(jià)值上億的高性能算力,對(duì)科研學(xué)習(xí)者完全免費(fèi)。
這就是百度的 AI Studio。現(xiàn)在,我們將這篇測(cè)評(píng)及使用分享轉(zhuǎn)載如下,祝薅羊毛開心順利。
1. AI Studio 和飛槳(PaddlePaddle)
AI Studio 和飛槳算是后起之秀,包括我在內(nèi)的很多人還不是很熟悉這一整套方案,在開薅之前,所以先簡(jiǎn)單介紹下。
1.1 AI Studio
AI Studio是百度提供的一個(gè)針對(duì)AI學(xué)習(xí)者的在線一體化開發(fā)實(shí)訓(xùn)平臺(tái)。
平臺(tái)集合了 AI 教程, 深度學(xué)習(xí)樣例工程, 各領(lǐng)域的經(jīng)典數(shù)據(jù)集, 云端的運(yùn)算及存儲(chǔ)資源, 以及比賽平臺(tái)和社區(qū)。[1]你可以把 AI Studio 看成國(guó)產(chǎn)版的 Kaggle。
和 Kaggle 類似,AI Studio 也提供了 GPU 支持,但百度 AI Studio 在 GPU 上有一個(gè)很明顯的優(yōu)勢(shì)。Kaggle 采用的是 Tesla K80 的 GPU,AI Studio 采用的是 Tesla V100 的 GPU,那么下表對(duì)比兩款單精度浮點(diǎn)運(yùn)算性能,就能感覺 v100 的優(yōu)勢(shì)了。
明顯在單精度浮點(diǎn)運(yùn)算上,AI Studio 提供的運(yùn)行環(huán)境在計(jì)算性能上還是很有優(yōu)勢(shì)的。理論上訓(xùn)練速度可以提高近 3 倍左右。
雖然性能上好很多,但目前還是可以免費(fèi)薅到,目前 AI Studio 提供了免費(fèi)申請(qǐng)和運(yùn)行項(xiàng)目獎(jiǎng)勵(lì)這兩種獲得算力卡的方式,最后一章我會(huì)帶領(lǐng)大家去薅。
即使算力卡用完了(目前送得太多,根本用不完),AI Studio 的 CPU 也是很有競(jìng)爭(zhēng)力的。親自用腳本測(cè)試過,AI Studio 的 CPU 是 Intel(R) Xeon(R) Gold 6148 CPU,可以說(shuō)在配置上,AI Studio 也是很有競(jìng)爭(zhēng)力的。
1.2 飛槳
根據(jù)官網(wǎng)介紹,飛槳是百度推出的 “源于產(chǎn)業(yè)實(shí)踐的開源深度學(xué)習(xí)平臺(tái)”,致力于讓深度學(xué)習(xí)技術(shù)的創(chuàng)新與應(yīng)用更簡(jiǎn)單。
Paddle 是 Parallel Distributed Deep Learning 的縮寫,翻譯過來(lái)是就是槳。和 TensorFlow,Pytorch 等框架一樣,飛槳給開發(fā)者提供了很多常用的架構(gòu),也可以直接在包里直接加載常用的數(shù)據(jù)庫(kù),對(duì)于學(xué)習(xí)者來(lái)說(shuō),還是很方便的。
飛槳(PaddlePaddle)還是有點(diǎn)國(guó)產(chǎn)的意思,去Github可以搜到PaddlePaddle 的項(xiàng)目,除了英文文檔,還提供了中文文檔,這個(gè)有時(shí)候還是挺方便的。雖然現(xiàn)在 star 比起 TensorFlow 還是差不少,但是感覺進(jìn)展得如火如荼。
1.3 AI Studio 與飛槳的生態(tài)
下圖是百度在4月首屆 WAVE SUMMIT 2019 深度學(xué)習(xí)開發(fā)者峰會(huì)時(shí)首次對(duì)外公布的 飛槳全景圖。
生態(tài)其實(shí)設(shè)計(jì)得很好,可能TensorFlow先發(fā)得太早吧,感覺飛槳追趕得很吃力。但從百度最近推廣飛槳的力度來(lái)看,我猜飛槳很有可能兩三年左右進(jìn)入主流深度學(xué)習(xí)框架之列。
2. AI Studio實(shí)例測(cè)評(píng):以數(shù)字識(shí)別項(xiàng)目為例
2.1 AI Studio GPU 和 CPU 性能對(duì)比。
為了測(cè)試 AI Studio 的性能,我用最經(jīng)典的 MNIST 數(shù)據(jù)集,在 LeNet 5 模型上跑,對(duì)比在 GPU 和 CPU 下在 AI Studio 的的性能。同時(shí)我進(jìn)行了一個(gè)不算嚴(yán)謹(jǐn)?shù)臏y(cè)試,我用最經(jīng)典的 MNIST 數(shù)據(jù)集,飛槳用的 MNIST 數(shù)據(jù)集是 60000 個(gè)訓(xùn)練數(shù)據(jù),10000 個(gè)測(cè)試數(shù)據(jù),Kaggle 的訓(xùn)練集數(shù)據(jù) 42000,測(cè)試集數(shù)據(jù) 28000。https://aiStudio.baidu.com/aiStudio/projectdetail/45293
以下是 AIStudio 的 CPU 和 GPU 測(cè)試性能對(duì)比
GPU 提升效果為 11 倍,因?yàn)橛?xùn)練過程有驗(yàn)證測(cè)試,而且 CPU 配置也太高了,所以并未達(dá)到理論上的 47x 的加速,但這速度還不錯(cuò)。
2.2 AI Studio 和 Kaggle 對(duì)比測(cè)試
測(cè)試環(huán)境:
1. Kaggle Kernel.
測(cè)試kernelhttps://www.kaggle.com/orange90/mnist-with-lenet-5-test-run-time. Batch_size =50,訓(xùn)練 5000 輪,使用框架TensorFlow,CNN 架構(gòu)是 LeNet-5
2. AI Studio.
測(cè)試項(xiàng)目https://aiStudio.baidu.com/aiStudio/projectdetail/45293
Batch_size=64,訓(xùn)練 5000 輪,使用框架飛槳, CNN 架構(gòu)是 LeNet-5
AI Studio 的測(cè)試結(jié)果在 2.1 展示了,就不再贅述了,以下是 Kaggle 的性能測(cè)試對(duì)比:
GPU 提升效果為 8 倍,因?yàn)橛?xùn)練過程有驗(yàn)證測(cè)試,所以并未達(dá)到理論上的 12.5x 的加速。
由于架構(gòu)的超參不一樣,直接對(duì)比運(yùn)行時(shí)間不太嚴(yán)謹(jǐn),但從 GPU 提升速度的倍數(shù)上來(lái)說(shuō),AI Studio 略勝一籌,況且 AI Studio 本來(lái) CPU 就很高配了,所以理論上 47x 的加速可能還得打個(gè)折。
2.3 AWS
也在AWS開了個(gè)instance來(lái)測(cè)試,選的是這一款配置里的p2.xlarge
直接把2.2里用到的kaggle的內(nèi)核導(dǎo)進(jìn)去了,測(cè)試結(jié)果如下:
性能上比前兩者都差一點(diǎn)。
順便一提,這個(gè)測(cè)試做得我腦殼痛,前期開 instance,配置環(huán)境的就花了一個(gè)多小時(shí)。對(duì)于 AWS 新手來(lái)說(shuō),可能折騰一天,薅了十幾美刀,還是沒能把代碼跑通。真的強(qiáng)烈不推薦在AWS來(lái)練習(xí)自己 deep learning 技能。
2.4. 測(cè)試總結(jié)
下表總結(jié)在不同環(huán)境下的測(cè)試效果及成本:
在使用體驗(yàn)上,和 Kaggle Kernel 或者 Jupyter Notebook 很接近,雖然外觀稍有不同,但快捷鍵基本一樣,沒有太大的不適應(yīng)。除此之外,AI Studio 由于在國(guó)內(nèi),頁(yè)面響應(yīng)比 Kaggle 更快,比 Kaggle 網(wǎng)絡(luò)更穩(wěn)定,斷線重連幾率要更低,畢竟斷線重連要重跑還是挺蛋疼的。
不過需要提醒的是,AI Studio 目前還是按運(yùn)行環(huán)境啟動(dòng)時(shí)間來(lái)計(jì)費(fèi),是在無(wú) GPU 環(huán)境下把代碼寫好,再開啟 GPU 去跑。雖然 AI Studio 的算力卡也是送的,但也要趕緊薅起來(lái),囤點(diǎn)算力資源,萬(wàn)一哪天百度沒錢了,不送了呢?
3. 羊毛來(lái)了,薅起來(lái)
現(xiàn)在的算力卡還是很好拿的,沒什么門檻,自己申請(qǐng)一下就拿到了,而且每天運(yùn)行一次項(xiàng)目,又送 12 個(gè)小時(shí)算力,連續(xù)運(yùn)行 5 天再加送 48 小時(shí)。
值得注意的是,申請(qǐng)的算力卡到手就是 48 小時(shí),裂變之后能湊 120 小時(shí),而且有效期比日常運(yùn)行獲取的12小時(shí)這種要長(zhǎng)很多。
我尋思每天免費(fèi)讓你12小時(shí) NVIDIA v 100GPU 這種事情,真的是天上掉餡餅吧。
此外,AI Studio 官方也有比賽,有獎(jiǎng)金,如果你的實(shí)力在 kaggle 里離拿獎(jiǎng)金只是一步之遙,那么蹭 AI Studio 還沒火起來(lái)之前,去 AI Studio 比賽應(yīng)該是很好拿獎(jiǎng)的。
3.1 自己申請(qǐng)
點(diǎn)進(jìn)https://aistudio.baidu.com/aistudio/questionnaire?activityid=539
接著填寫個(gè)人信息
提交后,會(huì)出現(xiàn)下圖
然后就靜候佳音。通過運(yùn)營(yíng)人員核驗(yàn)后,用戶的郵箱將收到運(yùn)營(yíng)人員發(fā)送的算力邀請(qǐng)碼:一串 32 位數(shù)字。
通過上面鏈接能申請(qǐng)到 48 小時(shí)的算力卡(有效期1個(gè)月),并且可以分裂,送給別人(稍后送上我的分裂算力卡)
使用算力卡的方法很簡(jiǎn)單,在運(yùn)行項(xiàng)目時(shí)選上 GPU,就會(huì)開始消耗了,如下圖。
3.2 跑項(xiàng)目賺算力卡
這個(gè)簡(jiǎn)直了,你不僅可以運(yùn)行自己的深度學(xué)習(xí)代碼,測(cè)試自己的項(xiàng)目,而且同時(shí)還會(huì)得到算力卡。每天跑一次就可以得到12小時(shí)算力卡(有效期2天),另外算力充電計(jì)劃,就是連續(xù)5天有使用算力卡,就會(huì)額外送48小時(shí)(有效期7天)。但預(yù)感這么高成本的事情應(yīng)該不會(huì)持續(xù)太久,建議早薅。下面是我的算力卡獎(jiǎng)勵(lì)歷史,感覺只要你用,AI Studio 就送你算力,不擔(dān)心算力不夠。
3.3 算力卡分裂
AI Studio 的算力卡有分裂功能,你申請(qǐng)到算力卡會(huì)有三個(gè)邀請(qǐng)碼,你可以分享給你的朋友。我申請(qǐng)的算力卡有三個(gè)分裂,我每天會(huì)在評(píng)論區(qū)放一個(gè)算力卡,對(duì)羊毛貪得無(wú)厭,或者懶得申請(qǐng)又想馬上使用的,那可要盯緊評(píng)論區(qū)了。
3.4 比賽薅羊毛
另外額外告訴大家一個(gè)可能能行的薅羊毛的方法,需要一定的實(shí)力。AI Studio 也有一些常規(guī)比賽,相對(duì)于 Kaggle,可能競(jìng)爭(zhēng)會(huì)小點(diǎn),如果你在 Kaggle 能top10%以上,來(lái) AI Studio 薅類似的比賽,就很大幾率拿得到獎(jiǎng)金了。
羊毛不是天天有,該出手時(shí)就出手!
-
cpu
+關(guān)注
關(guān)注
68文章
10824瀏覽量
211138 -
gpu
+關(guān)注
關(guān)注
28文章
4700瀏覽量
128695 -
AI
+關(guān)注
關(guān)注
87文章
30106瀏覽量
268401
原文標(biāo)題:免費(fèi)GPU計(jì)算資源哪里有?帶你薅薅國(guó)內(nèi)GPU羊毛
文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論