在過去的一年中,我們比較了8,800多個開源機器學習項目,從中挑選出前30名,這個極具競爭力的排行榜,精選了2018年1月到12月期間發布的最佳開源機器學習庫、數據集和應用程序等。Mybridge AI根據它們的受歡迎程度,參與度和新鮮度來評估。這30個開源項目的Github平均Star數為:3,558
開源項目對數據科學家用處很大,你可以通過閱讀代碼來學習,并在現有項目之上構建一些東西。話不多說,一起來看看上榜的項目有哪些:
1FastText
https://github.com/facebookresearch/fastTextStar 16675
fasttext是facebook開源的一個詞向量與文本分類工具,在2016年開源,典型應用場景是“帶監督的文本分類問題”。
2Deep-photo-styletransfer
https://github.com/luanfujun/deep-photo-styletransferStar 9747
深度攝影風格轉換,此代碼基于Torch。它已經在Ubuntu 14.04 LTS上進行了測試。上圖就是該算法的圖片風格轉換對比。
3face_recognition
https://github.com/ageitgey/face_recognitionStar 8672
Face Recognition 是一個基于 Python 的人臉識別庫,它還提供了一個命令行工具,讓你通過命令行對任意文件夾中的圖像進行人臉識別操作。該庫使用 dlib 頂尖的深度學習人臉識別技術構建,在戶外臉部檢測數據庫基準(Labeled Faces in the Wild benchmark)上的準確率高達 99.38%。
4Magenta
https://github.com/tensorflow/magentaStar 11752
Project Magenta由Google Brain團隊發布,其主要目標是利用機器學習創作藝術和譜寫曲子。Project Magenta使用了 TensorFlow系統。
5Sonnet
https://github.com/deepmind/sonnetStar 5731
Sonnet 庫使用面向對象的方法,允許創建定義一些前向傳導計算的模塊。模塊用一些輸入 Tensor 調用,添加操作到圖里并返回輸出 Tensor。其中一種設計選擇是通過在隨后調用相同的模塊時自動重用變量來確保變量分享被透明化處理。
6deeplearn.js
https://github.com/PAIR-code/deeplearnjsStar 5462
DeepLearn.js 是 Google 推出的一個可用于機器智能并加速 WebGL 的開源 JavaScript 庫,完全在瀏覽器中運行,不需要安裝,不需要后端處理
7fast-style-transfer
https://github.com/lengstrom/fast-style-transferStar 4843
快速風格遷移的TensorFlow實現,任意風格圖和內容圖0.1秒出結果。
8Pysc2
https://github.com/deepmind/pysc2Star 3683
PySC2 是 DeepMind 開源的 “星際爭霸II學習環境”(SC2LE)的 Python 組件,允許研究者較容易地使用暴雪的 feature-layer API 和自己的智能體。
9AirSim
https://github.com/Microsoft/AirSimStar 3681
AirSim 是微軟開源的一個跨平臺的建立在虛幻引擎( Unreal Engine)上的無人機以及其它自主移動設備的模擬器。 它支持硬件在循環與流行的飛行控制器的物理和視覺逼真模擬。
10Facets
https://github.com/PAIR-code/facetsStar 5054
Facets 是 Google 開源的一款可視化工具,幫助理解、分析和調試 ML 數據集。Facets 包含兩個部分 —— Facets Overview 和 Facets Dive ,允許用戶以不同的粒度查看其數據的整體圖像。
11Style2Paints
https://github.com/lllyasviel/style2paintsStar 8150
STYLE2PAINTS 是新一代的線稿上色 AI ,可根據用戶上傳的自定義色彩給線稿進行上色。
12Tensor2Tensor
https://github.com/tensorflow/tensor2tensorStar 3087
Tensor2Tensor 是一個模塊化和可擴展的庫和二進制文件,用于在 TensorFlow 中訓練深度學習模型,并專注于序列任務,由谷歌開發維護。
13pytorch-CycleGAN-and-pix2pix
https://github.com/junyanz/pytorch-CycleGAN-and-pix2pixStar 6197
基于PyTorch的圖像到圖像翻譯的項目,比如馬到斑馬,老鷹到貓等。當前的軟件適用于PyTorch 0.4+
14Faiss
https://github.com/facebookresearch/faissStar 5181
FAISS 是 Facebook AI 研究團隊開源的針對聚類和相似性搜索庫,用C++編寫,它包含一種在任意大小的向量集合中搜索直到可能不適合在 RAM 中的新算法,還包含用于評估和參數調整的支持代碼。
15Fashion-mnist
https://github.com/zalandoresearch/fashion-mnistStar 4623
FashionMNIST 是一個替代 MNIST 手寫數字集的圖像數據集,其涵蓋了來自 10 種類別的共 7 萬個不同商品的正面圖片,FashionMNIST 的大小、格式和訓練集 / 測試集劃分與原始的 MNIST 完全一致。
16ParlAI
https://github.com/facebookresearch/ParlAIStar 3933
ParlAI是 Facebook 開源的,用于在 Python 中實現的對話 AI 研究框架。
17Fairseq
https://github.com/facebookresearch/fairseqStar 3254
Fairseq 使用一種全新的卷積神經網絡(CNN)進行語言翻譯,結果以 9 倍于以往循環神經網絡(CNN)的速度實現了目前最高準確率。
18Pyro
https://github.com/uber/pyroStar 4772
Pyro 是 Uber AI 實驗室開源的一款深度概率編程語言(PPL),基于 Python 與 PyTorch 之上,專注于變分推理,同時支持可組合推理算法。
19iGAN
https://github.com/junyanz/iGANStar 3121
iGAN,又名 interactive GAN ,自然圖像流形上的可視化操作的生成。該系統基于類似 GAN and DCGAN 這些深度生成模型(Deep Generative Models)
20Deep-image-prior
https://github.com/DmitryUlyanov/deep-image-priorStar 3666
它讓一個深度卷積網絡去學習復制被破壞的圖像(如,加入噪點的圖像),發現這個網絡會自動先學會如何重建圖像。
21Face_classification
https://github.com/oarriaga/face_classificationStar 3559
利用fer2013/imdb 數據庫、Keras CNN 模型和OpenCV進行實時臉部識別和情緒/性別分類。
22Speech-to-Text-WaveNet
https://github.com/buriburisuri/speech-to-text-wavenetStar 2785
用WaveNet和TensorFlow進行端到端的英語演講語句識別。
23StarGAN
https://github.com/yunjey/StarGANStar 3347
StarGAN,顧名思義,就是星形網絡結構,在StarGAN中,生成網絡G被實現成星形。
24Ml-agents
https://github.com/Unity-Technologies/ml-agentsStar 4608
Unity機器學習代理(ML-Agents)是一款開源的Unity插件,讓你可以在游戲環境和模擬環境中訓練智能代理。
25DeepVideoAnalytics
https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/Star 2337
Deep Video Analytics提供了一個從視頻和圖像索引和提取信息的平臺。使用深度學習檢測和識別算法來用檢測到的對象索引各個幀/圖像。
26OpenNMT
https://github.com/OpenNMT/OpenNMTStar 2039
OpenNMT 是一個由 Harvard NLP (哈佛大學自然語言處理研究組) 開源的 Torch 神經網絡機器翻譯系統。
27Pix2pixHD
https://github.com/NVIDIA/pix2pixHDStar 2696
pix2pixHD 是英偉達開源的用條件 GANs (生成式對抗網絡)進行 2048x1024 分辨率的圖像合成和處理的項目,它可以用于將語義標簽貼圖轉換為逼真的圖像,或者從人臉標簽貼圖合成肖像。
28Horovod
https://github.com/uber/horovodStar 4595
Horovod 是 Uber 開源的針對 TensorFlow 的分布式深度學習框架,能夠輕松采用單個 GPU TensorFlow 程序,同時也能更快地在多個 GPU 上成功地對其進行訓練。
29AI-Blocks
https://github.com/MrNothing/AI-BlocksStar 1518
一款強大的WYSIWYG界面,能讓任何人創建機器學習模型。
30deep-voice-conversion
https://github.com/andabi/deep-voice-conversionStar 2007
該項目可在TensorFlow上用深度神經網絡實現語音轉換。
-
開源
+關注
關注
3文章
3249瀏覽量
42402 -
機器學習
+關注
關注
66文章
8377瀏覽量
132407
原文標題:2018年度最牛逼的30個機器學習項目!
文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數據結構】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論