HPE、IBM、Oracle、開源社區(qū)、創(chuàng)業(yè)公司采用RAPIDS,顯著提升端到端預(yù)測數(shù)據(jù)分析能力。
NVIDIA今日發(fā)布了一款針對數(shù)據(jù)科學和機器學習的GPU加速平臺,該平臺已為多個行業(yè)領(lǐng)先者所采用,并能幫助超大規(guī)模公司以前所未有的速度分析海量數(shù)據(jù)并進行精準的業(yè)務(wù)預(yù)測。
RAPIDS? 開源軟件幫助數(shù)據(jù)科學家顯著地提高了工作績效,對于這些數(shù)據(jù)科學家來說,種種業(yè)務(wù)挑戰(zhàn)應(yīng)接不暇,其中包括預(yù)估信用卡詐騙、預(yù)測零售存貨及理解顧客購買行為等等。眾多公司——無論是Databricks和Anaconda等開源社區(qū)先驅(qū)還是Hewlett Packard Enterprise、IBM和Oracle等技術(shù)領(lǐng)袖——在GPU對數(shù)據(jù)分析的重要性方面日益達成共識,并對RAPIDS表現(xiàn)出越來越多的支持。
據(jù)分析師估計,面向數(shù)據(jù)科學和機器學習的服務(wù)器市場每年價值約為200億美元,加上科學分析和深度學習市場,高性能計算市場總價值大約為360億美元。
“數(shù)據(jù)分析和機器學習是高性能計算市場中最大的細分市場,不過目前尚未實現(xiàn)加速,”NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在GPU技術(shù)大會主旨演講中發(fā)布RAPIDS時表示,“全球最大的行業(yè)均在海量服務(wù)器上運行機器學習算法,目的在于了解所在市場和環(huán)境中的復雜模式,同時迅速、精準地做出將直接影響其基礎(chǔ)的預(yù)測 。”
黃仁勛表示,“得益于CUDA及其全球生態(tài)系統(tǒng)以及與開源社區(qū)緊密合作,我們已創(chuàng)建了RAPIDS GPU加速平臺。該平臺已與全球最流行的數(shù)據(jù)科學庫及工作流無縫整合,可加速機器學習。如同深度學習一樣,我們正在不斷地為機器學習提速。”
RAPIDS已為GPU加速分析和機器學習提供了一整套開源庫,數(shù)據(jù)可視化即將是下一個目標。RAPIDS由NVIDIA工程師與主要的開源貢獻者在過去兩年的合作成果。
RAPIDS第一次為數(shù)據(jù)科學家提供了他們需要用來在GPU上運行整個數(shù)據(jù)科學管線的工具。最初的RAPIDS基準分析利用了XGBoost機器學習算法在NVIDIA DGX-2? 系統(tǒng)上進行訓練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍。這可幫助數(shù)據(jù)科學家將典型訓練時間從數(shù)天減少到數(shù)小時,或者從數(shù)小時減少到數(shù)分鐘,具體取決于其數(shù)據(jù)集的規(guī)模。
與開源社區(qū)開展緊密合作
RAPIDS構(gòu)建于Apache Arrow、pandas和scikit-learn等流行的開源項目之上,為最流行的Python數(shù)據(jù)科學工具鏈帶來了GPU提速。為了將更多的機器學習庫和功能引入RAPIDS,NVIDIA廣泛地與開源生態(tài)系統(tǒng)貢獻者展開合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 負責人兼Apache Arrow締造者Wes McKinney以及迅速增長的Python數(shù)據(jù)科學庫pandas等等。
McKinney表示,“作為GPU加速的數(shù)據(jù)科學平臺,RAPIDS是由Apache Arrow驅(qū)動的新一代的計算生態(tài)系統(tǒng)。NVIDIA與Ursa Labs的合作將加速Arrow核心數(shù)據(jù)庫的創(chuàng)新步伐,并有助于大幅提升分析及特征工程的績效。”
為了推動RAPIDS的廣泛應(yīng)用,NVIDIA正努力將RAPIDS與Apache Spark進行整合,后者是分析及數(shù)據(jù)科學方面領(lǐng)先的開源框架。
Databricks聯(lián)合創(chuàng)始人、首席技術(shù)官兼Apache Spark 創(chuàng)始人Matei Zaharia表示,“在Databricks公司中,我們對RAPIDS在加速Apache Spark工作量方面的潛力感到非常興奮。我們目前開展的多個項目都意在將Spark更好地與本地加速器進行整合,其中包括借助Project Hydrogen實現(xiàn)的Apache Arrow的支持以及GPU調(diào)度。我們相信,就擴大我們客戶數(shù)據(jù)科學及AI工作量來說,RAPIDS將是全新的、振奮人心的機會。”
廣泛的生態(tài)系統(tǒng)支持及應(yīng)用
各個行業(yè)技術(shù)領(lǐng)先的企業(yè)均是NVIDIA GPU加速平臺及RAPIDS的率先應(yīng)用者。
沃爾瑪執(zhí)行副總裁兼首席技術(shù)官Jeremy King表示,“NVIDIA的GPU加速平臺及RAPIDS軟件極大改進了我們使用數(shù)據(jù)的方式,幫助我們實現(xiàn)了復雜模式大規(guī)模地運行,同時進行更加精準的預(yù)測。RAPIDS的應(yīng)用得益于NVIDIA和沃爾瑪工程師之間的深度合作,我們準備繼續(xù)推進這種合作關(guān)系。”
此外,一些全球領(lǐng)先的技術(shù)公司也力圖通過全新的系統(tǒng)、數(shù)據(jù)科學平臺和軟件解決方案支持RAPIDS:
“HPE致力于改進客戶生活和工作的方式。人工智能、分析和機器學習技術(shù)能在揭示洞察方面扮演關(guān)鍵的角色,這有助于幫助客戶實現(xiàn)突破性的成果,同時改善我們所生存的世界。HPE提供全面的人工智能和數(shù)據(jù)分析解決方案并在市場中保持獨一無二的優(yōu)勢,其中既包括戰(zhàn)略咨詢,也包括專為特定需求開發(fā)的GPU加速器技術(shù)、運行支持以及強大的伙伴生態(tài)系統(tǒng);我們旨在為每位客戶定制合適的解決方案。我們對與NVIDIA在RAPIDS方面的合作感到非常興奮,此舉能加快數(shù)據(jù)科學和機器學習的應(yīng)用,推動我們的客戶更快地實現(xiàn)更具洞察力的成果。”——惠普企業(yè)首席執(zhí)行官Antonio Neri
“IBM已為企業(yè)人工智能構(gòu)建了全球領(lǐng)先的、在任何部署模式上均能運行的平臺。我們期望能拓展與NVIDIA已有的成功合作,利用RAPIDS來為客戶提供全新的機器學習工具。”——Hybrid Cloud高級副總裁兼IBM Research董事 Arvind Krishna
“當今的計算領(lǐng)域要要強大的處理能力,以便應(yīng)對數(shù)據(jù)科學和分析智能等紛繁復雜的工作,而這正是NVIDIA GPU的優(yōu)勢。RAPIDS正在不斷加速處理和機器學習培訓的速度。能在Oracle Cloud Infrastructure上支持這套全新的開源軟件讓我們感到非常興奮,我們也希望能與NVIDIA繼續(xù)合作,以在我們的Oracle Data Science Cloud等各種平臺上支持RAPIDS,并進一步加速客戶端到端數(shù)據(jù)科學工作流。RAPIDS軟件在Oracle Cloud上無縫運行,這使客戶得以支持各種高性能計算、人工智能和數(shù)據(jù)科學需求,同時利用Oracle Cloud Infrastructure 上可獲得的GPU實例組合。”——Oracle Cloud Infrastructure軟件開發(fā)部門高級副總裁Clay Magouyrk
本新聞稿得到包括Cisco、DELL EMC、聯(lián)想、NERSC, NetApp, Pure Storage, SAP和SAS等其它領(lǐng)先創(chuàng)新者以及諸多數(shù)據(jù)科學先驅(qū)的支持。
供貨
全套RAPIDS開源庫現(xiàn)在即可在http://www.rapids.ai上獲得,代碼經(jīng)Apache許可公布。容器化RAPIDS版本本周內(nèi)可在NVIDIA GPU Cloud container registry (https://www.nvidia.com/en-us/gpu-cloud/)上獲得。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4940瀏覽量
102815 -
機器學習
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132409
原文標題:GTC Europe | NVIDIA針對大規(guī)模數(shù)據(jù)分析和機器學習推出RAPIDS開源GPU加速平臺
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論