NVIDIA 發(fā)布了 65 個(gè)全新及更新的軟件開發(fā)工具包,包括庫、代碼樣本和指南,為正在推動(dòng)廣泛計(jì)算挑戰(zhàn)前沿的數(shù)據(jù)科學(xué)家、研究者、學(xué)生和開發(fā)者帶來更好的特性和功能。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在其 GTC 主題演講中發(fā)布了這些新增內(nèi)容,其中包括用于加速量子計(jì)算、到戶交付算法和圖神經(jīng)網(wǎng)絡(luò)挖掘的新一代 SDK。
NVIDIA 產(chǎn)品目錄中有 150 多個(gè)加速計(jì)算工具包,NVIDIA 開發(fā)者計(jì)劃中的近 300 萬名成員使用這些工具包,這個(gè)數(shù)字在過去五年增長了 6 倍。CUDA(并行計(jì)算平臺(tái)和編程模型)僅在去年就被下載了 700 萬次,自發(fā)布以來的下載次數(shù)已達(dá)到 3000 萬次。
拓展新市場
新發(fā)布的 SDK 有:
NVIDIA ReOpt:用于實(shí)時(shí)物流,引入了先進(jìn)的大規(guī)模并行算法,可以優(yōu)化車輛路線、倉庫選擇和車隊(duì)組合。其動(dòng)態(tài)改道功能可以減少旅行時(shí)間、節(jié)省燃料成本并最大限度地減少閑置時(shí)間,這將為物流和供應(yīng)鏈行業(yè)節(jié)省數(shù)十億美元。
cuNumeric:用于陣列計(jì)算,實(shí)現(xiàn) NumPy 應(yīng)用編程接口,可以自動(dòng)擴(kuò)展到多 GPU 和多節(jié)點(diǎn)系統(tǒng),而不需要修改代碼。這將給使用 Python 的 2000 萬名數(shù)據(jù)科學(xué)家、研究者和科學(xué)家?guī)碇匾膬r(jià)值。該工具包現(xiàn)已在 GitHub 和 Conda 上提供,可以擴(kuò)展到數(shù)千個(gè) GPU,為 PyData 和 NumPy 生態(tài)系統(tǒng)創(chuàng)造加速計(jì)算。
cuQuantum:用于量子計(jì)算,大大加快了模擬大型量子電路的速度,使量子研究者能夠研究更廣泛的算法和應(yīng)用空間。開發(fā)者可以模擬分子的近期變異量子算法和能夠識別容錯(cuò)的糾錯(cuò)算法等領(lǐng)域,也可以加速 Atos、谷歌和 IBM 的流行量子模擬器
CUDA-X 加速 DGL 容器:用于圖神經(jīng)網(wǎng)絡(luò),為從事具有大型圖的 GNN的開發(fā)者和數(shù)據(jù)科學(xué)家提供了一種快速建立工作環(huán)境的方法。該容器使得在結(jié)合 DGL 和 Pytorc h的集成 GPU 加速 GNN 環(huán)境中的工作變得很容易。憑借 GPU 加速 GNN,我們可以挖掘圖中的洞察,即使是有接近一萬億條邊的全球最大圖也不例外。例如 Pinterest 使用具有數(shù)十億個(gè)節(jié)點(diǎn)和邊緣的圖神經(jīng)網(wǎng)絡(luò)來了解其具有超過 3000 億個(gè) Pin 的生態(tài)系統(tǒng)。該網(wǎng)絡(luò)基于 GPU 和各種經(jīng)過優(yōu)化的庫,可用于模型的訓(xùn)練和推理。
Amazon Web Services 機(jī)器學(xué)習(xí)總監(jiān) Alex Smola 表示:“我們團(tuán)隊(duì)十分高興能與 NVIDIA 合作,通過用于圖構(gòu)建的 RAPIDS cuDF、用于圖采樣的 RAPIDS cuGraph 和 GNN 的自定義計(jì)算內(nèi)核來加速 DGL。而開源的 DGL 也能通過亞馬遜 NeptuneML 以托管式服務(wù)的形式提供。”
經(jīng)過更新的SDK加速應(yīng)用開發(fā)
眾多最受歡迎的 NVIDIA SDK 都增強(qiáng)了功能并進(jìn)行了升級,包括 Clara、DLSS、RTX、Nsight 和 Isaac 工具包。
其他經(jīng)過更新的 SDK 包括:
RAPIDS 21.10:用于數(shù)據(jù)科學(xué),提供時(shí)間序列數(shù)據(jù)處理這項(xiàng)新功能并對現(xiàn)有算法進(jìn)行多項(xiàng)加速。今年以來,NVIDIA 最受歡迎的 SDK 之一——RAPIDS 的下載量增長了 400%。
Deepstream 6.0:用于智能視頻分析的 Deepstream 6.0 引入了新的圖合成器界面,使具有最低編碼能力的用戶也能使用計(jì)算機(jī)視覺,還引入了可視化拖放界面,可實(shí)現(xiàn)簡單、直觀的AI產(chǎn)品開發(fā)流程。
Triton 2.15、TensorRT 8.2 和 cuDNN 8.4:用于深度神經(jīng)網(wǎng)絡(luò),為大型語言模型提供新的優(yōu)化,并且為梯度增強(qiáng)決策樹和隨機(jī)森林提供推理加速。
DOCA 1.2:用于數(shù)據(jù)中心網(wǎng)絡(luò),提供一個(gè)零信任的安全框架,該框架通過硬件和軟件認(rèn)證、線路速率數(shù)據(jù)加密、分布式防火墻和智能遙測來擴(kuò)展威脅保護(hù)。
Merlin 0.8:用于推薦系統(tǒng),具有預(yù)測用戶下一步行動(dòng)的新功能,只需很少的用戶數(shù)據(jù),甚至無需用戶數(shù)據(jù),并且支持大于 GPU 內(nèi)存的模型。
適用于SDK的新培訓(xùn)課程
根據(jù) IDC 預(yù)計(jì),全球全職開發(fā)者的短缺數(shù)量預(yù)計(jì)將從 2021 年的 140 萬增加到 2025 年的 400 萬。該分析公司認(rèn)為,創(chuàng)建提供教育和賦能的基礎(chǔ)設(shè)施是彌補(bǔ)這一短缺的長期解決方案。
NVIDIA 深度學(xué)習(xí)培訓(xùn)中心的兩門新課程支持并加速開發(fā)者對 SDK 的學(xué)習(xí)和使用,為該學(xué)院的 40 多門課程目錄增添新的內(nèi)容。
“用于 DPU 的 DOCA 介紹”是一門自學(xué)課程。該課程向開發(fā)者、研究者和學(xué)生介紹 NVIDIA DOCA 的基本概念。NVIDIA DOCA 是一個(gè)用于在 NVIDIA BlueField DPUs 上實(shí)現(xiàn)加速數(shù)據(jù)中心計(jì)算的平臺(tái)。
將于本月晚些時(shí)候推出的“構(gòu)建實(shí)時(shí)視頻AI應(yīng)用”課程將介紹如何使用 NVIDIA DeepStream 智能視頻分析工具和 NVIDIA TAO 工具套件將原始視頻數(shù)據(jù)轉(zhuǎn)化為基于實(shí)時(shí)深度學(xué)習(xí)的洞察,從而實(shí)現(xiàn)用于構(gòu)建高性能流媒體管道的硬件加速組件。
配合新 SDK 的 NVIDIA 深度學(xué)習(xí)培訓(xùn)中心課程包括:
由教師授課的“加速數(shù)據(jù)科學(xué)基礎(chǔ)”和自學(xué)課程“加速端到端數(shù)據(jù)科學(xué)工作流”使用 NVIDIA RAPIDS 加速數(shù)據(jù)科學(xué)庫來應(yīng)用各種 GPU 加速機(jī)器學(xué)習(xí)算法,包括 XGBoost、cuGRAPH 的單源最短路徑以及 cuML 的 KNN、DBSCAN 和邏輯回歸,以便執(zhí)行大規(guī)模的數(shù)據(jù)分析。
“構(gòu)建智能推薦系統(tǒng)”涵蓋 NVIDIA Merlin 和其他用于構(gòu)建高效推薦系統(tǒng)的基本工具和技術(shù)以及如何部署用于實(shí)時(shí)推薦的 GPU 加速解決方案。
責(zé)任編輯:haq
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6909瀏覽量
88849 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4949瀏覽量
102828 -
軟件
+關(guān)注
關(guān)注
69文章
4799瀏覽量
87178
原文標(biāo)題:GTC21 | NVIDIA發(fā)布新的、更新的加速計(jì)算庫:包含NVIDIA ReOpt、cuQuantum、DOCA等數(shù)十種更新
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論