精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA GPU并行計算技術(shù)解決AI研究問題

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Solee Moon ? 2022-04-19 16:44 ? 次閱讀

由于冠狀病毒的存在, 2021 年韓國科學(xué)技術(shù)信息研究所( KISTI ) GPU 黑客大賽在 KISTI NVIDIA 和 OpenACC 組織的專家導(dǎo)師指導(dǎo)下舉行。為了激發(fā)科學(xué)家加速 AI 研究或 HPC 代碼的可能性, hackathon 提供了利用 NVIDIA GPU并行計算技術(shù)解決研究問題和擴(kuò)展專業(yè)知識的機(jī)會。

以面對面活動而聞名的虛擬黑客大會對與會者和主持人都提出了自己的挑戰(zhàn)。新的模式還需要兼顧由三個 HPC 和 AI 團(tuán)隊、四個高等教育和研究團(tuán)隊以及兩個行業(yè)團(tuán)隊組成的多樣化團(tuán)隊。

活動團(tuán)隊發(fā)現(xiàn)以下配方有助于為參與者創(chuàng)造有意義的成功體驗(yàn):

指導(dǎo)

基于他們在特定領(lǐng)域或編程語言方面的專業(yè)知識,專門的導(dǎo)師與團(tuán)隊一起進(jìn)行指導(dǎo),以設(shè)定目標(biāo),并考慮不同的方法。導(dǎo)師們合作解決團(tuán)隊遇到的問題并排除障礙。每天的導(dǎo)師同步電話讓每個人都集中精力,朝著實(shí)現(xiàn)目標(biāo)的最佳策略努力。

社交

每個人都知道,只工作不玩耍實(shí)際上會阻礙團(tuán)隊的生產(chǎn)力。 hackathon 為參與者和導(dǎo)師提供了 TGIF 社交時間會議。使用 Metaverse Gather 城鎮(zhèn)空間,導(dǎo)師和團(tuán)隊分享經(jīng)驗(yàn),為電池充電,并建立聯(lián)系,幫助他們在活動期間繼續(xù)前進(jìn)。

資源和現(xiàn)場研討會

成功的另一個重要因素是為與會者提供專門的培訓(xùn)和資源。例如, NVIDIA 深度學(xué)習(xí)培訓(xùn)中心( DLI )的一位大使和導(dǎo)師介紹了一個涵蓋 CUDA C / C ++主題的研討會。其他導(dǎo)師提供了團(tuán)隊專用的技術(shù)課程,重點(diǎn)是TRT和 NVIDIA Triton 、OpenACC和 NSight 系統(tǒng)的評測、并行計算和優(yōu)化。

努力工作是有回報的

延世大學(xué)的帕斯卡團(tuán)隊正在開發(fā)一種熱流體解算器,該解算器可以有效地計算湍流的熱運(yùn)動。在這次黑客大會上,團(tuán)隊通過 OpenACC 和 cuFFT 庫將基于 CPU 的現(xiàn)有代碼轉(zhuǎn)換為多 GPU 環(huán)境。這使得最耗時的子程序之一的計算速度加快了 4 . 84 倍 RHS (右側(cè),分步)。

來自 AmorePacific 化妝品公司的 Amore Opt 團(tuán)隊致力于 GPU 優(yōu)化 DeepLabV3 +細(xì)分模型。通過應(yīng)用他們對 TensorRT 推理優(yōu)化器和 NVIDIA Triton 推理服務(wù)器的了解,他們提高了推理速度,使推理速度提高了 26 倍。他們做到了這一點(diǎn),同時保持人工智能模型的準(zhǔn)確性,以便為未來的大規(guī)模客戶服務(wù)檢測皮膚問題。

首爾國立大學(xué)的 TFC 團(tuán)隊參與了一個項目,以加速基于 CPU 的 Fortran 內(nèi)部流體計算代碼。通過在 KISTI 使用 NVIDIA GPU s ,團(tuán)隊加速了耗時的三對角矩陣算法( TDMA )用于熱解算器和動量解算器,以及快速傅立葉變換( FFT )用于壓力解算器計算。他們在一臺 V100 GPU 上實(shí)現(xiàn)了 11.15 倍的速度。

NVIDIA Inception 成員 Nota 和杭陽大學(xué)合作,通過利用 NVIDIA GPU s 中的張量核進(jìn)行 INT4 量化,優(yōu)化了 Nota 模型壓縮引擎。名為 NOTA-HYU 的團(tuán)隊學(xué)會了使用 NVIDIA 分析工具 NSight 系統(tǒng)和 NSight 計算。然后,他們應(yīng)用 NVIDIA 庫彎刀,通過 CUDA 優(yōu)化,使剩余塊的總體速度提高 1.85 倍。

關(guān)于作者

Solee Moon 是 NVIDIA 高等教育與研究( HER )和 NVIDIA 深度學(xué)習(xí)培訓(xùn)中心( DLI )項目的企業(yè)營銷專家,專注于支持 AI 開發(fā)者社區(qū)的發(fā)展。在 NVIDIA 之前, Solee 曾在三星電子 CTR 擔(dān)任品牌營銷專家,執(zhí)行各種整合營銷傳播活動。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4940

    瀏覽量

    102816
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5492

    瀏覽量

    120977
收藏 人收藏

    評論

    相關(guān)推薦

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對卷積核優(yōu)化的思考。 GPU的存儲體系采用了獨(dú)特的倒金字塔結(jié)構(gòu),在我看來這是其計算性能的關(guān)鍵。大容量寄存器設(shè)計破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機(jī)制巧妙解決了內(nèi)存帶寬限制。NVIDIA
    發(fā)表于 11-24 17:12

    PyTorch GPU 加速訓(xùn)練模型方法

    的基本原理 GPU(圖形處理單元)最初是為圖形渲染設(shè)計的,但隨著技術(shù)的發(fā)展,人們發(fā)現(xiàn)GPU并行計算方面有著天然的優(yōu)勢。GPU擁有成千上萬個
    的頭像 發(fā)表于 11-05 17:43 ?449次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    方式可以提高處理器的吞吐量。并行計算模式(而非圖形模式下)GPGPU的流水線是針對線程束進(jìn)行管理的,也就是NVIDIA所說的 CUDA環(huán)境下的 warp 或者AMD 所說的 OpenCL 環(huán)境下
    發(fā)表于 11-03 12:55

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計算能力來加速科學(xué)計算、數(shù)據(jù)分
    的頭像 發(fā)表于 10-25 09:23 ?215次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?154次閱讀

    初創(chuàng)公司SEA.AI利用NVIDIA邊緣AI計算機(jī)視覺技術(shù)變革航海安全系統(tǒng)

    總部位于奧地利林茨的初創(chuàng)公司正在利用 NVIDIA 邊緣 AI計算機(jī)視覺技術(shù)變革航海安全系統(tǒng),讓每一次出海變得更安全。
    的頭像 發(fā)表于 09-09 09:32 ?465次閱讀

    名單公布!【書籍評測活動NO.41】大模型時代的基礎(chǔ)架構(gòu):大模型算力中心建設(shè)指南

    案例,展示如何針對機(jī)器學(xué)習(xí)應(yīng)用進(jìn)行需求分析、設(shè)計與實(shí)現(xiàn)。 無論是高等院校計算機(jī)與人工智能等相關(guān)專業(yè)的本科生或研究生,還是對并行計算技術(shù)、云計算技術(shù)、高性能存儲及高性能網(wǎng)絡(luò)
    發(fā)表于 08-16 18:33

    恒訊科技的GPU云解決方案有什么特點(diǎn)和優(yōu)勢?

    GPU云解決方案通常指的是云服務(wù)提供商提供的、基于圖形處理單元(GPU)的計算服務(wù)。這些服務(wù)利用GPU
    的頭像 發(fā)表于 06-12 17:24 ?375次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    Blackwell Tensor Core GPU 與1個 NVIDIA Grace CPU 連接,實(shí)現(xiàn)高效的計算協(xié)同。GB200 NVL72 同時集成尖端功能和第二代 Transformer 引擎,
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱
    的頭像 發(fā)表于 04-20 09:39 ?645次閱讀

    NVLink技術(shù)GPUGPU的通信

    在多 GPU 系統(tǒng)內(nèi)部,GPU 間通信的帶寬通常在數(shù)百GB/s以上,PCIe總線的數(shù)據(jù)傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉(zhuǎn)換會產(chǎn)生較大延時,影響GPU并行計算的效率和性能。
    發(fā)表于 03-27 09:40 ?3613次閱讀
    NVLink<b class='flag-5'>技術(shù)</b>之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的通信

    NVIDIA cuPQC幫助開發(fā)適用于量子計算時代的加密技術(shù)

    NVIDIA cuPQC 可為相關(guān)開發(fā)者提供加速計算支持,幫助開發(fā)適用于量子計算時代的加密技術(shù)。cuPQC 庫可利用
    的頭像 發(fā)表于 03-22 09:53 ?389次閱讀

    NVIDIA 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級 GPU 計算AI 基礎(chǔ)設(shè)施

    NVIDIA 軟件實(shí)現(xiàn)了跨 ?Blackwell GPU、新交換機(jī)和 BlueField-3 SuperNIC 的分布式計算,大幅提升了 AI、數(shù)據(jù)處理、高性能
    發(fā)表于 03-19 10:05 ?312次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機(jī),全面優(yōu)化萬億參數(shù)級 <b class='flag-5'>GPU</b> <b class='flag-5'>計算</b>和 <b class='flag-5'>AI</b> 基礎(chǔ)設(shè)施

    NVIDIA 人工智能開講 | 什么是 AI For Science?詳解 AI 助力科學(xué)研究領(lǐng)域的新突破

    ”兩大音頻 APP上搜索“ NVIDIA 人工智能開講 ”專輯,眾多技術(shù)大咖帶你深度剖析核心技術(shù),把脈未來科技發(fā)展方向! AI For Science (亦稱 “
    的頭像 發(fā)表于 12-25 18:30 ?953次閱讀
    <b class='flag-5'>NVIDIA</b> 人工智能開講 | 什么是 <b class='flag-5'>AI</b> For Science?詳解 <b class='flag-5'>AI</b> 助力科學(xué)<b class='flag-5'>研究</b>領(lǐng)域的新突破

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別

     相比于傳統(tǒng)的CPU服務(wù)器,GPU服務(wù)器支持同時計算大量相似的計算操作,可以實(shí)現(xiàn)更強(qiáng)的并行計算性能。GPU服務(wù)器通常配備多個高性能的
    的頭像 發(fā)表于 12-02 17:20 ?1861次閱讀