精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達發布基于Ampere架構的GPUA100

h1654155282.3538 ? 來源:半導體行業觀察 ? 作者:半導體行業觀察 ? 2020-11-17 15:51 ? 次閱讀

據該公司CEO黃仁勛介紹,A100采用臺積電當時最先進的7納米工藝打造,擁有540億個晶體管,面積高達826mm2,GPU的最大功率也達到了400W。又因為同時搭載了三星HBM2顯存、第三代TensorCore和帶寬高達600GB/s的新版NVLink,英偉達的A100在多個應用領域也展現出強悍的性能。

從英偉達提供的數據可以看到,如果用PyTorch框架跑AI模型,相比上一代V100芯片,A100在BERT模型的訓練上性能提升6倍,BERT推斷時性能提升7倍。而根據MLPerf組織在十月底發布的最新推理基準測試(Benchmark)MLPerfInferencev0.7結果,英偉達A100TensorCoreGPU在云端推理的基準測試性能是最先進英特爾CPU的237倍。

但英偉達不止步于此。在昨日,他們發布了面向AI超級計算的全球最強GPU——A10080GB;與此同時,他們還帶來了一體式AI數據中心NVIDIADGXStationA100以及NVIDIAMellanox400GInfiniBand產品

全球最強的AI超算GPU

據英偉達方面介紹,公司全新的A10080GBGPU的最大特點在于采用了HBM2E內存技術,能將A10040GBGPU的高帶寬內存增加一倍至80GB,這樣的設計也讓英偉達成為業內首個實現了2TB/s以上的內存帶寬的企業。

“若想獲得HPC和AI的最新研究成果,則需要構建最大的模型,而這需要比以往更大的內存容量和更高的帶寬。A10080GBGPU所提供的內存是六個月前推出的前代產品的兩倍,突破了每秒2TB的限制,使研究人員可以應對全球科學及大數據方面最嚴峻的挑戰。”NVIDIA應用深度學習研究副總裁BryanCatanzaro表示。

此外,第三代TensorCore核心、MIG技術、結構化稀疏以及第三代NVLink和NVSwitch,也是全新GPU能夠獲得市場認可的保證。

從英偉達提供的資料我們可以看到,該公司的第三代TensorCore核心通過全新TF32,能將上一代Volta架構的AI吞吐量提高多達20倍;通過FP64,新核心更是能將HPC性能提高多達2.5倍;而通過INT8,新核心也可以將AI推理性能提高多達20倍,并且支持BF16數據格式。

MIG技術則能將單個獨立實例的內存增加一倍,并可最多提供七個MIG,讓每個實例具備10GB內存。英偉達方面表示,該技術是一種安全的硬件隔離方法,在處理各類較小的工作負載時,可實現GPU最佳利用率。例如在如RNN-T等自動語言識別模型的AI推理上,單個A10080GBMIG實例可處理更大規模的批量數據,將生產中的推理吞吐量提高1.25倍。

至于結構化稀疏,則可以將推理稀疏模型的速度提高2倍;包括第三代NVLink和NVSwitch在內的新一代互連技術,則可使GPU之間的帶寬增加至原來的兩倍,將數據密集型工作負載的GPU數據傳輸速度提高至每秒600gigabytes。

除了性能提升以外,基于A10040GB的多樣化功能設計的A10080GBGPU也成為需要大量數據存儲空間的各類應用的理想選擇。

以DLRM等推薦系統模型為例,他們為AI訓練提供了涵蓋數十億用戶和產品信息的海量表單。但A10080GB可實現高達3倍加速,使企業可以重新快速訓練這些模型,從而提供更加精確的推薦;在TB級零售大數據分析基準上,A10080GB將其性能提高了2倍,使其成為可對最大規模數據集進行快速分析的理想平臺;對于科學應用,A10080GB可為天氣預報和量子化學等領域提供巨大的加速。

“作為NVIDIAHGXAI超級計算平臺的關鍵組件,A10080GB還可訓練如GPT-2這樣的、具有更多參數的最大模型。”英偉達方面強調。

下一代400GInfiniBand

在發布A10080GB的同時,英偉達還帶了下一代的400GInfiniBand產品。在講述英偉達的新品之前,我們有必要先了解一下什么是InfiniBand。

所謂InfiniBand,是一種網絡通信協議,它提供了一種基于交換的架構,由處理器節點之間、處理器節點和輸入/輸出節點(如磁盤或存儲)之間的點對點雙向串行鏈路構成。每個鏈路都有一個連接到鏈路兩端的設備,這樣在每個鏈路兩端控制傳輸(發送和接收)的特性就被很好地定義和控制。而早前被英偉達收購的Mellanox則是這個領域的專家。

資料顯示,Mellanox為服務器,存儲和超融合基礎設施提供包括以太網交換機,芯片和InfiniBand智能互連解決方案在內的大量的數據中心產品,其中,更以InfiniBand互連,是這些產品中重中之重。

據英偉達介紹,公司推出的第七代MellanoxInfiniBandNDR400Gb/s上帶來了更低的延遲,與上一代產品相比,新的產品更是實現了數據吞吐量的翻倍。又因為英偉達為這個新品帶來了網絡計算引擎,這就讓其能夠獲得額外的加速。

英偉達進一步指出,作為一個面向AI超級計算的業界最強大的網絡解決方案,MellanoxNDR400GInfiniBand交換機,可提供3倍的端口密度和32倍的AI加速能力。此外,它還將框式交換機系統的聚合雙向吞吐量提高了5倍,達到1.64petabits/s,從而使用戶能夠以更少的交換機,運行更大的工作負載。

“基于MellanoxInfiniBand架構的邊緣交換機的雙向總吞吐量可達51.2Tb/s,實現了具有里程碑意義的每秒超過665億數據包的處理能力。”英偉達方面強調。而通過提供全球唯一的完全硬件卸載和網絡計算平臺,NVIDIAMellanox400GInfiniBand實現了大幅的性能飛躍,可加快相關研究工作的進展。

“我們的AI客戶的最重要的工作就是處理日益復雜的應用程序,這需要更快速、更智能、更具擴展性的網絡。NVIDIAMellanox400GInfiniBand的海量吞吐量和智能加速引擎使HPC、AI和超大規模云基礎設施能夠以更低的成本和復雜性,實現無與倫比的性能。”NVIDIA網絡高級副總裁GiladShainer表示。

從他們提供的數據我們可以看到,包括Atos、戴爾科技富士通、浪潮、聯想和SuperMicro等公司在內的全球領先的基礎設施制造商,計劃將Mellanox400GInfiniBand解決方案集成到他們的企業級產品中去。此外,包括DDN、IBMStorage以及其它存儲廠商在內的領先的存儲基礎設施合作伙伴也將支持NDR。

全球唯一的千兆級工作組服務器

為了應對不同開發者對AI系統的需求,在推出芯片和連接解決方案的同時,英偉達在2017年還推出一體式的AI數據中心NVIDIADGXStation。作為世界上首款面向AI開發前沿的個人超級計算機,開發者只需要對其執行簡單的設置,就可以用Caffe、TensorFlow等去做深度學習訓練、高精度圖像渲染和科學計算等傳統HPC應用,避免了裝驅動和配置環境等麻煩,這很適合高校、研究所、以及IT力量相對薄弱的企業。

昨日,英偉達今日發布了全球唯一的千兆級工作組服務器NVIDIADGXStationA100。作為開創性的第二代人工智能系統,DGXStationA100加速滿足位于全球各地的公司辦公室、研究機構、實驗室或家庭辦公室中辦公的團隊對于機器學習和數據科學工作負載的強烈需求。而為了支持諸如BERTLarge推理等復雜的對話式AI模型,DGXStationA100比上一代DGXStation提速4倍以上。對于BERTLargeAI訓練,其性能更是提高近3倍。

從性能來看,英偉達方面表示,DGXStationA100的AI性能可達2.5petaflops,是唯一一臺配備四個通過NVIDIANVLink完全互連的全新NVIDIAA100TensorCoreGPU的工作組服務器,可提供高達320GB的GPU內存,能夠助力企業級數據科學和AI領域以最速度取得突破。

作為唯一支持NVIDIA多實例GPU(MIG)技術的工作組服務器,單一的DGXStationA100最多可提供28個獨立GPU實例以運行并行任務,并可在不影響系統性能的前提下支持多用戶。

為了支持更大規模的數據中心工作負載,DGXA100系統還將配備全新NVIDIAA10080GBGPU使每個DGXA100系統的GPU內存容量增加一倍(最高可達640GB),從而確保AI團隊能夠使用更大規模的數據集和模型來提高準確性。

“全新DGXA100640GB系統也將集成到企業版NVIDIADGXSuperPODTM解決方案,使機構能基于以20個DGXA100系統為單位的一站式AI超級計算機,實現大規模AI模型的構建、訓練和部署。”英偉達方面強調。

該公司副總裁兼DGX系統總經理CharlieBoyle則表示:“DGXStationA100將AI從數據中心引入可以在任何地方接入的服務器級系統。數據科學和AI研究團隊可以使用與NVIDIADGXA100系統相同的軟件堆棧加速他們的工作,使其能夠輕松地從開發走向部署。”

從英偉達提供的資料我們可以看到,配備A10080GBGPU的NVIDIADGXSuperPOD系統將率先安裝于英國的Cambridge-1超級計算機,以加速推進醫療保健領域研究,以及佛羅里達大學的全新HiPerGatorAI超級計算機,該超級計算機將賦力這一“陽光之州”開展AI賦能的科學發現。

在今年發布的第二季財報上,英偉達數據中心業務首超游戲,成為公司營收最大的業務板塊。從營收增長上看,與去年同期相比,英偉達數據中心業務業務大幅增長167%,由此可以看到英偉達在這個市場影響力的提升以及公司對這個市場的信心。

考慮到公司深厚的技術積累和過去幾年收購所做的“查漏補缺”,英偉達必將成為Intel在數據中心的最強勁挑戰者。
責任編輯人:CC

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3747

    瀏覽量

    90835
  • Ampere
    +關注

    關注

    1

    文章

    64

    瀏覽量

    4533
收藏 人收藏

    評論

    相關推薦

    英偉進軍ARM架構CPU市場,預計2025年推出新產品線

    近日,英偉公司傳出了一則令人矚目的消息:該公司正在積極開發一款基于ARM架構的新型CPU。這一消息不僅證實了之前業界關于英偉ARM PC
    的頭像 發表于 11-11 15:33 ?248次閱讀

    英偉Blackwell架構揭秘:下一個AI計算里程碑?# 英偉# 英偉Blackwell

    英偉行業資訊
    jf_02331860
    發布于 :2024年08月26日 10:58:09

    英偉或取消B100轉用B200A代替

    今年3月份,英偉在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現行H
    的頭像 發表于 08-08 17:19 ?459次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發布于 :2024年07月24日 17:18:28

    英偉Blackwell架構,行業首選

    的半導體技術路徑圖,首度公開了即將面世的下一代芯片——Rubin平臺,旨在接替現有的Blackwell。   回顧過往,NVIDIA始終保持著每兩年發布一次全新架構的傳統,從2020年的Ampere
    的頭像 發表于 06-05 15:28 ?598次閱讀

    英偉加速AI芯片迭代,推出Rubin架構計劃

    在近日舉辦的COMPUTEX 2024展會上,英偉CEO黃仁勛再次展現了公司在人工智能(AI)芯片領域的雄心壯志。他公布了下一代AI芯片架構“Rubin”,這是繼今年3月發布的“Bl
    的頭像 發表于 06-03 11:36 ?779次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    2024年3月19日,[英偉]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構BLACKWELL,并推出基于該架構的超級芯片GB200,將助推數據處理、工程模擬、電子設計自動化
    發表于 05-13 17:16

    英偉發布新一代AI芯片架構Blackwell GPU

    近日,英偉首席執行官黃仁勛在GTC 2024會議上發表主題演講,重磅推出全新AI芯片架構Blackwell GPU。這一創新技術的首款芯片產品命名為GB200,標志著英偉
    的頭像 發表于 03-26 11:19 ?823次閱讀

    英偉發布最強AI加速卡Blackwell GB200

    英偉在最近的GTC開發者大會上發布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構Blackwell,標志著
    的頭像 發表于 03-20 11:38 ?1069次閱讀

    英偉H200和A100的區別

    英偉H200和A100兩款芯片在性能、架構、內存以及應用場景等多個方面存在顯著的區別。
    的頭像 發表于 03-07 16:23 ?3377次閱讀

    英偉H200和A100的差異

    英偉H200和A100在多個方面存在差異。
    的頭像 發表于 03-07 16:18 ?2241次閱讀

    英偉顯卡價格

    英偉顯卡的價格因其型號、性能、發布時間等因素而有所不同。
    的頭像 發表于 03-01 16:39 ?1077次閱讀

    英偉:預計下一代AI芯片B100短缺,計劃擴產并采用新架構

    近期熱門的 H100 芯片運期短縮數天后,英偉新型 AI 旗艦芯片 B100搭載全新的 Blackwell,有望使 AI 計算性能提升至 2~3 倍。鑒于 AI 芯片市場需求旺盛,外
    的頭像 發表于 02-25 09:29 ?871次閱讀

    英偉正在考慮第三家晶圓代工伙伴

    英偉專為AI、高效能計算(HPC)設計的數據中心GPU目前大多由臺積電代工,但此前英偉的游戲GPU主要是交給三星代工, 三星的晶圓代工廠負責研發采用
    的頭像 發表于 12-12 10:48 ?2184次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>正在考慮第三家晶圓代工伙伴