又粗又大精品久久久久国产片_中国一级毛片国产_欧美三级国产三级在线_成在人av抽搐高潮喷水流白浆_欧洲日韩国产综合AV无码_午夜伦理电影在线观看_久久人妻无码hd毛片_国产在线观看第一页_亚洲精品成人电影

在當前的顯卡市場上，占據80％的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡，同時也讓高端游戲卡的價格高企，發燒顯卡至少五位數起。

在RTX 30系列顯卡發布之后，玩家的不滿似乎釋然了，相比當前的圖靈顯卡，安培架構的RTX 3090／3080／3070顯卡一下子變得真香了，因為它們性能翻倍不說，國內價格反而下降了。

·GeForce RTX 3090：取代RTX Titan，相比于Titan RTX快了50％，性能是RTX 2080 Ti顯卡的2倍，配備24GB GDDR6X顯存，售價11999元，9月24日上市。

·GeForce RTX 3080：取代RTX 2080 Ti，相比于RTX 2080性能快2倍，搭配10GB GDDR6X顯存，海外699美元沒變，國內從上代6499降至5499元，9月17日上市。

·GeForce RTX 3070：價格不到RTX 2080 Ti的一半，但是平均性能更高，同時比RTX 2070快足足60％，配備8GB GDDR6顯存，售價3899元，10月份上市。

RTX 30系列顯卡售價及上市時間

RTX 30系列顯卡性能變化

RTX 30系列顯卡規格

從這個規格表中可以看出，與RTX 2080 Ti顯卡相比，RTX 3090的標志性FP32性能從13．4T提升到了35．7T，翻倍還多，光追及AI加速提升也同樣明顯。

與圖靈顯卡相比，安培GPU的變化之大讓人驚訝，在過去十多年的顯卡升級換代中，性能翻倍的提升很少見到了，NVIDA是怎么做到的？

今天我們就來從詳細解讀一下安培GPU的架構，探究它到底帶來了哪些技術升級以致于讓NVIDIA創始人黃仁勛稱之為有史以來性能提升最大的一次。

先從工藝說起：12nm干掉7nm之后 8nm如何再進一步

對于半導體芯片來說，很關鍵的一部分是制程工藝，先進的架構也要通過工藝來實現，這是影響芯片能效、性能甚至成本的一大因素。

對NVIDIA來說，他們的Volta伏特、Turing圖靈兩代架構都是臺積電12nm FFN工藝了，這是臺積電16nm工藝的改進版，如果再算上16nm的Pascal架構，實際上過去三代GPU都沒有重大工藝上的升級了。

在Ampere安培架構上，NVIDIA終于升級工藝了，只不過這次有兩個意外——首先沒有選擇臺積電，其次沒有上7nm，而是三星定制的8nm工藝，雖然跟7nm看起來只差了1nm，但實際上是兩代工藝。

考慮到NVIDIA之前對工藝的表態，沒用7nm工藝而是三星8nm工藝又在意料之中，最關鍵的問題在于NVIDIA能夠做到多好。

三星的8nm工藝是基于10nm工藝改良的，至少有LPP和LPU兩個版本，前者適合移動SoC，后者適合高性能芯片，NVIDIA的定制大概是基于后者。

與臺積電的7nm工藝晶體管密度大約1億／mm2相比，8nm工藝大概是6000萬晶體管／mm2，但這是單一的SRAM芯片的對比，實際上GPU芯片比較復雜，差距會縮小很多。

根據是NVIDIA公布的信息，臺積電7nm工藝制造的安培A100核心是540億晶體管，核心面積826mm2，而三星8nm工藝制造的GA102核心是280億晶體管，核心面積官方沒公布，據悉是628mm2，也是大核心了。

這么算下來，7nm A100核心的晶體管密度6560萬晶體管／mm2，而三星8nm的GA102核心也有4460萬晶體管／mm2——差距仍在，但似乎可以接受了。

三星8nm工藝的晶圓代工價格還是秘密，但是不論技術還是商業策略上，三星都會比臺積電便宜很多，預計代工價格能差30％或者更高，所以這也是RTX 30系列顯卡能夠不漲價甚至降價的關鍵。

那三星8nm工藝帶來了多大的性能及能效提升呢？首先大家可以看到RTX 30系列顯卡的頻率提升了，從RTX 20系列的1．5GHz＋提升到了1．7GHz＋，升級工藝還是有性能提升的。

不過RTX 20系列的加速頻率實際可以達到1．9GHz甚至接近2GHz，RTX 30系列預計也就這個水平。

但是能效還是有提升的，NVIDIA官方稱在60fps性能下，圖靈顯卡的功耗大約有240W，安培顯卡則是120W多點，算下來是1．9倍能效，提升了90％，同時溫度還低了3度，噪音減少2分貝。

總的來說，在工藝這方面大家對安培GPU有驚喜有失望，失望的是沒有上預期中的7nm工藝（不管臺積電還是三星），工藝依然升級到了8nm。

但是NVIDIA工藝雖然并不算激進，但性能、能效進步還是挺大的，安培顯卡各方面指標都是大幅勝過現在的圖靈卡，而且價格做到了不升反降，這也是不追求激進工藝的好處，反正之前12nm都能贏，現在上8nm更加穩妥了。

安培GPU架構詳解之：FP32單元翻倍 CUDA核心改了什么？

發布安培的時候，NVIDIA CEO黃仁勛表示這是GPU有史以來最大的性能飛躍，而2018年推出圖靈GPU時，老黃也是類似的說詞——GPU有史以來最大的變革，這兩個評價其實也沒錯。

圖靈GPU架構有很多第一次，首次支持RTX Core（光追加速單元），首次支持Tensor Core，同時還改進了CUDA內核，不過前兩個是重點。

在安培GPU上，RT Core、Tensor Core當然繼續加強，不過最主要的亮點是CUDA架構的改進，性能翻倍的根源就在這里，我們先來看看這方面的變化。

GA102核心架構示意圖

GA102核心總計7組GPC單元，每組有12組SM單元，總計84組，RTX 30系列顯卡視乎規格不同啟用的SM單元總數不同，RTX 3090是82組，RTX 3080是68組，RTX 3070是46組。

在之前的GA100大核心中，每組SM是64個INT32單元、64個FP32單元及32個FP64單元組成的，但在GA102核心中，FP64單元大幅減少，增加了RT Core，Tensor Core也略微減少。

GA102核心的SM單元

按照之前圖靈GPU的路線走，安培GPU的SM單元增加的并不多，但實際上FP32性能翻倍了還多，算上頻率，RTX 3080的理論性能差不多是RTX 2080的三倍了，這是怎么做到的？

答案就是CUDA核心的FP32翻倍，但翻倍的方式有點特殊，每個SM單元中有4個分區，每個分區除了第三代Tensor Core核心之外，還有一組是16個FP32單元及16個FP32、16個IN32組成的單元，后者可以同時執行FP32或者INT32運算。

16個FP32單元每周期可執行16個FP32運算，混合的那個單元可以執行32個FP32或者16個FP32＋16個INT32。

如此一來，每個SM單元可以同時執行4x（16FP32＋16FP32）＝128個FP32運算，或者4x（16FP32＋16INT32）＝64個FP32＋64個INT32運算。

只算FP32浮點的話，那么就是浮點翻倍了，因為圖靈以及GA100都是每周期64個FP32浮點而已，現在可以做128個FP32運算了。

提升FP32性能不論對游戲還是運算都大有裨益，但也需要配套的提升，GA102的L1容量提升了33％，L1帶寬從116GB／s翻倍到219GB／s，共享內存的性能也從每周期64B翻倍到128B。

審核編輯：符乾江

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

IC設計

IC設計

+關注

關注
37

文章
1292

瀏覽量
103781
NVIDIA

NVIDIA

+關注

關注
14

文章
4949

瀏覽量
102830
gpu

gpu

+關注

關注
28

文章
4703

瀏覽量
128729

NVIDIA RTX AI Toolkit擁抱LoRA技術

在 RTX AI PC 和工作站上使用最新版 RTX AI Toolkit 微調 LLM，最高可將性能提升至原來的 6 倍。

發表于 11-20 09:14 ?223次閱讀

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> AI Toolkit擁抱LoRA技術

AMD與NVIDIA GPU優缺點

，NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術領先于市場。例如，NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲

發表于 10-27 11:15 ?481次閱讀

NVIDIA RTX AI套件簡化AI驅動的應用開發

NVIDIA 于近日發布 NVIDIA RTX AI套件，這一工具和 SDK 集合能夠幫助 Windows 應用開發者定制、優化和部署適用于 Windows 應用的 AI 模型。該套件免費提供，不要求使用者具備 AI 框架和開發

發表于 09-06 14:45 ?404次閱讀

《黑神話：悟空》潮流來了！Nvidia GPU 合作伙伴推出八款全新 RTX 40 Super 顯卡

ABSTRACT摘要Nvidia合作伙伴推出了八款采用“黑神話：悟空”品牌的全新RTX40Super顯卡。包括技嘉、MSI和Zotac在內的AIB正在慶祝這款受中國神話影響的動作角色扮演游戲的發布

發表于 08-30 12:50 ?298次閱讀

《黑神話：悟空》潮流來了！<b class='flag-5'>Nvidia</b> GPU 合作伙伴推出八款全新 <b class='flag-5'>RTX</b> 40 Super 顯卡

新款Nvidia Titan GPU正在開發中？或將擊敗未發布的RTX 5090

ABSTRACT摘要最近有消息透露，NVIDIA正在開發一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發布其RTX40系列

發表于 07-26 08:26 ?433次閱讀

新款<b class='flag-5'>Nvidia</b> Titan GPU正在開發中？或將擊敗未發布的<b class='flag-5'>RTX</b> 5090

Nvidia 再推出特供版顯卡 GeForce RTX 5090D

ABSTRACT摘要NVIDIA正在準備另一款“D”版本RTX5090D，這將成為國內市場的旗艦GeForceRTX50系列顯卡。JAEALOT2024年7月4日NVIDIA正在準備另

發表于 07-19 08:26 ?502次閱讀

<b class='flag-5'>Nvidia</b> 再推出特供版顯卡 GeForce <b class='flag-5'>RTX</b> 5090D

NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運行的AI助手及數字人

NVIDIA 宣布推出全新 NVIDIA RTX?技術，用于支持在全新 GeForce RTX AI 筆記本電腦上運行的 AI 助手及數字人。 ?

發表于 06-04 10:19 ?703次閱讀

RTX 5880 Ada Generation GPU與RTX? A6000 GPU對比

NVIDIA RTX? 5880 Ada Generation GPU 是目前國內重量級 GPU，基于全新 NVIDIA Ada Lovelace 架構構建，采用 4nm 制成工藝，擁

發表于 04-19 10:20 ?1642次閱讀

NVIDIA發布兩款新的專業顯卡RTX A1000、RTX A400

NVIDIA今天發布了兩款新的專業顯卡RTX A1000、RTX A400，從編號就能看出來定位入門級，而且架構并非最新的Ada Lovelace，還是上一代的Ampere。

發表于 04-18 11:35 ?2017次閱讀

英偉達發布兩款Ampere架構專業可視化GPU：RTX A400與RTX A10

RTX A400和RTX A1000旨在替代2021年發布的T1000和T400，以及T600，成為英偉達最后三款未納入NVIDIA RTX命名體系的專業可視化GPU產品。

發表于 04-17 16:27 ?938次閱讀

NVIDIA RTX 5090痛失512位顯存！

NVIDIA有望在今年底或明年初發布下一代RTX 50系列顯卡，大概率首發配備新一代GDDR7顯存，但是顯存位寬和之前的說法不太一樣。

發表于 03-11 16:02 ?791次閱讀

英偉達RTX 50系列顯卡將采用PCIe Gen 6 16-Pin供電技術

據報道，在Moore‘s Law is Dead播客節目最新的一期中，主持人Tom透露了NVIDIA GeForce RTX 50系列顯卡將會配置為原生PCIe Gen 6 16 Pin電源接口。

發表于 02-19 14:16 ?1292次閱讀

RTX 4070 Ti SUPER詳細評測

2024年1月9日，NVIDIA發布了GeForce RTX 40 SUPER系列顯卡，包括RTX 4070 SUPER、RTX 4070

發表于 01-29 10:31 ?3692次閱讀

英偉達發布RTX 40 SUPER系列顯卡

在剛剛結束的CES 2024上，GPU巨頭英偉達正式推出了全新的RTX 40 SUPER系列顯卡，包括RTX 4080 SUPER、RTX 4070 Ti SUPER和

發表于 01-22 16:09 ?872次閱讀

NVIDIA發布中國定制版RTX 4090D

剛剛，NVIDIA官網發布了針對中國市場定制的RTX 4090D——D就是傳說中的Dragon，對應即將到來的中國龍年。

發表于 12-29 10:42 ?1022次閱讀