NVIDIA新一代顯卡即將出爐,盡管對于個中細節并不了解細節,但業界普遍認為無論是NVIDIA還是AMD,新一代顯卡搭載GDDR6顯存可能性極高。什么?我的電腦才用上DDR4,怎么顯卡就用GDDR6了?而且頻率還跑得那么高?是不是理不清它們之間的關系?下面就讓我們重新回顧一下顯存的發展歷史,展望下一代GDDR6顯存的一些新特性。
其實DDR內存和GDDR顯存本來就是同宗同源,初期時DDR/GDDR、DDR2/GDDR2其實規范差異很小,頻率等參數基本上都是一致,兩者不分家,因此當時顯卡即可以用DDR2顆粒,也可以用GDDR2顯存顆粒。
這個圖是不是很熟悉
Q:
DDR的種類:
A:
1、DDR SDRAM:Double Data Rate Synchronous Dynamic Random Access Memory,雙倍數據率同步動態隨機存取存儲器;
2、DDR2 SDRAM:Double-Data-Rate Two Synchronous Dynamic Random Access Memory,第二代雙倍數據率同步動態隨機存取存儲器;
3、DDR3 SDRAM:Double-Data-Rate Three Synchronous Dynamic Random Access Memory,第三代雙倍數據率同步動態隨機存取存儲器;
4、DDR4 SDRAM:Double-Data-Rate Fourth Synchronous Dynamic Random Access Memory,第四代雙倍數據率同步動態隨機存取存儲器。
DDR的發展:
SDRAM
DDR
DDR2
DDR3
DDR4
可以很清楚地發現,DDR、DDR2、DDR3和DDR4之間的接口并不兼容,當然,其工作電壓也是不一樣的。(除了DDR4是臺式機的接口,前三個為筆記本上的接口)
DDR SDRAM可在一個時鐘周期內傳送兩次數據
DDR數據傳輸速度為系統鐘頻率的兩倍,能在選通脈沖的上升沿和下降沿傳輸數據
DDR2的數據傳輸速度為系統時鐘頻率的四倍
DDR3的數據傳輸速度為系統時鐘頻率的8倍
DDR的發展圖
Samsung-DDR的帶寬與數據傳輸率上升軌跡
Q:
QDR是什么?
A:
SDR(Single Data Rate):單倍數據倍率,只利用時鐘信號的上沿傳輸數據,例如SDRAM等。
DDR(Double Data Rate):雙倍數據倍率,利用時鐘信號的上沿&下沿傳輸數據,例如DDR-SDRAM等。
QDR(Quad Data Rate):四倍數據倍率,在DDR的基礎上,擁有獨立的寫接口和讀接口,以此達到4倍速率,例如QDR-SRAM等 。DDR2-SDRAM,DDR3-SDRAM基本原理和DDR-SDRAM是一樣的,通過提高時鐘頻率來提升性能,因為時鐘頻率提高了,必須做相應的預處理(DDR支持2、4、8busrt, DDR2支持4和8,而DDR3只支持8)。
QDR是Quad Data RateStatic Random Access Memory(QDR SRAM)的縮寫,也就是四倍數據速率靜態隨機存取存儲器的意思。QDR的四倍數據速率是相對普通SRAM而言的。
普通SRAM使用半雙工總線,即在同一時刻只能進行讀或者寫操作(讀/寫共用一條數據通道),所以普通SRAM又稱作SDR(Single Data Rate)SRAM,即“單倍數據速率靜態隨機存取存儲器”。
DDR(Double Data Rate) SRAM在SDR SRAM的基礎上做了改進,與SDR SRAM只在參考時鐘的上升沿采樣數據不同,DDR SRAM在參考時鐘的上升沿和下降沿都采樣數據,這樣,DDR SRAM在一個時鐘周期內可以傳輸雙倍數據,DDR SRAM(雙倍數據速率SRAM)也是由此得名的。
QDR在保留DDR特征的基礎上,對其數據總線進行了升級,DDR只有一條數據通道,數據讀/寫操作共用,屬于半雙工工作方式,而QDR擁有兩獨立條數據通道,數據讀/寫操作可以同時進行,屬于全雙工工作方式,因此,QDR的數據存取速率又是DDR的兩倍。
這樣計算下來,QDR的數據存取速率是SDR的四倍,四倍數據速率的雅稱也因此而來。QDR1/2/3的最高工作頻率分別為200/333/500MHz。在高速通信系統中(40G/100G)基本上都使用QDR。
QDR器件規范是由Cypress、IDT、NEC、Samsung和Renesas等公司組成的QDR聯盟共同定義和開發的。QDR聯盟的官方網站是:http://www.qdrsram.com。
同DDR一樣,QDR也分為QDR1、QDR2和QDR3。與QDR1相比,QDR2增加了一對源同步時鐘,可以幫組SRAM控制器捕獲數據,此時鐘被稱為反饋時鐘(CQ和CQ#),這個反饋時鐘與QDR2的輸入參考時鐘保持同步,同時又與QDR2輸出路徑的數據總線保持沿對齊。這樣,QDR2產生的整體數據有效視窗便會比同頻率的QDR1增大約35%,而延遲卻比QDR1少了二分之一個周期,這額外的半周期可容許在最低的延遲下進行更高頻率和更大帶寬操作。QDR3目前還處在概念中,QDR聯盟于2004年5月制定的QDR3規范中,器件的最高時鐘頻率可達500MHz。QDR器件結構示意圖如下所示:
1).K/K#:QDR系統時鐘信號;
3).CQ/CQ#:輸出環回時鐘;
這里說明下,K/K#、C/C#和CQ/CQ#不是真正的差分信號,而是相位相差180度的偽差分時鐘,在測試時不能使用差分探頭,一般使用兩個單端探頭。
4).A[20:0]:地址輸入信號,讀寫通道復用,分別在時鐘K/K#的上升沿采樣;
5).WPS#:寫端口選擇輸入信號,在時鐘信號K的上升沿有效,當WPS#無效時,寫端口信號被忽略;
6).BWS[3:0]#:比特寫入選擇信號,用于選擇將拿個Byte寫入到QDR鐘,對于9位數據位寬的QDR,用BWS0#控制,對于18位數據位寬的QDR,由BWS0#控制低9位,BWS1#控制高9位,其他以此類推;
7).NWS[0:1]#:4字節寫入選擇信號(此管腳只在8位QDR器件上才有),用來控制當前寫端口的哪4位字節被寫入,NWS0#控制D[3:0],NWS1#控制D[7:4]。
8).RPS#:寫端口地址選擇輸入信號,時鐘K上升沿有效,當RPS#信號無效時,讀端口信號被忽略;
9).D[18:0]:寫操作數據輸入通道,在時鐘K和K#的上升沿有效;
10).Q[18:0]:讀操作數據輸出通道,單時鐘模式下,在在時鐘K和K#的上升沿有效,多時鐘模式下,在時鐘C和C#的上升沿有效;
11).ZQ:輸出阻抗控制信號。用于控制QDR的輸出端口的CQ/CQ#以及Q[18:0]等信號的輸出阻抗。當ZQ和GND間的電阻為RQ時,則CQ/CQ#和Q[18:0]的輸出阻抗被設置為0.2RQ。當ZQ直接連接到VDD時,輸出信號有最小的輸出阻抗,ZQ不能懸空或直接接地;
12).DOFF#:DLL使能輸入信號,當該管腳接地時,將會關掉QDR內置的DLL;
13).144M/288M:144M/288M地址擴展引腳,在72M器件上,這些管腳必須拉低。
QDR SRAM的I/O端口采用的是HSTL電平。HSTL即High SpeedTransceiver Logic,是一種基于EIA/JESD8-6標準的數字接口電路邏輯,其輸出為一差分放大器(如果只使用一端的話,另一端需要與內部參考電壓相連),QDR具有單獨的輸出端口電源Vddq,QDR1為2.5V、QDR2為1.8V、QDR3為1.2V。
QDR有三對參考時鐘,其中,只有K/K#時鐘是必須的,它是寫數據和地址信號的采樣時鐘。C/C#和CQ/CQ#這兩對時鐘可選,QDR有四種時鐘設計方案,分別如下:
1).僅使用K/K#時鐘。K/K#既是寫參考時鐘,也是讀參考時鐘;
2).用K/K#時鐘和C/C#時鐘,不使用CQ/CQ#時鐘;
3).用K/K#時鐘和C/C#時鐘的換回環,不用CQ/CQ#時鐘;
4).用K/K#時鐘和CQ/CQ#時鐘。
由于K/K#時鐘和CQ/CQ#時鐘分別是由QDR控制器和QDR本身提供的,這樣,在讀寫時都有源同步時鐘做參考,所以,在高速設計中,基本上都是使用第四種時鐘方案。
使用單時鐘模式時,C/C#時鐘必須從外部上拉到高電平(CQ/CQ#是輸出時鐘,無需處理),在使用第二種時鐘模式時,C/C#的時鐘的PCB走線必需要比K/K#時鐘長,QDR2 SRAM有一個參數tKHCH(即K/K#時鐘和C/C#時鐘的skew),規范中要求此參數必須大于0,因為QDR的同時讀寫特點,假設在同一時鐘周期內,要對同一個地址的數據進行讀操作和寫操作,規范要求是,要先進行寫操作,后進行讀操作,也就是寫參考時鐘K/K#需要比讀參考時鐘C/C#先到達。但是,規范中同時規定,C/C#時鐘與K/K#時鐘之間的skew必須小于三分之一時鐘周期。
如果將多片QDR2 SRAM器件并聯使用的話,需要注意C/C#時鐘的PCB走線方式,即C/C#時鐘須先到達最遠端的QDR器件(即第三種時鐘方案),最后到達最近處的QDR器件,這樣,參考時鐘信號的延遲正好可以抵消數據信號的延遲,確保幾個器件上的數據保持同步,如下圖所示。
使用QDR器件時,須注意一下幾點:
1).QDR2有最低頻率要求,最低工作頻率不能低于120MHz;
2).QDR上電期間,要保證DOFF#管腳一直處于低電平,因為DOFF#的作用是使能器件內部的DLL,在剛上電的這段時間,時鐘信號本身是不穩定的,為了讓內部DLL正確的鎖住時鐘,需要停止時鐘信號至少30ns來復位內部DLL,然后等外部時鐘穩定后在使能DLL去鎖定穩定的時鐘;
3).VDD要先于VDDQ上電,VDDQ要先于VREF或與之同時上電。
Q:
GDDR是什么
A:
GDDR是Graphics Double Data Rate的縮寫,為顯存的一種,GDDR是為了設計高端顯卡而特別設計的高性能DDR存儲器規格,其有專屬的工作頻率、時鐘頻率、電壓,因此與市面上標準的DDR存儲器有所差異,與普通DDR內存不同且不能共用。一般它比主內存中使用的普通DDR存儲器時鐘頻率更高,發熱量更小,所以更適合搭配高端顯示芯片。
當應用程序越來越多要進行3D顯示及演算時,頻繁地讀取在顯卡中的SDRAM或SGRAM保存的連續畫面圖像數據的速度開始不能滿足需求,人們研發了GDDR,它是為了代替舊式顯存的不足而出現。開始時第一代GDDR只是普通DDR的稍微改進版,但也比舊式顯存要快的多。
進入GDDR時代的顯存家族一共有五兄弟,分別是GDDR、GDDR2、GDDR3、GDDR4和GDDR5。GDDR顯存已在市場被淘汰,目前市場上常見的顯存主要有GDDR2、GDDR3、GDDR4、GDDR5幾種類型的產品。
GDDR2顯存,目前多被低端顯卡產品采用,采用BGA(Ball Grid ArrayPackage)封裝,顯存的速度從3.7ns到2ns不等,最高默認頻率從500MHz~1000MHz,但明顯不如GDDR3顯存。其單顆顆粒位寬為16bit,組成128bit的規格需要8顆。
GDDR3顯存是專門為圖形處理開發的一種新型內存,同樣采用BGA封裝技術,其單顆顆粒位寬為32bit,8顆顆粒即可組成256bit/512MB的顯存位寬及容量。顯存速度在2.5ns(800MHz)~0.8ns(2500MHz)間。相比GDDR2,GDDR3具備低功耗、高頻率和單顆容量大三大優點,使得GDDR3目前為主流顯卡產品廣泛采用。
GDDR4和GDDR3基本技術一樣,GDDR4單顆顯存顆粒可實現64bit位寬64MB容量,也就是說只需4顆顯存芯片就能夠實現256bit位寬和256MB容量,8顆更可輕松實現512bit位寬512MB容量。目前GDDR4顯存顆粒的速度集中在0.7ns~0.9ns之間,但GDDR4顯存時序過長,同頻率的GDDR3顯存在性能上要領先于采用GDDR4顯存的產品,并且GDDR4顯存并沒有因為電壓更低而解決高功耗、高發熱的問題,這導致GDDR4對GDDR3缺乏競爭力,逐漸被淘汰了。
相對于GDDR3、GDDR4而言,GDDR5顯存擁有諸多技術優勢,還具備更高的帶寬、更低的功耗、更高的性能。如果搭配同數量、同顯存位寬的顯存顆粒,GDDR5顯存顆粒提供的總帶寬是GDDR3的3倍以上。由于GDDR5顯存可實現比目前主流的128bit或256bit顯存更高的位寬,也就意味著采用GDDR5顯存的顯卡會有更大的靈活性,性能亦會有較大幅度的提升。所以目前主流的高端顯卡都無一例外地采用了GDDR5顯存。
DDR的帶寬發展遠遠跟不上GDDR
因此顯存與內存分道揚鑣是基于技術需求上的考慮,畢竟術業有專攻,GDDR顯存的推出就是更好地滿足GPU胃口,達到更好的性能。
但是后期由于超大規模集成電路技術飛速進步,加上人們對于顯卡性能日益增長的需求,普通的GDDR/GDDR2顯存已經不能滿足顯卡GPU高速交互數據需求,畢竟GPU沒有像CPU那樣設計有大容量L1、L2、L3緩存,而且GPU與顯存之間的數據交換非常頻繁,還是那種大容量的紋理貼圖數據,需要更高的顯存帶寬;其二是顯存可以直接集成于顯卡PCB上,不必像內存那樣做成獨立部件,又要考慮走線、信號傳輸延遲,可以專門做定向優化,同時提高顯存位寬有利于減少顯存顆粒,在顯卡上實現更高容量的顯存集成。
GDDR(Graphics Double Date Rate SDRAM,雙倍速率同步動態隨機存儲器)
和DDR一樣都是采用2bit預取,同時可以在一個時鐘周期的上升沿和下降沿分別傳輸一次數據,這樣就實現單時間周期兩倍的傳輸速率。但此時GDDR頻率并不比DDR要高出多少,但是GDDR為了追求更高的頻率,在延遲要求上有所放寬。
GDDR顆粒為了追求大位寬,因此容量會特別小,那時候都是8×16Bit的規格,也就是一顆GDDR顯存才16MB大小,而同期的DDR內存顆粒可以做到32甚至64MB大小。
如果你浸淫在PC DIY界多年,你可能會記得以前DDR、GDDR顯存顆粒都是這種多腳的TSOP封裝,而且GDDR顯存顆粒體積也很大。
▲DDR內存
后期由于光刻工藝升級以及追求更加的封裝面積,存儲廠商在GDDR上實現了BGA封裝技術,也就是針腳不外露,全部藏在底部。同時實現了32bit的顯存位寬,并且一直延續至今。
GDDR2
技術細節同樣來自于DDR2,和DDR2一樣GDDR 2bit的預取升級到4bit,相比DDR1代可以將頻率翻倍。不過由于GDDR2跑得比DDR2還快,誕生時間早,工藝上可能稍微欠缺了一點,工作電壓高達2.5V,盡管等效工作頻率高達1GHz,但巨大的發熱量甚至媲美GPU核心,需要專門的散熱片輔助散熱。
▲DDR2內存
因此采用GDDR2顯存的顯卡都是曇花一現,只有NVIDIA的FX5800 /5600 Ultra、ATI9800Pro用過,很快就消息了,可以說GDDR2是個失敗的產品。
▲ATI9800Pro
GDDR3
被GDDR2坑過后,大家都認為存儲標準制定方JEDEC跑得實在是太慢了,GDDR、GDDR2標準嚴重不符合顯卡GPU發展需求,NVIDIA、AMD開始聯手對GDDR3標準實施深入的指導,因此GDDR3可以說真正地與DDR3分道揚鑣,技術標準得到大幅度提升。
▲DDR3內存
深刻地認識到GDDR、DDR應用場景完全不同,因此設計之初就應該考慮到這個問題,考慮到高速讀寫需求,GDDR3設計有兩條獨立的數據選擇脈沖DQS,一條用于讀取,另一條用于寫入,這樣互不干擾,因此GDDR3讀寫數據速度要比GDDR2快多了,畢竟GPU存取數據頻繁程度高,GDDR3的新設計可以讓顯存效率大幅度提升。
盡管GDDR3保留GDDR2的4bit預取,但對GDDR3也修改I/O控制電路,新的電路設計可以最大程度降低電流,工作電壓也隨之下降到1.8V,間接地控制住功耗和發熱量,一舉解決GDDR2存在的弊端。
都說工藝是提升性能、頻率的良方,GDDR3憑借制程工藝紅利,從1GHz不斷攀升,一直走到了2.5GHz,因此其生命線長達五年才落幕。
▲奇夢達的GDDR3
▲三星的GDDR3
GDDR4
可能是GDDR3跑得太快,標準對于往后幾代GPU來說還算是夠用,加上NVIDIA與ATI之間競爭日益劇烈,就GDDR4標準制定分歧嚴重,最后NVIDIA明確表示不支持GDDR4,顯卡產品也并沒有采用,最終標準GDDR4由ATI一手操辦,但缺乏NVIDIA的支持,存儲廠商只有小規模試產,AMD也只有三款非主流產品采用了GDDR4顯存,因此GDDR4起不了什么浪花。
▲DDR4內存,已經和GDDR4顯存沒有瓜葛了
事實上,GDDR4技術是有巨大進步,使用DDR3的8bit預取技術,這個也是NVIDA與ATI矛盾發展的開端。然后采用了Data Bus Inversion技術,提高數據精度、降低工作電壓至1.5V,繼續降低功耗。
而GDDR4頻率起步就是2GHz水平,其后雖然有更高頻率顆粒出現,但是由于NVIDIA的不支持,市場太小導致生產成本高漲,加上AMD顯卡性能不如同期N卡,GDDR4很快就被歷史所遺忘。
▲AMD Radeon HD2600XT用的就是GDDR4
GDDR5
GDDR顯存的命運總是那么跌宕起伏,奇數代的顯存總是存活得更久,2012年GDDR5顯存終于登上舞臺,在繼承GDDR4的8bit預取,加上QDR雙數據總線、4路bank設計讓GDDR5顯存頻率突飛猛進,一路高歌,一并沖上8Gbps。
盡管GDDR5只有32bit的顆粒,但是它擁有兩條并行的數據總線,那么他的工作模式就相當靈活,可以自由在32bit、16bit一下工作,同時一個32bit顯存控制器也能控制兩個GDDR5顯存,實現了顯存容量翻倍。
根據當時NVIDIA 200系列顯卡上市情況來看,即便是采用相同GPU核心,使用GDDR5顯存會比GDDR3顯存,綜合性能提升20%以上,這個提升幅度相當驚人。也因此GDDR5能夠經久不衰,一直到1000系列還在用,而且頻率不斷在進步,達到8Gbps的巔峰。
▲三星GDDR5
GDDR5X
嗯?怎么突然冒出個GDDR5X,GDDR6哪里去了?這可不得怪JEDEC標準定制得太慢,NVIDIA已經忍不住了,聯合美光推出了這樣一個半代產品GDDR5X,還是高端NVIDIA顯卡獨占。
GDDR5X可以視為GDDR6的先行版,它繼續將預取從8bit提升至16bit,使用了改進版的QDR 4倍數據倍率技術,也就是說每個時鐘可以傳輸4bit數據!GDDR5X的電壓下降到1.35V。最終我們見到首批使用GDDR5X顯存頻率可以高達10Gbps,據說后續還會有14Gbps的版本面世。
▲美光GDDR5X
GDDR6
GDDR6標準終于姍姍來遲,即將到來的NVIDIA 11系列顯卡肯定是要用上它的。和GDDR5X一樣采用了16bit預取,這已經是被證實提高數據傳輸速度最為有效的方法。其次就是GDDR6終于一改以往GDDR1/2/3/4/5/5X只有一個讀寫通道問題,使用雙通道,雖然位寬變小了,但是實際上效率更高以后,會帶來明顯的性能提升。
其次就是顯存容量的進步,原本GDDR5最常見的都是8Gb單顆粒,而GDDR6標準下最高可以達到32Gb,換算過來單顆粒就是4GB,好處顯而易見,那就是低端顯卡單顆粒就搞定了,還要什么HBM2?高端3顆也就滿足12GB,推算頂級顯卡384bit顯存位寬計算,搭載12顆就能達到48GB,難怪NVIDIA絲毫沒有在消費級游戲卡上用HBM2顯存的意思。
▲GDDR6帶寬可以達到896GB/s,這是美光提供的數據
此外GDDR6修改了封裝方式,減少了底部接口數目,從190 ball減少至180ball,尺寸更小,這樣應用場景更為寬闊。
▲GDDR6優勢——針腳少、尺寸更小、效能更高
目前全球三大存儲芯片廠商三星、海力士和美光都推出了自己的GDDR6計劃,不過由于技術實力差異和產品研發路線不同等因素,這三家的產品還存在一定的區別。
三星
期初三星在GDDR6上也是雷聲大雨點小,推出GDDR6的時機也要晚于其余兩家,但三星厚積薄發,一推出的GDDR6顯存規格就是最高的,1Y nm工藝(10-16nm),單顆粒2GB,速度最高可達18Gbps,超過了JEDEC規范。
海力士
首批采用21nm工藝,單顆粒1GB容量,速度有10/12/14Gbps,也超過GDDR5X現時的極限,比較有趣的是,GDDR6電壓應該是1.35V,海力士研發出1.25V低電壓版的GDDR6顯存,估計是為筆記本設備研發的。
美光
美光是最早、也是最積極推進GDDR6顯存的存儲廠商,將會采用16nm工藝制造,也是單顆粒8Gb,速度10-14Gbps不等,而且也有對應多款1.25V低電壓版GDDR6顯存。
如今GDDR6顯存依靠高頻率、高容量和低功耗特性,將會在未來新一代游戲顯卡上大方異彩,為新架構顯卡帶來更強大的綜合性能,而且對比成本居高不下、封裝難度高的HBM 2顯存來講,GDDR6顯然更加實惠,更易于往中低端顯卡推廣。
-
DDR
+關注
關注
11文章
711瀏覽量
65225 -
QDR
+關注
關注
0文章
14瀏覽量
11974 -
GDDR
+關注
關注
0文章
27瀏覽量
4649
原文標題:DDR、GDDR、QDR的區別
文章出處:【微信號:pcb_repaired,微信公眾號:工控維修那些事兒】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論