在AI和大數(shù)據(jù)時(shí)代到來(lái)之后,GPU單兵作戰(zhàn)就變成了奢望,以現(xiàn)在的數(shù)據(jù)中心和超算為例,動(dòng)輒就是成千上萬(wàn)張GPU,龐大的GPU網(wǎng)絡(luò)在交換機(jī)和光模塊的支持下代表了這個(gè)計(jì)算時(shí)代下最高的算力。但并非只有數(shù)據(jù)中心和超算里的GPU才需要這樣的擴(kuò)展性,嵌入式GPU和專業(yè)GPU同樣如此。
物理限制的嵌入式GPU
隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對(duì)邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過(guò)程中,我們還有一些物理限制沒(méi)法消除,像是尺寸、重量和功耗等。
為了解決這一系列問(wèn)題,美國(guó)政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開(kāi)發(fā)開(kāi)放的標(biāo)準(zhǔn)和最好的方案來(lái)實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來(lái)的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。
這類嵌入式GPU并非用來(lái)單獨(dú)售賣(mài),而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國(guó)空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。
MXM嵌入式GPU模塊 / 凌華科技
即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGA和ASIC等等。SOSA聯(lián)盟主席,來(lái)自美國(guó)空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問(wèn)題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來(lái)就不得不犧牲帶寬、容量。
所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒(méi)有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對(duì)于嵌入式GPU的擴(kuò)展性來(lái)說(shuō)還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來(lái)者顛覆。
顯卡交火時(shí)代的結(jié)束
不管是最新發(fā)布的RTX4090消費(fèi)級(jí)顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無(wú)論是晶體管數(shù)目還是CUDA核心都做到了極致。
然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無(wú)處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說(shuō)法,他們省下了NVLink連接器的空間,釋放了更多的空間來(lái)處理更多的AI計(jì)算。
在上一代顯卡的NVLink中,通過(guò)連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對(duì)于個(gè)人或?qū)I(yè)用戶來(lái)說(shuō)是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問(wèn)題。
RTX6000 / 英偉達(dá)
英偉達(dá)方面表示,就RTX 6000這類專業(yè)顯卡而言,他們?nèi)∠鸑VLink后省下了足夠的空間,塞入了更多的計(jì)算單元來(lái)提升單卡的性能。與此同時(shí),雖然這些專業(yè)顯卡的NVLink支持被取消,不代表英偉達(dá)放棄了這一技術(shù)。英偉達(dá)決心將NVLink的重心放在數(shù)據(jù)中心產(chǎn)品上,比如Grace CPU、Hopper GPU,他們通過(guò)NVLink Die to Die和Chip to Chip的互聯(lián)可以實(shí)現(xiàn)更好的擴(kuò)展性。
但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過(guò)去AMD的交火和英偉達(dá)的SLI也是兩家競(jìng)爭(zhēng)最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來(lái)了終結(jié)。
但顯卡交火的落幕也情有可原,且不說(shuō)這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持。或許專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。
物理限制的嵌入式GPU
隨著各種傳感器的性能持續(xù)走高,譬如多線激光雷達(dá)、高分辨率的圖像傳感器等,我們對(duì)邊緣計(jì)算單元尤其是GPU的需求也在持續(xù)增加。但在實(shí)現(xiàn)的過(guò)程中,我們還有一些物理限制沒(méi)法消除,像是尺寸、重量和功耗等。
為了解決這一系列問(wèn)題,美國(guó)政府和行業(yè)方案提供商們成立了SOSA聯(lián)盟,以求開(kāi)發(fā)開(kāi)放的標(biāo)準(zhǔn)和最好的方案來(lái)實(shí)現(xiàn)高性價(jià)比、互操作性強(qiáng)的傳感器系統(tǒng)。如何克服這些負(fù)載計(jì)算工作量提升帶來(lái)的挑戰(zhàn),又能不增加寶貴的物理資源呢?答案自然還是將GPU、DPU等技術(shù)集成到嵌入式結(jié)構(gòu)中去。
這類嵌入式GPU并非用來(lái)單獨(dú)售賣(mài),而是交給合作伙伴整合到不同的邊緣計(jì)算系統(tǒng)中,比如研華、凌華、EIZO、Mercury Systems等,然后交付給美國(guó)空軍、洛克希德·馬丁這類軍事、航空、工業(yè)客戶。
MXM嵌入式GPU模塊 / 凌華科技
即便選擇了嵌入式結(jié)構(gòu),也還有著不少的路線,比如GPU、FPGA和ASIC等等。SOSA聯(lián)盟主席,來(lái)自美國(guó)空軍的Ilya Lipkin表示,如果想要更快的運(yùn)行速度,快速部署軟件,自然是選擇GPU最好。但他們也面臨著空間的問(wèn)題,因?yàn)榍度胧紾PU往往會(huì)被塞到3U或者6U的服務(wù)器里,他們想要做到更小的體積,甚至是手掌大小,可這樣一來(lái)就不得不犧牲帶寬、容量。
所以,雖然嵌入式GPU仍然在這些嵌入式傳感系統(tǒng)中可以保持領(lǐng)先地位,但他們并沒(méi)有像獲得數(shù)據(jù)中心那樣不算嚴(yán)格的空間要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但這對(duì)于嵌入式GPU的擴(kuò)展性來(lái)說(shuō)還不算完美。在邊緣計(jì)算上,反倒是一些FPGA和ASIC方案在能耗比和擴(kuò)展性上占優(yōu),如果嵌入式GPU不能做到更強(qiáng)大的擴(kuò)展性,很有可能會(huì)被后來(lái)者顛覆。
顯卡交火時(shí)代的結(jié)束
不管是最新發(fā)布的RTX4090消費(fèi)級(jí)顯卡,還是RTX 6000這樣的專業(yè)顯卡,都象征了英偉達(dá)在新架構(gòu)GPU上的又一次創(chuàng)新。在臺(tái)積電4N工藝的加持下,無(wú)論是晶體管數(shù)目還是CUDA核心都做到了極致。
然而,原本變成了專屬英偉達(dá)高端消費(fèi)顯卡和專業(yè)顯卡的交火技術(shù)NVLink,在RTX4090和RTX 6000上卻無(wú)處可尋,難不成英偉達(dá)徹底放棄顯卡交火技術(shù),也就此放棄NVLink了?根據(jù)英偉達(dá)CEO黃仁勛的說(shuō)法,他們省下了NVLink連接器的空間,釋放了更多的空間來(lái)處理更多的AI計(jì)算。
在上一代顯卡的NVLink中,通過(guò)連接兩塊英偉達(dá)顯卡,使用高端顯卡和專業(yè)顯卡的專業(yè)系統(tǒng)能夠獲得更高的帶寬和雙倍的顯存容量。這樣的提升對(duì)于個(gè)人或?qū)I(yè)用戶來(lái)說(shuō)是極大的提升,那么為何英偉達(dá)會(huì)放棄NVLink呢?筆者也在英偉達(dá)GTC的一次分享會(huì)議上提出了這一問(wèn)題。
RTX6000 / 英偉達(dá)
但這確實(shí)象征著一個(gè)時(shí)代的結(jié)束,過(guò)去AMD的交火和英偉達(dá)的SLI也是兩家競(jìng)爭(zhēng)最火熱的一項(xiàng)技術(shù),可隨著AMD放棄了交火支持,英偉達(dá)的SLI在換成NVLink后如今也迎來(lái)了終結(jié)。
但顯卡交火的落幕也情有可原,且不說(shuō)這種互聯(lián)方式的受眾群體一再變少,要想享受到顯卡交火的性能也需要軟件追加更新支持。或許專業(yè)顯卡的目標(biāo)還是追求單卡性能就好,多卡互聯(lián)的支持還是讓給數(shù)據(jù)中心吧。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
gpu
+關(guān)注
關(guān)注
28文章
4703瀏覽量
128728
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
深度評(píng)測(cè):云計(jì)算平臺(tái)的優(yōu)勢(shì)和不足
云計(jì)算平臺(tái)具有成本效益、靈活性和可擴(kuò)展性、簡(jiǎn)化維護(hù)和升級(jí)、全球訪問(wèn)性以及災(zāi)難恢復(fù)等優(yōu)勢(shì),但也面臨安全性問(wèn)題、依賴性問(wèn)題、合規(guī)性和隱私問(wèn)題、性能限制以及遷移復(fù)雜性等挑戰(zhàn)。企業(yè)在采用云計(jì)算
Perforce Helix Core通過(guò)ISO 26262認(rèn)證!為汽車(chē)軟件開(kāi)發(fā)團(tuán)隊(duì)提供無(wú)限可擴(kuò)展性、細(xì)粒度安全性、文件快速訪問(wèn)等
News!Helix Core通過(guò)ISO 26262認(rèn)證,符合汽車(chē)系統(tǒng)開(kāi)發(fā)所需的安全和可靠性標(biāo)準(zhǔn),助力汽車(chē)軟件安全合規(guī)!具備無(wú)限可擴(kuò)展性、細(xì)粒度安全性、文件快速訪問(wèn)...是眾多汽車(chē)OEM和供應(yīng)商的首選版本控制工具。
GPU算力租用平臺(tái)怎么樣
GPU算力租用平臺(tái)以其成本效益、靈活性與可擴(kuò)展性、簡(jiǎn)化運(yùn)維以及即時(shí)訪問(wèn)等優(yōu)勢(shì),在深度學(xué)習(xí)、科學(xué)計(jì)算、圖形渲染等多個(gè)領(lǐng)域發(fā)揮著重要作用。
Cincoze高階效能&PCIe擴(kuò)展型工控機(jī)
應(yīng)用于如機(jī)器視覺(jué)、AI運(yùn)算等要求高度運(yùn)算效能與實(shí)時(shí)GPU圖像辨識(shí)速度的應(yīng)用場(chǎng)景。DS?系列不僅具備強(qiáng)大的處理能力,還支持多種擴(kuò)展模塊,以及多元的認(rèn)證標(biāo)準(zhǔn),確保在苛刻的環(huán)境下持續(xù)穩(wěn)定運(yùn)行
Imagination DXS GPU:重塑汽車(chē)智能與交互的未來(lái)
增長(zhǎng)。在此背景下,Imagination公司最新推出的DXS GPU IP產(chǎn)品,以其可擴(kuò)展性、靈活性和強(qiáng)大的計(jì)算能力,為車(chē)載智能與交互系統(tǒng)注入了新的活力。
使用低成本MSPM0 MCU在無(wú)線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可擴(kuò)展性
電子發(fā)燒友網(wǎng)站提供《使用低成本MSPM0 MCU在無(wú)線電動(dòng)工具和園藝工具中實(shí)現(xiàn)可擴(kuò)展性.pdf》資料免費(fèi)下載
發(fā)表于 09-02 11:47
?0次下載
國(guó)產(chǎn)NVMe SSD擴(kuò)展卡:驅(qū)動(dòng)存儲(chǔ)新紀(jì)元
NVMe技術(shù)的標(biāo)準(zhǔn)化接口使得不同廠商的設(shè)備能夠更好地兼容和互操作,提升了存儲(chǔ)系統(tǒng)的靈活性和擴(kuò)展性。
大模型發(fā)展下,國(guó)產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn)
電子發(fā)燒友網(wǎng)站提供《大模型發(fā)展下,國(guó)產(chǎn)GPU的機(jī)會(huì)和挑戰(zhàn).pdf》資料免費(fèi)下載
發(fā)表于 07-18 15:44
?7次下載
進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片
。允許在網(wǎng)絡(luò)結(jié)構(gòu)中直接減少和組合張量,優(yōu)化計(jì)算任務(wù)并增強(qiáng)圖形處理器集群的可擴(kuò)展性。
**5. **安全性和可靠性
引入英偉達(dá)機(jī)密計(jì)算技術(shù),在不影響性能的情況下,增強(qiáng)了大規(guī)模實(shí)時(shí)生成式人工智能推理的安全性
發(fā)表于 05-13 17:16
FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU
、運(yùn)動(dòng)和電力限制等環(huán)境因素。
Larzul 說(shuō):“在一些關(guān)鍵的應(yīng)用場(chǎng)景中,比如智慧城市的視頻監(jiān)控,要求硬件暴露在對(duì) GPU 有不利影響的環(huán)境因素 (比如太陽(yáng)) 下?!?GPU 受晶體管
發(fā)表于 03-21 15:19
Andes RISC-V CON全球巡回展,思爾芯邀您共同探索RISC-V
當(dāng)前RISC-V技術(shù),以其開(kāi)源性、簡(jiǎn)潔性及高度可擴(kuò)展性,在各個(gè)領(lǐng)域中發(fā)揮著日益重要的作用。
FPGA與AISC的差異
擴(kuò)展性較好,可以通過(guò)增加芯片數(shù)量或使用更大容量的芯片來(lái)滿足更高的性能需求。而ASIC的可擴(kuò)展性相對(duì)較差,需要重新設(shè)計(jì)和制造。
驗(yàn)證和調(diào)試 :FPGA的驗(yàn)證和調(diào)試過(guò)程相對(duì)簡(jiǎn)單,可以在系統(tǒng)級(jí)進(jìn)行仿真和測(cè)試。而
發(fā)表于 02-22 09:54
分布式大屏控制系統(tǒng)的可擴(kuò)展性設(shè)計(jì)
分布式大屏控制系統(tǒng)的可擴(kuò)展性設(shè)計(jì)是確保系統(tǒng)能夠適應(yīng)不斷增長(zhǎng)的需求和未來(lái)發(fā)展的關(guān)鍵因素。以下是可擴(kuò)展性設(shè)計(jì)的幾個(gè)方面: 模塊化設(shè)計(jì):將系統(tǒng)劃分為多個(gè)模塊,每個(gè)模塊具有獨(dú)立的功能和接口。這種設(shè)計(jì)方式使得
三星攜手紅帽在真實(shí)用戶環(huán)境下驗(yàn)證CXL內(nèi)存技術(shù)
CXL憑借其統(tǒng)一的接口標(biāo)準(zhǔn),通過(guò)PCIe接口連接各類處理器如CPU、GPU及內(nèi)存設(shè)備,有效解決了當(dāng)前系統(tǒng)在速度、延遲和可擴(kuò)展性上所面臨的瓶頸。
Java中保持擴(kuò)展性的實(shí)現(xiàn)方法
SOLID(單一、開(kāi)閉、里式替換、接口隔離、依賴倒置)五大原則和23種設(shè)計(jì)模式(常見(jiàn)的單例、構(gòu)建者、裝飾、適配、代理、組合、模板等等),小伙伴們對(duì)這些肯定都很熟悉。這些原則和設(shè)計(jì)模式能夠輔助我們,讓我們在設(shè)計(jì)的時(shí)候有所抉擇,從而達(dá)到高內(nèi)聚、低耦合的目的。
評(píng)論