精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么FPGA主頻比CPU慢,但卻可以用來幫CPU做加速

電子工程師 ? 來源:FPGA技術(shù)江湖 ? 作者:EDN電子技術(shù)設(shè)計 ? 2020-11-20 09:56 ? 次閱讀

我們知道,FPGA的頻率一般只有幾百M(fèi)Hz,而CPU的頻率卻高達(dá)數(shù)GHz。那么,有不少網(wǎng)友心中就有一個疑問:“為什么FPGA主頻比CPU慢,但卻可以用來幫CPU做加速?”。

今天,EDN就和大家系統(tǒng)性地討論下這個問題。

將FPGA主頻與CPU相比不妥

在開始之前,首先要明確一點(diǎn),將FPGA的主頻與CPU比較,實(shí)際是風(fēng)馬牛不相及的問題。FPGA和CPU是兩種完全不同的器件,前者是專用,是硬件編程,而后者是通用,是軟件編程。

不同體系結(jié)構(gòu)性能和靈活性的比較。(圖片來源:《如何評價微軟在數(shù)據(jù)中心使用 FPGA 代替?zhèn)鹘y(tǒng) CPU 的做法?》)

表面上看,F(xiàn)PGA的時鐘頻率要低;對于通用計算任務(wù),F(xiàn)PGA設(shè)計貌似不如CPU設(shè)計。但是實(shí)際上,單個FPGA的并行度卻比CPU要高得多。FPGA的行為是確定性的,用作硬件加速器沒有時間片、線程或資源沖突的問題。它始終以完全相同的速度執(zhí)行一件事。因此,如果需要低延遲,那么FPGA就可能是最佳選擇。

計算密集型任務(wù),CPU、GPU、FPGA、ASIC 的數(shù)量級比較(以16位整數(shù)乘法為例,數(shù)字僅為數(shù)量級的估計)(圖片來源:《如何評價微軟在數(shù)據(jù)中心使用 FPGA 代替?zhèn)鹘y(tǒng) CPU 的做法?》)

FPGA并行計算機(jī)制

如知乎網(wǎng)友young cc所言,雖然CPU主頻很高,但其是通用處理器,做某個特定運(yùn)算(如信號處理,圖像處理)可能需要很多個時鐘周期。而FPGA可以通過編程重組電路,直接生成專用電路。加上電路并行性,可能做這個特定運(yùn)算只需要一個時鐘周期。

舉例來說,CPU主頻為3GHz,F(xiàn)PGA主頻為200MHz。若做某個特定運(yùn)算,CPU需要30個時鐘周期,而FPGA只需一個,那么耗時情況是:

CPU:30/3GHz =10ns;

FPGA:1/200MHz =5ns。

可以看到,F(xiàn)PGA做這個特定運(yùn)算速度比CPU快,能幫助加速。

另外,CPU的主頻是加過流水線之后的。比如是15級流水線,則第一條指令執(zhí)行了15個時鐘周期后才能出結(jié)果。

但是,使用FPGA也不一定總能做加速。

例如,知乎網(wǎng)友Evan172就表示,使用FPGA做加速,只是在某些強(qiáng)計算和數(shù)據(jù)處理的方面,因?yàn)槠溆布娐凡⑿羞\(yùn)行和有很多DSP硬核資源供調(diào)用的特點(diǎn),可以工作得更出色。

FPGA本身也只是輔助角色,做控制的還是CPU本身,所以FPGA并不能代替CPU,只是在完成一件大任務(wù)的過程中將某部分任務(wù)分解給FPGA可以更好地一起完成任務(wù)。在這過程中也會有額外的開銷產(chǎn)生,在某些場合,可能用了FPGA而效果更差也是有的。

另外,通常說的使用FPGA加速比CPU和GPU省電,是指在完成同樣的任務(wù)下,F(xiàn)PGA耗費(fèi)的電力比起CPU和GPU更少一些。這是相對而言的,并不是說FPGA本身就一定省電。

一個有趣的例子:數(shù)組加法計算

知乎用戶doing舉了一個很有趣的例子。他指出,假設(shè)用FPGA完整實(shí)現(xiàn)了CPU,然后再跑軟件的話,的確比CPU慢。問題是FPGA不會那么干,它會直指問題本質(zhì),解決問題。

例如,有兩個數(shù)組,其中有256個32位數(shù)。現(xiàn)在要把它們對應(yīng)相加變成一個數(shù)組,用CPU寫最快大概是這個樣子:

r[0] = a[0] + b[0];

r[1] = a[1] + b[1];

...

r[255] = a[255] + b[255];

當(dāng)然也可能會這么寫(在分支預(yù)測準(zhǔn)確,指令緩存不大的情況下可能更快):

for (int i = 0; i < 255; i++)

r[i] = a[i] + b[i];

對FPGA來說,也可以用上面相同的寫法,不同在于:

CPU是一個一個加法計算,而FPGA排好邏輯電路,在一個時鐘周期內(nèi)計算完畢。就算CPU主頻比FPGA快100倍也趕不上啊。話說后來CPU大量的增加SIMD指令,就有點(diǎn)這個意思,不過這相當(dāng)于提供庫函數(shù),沒那么靈活。

FPGA并行是真并行,CPU完全沒得比。CPU如果想并行最多也就是讓多個核并行,但是對于大部分算法實(shí)現(xiàn)來說,如上例,多個核之間的同步調(diào)度開銷遠(yuǎn)遠(yuǎn)大于計算開銷,就算多個核之間的調(diào)用開銷可以做的很小,一般CPU也就那幾個核,而FPGA只要門足夠,想并行幾路就可以并行幾路。

所以在做可并行的計算密集型任務(wù)時,比如信號處理,網(wǎng)絡(luò)傳輸?shù)鹊菷PGA可以幫上忙;但是如果做常見的以串行為主的任務(wù),F(xiàn)PGA的確遠(yuǎn)遠(yuǎn)比不上CPU。如果要類比的話,有點(diǎn)像似GPU和CPU之間的關(guān)系。

“當(dāng)年寫Verilog的時候,我就想如果CPU里面自帶一塊FPGA,應(yīng)用程序程序可以在初始化期間直接燒一段代碼下去,那豈不是很爽。后來,有了能寫shader的3D顯卡...”

為什么FPGA成為數(shù)據(jù)中心尖端技術(shù)?

最后再討論一個話題,就是為什么FPGA一直是數(shù)據(jù)中心領(lǐng)域最尖端的技術(shù)?

有人可能認(rèn)為,再大的問題(算力)都可以通過堆CPU核心來解決。那么,假設(shè)有一臺強(qiáng)大的48核服務(wù)器,即使使用非常高端的FPGA,也很難達(dá)到相同的吞吐量。而且,F(xiàn)PGA硬件設(shè)計還需要由強(qiáng)大的團(tuán)隊來完成,非常燒錢。

這時,如果把機(jī)會成本和能源效率兩者考慮進(jìn)去,好處就開始顯現(xiàn)出來了。

首先來看能源效率。假設(shè)這臺48核服務(wù)器的功耗為400W并且發(fā)熱嚴(yán)重,那么就會對數(shù)據(jù)中心運(yùn)營不利——能耗和散熱是數(shù)據(jù)中心運(yùn)營的兩項(xiàng)最大支出。而將FPGA連接起來只執(zhí)行一項(xiàng)任務(wù),就可以實(shí)現(xiàn)很高的能效而開銷極低。通過正確的設(shè)計,可以在實(shí)現(xiàn)低功耗的同時獲得高吞吐量。

其次,機(jī)會成本(這個問題不太明顯)。系統(tǒng)中的CPU內(nèi)核數(shù)量就那么多。購買新的內(nèi)核并且安裝需要花很長時間,而且最好是將通用CPU內(nèi)核保留用于通用任務(wù)(例如虛擬機(jī)訂閱)。每個CPU核賣不出去就會燒錢。

當(dāng)有任務(wù)大量占用CPU時間(例如AI推理)時,F(xiàn)PGA就成為了不錯的選擇。

一個有關(guān)微軟Project Catapult項(xiàng)目當(dāng)中FPGA的趣事

當(dāng)年,微軟必應(yīng)團(tuán)隊在其Project Catapult項(xiàng)目中發(fā)現(xiàn),在啟用FPGA時,CPU的總體利用率實(shí)際上略有上升。所有的人都感到困惑,因?yàn)閺闹庇X來看FPGA應(yīng)該要減少CPU負(fù)載。但是后來他們發(fā)現(xiàn),數(shù)據(jù)中心的業(yè)務(wù)流量達(dá)到了原來的2倍!由于效率提高,流量實(shí)現(xiàn)了兩倍的負(fù)載均衡。由此可見FPGA的強(qiáng)大之處。

結(jié)語

維基百科的相關(guān)詞條提到兩點(diǎn):FPGA的優(yōu)勢在于其并行特性,有時對于某些應(yīng)用而言可以使速度明顯變快;可以使用FPGA來對算法中的某些部分加速,也可以在FPGA和通用處理器之間共享部分計算。

綜上,F(xiàn)PGA有兩個優(yōu)點(diǎn):FPGA并行度遠(yuǎn)超CPU;CPU是通用電路,F(xiàn)PGA是定制電路。但是也有兩個缺點(diǎn):開發(fā)周期長;并不是所有東西都適合FPGA。

責(zé)任編輯:xj

原文標(biāo)題:為什么FPGA主頻比CPU慢,卻可以幫其加速?

文章出處:【微信公眾號:FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1626

    文章

    21678

    瀏覽量

    602034
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10829

    瀏覽量

    211193
  • 主頻
    +關(guān)注

    關(guān)注

    1

    文章

    19

    瀏覽量

    9029

原文標(biāo)題:為什么FPGA主頻比CPU慢,卻可以幫其加速?

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    音頻子系統(tǒng)主要是用來做什么的,可以用來PCM編碼器嗎?

    請問,音頻子系統(tǒng)主要是用來做什么的,可以用來PCM編碼器嗎?支持PCM編碼輸出嗎?
    發(fā)表于 11-07 07:38

    如何限制容器可以使用的CPU資源

    默認(rèn)情況下容器可以使用的主機(jī) CPU 資源是不受限制的。和內(nèi)存資源的使用一樣,如果不對容器可以使用的 CPU 資源進(jìn)行限制,一旦發(fā)生容器內(nèi)程序異常使用
    的頭像 發(fā)表于 10-24 17:04 ?168次閱讀
    如何限制容器<b class='flag-5'>可以</b>使用的<b class='flag-5'>CPU</b>資源

    CPU主頻是什么意思

    CPU主頻,作為計算機(jī)處理器性能的一個重要指標(biāo),承載著豐富的技術(shù)內(nèi)涵與實(shí)際應(yīng)用價值。以下是對CPU主頻的詳細(xì)解析,包括其定義、用途、技術(shù)原理、影響因素以及在多個領(lǐng)域的實(shí)際應(yīng)用。
    的頭像 發(fā)表于 09-26 15:50 ?1051次閱讀

    CPU時鐘周期與主頻的關(guān)系和區(qū)別

    CPU時鐘周期與主頻是計算機(jī)體系結(jié)構(gòu)中兩個緊密相連且至關(guān)重要的概念,它們之間既存在關(guān)系又有所區(qū)別。以下將詳細(xì)闡述CPU時鐘周期與主頻的關(guān)系和區(qū)別。
    的頭像 發(fā)表于 09-26 15:46 ?1323次閱讀

    由于接口不夠,SDIO接口可以用CPUFPGA之間進(jìn)行通信嗎

    由于接口不夠,SDIO接口可以用CPUFPGA之間進(jìn)行通信嗎
    發(fā)表于 04-23 10:56

    EVENTOUT這個功能可以用來IO,PWM輸出嗎?

    如題,EVENTOUT這個功能可以用來IO,PWM輸出嗎?
    發(fā)表于 04-15 07:10

    請問DMA控制器可以減輕CPU負(fù)擔(dān)嗎?

    直接存儲器訪問 ( DMA )控制器,可以在內(nèi)存和/或外設(shè)之間傳輸數(shù)據(jù),而不需要 CPU 參與每次傳輸。合理利用 DMA 控制器,可以減輕CPU的負(fù)擔(dān)。
    的頭像 發(fā)表于 03-28 09:41 ?657次閱讀
    請問DMA控制器<b class='flag-5'>可以</b>減輕<b class='flag-5'>CPU</b>負(fù)擔(dān)嗎?

    什么是cpu主頻和外頻,它們之間關(guān)系如何

    CPU主頻和外頻是計算機(jī)中兩個重要的頻率指標(biāo),它們分別代表了CPU內(nèi)部和與外部組件之間的數(shù)據(jù)傳輸速率。這兩個頻率指標(biāo)之間有著密切的關(guān)系,對計算機(jī)的性能和穩(wěn)定性有著重要的影響。 首先,我們來具體了解
    的頭像 發(fā)表于 02-03 16:50 ?3855次閱讀

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項(xiàng)任務(wù)。這是因?yàn)镚PU的架構(gòu)使得它可以同時
    的頭像 發(fā)表于 01-26 08:30 ?2263次閱讀
    為什么GPU<b class='flag-5'>比</b><b class='flag-5'>CPU</b>更快?

    FPGA可以用來數(shù)字電源嗎?

    請問: FPGA可以用來數(shù)字電源嗎?有參考設(shè)計案例嗎? FPGA和DSP數(shù)字電源的優(yōu)缺點(diǎn)是什么?
    發(fā)表于 01-08 22:24

    淺談多CPU、多核CPU、超線程技術(shù)、SMP

    Local APIC: APIC全稱是Advanced Programmable Interrupt Controller,翻譯過來就是高級可編程中斷控制器,用來處理CPU中斷。
    的頭像 發(fā)表于 01-06 10:38 ?2360次閱讀
    淺談多<b class='flag-5'>CPU</b>、多核<b class='flag-5'>CPU</b>、超線程技術(shù)、SMP

    法拉電容是不是可以用來電池用

    法拉電容是不是可以用來電池用? 很抱歉,我不認(rèn)為法拉電容可以直接用來制造電池。法拉電容和電池雖然都是儲存能量的裝置,但是它們的工作原理和結(jié)構(gòu)有著明顯的區(qū)別。 首先,我們需要了解法拉電
    的頭像 發(fā)表于 12-29 13:42 ?2903次閱讀

    如何能夠?qū)崿F(xiàn)通用FPGA問題?

    FPGA 是一種偽通用計算加速器,與 GPGPU(通用 GPU)類似,FPGA 可以很好地卸載特定類型的計算。從編程角度上講,FPGA
    發(fā)表于 12-29 10:29 ?422次閱讀

    地球上有多少硅原子可以用來生成晶體管呢?

    硅是常見的元素,那么地球上有多少硅原子可以用來生成晶體管
    的頭像 發(fā)表于 12-22 10:51 ?1458次閱讀
    地球上有多少硅原子<b class='flag-5'>可以用來</b>生成晶體管呢?

    影響CPU性能的高低的因素是什么

    根據(jù)以上公式,可以反向推算出 CPU 的外頻。如 CPU 主頻為 3.2GHz,倍頻為 24 時,外頻為 3200MHz÷24=133MHz。
    發(fā)表于 12-08 12:19 ?2058次閱讀