精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU和GPU對(duì)于微架構(gòu)、主頻、IPC的對(duì)比分析

GReq_mcu168 ? 2017-12-21 10:09 ? 次閱讀

芯片的速度主要取決于三個(gè)方面:微架構(gòu)、主頻、IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。

1.微架構(gòu)

從微架構(gòu)上看,CPUGPU看起來完全不是按照相同的設(shè)計(jì)思路設(shè)計(jì)的,當(dāng)代CPU的微架構(gòu)是按照兼顧“指令并行執(zhí)行”和“數(shù)據(jù)并行運(yùn)算”的思路而設(shè)計(jì),就是要兼顧程序執(zhí)行和數(shù)據(jù)運(yùn)算的并行性、通用性以及它們的平衡性。CPU的微架構(gòu)偏重于程序執(zhí)行的效率,不會(huì)一味追求某種運(yùn)算極致速度而犧牲程序執(zhí)行的效率。
CPU和GPU對(duì)于微架構(gòu)、主頻、IPC的對(duì)比分析

CPU微架構(gòu)的設(shè)計(jì)是面向指令執(zhí)行高效率而設(shè)計(jì)的,因而CPU是計(jì)算機(jī)中設(shè)計(jì)最復(fù)雜的芯片。和GPU相比,CPU核心的重復(fù)設(shè)計(jì)部分不多,這種復(fù)雜性不能僅以晶體管的多寡來衡量,這種復(fù)雜性來自于實(shí)現(xiàn):如程序分支預(yù)測(cè),推測(cè)執(zhí)行,多重嵌套分支執(zhí)行,并行執(zhí)行時(shí)候的指令相關(guān)性和數(shù)據(jù)相關(guān)性,多核協(xié)同處理時(shí)候的數(shù)據(jù)一致性等等復(fù)雜邏輯。

GPU其實(shí)是由硬件實(shí)現(xiàn)的一組圖形函數(shù)的集合,這些函數(shù)主要用于繪制各種圖形所需要的運(yùn)算。這些和像素,光影處理,3D 坐標(biāo)變換等相關(guān)的運(yùn)算由GPU硬件加速來實(shí)現(xiàn)。圖形運(yùn)算的特點(diǎn)是大量同類型數(shù)據(jù)的密集運(yùn)算——如圖形數(shù)據(jù)的矩陣運(yùn)算,GPU的微架構(gòu)就是面向適合于矩陣類型的數(shù)值計(jì)算而設(shè)計(jì)的,大量重復(fù)設(shè)計(jì)的計(jì)算單元,這類計(jì)算可以分成眾多獨(dú)立的數(shù)值計(jì)算——大量數(shù)值運(yùn)算的線程,而且數(shù)據(jù)之間沒有像程序執(zhí)行的那種邏輯關(guān)聯(lián)性。

GPU微架構(gòu)復(fù)雜度不高,盡管晶體管的數(shù)量不少。從應(yīng)用的角度看,如何運(yùn)用好GPU的并行計(jì)算能力主要的工作是開發(fā)好它的驅(qū)動(dòng)程序。GPU驅(qū)動(dòng)程序的優(yōu)劣很大程度左右了GPU實(shí)際性能的發(fā)揮。

因此從微架構(gòu)上看,CPU擅長的是像操作系統(tǒng)、系統(tǒng)軟件和通用應(yīng)用程序這類擁有復(fù)雜指令調(diào)度、循環(huán)、分支、邏輯判斷以及執(zhí)行等的程序任務(wù)。它的并行優(yōu)勢(shì)是程序執(zhí)行層面的,程序邏輯的復(fù)雜度也限定了程序執(zhí)行的指令并行性,上百個(gè)并行程序執(zhí)行的線程基本看不到。GPU擅長的是圖形類的或者是非圖形類的高度并行數(shù)值計(jì)算,GPU可以容納上千個(gè)沒有邏輯關(guān)系的數(shù)值計(jì)算線程,它的優(yōu)勢(shì)是無邏輯關(guān)系數(shù)據(jù)的并行計(jì)算。

2.主頻

另外,GPU執(zhí)行每個(gè)數(shù)值計(jì)算的速度并沒有比CPU快,從目前主流CPU和GPU的主頻就可以看出了,CPU的主頻都超過了1GHz,2GHz,甚至3GHz,而GPU的主頻最高還不到1GHz,主流的也就500~600MHz。要知道1GHz = 1000MHz。所以GPU在執(zhí)行少量線程的數(shù)值計(jì)算時(shí)并不能超過CPU。

目前GPU數(shù)值計(jì)算的優(yōu)勢(shì)主要是浮點(diǎn)運(yùn)算,它執(zhí)行浮點(diǎn)運(yùn)算快是靠大量并行,但是這種數(shù)值運(yùn)算的并行性在面對(duì)程序的邏輯執(zhí)行時(shí)毫無用處。

3.IPC

(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))

這個(gè)方面,CPU和GPU無法比較,因?yàn)镚PU大多數(shù)指令都是面向數(shù)值計(jì)算的,少量的控制指令也無法被操作系統(tǒng)和軟件直接使用。如果比較數(shù)據(jù)指令的IPC,GPU顯然要高過CPU,因?yàn)椴⑿械脑颉5牵绻容^控制指令的IPC,自然是CPU的要高的多。原因很簡(jiǎn)單,CPU著重的是指令執(zhí)行的并行性。

另外,目前有些GPU也能夠支持比較復(fù)雜的控制指令,比如條件轉(zhuǎn)移、分支、循環(huán)和子程序調(diào)用等,但是GPU程序控制這方面的增加,和支持操作系統(tǒng)所需要的能力CPU相比還是天壤之別,而且指令執(zhí)行的效率也無法和CPU相提并論。

最后總結(jié)一下:

CPU擅長的:操作系統(tǒng),系統(tǒng)軟件,應(yīng)用程序,通用計(jì)算,系統(tǒng)控制等等;游戲中人工智能,物理模擬等等;3D建模-光線追蹤渲染;虛擬化技術(shù)——抽象硬件,同時(shí)運(yùn)行多個(gè)操作系統(tǒng)或者一個(gè)操作系統(tǒng)的多個(gè)副本等等。

GPU擅長的:圖形類矩陣運(yùn)算,非圖形類并行數(shù)值計(jì)算,高端3D游戲。

綜上所述,在一臺(tái)均衡計(jì)算的計(jì)算機(jī)系統(tǒng)中,CPU和GPU還是各司其職,除了圖形運(yùn)算,GPU將來可能主要集中在高效率低成本的高性能并行數(shù)值計(jì)算,幫助CPU分擔(dān)這種類型的計(jì)算,提高系統(tǒng)這方面的性能。而當(dāng)前的典型應(yīng)用還是高端3D游戲,一個(gè)高效的GPU配合一個(gè)高效的CPU,3D游戲的整體效率才能得到保證。“高端3D游戲只需要高端顯卡”或者“高端3D游戲只需要CPU”都是無稽之談。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10826

    瀏覽量

    211160
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4702

    瀏覽量

    128709
  • IPC
    IPC
    +關(guān)注

    關(guān)注

    3

    文章

    345

    瀏覽量

    51830

原文標(biāo)題:CPU和GPU擅長和不擅長的地方

文章出處:【微信號(hào):mcu168,微信公眾號(hào):硬件攻城獅】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析

    ;社區(qū)活動(dòng)專版標(biāo)題名稱必須包含【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗(yàn)】+自擬標(biāo)題 注意事項(xiàng) 1、活動(dòng)期間
    發(fā)表于 09-02 10:09

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的架構(gòu)。書中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對(duì)全書內(nèi)容有一個(gè)整體了解
    發(fā)表于 10-15 22:08

    CPUGPU擅長和不擅長的地方

    和不擅長”。 芯片的速度主要取決于三個(gè)方面:架構(gòu)主頻IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。 1.
    發(fā)表于 12-03 15:43

    CPUGPU擅長和不擅長的地方

    和不擅長”。芯片的速度主要取決于三個(gè)方面:架構(gòu)主頻IPC(每個(gè)時(shí)鐘周期執(zhí)行的指令數(shù))。1.架構(gòu)
    發(fā)表于 12-03 20:08

    步進(jìn)電機(jī)與伺服電機(jī)對(duì)比分析

    步進(jìn)電機(jī)與伺服電機(jī)對(duì)比分析采用閉環(huán)技術(shù)的步進(jìn)電機(jī)
    發(fā)表于 02-05 06:05

    LTE與WiMAX對(duì)比分析哪個(gè)好?

    LTE與WiMAX對(duì)比分析哪個(gè)好?
    發(fā)表于 05-31 06:22

    CPLD與FPGA對(duì)比分析哪個(gè)好?

    CPLD與FPGA對(duì)比分析哪個(gè)好?
    發(fā)表于 06-21 06:10

    x86/arm/mips各架構(gòu)對(duì)比分析哪個(gè)好?

    x86/arm/mips各架構(gòu)對(duì)比分析哪個(gè)好?
    發(fā)表于 10-21 06:39

    STM32和Arduino對(duì)比分析哪個(gè)好?

    Arduino和STM32各自的特點(diǎn)是什么?STM32和Arduino對(duì)比分析哪個(gè)好?
    發(fā)表于 11-04 06:34

    CPLD與FPGA的對(duì)比分析哪個(gè)好?

    CPLD與FPGA的對(duì)比分析哪個(gè)好?
    發(fā)表于 11-05 08:20

    DRAM和SRAM對(duì)比分析哪個(gè)好?

    RAM有哪些分類?特點(diǎn)是什么?DRAM和SRAM對(duì)比分析哪個(gè)好?
    發(fā)表于 01-20 07:16

    SPWM調(diào)制方法對(duì)比分析

    SPWM調(diào)制方法對(duì)比分析 摘要:對(duì)比分析了三種正弦波脈寬調(diào)制(SPWM)控制方法,指出各自的優(yōu)缺點(diǎn)及應(yīng)用,給出了一些數(shù)學(xué)
    發(fā)表于 07-06 13:33 ?1.3w次閱讀
    SPWM調(diào)制方法<b class='flag-5'>對(duì)比分析</b>

    小型PLC對(duì)比分析

    小型PLC對(duì)比分析.
    發(fā)表于 04-27 15:43 ?71次下載
    小型PLC<b class='flag-5'>對(duì)比分析</b>

    基于GPUCPU標(biāo)準(zhǔn)配置架構(gòu)介紹

    Intel的新一代架構(gòu)Sandy Bridge將于明年初開始大規(guī)模出貨,而且新架構(gòu)除了帶來CPU性能的大幅提升外,還將帶來CPUGPU的首
    發(fā)表于 09-19 16:14 ?10次下載

    CPU主頻是多少

    一般而言目前主流的CPU產(chǎn)品的主頻都在3.0GHz左右,一般同一個(gè)核心架構(gòu)CPU產(chǎn)品主頻越高,性能表現(xiàn)越出色。
    發(fā)表于 05-13 09:31 ?1.3w次閱讀