精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ntel I9的多核scalability是真的嗎

Linux閱碼場 ? 來源:Linux閱碼場 ? 作者:宋寶華 ? 2021-10-20 11:25 ? 次閱讀

昨天我們用Intel I9的10核,每個核2個threads的機器跑了內核的編譯:

超線程SMT究竟可以快多少?

今天,我換一臺機器,采用AMD Ryzen。

默認情況16核,每個核2個threads,共32個CPUs:

8d9e0e28-3101-11ec-82a8-dac502259ad0.png

下面編譯內核:

8df6755e-3101-11ec-82a8-dac502259ad0.png

大約需要53秒。記得昨天用Intel I9 10核20線程需要2分鐘30秒左右。

再來一遍:

8e5dca56-3101-11ec-82a8-dac502259ad0.png

這說明make clean, drop_caches后時間也差不多。51秒,53秒左右的正常抖動范圍。

現在我們關閉smt,只保留16個CPU:

8eda8b0e-3101-11ec-82a8-dac502259ad0.png

具體的關閉方法就是:

sudo sh -c ‘echo off 》 /sys/devices/system/cpu/smt/control’

這樣只剩下16個CPU,下面來編譯:

8f52ff44-3101-11ec-82a8-dac502259ad0.png

時間57秒,相對于51、53秒,速度下降不到10%。

這說明超線程SMT對編譯內核這個workload的性能的提升絕對沒有達到100%,甚至都沒有達到10%。

我們現在重新開啟超線程:

sudo sh -c ‘echo on 》 /sys/devices/system/cpu/smt/control

看一下哪個CPU和哪個CPU是thread sibling:

8fd104d4-3101-11ec-82a8-dac502259ad0.png

看起來CPU0和CPU16是一對,CPU1和CPU17是一對,依次類推。

剛才我們關閉SMT是把CPU16-CPU31全關了,只留下每對里面的1個CPU,也就是留下了CPU0-CPU15。

在開啟SMT的時候(假設藍色和紅色是一個CORE里面的兩個CPU):

9085d2f6-3101-11ec-82a8-dac502259ad0.png

在關閉SMT的時候,等于每對里面只留1個CPU:

現在我們換一種關法,一對對關,只留下8對,也就是8個core:

指令如下:

918b663e-3101-11ec-82a8-dac502259ad0.png

實現效果如下:

92315648-3101-11ec-82a8-dac502259ad0.png

再重新編譯內核:

926acc0c-3101-11ec-82a8-dac502259ad0.png

現在耗時是1分21秒,相對于所有CPU全開,下降了很多,時間增大了59%,當然沒有達到2倍。

再想想昨天的Intel I9,關閉5個完整核耗時是3分10秒,全開10核是2分30秒,Intel一半核工作和所有核同時工作的差距遠不如AMD那么明顯。

所以可以看出,就內核編譯這個workload而言,AMD的16core相對于8core,性能的scale會更加成正比。當然AMD開關SMT,對內核編譯這個workload而言,影響小于10%,而Intel I9的影響有14%。

很多童鞋昨天留言,說編譯內核有一定的IO bound,另外提到link階段是單線程,還有的童鞋說是Intel Turbo的影響,這些我們都認為是有一定道理的。但是,我始終堅信,profiling是檢驗猜想的唯一標準,后面有空再寫一篇文章來profiling一些究竟是為什么。

這到底是為什么?牙膏廠的多核scalability究竟是不是騙紙?還是按摩店的部分核沒有Intel部分核的威猛模式?「元芳,你怎么看?」

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5441

    瀏覽量

    133936
  • 內核
    +關注

    關注

    3

    文章

    1363

    瀏覽量

    40228
  • intel
    +關注

    關注

    19

    文章

    3480

    瀏覽量

    185750

原文標題:這到底是為什么?牙膏廠的多核scalability究竟是不是騙紙?還是按摩店的部分核沒有Intel部分核的威猛模式?「元芳,你怎么看?」

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    多核CPU的優勢是什么

    多核CPU(Central Processing Unit,中央處理器)作為現代計算機技術的重要里程碑,其優勢在于顯著提升了計算性能、多任務處理能力、系統穩定性以及能效比等多個方面。以下將詳細闡述多核CPU的幾大優勢,并結合相關數據和背景進行說明。
    的頭像 發表于 08-22 14:30 ?2115次閱讀

    Intel 13/14代i9 K系列處理器不穩定,部分用戶轉向AMD

    自年初以來,Intel的13代與14代酷睿i9 K系列處理器持續遭受不穩定性的困擾,這一狀況已引起廣泛用戶與業界的深切關注。盡管問題曝光已超過季度之久,Intel官方尚未能明確指出問題的核心
    的頭像 發表于 07-16 15:01 ?1035次閱讀

    求助,關于ESP32多核使用問題求解答

    關于esp32的多核使用,除了使用xTaskCreatePinnedToCore函數來控制線程跑的核心外能否有其他的實現比如: 現在有兩個bin文件,每個核心同時跑不同的bin文件,這種是否能夠實現。
    發表于 06-17 06:28

    TC3x多核使用與TC2x多核使用相比是否有任何限制?

    大家好,TC3x 多核使用與 TC2x 多核使用相比是否有任何限制? 舉例說明:TC3x 是否不允許在不同內核運行的代碼之間進行多內核共享數據交換?
    發表于 05-22 07:32

    risc-v多核芯片在AI方面的應用

    RISC-V多核芯片在AI方面的應用主要體現在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。 首先,RISC-V適合用于高效設計實現,其內核面積更小,功耗更低,使得它能
    發表于 04-28 09:20

    13代及14代酷睿i9系列高端CPU游戲崩潰問題引發關注

    4 月 10 日訊,亞馬遜 ZDNet Korea 報告指出,近期多名電腦用戶在采用英特爾第 13 和 14 代酷睿 i9 高端處理器玩游戲時遇到了崩潰現象,如萬代南夢宮游戲《鐵拳 8》PC 演示版雖然配備較大的內存和顯存,但仍無法避免頻繁崩潰。
    的頭像 發表于 04-10 10:08 ?2079次閱讀

    兆芯開先KX-7000處理器現身Geekbench,多核性能接近8代i5

     KX-7000在連續兩次百項基準測試中,取得單核最高得分824分,多核最高得分3813分的優異表現,多核性能與第八代酷睿i5旗鼓相當。
    的頭像 發表于 03-19 14:18 ?1140次閱讀

    英特爾酷睿i9-14900KS確認發售,預購價較i9-14900K上漲27%

    據報道,中國香港零售商 SE Computer已確定于3月14日推出英特爾酷睿i9-14900KS處理器,據悉已開啟預售,其預訂價格相較i9-14900K提升約27%。
    的頭像 發表于 03-10 11:24 ?1372次閱讀

    多核異構通信框架(RPMsg-Lite)

    概要 隨著科技的飛速發展,計算需求日益復雜和多樣化,傳統的單核處理器已難以滿足所有應用場景的需求。在這樣的背景下,異構多核系統應運而生,成為推動計算領域進步的重要力量。異構多核系統不僅提高了計算效率
    的頭像 發表于 03-08 18:20 ?4886次閱讀
    <b class='flag-5'>多核</b>異構通信框架(RPMsg-Lite)

    蘋果M3芯片和英特爾酷睿i9處理器哪個強

    蘋果M3芯片和英特爾酷睿i9處理器各有其優勢,難以簡單地說哪個更強。
    的頭像 發表于 03-08 15:29 ?6943次閱讀

    i.MX 9系列-啟動時間測量方法應用指南

    電子發燒友網站提供《i.MX 9系列-啟動時間測量方法應用指南.pdf》資料免費下載
    發表于 02-20 10:37 ?0次下載
    <b class='flag-5'>i</b>.MX <b class='flag-5'>9</b>系列-啟動時間測量方法應用指南

    什么是多核多線程?多核多線程如何提高程序的運行效率?

    單線程無法充分利用多核處理器的并行計算能力。
    的頭像 發表于 02-20 10:22 ?1269次閱讀

    TC397A如何多核調試?

    TC397的開發板,想試一下多核調試,請問有相關歷程或者文檔嗎,現在都默認一個核在跑
    發表于 02-19 08:08

    華碩天選5 Pro游戲本1月23日發布,搭載RTX4060獨顯,起售價8999元

    據華碩官方公布數據顯示,在 CineBench R20 測試中,天選 5 Pro 搭載的舊版酷睿 i9-13980HX 分數分別為單核 803分與多核 11,000分,而新版酷睿 i9-14900HX 的分數則為單核 841分與
    的頭像 發表于 01-18 10:20 ?8894次閱讀

    首發i9-14900HX 華碩天選5 Pro詳細評測報告

    簡單說來,i9-14900HX其實就是移動版的i9-14900K,它擁有8 P-Core和16 E-Core,共16核心24線程,32MB二級緩存和36MB三級緩存。
    發表于 01-11 11:16 ?5044次閱讀
    首發<b class='flag-5'>i9</b>-14900HX 華碩天選5 Pro詳細評測報告