精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

介紹Armv9.5-A中Arm架構的最新特性

冬至子 ? 來源:Martin Weidmann ? 作者:Martin Weidmann ? 2023-10-11 09:44 ? 次閱讀

隨著人工智能AI)的崛起和安全威脅加劇,計算的需求持續加強。因此,世界上各種設備核心的基礎計算架構的持續演進顯得尤為重要。這就是為什么我們的工程團隊向Arm架構中添加新的功能和技術,然后軟件團隊確保軟件盡可能無縫地利用這些未來的功能和技術。

Arm架構是怎樣開發的

Arm每年發布對Arm指令集架構(ISA)的更新,這些更新是與Arm生態系統的多樣化合作伙伴共同創建的。該過程涉及芯片合作伙伴、操作系統供應商和OEMs、Arm的內部工程團隊和標準制定機構。

經過嚴格規劃的ISA可以確保軟件在新舊硬件上繼續工作很多年。Arm與Linaro以及其他眾多合作伙伴緊密合作,以便最廣泛使用的軟件上游社區(例如Linux內核和發行版)可以利用Arm ISA,以幫助提供全球最廣泛的開發者生態系統。

每年九月,我們發布一篇博客,討論當年A-Profile架構的關鍵更新。然后我們通過開發者網頁發布完整的指令集和系統寄存器文檔。

完整的Arm架構參考手冊(Arm ARM)也每年更新一次。預計將在2024年初發布包含2023擴展的更新。在2023年和2024年,“Learn the Architecture”頁面也將更新。

Architecture 2023 image 1.png

發布博客和文檔只是部署新架構的第一步。下一步我們將和生態系統伙伴合作,確保一旦硬件可用,開源軟件就能立即利用這一功能。

2023年,Arm引入新功能,以支持我們持續關注的人工智能(AI)、機器學習(ML)和安全性。讓安全的AI無處不在是Arm架構的關鍵優先任務,神經網絡(NNs)的訓練對AI的持續發展和進步至關重要。這就是為什么2023年的架構擴展包括FP8的新8位浮點格式的支持,此格式已在NNs中迅速被采納。在安全性方面,我們正在添加Checked Pointer Arithmetic,該功能基于Arm Memory Tagging Extension (MTE),允許開發人員快速檢測內存安全性違規,從而在應用開發過程中節省成本和時間。

之前對A-Profile架構的更新的詳細信息可以在這里找到:2014、2015、2016、2017、2018、2019、2020、2021和2022。

讓我們看看今年增加了哪些新功能。

Floating Point 8 (FP8)

2022年,Arm、Intel 和 Nvidia 宣布了他們在FP8上的合作,這是一個交換格式,允許軟件生態系統輕松地共享NN模型,并支持AI計算能力的持續進步。作為2023年擴展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了對FP8的支持。

FP8支持兩種數據格式:E5M2 和 E4M3。這兩種格式在精度和范圍之間提供了不同的權衡。
image.png

由FPMR寄存器控制選擇使用那種格式。可以為一條指令的不同輸入選擇不同的格式,從而有效地處理不同格式的數據集。我們堅信,行業共創的FP8帶來的好處,使開發者能夠集中精力在真正重要的創新和差異化上。我們很興奮地看到FP8如何推動未來的AI發展.

實時遷移

實時遷移是將虛擬機(VM)從一個主機移動到另一個主機的過程,同時保留其可用性和狀態。高效的實時遷移支持是大規模數據中心管理的重要工具。

image.png

為了實現實時遷移,hypervisor需要在VM仍在舊主機上運行時將頁面復制到新主機。這通常需要一個迭代過程,因為VM可能會“弄臟”已經被復制的頁面。解決這個問題有不同的方法,但它們都必須面對三個挑戰:

記錄(Recording):創建VM寫入(弄臟)的頁面的記錄。
調查(Surveying):處理記錄,以確定哪些頁面需要重新復制。
清理(Cleaning):在每次迭代上重置記錄機制。

2023年的擴展引入了新特性,幫助優化這三個過程。

FEAT_HDBSS增加了記錄被弄臟的stage 2頁面或塊日志的能力。這種機制減少了記錄成本,因為內存管理單元(MMU)可以有效地創建日志,而不中斷VM的執行。該日志還減少了調查成本,因為生成的數據是hypervisor可以高效使用的格式。

image.png

為了解決清理成本,FEAT_HACDBS為清理 stage 2頁表中的臟狀態增加了一個加速器。該引擎使用臟頁面的日志來定位需要更新的stage 2頁表描述符。

這些特性一起為實時遷移帶來顯著的性能和效率提升。

Checked Pointer Arithmetic 檢驗過的指針運算

AArch64支持的特性可以重新利用保存地址的寄存器的高位。例如,Armv8.0-A中引入的Tagged Pointers和Armv8.5-A中引入的MTE。

軟件經常需要操作指針,例如給基址加上一個偏移量。這通常使用常規的算術操作來完成,如加或減。地址計算上的溢出可能導致非地址位被損壞。例如,如果正在使用MTE,地址操作可能導致存儲在指針中的MTE Tag被更改。損壞的MTE Tag可能導致處理器無法檢測到內存安全違規,如下所示:

image.png

2023年的擴展引入了專門用于操作指針的新指令。這些指令包含多個指針特定的檢查,包括檢查bits[63:56]是否被修改,并防止溢出。尋址模式的加載和存儲指令也可以被配置為保留bits[63:56]。

取之前的MTE例子,新的特性允許處理器檢測指針的前8位是否已經被修改。這意味著,如果MTE標簽被損壞,它將被報告回到軟件中。

其他功能

2023年擴展部分引入的其他增強功能包括:

  • 支持使用PC(程序計數器)和SP(當前選擇的堆棧指針)的組合作為生成或檢查指針認證代碼時的modifier 。
  • 支持具備Realm Management Extension (RME) 的設計,在Granule Protection Tables中支持non secure only,并具有禁用某些Physical Address Spaces (PAS)的能力。
  • EL3配置寫入陷阱。
  • 斷點支持地址范圍和mismatch觸發,而無需鏈接。
  • 支持從EL3有效地將SErrors委托給EL2或EL1。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 寄存器
    +關注

    關注

    31

    文章

    5250

    瀏覽量

    119177
  • 神經網絡
    +關注

    關注

    42

    文章

    4717

    瀏覽量

    99971
  • 人工智能
    +關注

    關注

    1787

    文章

    46024

    瀏覽量

    234850
  • 機器學習
    +關注

    關注

    66

    文章

    8306

    瀏覽量

    131831
  • ARM架構
    +關注

    關注

    14

    文章

    175

    瀏覽量

    36176
收藏 人收藏

    評論

    相關推薦

    Arm推出AI優化的Arm終端CSS以及新的Arm Kleidi軟件

    Arm 終端計算子系統 (CSS) 作為新的計算解決方案,結合了 Armv9 架構的優勢,以及基于三納米工藝節點,經過驗證和證實為生產就緒的新 Arm CPU 和 GPU 實現,可賦能
    的頭像 發表于 05-30 11:33 ?478次閱讀
    <b class='flag-5'>Arm</b>推出AI優化的<b class='flag-5'>Arm</b>終端CSS以及新的<b class='flag-5'>Arm</b> Kleidi軟件

    移動端芯片性能提升,Armv9架構新升級引發關注

    “數碼博主”5月17日的最新爆料指出,聯發科積極推進Armv9新一代IP BLACKHAWK“黑鷹”的架構設計,預計天璣9400芯片將采用這一架構,有望以“全大核”設計再度領跑移動SoC CPU性能榜單。
    的頭像 發表于 05-17 16:51 ?776次閱讀

    英特爾與Arm聯手助力初創企業開發Arm架構SoC

    介紹,此次合作旨在聯合推動使用Intel 18A制程工藝研發Arm架構SoC的初創企業發展。英特爾和Arm將攜手提供IP和制造及相關金融支
    的頭像 發表于 03-25 15:34 ?278次閱讀

    Arm Helium技術誕生的由來 為何不直接采用Neon?

    經過 Arm 研究團隊多年的不懈努力,Arm 于 2019 年推出了適用于 Armv8?M 架構Arm Cortex-M 矢量擴展技術
    的頭像 發表于 02-29 17:01 ?1592次閱讀
    <b class='flag-5'>Arm</b> Helium技術誕生的由來 為何不直接采用Neon?

    arm架構和x86架構區別 linux是x86還是arm

    ARM架構和x86架構是兩種不同的計算機處理器架構,它們在體系結構、指令集、應用領域等方面有著明顯的區別。Linux操作系統則具有廣泛的適配性,可以運行在各種
    的頭像 發表于 01-30 13:46 ?1.4w次閱讀

    如何克服Amdahl定律的影響呢?

    在前幾篇文章,我們介紹了采用 Arm Helium 技術(也稱為 MVE)的 Armv8.1-M 架構如何處理矢量指令。
    的頭像 發表于 01-12 14:30 ?582次閱讀
    如何克服Amdahl定律的影響呢?

    u-boot armv8鏈接腳本

    armv8,u-boot使用arch/arm/cpu/armv8/u-boot.lds進行鏈接。 u-boot-spl和u-boot-tpl使用arch/
    的頭像 發表于 12-07 11:19 ?441次閱讀

    armv8 u-boot的啟動介紹

    先看arm官網提供的一張圖: 上圖詳細概括了arm官方推薦的armv8的啟動層次結構: 官方將啟動分為了BL1,BL2,BL31,BL32,BL33階段,根據順序,芯片啟動后首先執行BL1階段代碼
    的頭像 發表于 12-07 11:09 ?1385次閱讀
    <b class='flag-5'>armv</b>8 u-boot的啟動<b class='flag-5'>介紹</b>

    Arm架構在5G商用的優勢與挑戰

    Arm架構還能解決5G推廣面臨的高能耗問題。Arm最新推出的輕量化5G端側協議,能夠很好地推動5G模組走向高性能、低功耗、低成本的市場趨勢。這也是
    發表于 12-04 14:57 ?389次閱讀

    Arm最新處理器架構分析—X4、A720和A520

    上一篇文章我們介紹Arm的Cortex-X1至Cortex-X3系列處理器,2023年的5月底,Arm如期發布了新一年的處理器架構
    的頭像 發表于 11-29 11:47 ?3813次閱讀
    <b class='flag-5'>Arm</b>最新處理器<b class='flag-5'>架構</b>分析—X4、<b class='flag-5'>A</b>720和<b class='flag-5'>A</b>520

    Arm架構學習—開啟Armv9時代

    在上一篇文章“從A76到A78——在變化中學習Arm架構,我們了解了Arm處理器微
    的頭像 發表于 11-27 16:46 ?923次閱讀
    <b class='flag-5'>Arm</b>微<b class='flag-5'>架構</b>學習—開啟<b class='flag-5'>Armv</b>9時代

    ARM處理器Trusted Firmware-M架構

    例,如果是A系列的處理器則有Trusted Firmware-A可供參考。 架構 首先先來看Trusted Firmware-M的構架: Figure 1: FF-M compliant design with TF-M Tru
    的頭像 發表于 11-02 16:06 ?648次閱讀
    <b class='flag-5'>ARM</b>處理器Trusted Firmware-M<b class='flag-5'>架構</b>

    cortexM3和armv7m到底哪個是內核哪個是架構

    cortexM3和armv7m到底哪個是內核,哪個是架構?他們有什么關系啊
    發表于 11-02 06:15

    AMD計劃生產基于Arm架構的CPU

    英偉達已經開始設計基于 Arm 架構的 CPU。該處理器將運行微軟 Windows 操作系統。此外,AMD 也計劃生產基于 Arm 架構的 CPU。
    的頭像 發表于 10-27 10:53 ?943次閱讀

    armv7 generic timer使用筆記

    armv7-A架構每個CPU核心都包含自己的私有定時器,所有cpu的定時器共享一個System counter, System counter負責產生計數,傳遞到每個核心的私有定時器
    的頭像 發表于 09-27 15:10 ?2092次閱讀
    <b class='flag-5'>armv</b>7 generic timer使用筆記