鯤鵬處理器基于Arm架構。Arm是一種CPU架構,有別于Intel、AMD CPU采用的CISC復雜指令集,Arm CPU采用RISC精簡指令集(精簡指令集計算機)。更多內容參考“華為鯤鵬處理器介紹”、“鯤鵬計算產業發展白皮書”和“華為鯤鵬生態研究框架”。 推薦閱讀:?1、?華為鯤鵬處理器介紹 2、2023「企業智能分析與決策」實踐合集
1、鯤鵬處理器的組織
Chip:芯片(Chip)是指有大規模集成電路的硅片,我們見過的CPU這種是最常見的芯片。一般幾塊硅片可以封裝在一起組成一個芯片。
DIE:芯片的最小物理單元。Kunpeng 920封裝了3個DIE,兩個用來做計算,第三個用來做IO。
晶粒(die)是以半導體材料制作而成未經封裝的一小塊集成電路本體,該集成電路的既定功能就是在這一小片半導體上實現。通常情況下,集成電路是以大批方式,經光刻等多項步驟,制作在大片的半導體晶圓,然后再分割成方型小片,這一小片就稱為晶粒,每個晶粒就是一個集成電路的復制品。
Core:真正的計算單元,我們在操作系統側看到的“核”。
Cluster:若干個核(core)的集合。Kunpeng 920把4個core集合成為一個cluster,而一個DIE上有8個cluster。
SoC: System on chip,例如,Kunpeng 920除了CPu外,還集成了RoCE 網卡、SAS控制器和南橋。 SoC可以理解為一個芯片集成了一個系統,可以完成特定的一系列的工作,例如,CPU是大腦,SoC是不僅有大腦,還有手、腳、身體等等,這些手腳就相當于,GPU,網卡處理器,聲卡處理器等。
2、Kunpeng 920芯片的架構
1片SoC上包含3個DIE,2個計算DIE,1個IO DIE。 1個計算DIE中8個Cluster。 1個Cluster中4個Core。 因此一個kunpeng 920芯片中包含4*8*2=64個核。 計算DIE上的每一個core具有自己的L1和L2級Cache,所有的core共享L3級Cache。 IO DIE上集成有網絡模塊、PCle模塊。 這些DIE在芯片內部通過高速內部總線進行連接。
3、芯片架構的系統安全&IMU
系統安全:支持安全啟動,以及保證系統在可信環境內運行的一套軟硬件方案。該方案由Secure Boot技術和ARM架構中的Trust Zone技術結合而成。 IMU ( lntelligent Management Unit )是Hi162x芯片內部的智能管理單元,完善ARM節點在數據中心的管理和控制,未來數據中心設備管理要求統一、智能和協同,遵循管理系統集中決策+節點執行監控,按照設備節點模型統一管理。 IMU作為數據中心的管理末端,協同BMC,完成數據中心的節點執行監控。 IMU可以覆蓋的功能:RA5故障預處理以及錯誤記錄上報、安全信任根、能效管理、芯片內部管理。
4、Kunpeng 920的其他子系統
鯤鵬處理器包含計算、存儲、設備IO、中斷以及虛擬化等子系統。 鯤鵬920含有兩個CPU DIE、一個IO DIE、以及共8組DDR4channel,它們通過AMBA(Advanced MicrocontrollerBus Architecture)總線互聯。
5、Kunpeng 920的IO子系統
鯤鵬處理器和IO子系統通過IO DIE進行擴展,支持soC片上加速器,如100G網卡、SAS控制器等。鯤鵬處理器同時支持基于PCle 4.0的設備擴展,可支持網卡、GPu等板卡。 為了方便軟件編程,內部SoC上的高速設備也基于PCle,且可以通過PCle的配置空間進行配置。 各子系統 PCIE(含CCIX ),Hydra(多片互聯),Network,Storage,HAC,ME,各自遵循行業標準,兼容軟件接口規范,滿足開源及演進要求。
6、Kunpeng 920的中斷子系統
1.在兼容ARM GIC規范的基礎上,實現了線中斷、消息中斷支持。 (1)GlC ( Generic Interrupt Controller)指Arm定義的通用中斷控制器。也是當前的芯片系統基于GIC規范提出的一種全局中斷管理架構,它主要包括如下功能:
使能、禁用、選擇所有的SGI、PPI、SPI以及LPI。
支持將輸入的中斷路由到任一指定的CPU內核。
支持中斷優先級配置。
支持Arm AArch64安全化擴展。
持Arm AArch64虛擬化擴展。
(2)gicv3中,引入了消息中斷,并且為之支持了LPI。分配了大量的中斷號,用于LPIo對于LPI的實現,有2種方式,一種是訪問redistributor提供的寄存器,一種是使用ITS。 (3)ITS( Hyper Interrupt Translation Service)功能是提供LPI中斷重定向服務,將LPI中斷路由到不同的CPU內核,其中中斷和CPU內核的路由關系支持動態配置。 (4)LPI(Locality-specific Peripheral Interrupt):基于message的中斷。 2.鯤鵬處理器引入中斷收集再分發的概念。 3.鯤鵬920上還實現了華為公司的MBIGEN(message based interrupt generator)技術。
7、Kunpeng 920的網絡子系統
1、網絡子系統包括Network ICL和RoCE引擎兩大部分。 2、Network lCL包括多個1Gbps~100Gbps以太網控制器,二層DCB、MAC地址表,多播表,VLAN過濾表,流表,中斷,PCle化,具有完整的NIC引擎,可以在RoCE引擎關閉的情況下單獨工作。 3、RoCE(RDMA over Converge Ethernet)是一種在以太網上采用RDMA(RemoteDirect Memory Access,遠程直接內存訪問)的網絡互聯技術。 4、華為鯤鵬920處理器使用的RoCE v2協議是由InfiniBand(IB)協議演進而來,既具有lnfiniBand網絡的低時延、低CPU利用率等特點,又能夠很好地兼容于Ethernet網絡。
8、Kunpeng 920的SAS子系統
1、提供2個X8 SAS 3.0控制器 (1)SAS(Serial Attached SCSI)即串行SCSI技術,一種磁盤連接技術。SAS控制器用于磁盤與內存之間進行交互。 (2)SAS控制器主要通過總線與CPU和內存進行交互,同時通過SERDES與硬盤進行連接。 (3)SAS控制器與設備連接方式有兩種:直連和Expander連接。
直連表示SAS控制器的PHY與設備直接連接,不經過中間轉換或擴展;.
Expander連接表示SAS控制器與設備之間通過擴展器進行連接
2、支持SAS 3.0,向下兼容SAS2.0和SAS1.0;支持SATA3.0,向下兼容SATA2.0和SATA1.0;SAS支持12G/6G/3G/1.5G四種速率,SATA支持6G/3G/1.5G速率,同時可以實現速率的自協商。 3、可以直接不經過Expander最大連接8個SAS盤或者SATA盤,兩者可以混插; SAS盤分為SAS機械盤和SAS SSD盤,SAS盤是為滿足高性能、高可靠性而設計,在內部驅動電機的可靠性、轉速以及基板方面都與SATA盤有差異。 4、可以連接SAS Expander擴展更多磁盤。提供1個X2 SATA控制器; 5、支持SATA 3.0,向下兼容SATA 2.5;支持AHCI1.3,向下兼容AHCI 1.2;支持6G/3G/1.5G速率自協商; 6、支持直連兩個SATA盤。 7、支持NOR Flash控制器,4個片選,NOR FLASH最大支持512K。 8、支持SPI Flash控制器,2個片選,SPI Flash最大支持32M。 9、支持NAND FLASH接口,4個片選。
9、Kunpeng 920的PCle子系統
1、支持PCle GEN1/2/3/4.0
Run at the 2.5G/5G/8G/16G。
x16 PCle控制器
嵌入式DMA引擎
PCle是一種高性能、通用的I/O互連接口,適用于各種計算和通信平臺。鯤鵬920PCle子系統提供了實現PCle根聯合體(Root Complex,RC)或端點(Endpoint,EP)應用程序的解決方案。 2、最多支持40個PCle Lane
3 PCle控制器
提供了實現PCIe根聯合體或端點應用程序的解決方案
鯤鵬920 PCle子系統包含3個PCle Core,最多支持40個PCle Lane。每個PCle Core包括多個PCle端口。PCle Core0共享16個Lane。PCle Core1共享16個Lane。PCle Core2共享8個Lane。3個PCle Core均可作為根端口(Root Port,RP)使用。只有PCle Core1能作為EP端口。 3、硬件特性:SRIS(Separate Refclk Independent ssc)支持SR-IOv 4、支持共享虛擬內存 5、支持CCIX 6、支持P2P(Peer to Peer)。不同控制器之間的對等流量
審核編輯 :李倩
-
處理器
+關注
關注
68文章
18927瀏覽量
227230 -
集成電路
+關注
關注
5366文章
11162瀏覽量
358375 -
半導體材料
+關注
關注
11文章
493瀏覽量
29370 -
芯片架構
+關注
關注
1文章
30瀏覽量
14537
原文標題:Kunpeng處理器組織及芯片架構
文章出處:【微信號:架構師技術聯盟,微信公眾號:架構師技術聯盟】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論