隨著嵌入式技術應用領域的不斷擴展,對嵌入式系統(tǒng)的要求越來越高,而作為嵌入式系統(tǒng)核心的微處理器也面臨日益嚴竣的挑戰(zhàn)。ARM公司從成立以來,一直以知識產權(IP,Intelligence Property)提供者的身份出售知識產權,在32位RISC CPU開發(fā)領域中不斷取得突破,其設計的微處理器結構已經從v3發(fā)展到現(xiàn)在的v7。Cortex系列處理器是基于ARMv7架構的,分為Cortex-M、Cortex-R和Cortex-A三類。ARM系列微處理器的核心及體系結構如表1所列。
?????
?
??? 1 ARM Cortex處理器技術特點
??? ARMv7架構是在ARMv6架構的基礎上誕生的。該架構采用了Thumb-2技術,它是在ARM的Thumb代碼壓縮技術的基礎上發(fā)展起來的,并且保持了對現(xiàn)存ARM解決方案的完整的代碼兼容性。Thumb-2技術比純32位代碼少使用31%的內存,減小了系統(tǒng)開銷。同時能夠提供比已有的基于Thumb技術的解決方案高出38%的性能。ARMv7架構還采用了NEON技術,將DSP和媒體處理能力提高了近4倍,并支持改良的浮點運算,滿足下一代3D圖形、游戲物理應用以及傳統(tǒng)嵌入式控制應用的需求。此外,ARMv7還支持改良的運行環(huán)境,以迎合不斷增加的JIT(Just In Time)和DAC(DynamicAdaptive Compilation)技術的使用。
??? 在與早期的ARM處理器軟件兼容性方面,ARMv7架構在設計時充分考慮到了。ARM Cortex-M系列支持Thumb-2指令集(Thumb指令集的擴展集),可以執(zhí)行所有已存的為早期處理器編寫的代碼。通過一個前向的轉換方式,為ARM Cortex-M系列處理器所寫的用戶代碼可以與ARM Cortex-R系列微處理器完全兼容。ARMCortex-M系列系統(tǒng)代碼(如實時操作系統(tǒng))可以很容易地移植到基于ARM Cortex-R系列的系統(tǒng)上。ARMCortex-A和Cortex-R系列處理器還支持ARM 32位指令集,向后完全兼容早期的ARM處理器,包括從1995年發(fā)布的ARM7TDMI處理器到2002年發(fā)布的ARMll處理器系列。圖1為v5~v7架構的處理器技術比較。由于應用領域的不同,基于v7架構的Cortex處理器系列所采用的技術也不相同。?
????
??? 在命名方式上,基于ARMv7架構的ARM處理器已經不再延用過去的數(shù)字命名方式,而是冠以Cortex的代號。基于v7A的稱為"Cortex-A系列",基于v7R的稱為"Cortex-R系列",基于v7M的稱為"Cortex-M3"。
??? 2 ARM Cortex-M3處理器技術特點
??? ARM Cortex-M3處理器是為存儲器和處理器的尺寸對產品成本影響極大的各種應用專門開發(fā)設計的,其結構如圖2所示。它整合了多種技術,減少使用內存,并在極小的RISC內核上提供低功耗和高性能,可實現(xiàn)由以往的代碼向32位微控制器的快速移植。ARM Cortex-M3處理器是使用最少門數(shù)的ARM CPU,相對于過去的設計大大減小了芯片面積,可減小裝置的體積或采用更低成本的工藝進行生產,僅33 000門的內核性能可達1.2DMIPS/MHz。此外,基本系統(tǒng)外設還具備高度集成化特點,集成了許多緊耦合系統(tǒng)外設,合理利用了芯片空間,使系統(tǒng)滿足下一代產品的控制需求。
????
?
??? ARM Cortex-M3處理器結合了執(zhí)行Thumb-2指令的32位哈佛微體系結構和系統(tǒng)外設,包括Nested Vec-tored Interrupt Controller和Arbiter總線。該技術方案在測試和實例應用中表現(xiàn)出較高的性能:在臺機電180 nm工藝下,芯片性能達1.2 DMIPS/MHz,時鐘頻率高達100 MHz。Cortex-M3處理器還實現(xiàn)了Tail-Chaining中斷技術。該技術是一項完全基于硬件的中斷處理技術,最多可減少12個時鐘周期數(shù),在實際應用中可減少70%中斷;推出了新的單線調試技術,避免使用多引腳進行JTAG調試,并全面支持RealView編譯器和RealView調試產品。RealView工具向設計者提供模擬、創(chuàng)建虛擬模型、編譯軟件、調試、驗證和測試基于ARMv7架構的系統(tǒng)等功能。 為微控制器應用而開發(fā)的Cortex-M3擁有以下性能:
??? 實現(xiàn)單周期Flash應用最優(yōu)化;
??? 準確快速地中斷處理,永不超過12周期,僅6周期tail-chaining(末尾連鎖);
??? 有低功耗時鐘門控(Clock Cating)的3種睡眠模式;
??? 單周期乘法和乘法累加指令;
??? ARM Thumb-2混合的16/32位同有指令集,無模式轉換;
??? 包括數(shù)據觀察點和Flash補丁在內的高級調試功能;
??? 原子位操作,在一個單一指令中讀取/修改/編寫;
??? 1.25 DMIPS/MHz(與O.9DMIPS/MHz的ARM7和1.1 DMIPS/MHz的ARM9相比)。
??? 3 ARM Cortex-R處理器技術特點
??? ARM Cortex-R系列處理器目前包括ARM Cortex-R4和ARM Cortex-R4F兩個型號,主要適用于實時系統(tǒng)的嵌入式處理器。
??? 3.1 ARM Cortex-R4處理器技術特點
??? Cortex-R4處理器結構如圖3所示。該處理器支持手機、硬盤、打印機及汽車電子設計,能協(xié)助新一代嵌入式產品快速執(zhí)行各種復雜的控制算法與實時工作的運算;可通過內存保護單元(MPU,Memory Protection Unit)、高速緩存以及緊密耦合內存(TCM,Tightly Coupled Memory)讓處理器針對各種不同的嵌入式應用進行最佳化調整,且不影響基本的ARM指令集兼容性。這種設計能夠在延用原有程序代碼的情況下,降低系統(tǒng)的成本與復雜度,同時其緊密耦合內存功能也能提供更小的規(guī)格及更高效率的整合,并帶來快速的響應時間。
????
?
??? Cortex-R4處理器采用ARMv7體系結構,讓它能與現(xiàn)有的程序維持完全的回溯兼容性,能支持現(xiàn)今建立在全球各地數(shù)十億的系統(tǒng);并已針對Thumb-2指令進行最佳化設計。此項特性帶來很多的利益,其中包括:更低的時鐘速度所帶來的省電效益;更高的性能將各種多功能特色帶人移動電話與汽車產品的設計;更復雜的算法支持更高性能的數(shù)碼影像與內建硬盤的系統(tǒng)。運用Thumb-2指令集,加上RealView開發(fā)套件,使芯片內部存儲器的容量最多得以降低30%,大幅降低系統(tǒng)成本,其速度比在ARM946E-S處理器所使用的Thumb指令集高出40%。由于存儲器在芯片中的占用空間愈來愈多,因此這項設計將大幅節(jié)省芯片容量,讓芯片制造商運用這款處理器開發(fā)各種SoC(System on a Chip)器件。相比于前幾代的處理器,Cortex-R4處理器高效率的設計方案,使其能以更低的時鐘達到更高的性能;經過最佳化設計的Artisan Metro內存,則進一步降低嵌入式系統(tǒng)的體積與成本。處理器搭載一個先進的微架構,具備雙指令發(fā)送功能,采用90 nm工藝并搭配Artisan Advantage程序庫的組件,底面積不到1 mm2,耗電量低于0.27mW/MHz,并能提供超過600 DMIPS的性能。
??? Cortex-R4處理器在各種安全應用上加入容錯功能和內存保護機制,支持最新版OSEK實時操作系統(tǒng);支持RealView Develop系列軟件開發(fā)工具、RealView Create系列ESL工具與模塊,以及Core Sight除錯與追蹤技術,協(xié)助設計者迅速開發(fā)各種嵌入式系統(tǒng)。
??? 3.2 ARM Cortex-R4F處理器技術特點
??? Cortex-R4F處理器結構如圖4所示。該處理器擁有針對汽車市場而開發(fā)的各項先進功能,包括自動除錯功能、可相互連結的錯誤偵測機制,以及可選擇優(yōu)化的浮點運算單元(FPU,Floating-Point Unit)。ECC技術能監(jiān)控內存存取作業(yè),偵測并校正各種錯誤。當發(fā)生內存錯誤時,ECC邏輯除通報錯誤并停止系統(tǒng)運作外,還會加以校正。它還擁有Cortex-R4系列的各項先進功能,能夠透過高效能內存保護單元、高速緩存,以及緊密耦合內存,使處理器能針對各種不同的應用進行最佳化調整;同時將傳統(tǒng)處理器中的錯誤偵測功能延伸至整個SoC中,系統(tǒng)會不斷地掃描先前偵錯的資料,以提升系統(tǒng)的可靠度。基于對安全性能的重視,Cortex-R4F處理器特別搭載了高分辨率內存保護機制,能嚴密控制獨立的軟件作業(yè)。
??? Cortex-R4F處理器中執(zhí)行浮點運算的FPU,提供勝過固定小數(shù)點操作數(shù)的動態(tài)范圍及精準度。該FPU與ARM其他處理器核心之間的FPU均維持回溯兼容性,并針對各種汽車應用常見的單精度處理作業(yè)進行優(yōu)化。使用單倍精度格式,而非雙倍精度的數(shù)值資料,不僅能將數(shù)據處理速度提升至2倍,更能維持必要的精度以提高SoC設計的效率。
??? Cortex-R4F處理器采用一套具備雙指令發(fā)送功能的先進微架構,透過ARM Artisan Advantage程序庫中針對90 nm工藝的優(yōu)化,達到超過800 DMIPS的性能水準。Level 1內存松散的時序設計,使組件能使用高密度、低功耗的RAM,使在總成本中占有高比重的內存,能像處理器邏輯一樣擁有節(jié)省空間的優(yōu)勢。在90 nm工藝下,占用空間不到1 mm2,且耗電量不到0.27 mW/MHz,有效地協(xié)助系統(tǒng)開發(fā)者降低成本與功耗。該處理器采用ARMv7ISA架構,能與已被全球數(shù)十億臺系統(tǒng)所采用的ARM程序代碼維持回溯兼容性,并針對Thumb-2指令集進行最優(yōu)化設計。運用Thumb-2指令,搭配ARM RealView開發(fā)套件,使芯片內部存儲器的容量最大能縮減30%,大幅降低系統(tǒng)成本。此外,相較于內建在ARM946E-S處理器的舊版Thumb指令集,新技術能夠提高40%的工作效能。
????
??? 4 ARM Cortex-A8處理器技術特點
??? ARM Cortex-A8處理器是一款適用于復雜操作系統(tǒng)及用戶應用的應用處理器,其結構如圖5所示。支持智能能源管理(IEM,Intelligent Energy Manger)技術的ARM Artisan庫以及先進的泄漏控制技術,使得Cortex-A8處理器實現(xiàn)了非凡的速度和功耗效率。在65 nm上藝下,ARM cortex-A8處理器的功耗不到300 mW,能夠提供高性能和低功耗。它第一次為低費用、高容量的產品帶來了臺式機級別的性能。
??? ortex-A8處理器是第一款基于下一代ARMv7架構的應用處理器,使用了能夠帶來更高性能、更低功耗和更高代碼密度的Thumb-2技術。它首次采用了強大的NEON信號處理擴展集,為H.264和MP3等媒體編解碼提供加速。Cortex-A8的解決方案還包括Jazelle-RCTJava加速技術,對實時(JIT)和動態(tài)調整編譯(DAC)提供最優(yōu)化,同時減少內存占用空間高達3倍。該處理器配置了先進的超標量體系結構流水線,能夠同時執(zhí)行多條指令,并且提供超過2.0 DMIPS/MHz的性能。處理器集成了一個可調尺寸的二級高速緩沖存儲器,能夠同高速的16 KB或者32 KB一級高速緩沖存儲器一起工作,從而達到最快的讀取速度和最大的吞吐量。新處理器還配置了用于安全交易和數(shù)字版權管理的Trust Zone技術,以及實現(xiàn)低功耗管理的IEM功能。
??? Cortex-A8處理器使用了先進的分支預測技術,并且具有專用的NEON整型和浮點型流水線進行媒體和信號處理。在使用小于4 mm2的硅片及低功耗的65 nm工藝的情況下,Cortex-A8處理器的運行頻率將高于600MHz(不包括NEON追蹤技術和二級高速緩沖存儲器)。在高性能的90 nm和65 nm工藝下,Cortex-A8處理器運行頻率最高可達1 GHz,能夠滿足高性能消費產品設計的需要。
????
評論
查看更多