隨著智能手機越來越普及,消費者在選購手機的時候也越來越理性化,除了關心價格和外觀之外,手機的性能也成為了人們最關心的因素,大家都知道, 處理器是影響手機性能的最關鍵的因素,像德州儀器、高通、英偉達以及三星等主流的處理器廠商,大家都已經耳熟能詳。但是很多人并不知道,其實它們采用的都 是同一個架構——ARM架構,實際上,處理器采用的架構才是影響處理器性能的關鍵因素。今天,筆者就和大家一起,聊一聊ARM的那些事。
ARM架構簡介
ARM(Advanced RISC Machine的縮寫)架構,被稱作進階精簡指令集機器,是一個32位精簡指令集(RISC)處理器架構,其廣泛地使用在許多嵌入式系統設計。由于低成本、高效能、低耗電的特性,ARM處理器非常適用于移動通訊領域。
為了大家更好的理解,我們不妨做個比喻,ARM架構就像是一座建筑的結構設計部分,而處理器就相當于一個完整的建筑,只有有了穩定的結構作為基 礎,才能建造出各式各樣的房子。換句話說,ARM架構只相當于一座建筑的框架,至于最后建造出來的房子長什么樣,舒適度如何,就是由處理器廠商自己決定 了。不過有一點需要說明,假如結構的設計值是十層,容納人數的上限是100人,那么最后建好的房子也不能超過這個上限。這也就是說,采用相同架構的處理 器,性能基本上已經鎖定在一定的范圍之內,不會有本質的區別。所以,看處理器的性能要先看架構。
ARM架構
ARM授權方式
ARM公司是一家知識產權供應商,本身并不參與終端處理器芯片的制造和銷售,而是通過向其它芯片廠商授權設計方案,來獲取收益。ARM提供了多 樣的授權方式,ARM公司可以向芯片廠商單純的轉讓設計方案的使用及銷售權,比如德州儀器,其旗下的OMAP處理器是在原始ARM架構的基礎上設計的,這 種方式費用一般比較低,所以,德州儀器的芯片售價也相對較低。
對于一些具備自有設計技術的客戶,他們希望能對原始的ARM架構進行優化,以便更好的適應到自己研發的芯片,這樣就會牽扯到授權架構修改的費 用,而且這項費用也是相當昂貴的。比如高通Scropion架構,三星的蜂鳥Hummingbird核心等都是在Cortex-A8的基礎上修改的。一般 這些優化過的處理器都要比采用原始ARM架構的處理器性能更強。
采用ARM架構的品牌
ARM公司是全球最大的半導體知識產權核心供應商,目前已經在移動電話領域占據了90%的市場份額。超過100家半導體公司持有不同形式的 ARM授權。其中包括Intel、IBM、LG、NEC、SONY、NXP(原PHILIPS)和NS等公司。也有包括微軟、升陽和MRI等一系列知名軟 件系統公司。
ARM的設計是Acorn電腦公司(Acorn Computers Ltd)于1983年開始的開發計劃。1985年時開發出首款內核ARM1,經過三十年的發展,如今已經發展到運行速度可達2.5GHz的Crotex- A15核心。接下來筆者就為大家介紹一下ARM架構的發展歷程。因為ARM9之前的ARM核心基本上都是應用在音樂播放器、游戲機、相機以及計算器等電子 產品中,所以這部分筆者就不做過多介紹了,以下筆者著重介紹在智能手機中廣泛應用的ARM9及之后的ARM架構。
ARM9 處理器系列
ARM9系列于1997年問世,ARM9處理器系列包括ARM926EJ-S、ARM946E-S和ARM968E-S處理器。
ARM926EJ-S? 處理器具有一個采用Jazelle?技術的增強型32位RISC CPU、靈活的大小指令和數據高速緩存、緊密耦合內存(TCM)接口和內存管理單元(MMU)。它還提供單獨指令和數據AMBA?AHB? 接口,適合基于多層AHB的系統。ARM926EJ-S處理器可執行ARMv5TEJ指令集,其中包括功能得到增強的16 x 32位乘法器,可進行單周期MAC運算,以及16位定點DSP指令,可增強多個信號處理應用程序的性能并支持 Thumb? 技術。
ARM9內核
ARM926EJ-S處理器為入門級處理器,可支持完全版操作系統,其中包括 Linux、Windows CE和Symbian。因此,此處理器是眾多需要完整圖形用戶界面的應用的理想之選。ARM926EJ-S被廣泛的應用于智能手機處理器中。其中德州儀器 OMAP1系列處理器、高通MSM6***系列處理器以及飛思卡爾、恩智浦半導體等都采用了ARM926EJ-S內核。
采用ARM926EJ-S內核的產品
智能手機當中,諾基亞的大部分Symbian S60系統的智能手機,索尼愛立信K系列以及Walkman系列音樂手機,以及明基西門子和LG部分手機都采用了ARM926EJ-S內核。
采用TI OMAP 1710處理器的手機
OMAP 1710是一款采用ARM926EJ-S內核的處理器,也是TI公司第一款采用90納米制程的處理器,制程的減小也就意味著工作電壓的下 降,OMAP1710已經可以在1.05—1.3V之間動態調整,而普通待機狀態下的耗電量僅為10mAh,在當時來說,可謂節能高手。OMAP1710 最大工作頻率可以達到220MHz,一級緩存已經提升為32KB。這樣的性能在當時來說是相當強大的,當年諾基亞大部分智能手機都是采用的這顆核心,這些 手機包括:諾基亞6630、6680、6681、E50、E60、E61、E62、E65、E70、N70、N71、N72、N73、N80、N90、 N91、N92以及三星的SGH-i600、SGH-i607等,不過現在這樣的性能已經明顯過時了。
ARM11處理器系列所提供的引擎可用于當前生產領域中的很多智能手機;該系列還廣泛用于消費類、家庭和嵌入式應用領域。該處理器的功耗非常 低,提供的性能范圍為小面積設計中的350MHz到速度優化設計中的1GHz(45納米和65納米)。ARM11處理器軟件可以與以前所有ARM處理器兼 容,并引入了用于媒體處理的32位 SIMD、用于提高操作系統上下文切換性能的物理標記高速緩存、強制實施硬件安全性的TrustZone以及針對實時應用的緊密耦合內存。
ARM11結構圖
ARM1136J-S發布于2003年,是針對高性能和高能效的應用而設計的。ARM1136J-S是第一個執行ARMv6架構指令的處理器, 它集成了一條具有獨立的load-store和算術流水線的8級流水線。ARMv6指令包含了針對媒體處理的單指令多數據流(SIMD)擴展,采用特殊的 設計以改善視頻處理性能。ARM1136JF-S就是為了進行快速浮點運算,而在ARM1136J-S增加了向量浮點單元。
TI OMAP 2處理器
德州儀器OMAP2系列處理器采用了ARM1136架構,其中TI OMAP 2420能管理130—400萬像素的攝頭和QVGA(240×320)分辨率的屏幕,支持藍牙、紅外和高速USB傳輸,兼容A-GPS定位功能,可利用 WLAN功能無線上網,支持第三方SD、MMC存儲卡擴展,并可使用SD I/O設備,能處理400萬甚至更高像素的靜態圖片,能夠記錄30幀/秒的VGA(640×480)像素動態有聲視頻文件,能提供接近Hi-Fi級的3D 環繞音效,支持TV-OUT輸出功能,每秒可以計算200萬個多邊形。代表產品為諾基亞N82、N93、N95等。
高通驍龍S1處理器
高通驍龍Snapdragon S1是針對當今大眾市場的智能手機所開發的處理器,該處理器運算速度最高可達1GHz主頻,是全球首款達到1GHz主頻的移動單核產品。采用了65nm工 藝并集成Adreno 200圖形處理器(GPU),采用ARM11架構的處理器型號MSM7627/7227(主頻為600-800MHz)和MSM7625/7225(主頻 為528MHz)。
Tegra處理器
Tegra APX 2500芯片的制程是65納米,核心頻率750MHz,并集成256KB的L2緩存。芯片亦內建GeForce核心,支持OpenGL ES 2.0和Direct3D Mobile標準。APX 2500屬于ARM 11 MPCore架構,其低耗電設計,使手提電話可以長時間播放音樂或高清影片。此外,它支持720p的MPEG-4與H.264/MPEG-4 AVC的解碼。輸出方面,它支持HDMI 1.2和雙顯示輸出。之后推出的Tegra APX 2600在APX 2500基礎上增強了對NAND閃存的支持。2009年微軟推出的Zune HD中使用了Tegra APX 2600芯片。
Tegra 600和Tegra 650兩款型號,整合ARM 11 MP Core、影音處理器,Tegra 600支持720p H.264和VC-1影片解碼,Tegra 650更支持1080p影片解碼。該系列目前已停產。
ARM11處理器系列所提供的引擎可用于當前生產領域中的很多智能手機;該系列還廣泛用于消費類、家庭和嵌入式應用領域。該處理器的功耗非常 低,提供的性能范圍為小面積設計中的350MHz到速度優化設計中的1GHz(45納米和65納米)。ARM11處理器軟件可以與以前所有ARM處理器兼 容,并引入了用于媒體處理的32位 SIMD、用于提高操作系統上下文切換性能的物理標記高速緩存、強制實施硬件安全性的TrustZone以及針對實時應用的緊密耦合內存。
ARM11結構圖
ARM1136J-S發布于2003年,是針對高性能和高能效的應用而設計的。ARM1136J-S是第一個執行ARMv6架構指令的處理器, 它集成了一條具有獨立的load-store和算術流水線的8級流水線。ARMv6指令包含了針對媒體處理的單指令多數據流(SIMD)擴展,采用特殊的 設計以改善視頻處理性能。ARM1136JF-S就是為了進行快速浮點運算,而在ARM1136J-S增加了向量浮點單元。
TI OMAP 2處理器
德州儀器OMAP2系列處理器采用了ARM1136架構,其中TI OMAP 2420能管理130—400萬像素的攝頭和QVGA(240×320)分辨率的屏幕,支持藍牙、紅外和高速USB傳輸,兼容A-GPS定位功能,可利用 WLAN功能無線上網,支持第三方SD、MMC存儲卡擴展,并可使用SD I/O設備,能處理400萬甚至更高像素的靜態圖片,能夠記錄30幀/秒的VGA(640×480)像素動態有聲視頻文件,能提供接近Hi-Fi級的3D 環繞音效,支持TV-OUT輸出功能,每秒可以計算200萬個多邊形。代表產品為諾基亞N82、N93、N95等。
高通驍龍S1處理器
高通驍龍Snapdragon S1是針對當今大眾市場的智能手機所開發的處理器,該處理器運算速度最高可達1GHz主頻,是全球首款達到1GHz主頻的移動單核產品。采用了65nm工 藝并集成Adreno 200圖形處理器(GPU),采用ARM11架構的處理器型號MSM7627/7227(主頻為600-800MHz)和MSM7625/7225(主頻 為528MHz)。
Tegra處理器
Tegra APX 2500芯片的制程是65納米,核心頻率750MHz,并集成256KB的L2緩存。芯片亦內建GeForce核心,支持OpenGL ES 2.0和Direct3D Mobile標準。APX 2500屬于ARM 11 MPCore架構,其低耗電設計,使手提電話可以長時間播放音樂或高清影片。此外,它支持720p的MPEG-4與H.264/MPEG-4 AVC的解碼。輸出方面,它支持HDMI 1.2和雙顯示輸出。之后推出的Tegra APX 2600在APX 2500基礎上增強了對NAND閃存的支持。2009年微軟推出的Zune HD中使用了Tegra APX 2600芯片。
Tegra 600和Tegra 650兩款型號,整合ARM 11 MP Core、影音處理器,Tegra 600支持720p H.264和VC-1影片解碼,Tegra 650更支持1080p影片解碼。該系列目前已停產。
ARM公司在經典處理器ARM11以后的產品改用Cortex命名,并分成A、R和M三類,旨在為各種不同的市場提供服務。
Cortex系列屬于ARMv7架構,這是ARM公司最新的指令集架構。ARMv7架構定義了三大分工明確的系列:“A”系列面向尖端的基于 虛擬內存的操作系統和用戶應用;“R”系列針對實時系統;“M”系列對微控制器。由于應用領域不同,基于v7架構的Cortex處理器系列所采用的技術也 不相同,基于v7A的稱為Cortex-A系列,基于v7R的稱為Cortex-R系列,基于v7M的稱為Cortex-M系列。
Cortex-A5是Cortex-A家族中最低端的,其特點是功耗較低,單位功耗的效能很高,性能優于ARM9和ARM11,適合應用在千元級的低端產品市場。
Cortex-A5結構圖
Cortex-A5內部核心數目1-4核可選,同時與Cortex-A8一樣內部使用了TrustZone安全技術以及NEON多媒體處理引 擎,并能與 Cortex-A8/A9處理器實現完全的應用兼容。采用四核配置時,SOC芯片內部還可搭配Mail GPU或由用戶按需求配用PowerVR MBX/SGX GPU。
Cortex-A5架構功耗、性能、面積
Cortex-A5處理器和Cortex-A8與Cortex-A9一樣基于ARM V7架構,采用40nm低功耗制程技術制作,默認工作電壓1.1V,單核核心頻率480MHz,四核核心頻率可達1GHz,含緩存的核心面積最小僅1平方 毫米,一級緩存容量最大64KB,功耗/頻率比參數為0.12mW/MHz。
相比之下Cortex-A8處理器則采用65nm制程工藝制作,核心頻率650MHz(65nmLP工藝)/1.1GHz(65nm GP工藝),內建二級緩存,二級緩存最大容量為1MB,一級緩存同為最大64KB。功耗/頻率比參數為0.59/0.45mW/MHz。
高通驍龍S1處理器
高通驍龍S1部分處理器采用了Cortex-A5架構,其中MSM7627A/7227A(主頻為0.8-1.0GHz)和MSM7625A/7225A(主頻為0.6-0.8GHz)。
ARM Cortex-A8處理器是第一款基于ARMv7架構的應用處理器,Cortex-A8處理器的速率可以在600MHz到超過1GHz的范圍內調節,能夠 滿足那些需要工作在300mW以下的功耗優化的移動設備的要求;以及滿足那些需要2000 Dhrystone MIPS的性能優化的消費類應用的要求。
Cortex-A8處理器是ARM的第一款超標量處理器,具有提高代碼密度和性能的技術,用于多媒體和信號處理的NEON?技術,以及用于高效地支持預編譯和即時編譯Java及其他字節碼語言的Jazelle?運行時間編譯目標(RCT)技術。
Cortex-A8結構圖
TI OMAP3系列處理器采用了ARM Cortex-A8架構,可提供比基于ARM 11的處理器多至三倍的性能增益,同時使得3G手持終端具有可與筆記本電腦媲美的生產力以及先進的娛樂功能。作為業界第一個將采用65nm CMOS工藝設計的應用處理器,OMAP 3430在降低內核電壓并增加了降低功耗的特性的同時比以前的OMAP處理器系列具有更高的工作頻率。OMAP 3430的代表產品為摩托羅拉里程碑、XT711、三星I8910、諾基亞N900、palm pre等。可以運行在800MHz的處理器OMAP 3440的代表產品則為摩托羅拉XT720,Archos 5等。
TI OMAP 3xxx處理器
OMAP 36x系列同樣采用了ARM Cortex-A8架構,不過應用了更先進的45納米制造工藝,其中OMAP 3630主頻720MHz,OMAP 3640主頻1GHz。集成了PowerVR SGX530 GPU。德州儀器OMAP 36x系列的代表產品有摩托羅拉Droid X、Droid 2/里程碑2、Defy/ME525、Defy+,Archos 7,諾基亞N9等。
高通Scorpion架構
Scorpion(天蝎座)是高通自家設計的基于Cortex-A8架構的處理器架構,并使用ARM v7的指令集,具備了13階load/store管線,還有兩個整數處理管線,目標時脈是設定在1GHz。至于Scorpion中的SIMD資料路徑,不 用時可關掉一半,效能會好一些。目前已有HTC Desire、HTC HD2、Sony Ericsson X10、Acer Liquid加入Snapdragon陣營。Dell的平板電腦Stream采用第一代Snapdragon。第二代Snapdragon芯片制程從65 納米進入45納米,時脈也從1GHz提升至1.3GHz。
高通驍龍Snapdragon S2產品系列
高通驍龍Snapdragon S2全部采用45nm工藝制程,主頻提升至1.4GHz,集成Adreno205 GPU,支持HSPA+高速網絡,以及支持720p高清視頻播放。并且功耗相比第一代處理器降低30%。
高通驍龍Snapdragon S2是針對高端單核智能手機而設計的。其特點在于擁有最新設計和優化的多媒體子系統。整體性能以及電源管理能力上都有了很大的提升。
MSM8655/8255為1-1.4GHz的Scorpion處理器,用于高端單核智能手機。代表機型:索尼愛立信LT18i和HTC Desire S。
MSM7630/7230為0.8GHz的Scorpion處理器,雖然頻率不高,但由于采用了新的工藝和設計,性能上比第一代1GHz的處理器性能更強。代表機型:華為U8800。
高通驍龍Snapdragon S3產品系列
高通驍龍Snapdragon S3為1.2-1.5GHz雙核Scorpion處理器,依然采用了45nm工藝,由于采用異步的處理方式,在能耗方面比其他的雙核處理器會有比較明顯的優勢。
MSM8660/8260采用了雙核Scorpion處理器,主頻1.2-1.5GHz。用于高端雙核智能手機,代表機型HTC Sensation和小米手機。
三星Hummingbird核心
三星蜂鳥hummingbird核心同樣是在cortex-A8基礎上,進行修改增強的一款核心,采用這款核心的代表產品便是三星 S5PC110/S5PV210蘋果A4核心。而hummingbird核心也正是三星和蘋果合作研發而來。在實測性能上,較其它普通A8核心的CPU 相比,擁有了成倍的增長。
三星蜂鳥hummingbird處理器
三星S5PC110/S5PV210可以說是世界上最強的cortex-A8架構方案芯片,它在原cortex-A8的基礎上,進行了大幅度 的優化,在性能上也獲得了大幅度的增長,基本上,能夠達到同等架構的CPU效能的1倍以上。采用該處理器的機型有三星I9000,魅族M9等。
蘋果A4處理器
蘋果A4處理器
蘋果iPhone 4和蘋果iPad以及iTouch 4都采用了這個和三星S5PC110處理器相近的A4處理器,不過蘋果作了更多的優化,尤其是蘋果A4將負責視頻硬解的VXD370改成了 VXD375,GPU和內存的直連也令PowerVR 535的實際表現要超越三星S5PC110的PowerVR 540處理器。但歸根結底,蘋果A4處理器還是一個基于ARM Cortex-A8核心的高性能處理器。
Cortex-A9是性能很高的ARM處理器,可實現受到廣泛支持的ARMv7體系結構的豐富功能。Cortex-A9 處理器的設計旨在打造最先進的、高效率的、長度動態可變的、多指令執行超標量體系結構,提供采用亂序猜測方式執行的 8 階段管道處理器,憑借范圍廣泛的消費類、網絡、企業和移動應用中的前沿產品所需的功能,它可以提供史無前例的高性能和高能效。
ARM Cortex-A9 性能、功耗和面積
Cortex-A9 微體系結構既可用于可伸縮的多核處理器(Cortex-A9 MPCore? 多核處理器),也可用于更傳統的處理器(Cortex-A9 單核處理器)。可伸縮的多核處理器和單核處理器支持 16、32 或 64KB 4 路關聯的 L1 高速緩存配置,對于可選的 L2 高速緩存控制器,最多支持8MB的L2高速緩存配置,它們具有極高的靈活性,均適用于特定應用領域和市場。
TI OMAP 44xx處理器
2011年推出的OMAP 4430是德州儀器公司的首個雙核處理器型號,采用雙核心ARM Cortex-A9 MP架構,相比Cortex A8內核整體提升了1.5倍的性能。OMAP 4430在同級雙核里被喻為性能最優秀的處理器,擁有Tegra 2沒有的NEON模塊,擁有比E4210更小的發熱量,擁有比MSM8260更優秀的構架,所以擁有“怪獸級”雙核處理器之稱。OMAP 4430的代表產品有LG Optimus 3D,摩托羅拉里程碑3、XT883,三星 i9100G,黑莓PlayBook等。
Tegra 2芯片
在CES2010展會上,NVIDIA發布了全新的Tegra 2平臺,這是全球首款雙核處理器,將智能手機帶進了雙核時代,Tegra 2跳過了ARM Cortex-A8的階段,直接采用ARM Cortex-A9核心,采用臺積電的40納米制程制造,耗電量低于之前產品,Tegra 2可實現更快Web瀏覽速度、更短響應時間以及更高整體性能,而且還支持高清HD視頻播放和HDMI接口。
Tegra 3四核處理器
Tegra 3雖然名為“四核”,但是實際上內部包含了5個CPU核心,其中一個被稱為“Companion CPU core”協核心。NVIDIA將這種架構稱為vSMP(可變對稱多處理,Variable Symmetric Multiprocessing)。Tegra 3中的5個CPU核心均為Cortex-A9架構。不過,其中四個主要核心最高可支持1.4GHz主頻。而最后一個協核心最高頻率僅500MHz。
在Cortex-A9雙核處理器初見端倪之后,ARM再次給大家帶來驚喜,那就是ARM可能會推出一款四核芯片,最快處理速度能夠達到 2.5GHz,初步得知,這款處理器型號為Cortex-A15。 在還未上市的智能手機芯片當中,Cortex-A15可能是目前聽說的主頻最高的雙核芯片了,據說,這款芯片除了將手機CPU運行速度提升至2.5GHz 以外,還可以支持超過4GB的內存,能力相當的驚人,不過可能離我們還有一段距離,畢竟如此強勁的芯片的只有在更加強悍的硬件、軟件的支持下,才能夠正常 的發揮作用。
ARM Cortex?-A15
ARM Cortex?-A15 MPCore? 處理器提供前所未有的處理功能,與低功耗特性相結合,在 ARM 的各種新市場和現有市場上成就了卓越的產品,這些市場包括移動計算、高端數字家電、服務器和無線基礎結構。
Cortex-A15 MPCore 處理器是 Cortex-A 系列處理器的最新成員,確保在應用方面與所有其他獲得高度贊譽的 Cortex-A 處理器完全兼容。這樣,就可以立即訪問已得到認可的開發平臺和軟件體系,包括 Android?、Adobe? Flash? Player、Java Platform Standard Edition (Java SE)、JavaFX、Linux、Microsoft Windows Embedded、Symbian 和 Ubuntu 以及 700 多個 ARM Connected Community? 成員,這些成員提供應用軟件、硬件和軟件開發工具、中間件以及 SoC 設計服務。
Cortex-A15 MPCore 處理器具有無序超標量管道,帶有緊密耦合的低延遲 2 級高速緩存,該高速緩存的大小最高可達 4MB。浮點和 NEON? 媒體性能方面的其他改進使設備能夠為消費者提供下一代用戶體驗,并為 Web 基礎結構應用提供高性能計算。
預計 Cortex-A15 MPCore 處理器的移動配置所能提供的性能是當前的高級智能手機性能的五倍還多。在高級基礎結構應用中,Cortex-A15 的運行速度最高可達 2.5GHz,這將支持在不斷降低功耗、散熱和成本預算方面實現高度可伸縮的解決方案。
TI OMAP 54xx處理器
OMAP 5高級多核架構包含各種內核,其中包括ARM通用處理器、多個圖形內核和多種專用處理器,用于平衡可編程性、性能和功耗。OMAP 5提供了兩套方案:OMAP5430、OMAP5432,旨在滿足客戶的不同需求。
這兩款設備都采用TI定義的低功耗28納米制造工藝,同時擁有兩個ARM Cortex-A15 MP內核處理器,主頻均具有高達2GHz的速度,兩個ARM Cortex-M4處理器可實現低功耗負載和實時響應。OMAP 5430適用于要求最小尺寸的產品(例如智能手機),支持雙通道、LPDDR2堆疊封裝 (PoP) 內存。OMAP5432適用于移動計算和消費產品,它們要求更低成本,沒有極端的尺寸限制,支持雙通道 DDR3/DDR3L 內存。
結束語:
今天筆者為大家介紹了一下ARM架構的發展歷程,相信大家對ARM架構已經有了一定的了解。我們可以看到,隨著智能手機的普及,ARM架構也發 展的越來越快。再過不久,采用Cortex-A15的四核處理器就要和大家見面了。到底Cortex-A15能夠發揮出多大的能量呢?讓我們拭目以待吧。
評論
查看更多