眼下在非移動處理器市場風光無限的英特爾,其實也有著發展路上苦澀的經歷,各種成功、失敗、喜悅、沮喪,匯集在一起,才使得這位行業大佬發展到今天這樣的位置。
下面,小編就帶你梳理一下該公司歷史上的35款經典芯片,看英特爾CPU的發展都經歷了哪些鮮為人知的故事,也看看它走麥城時候的樣子。
始于4004
1971年,英特爾第一款微處理器——四位的4004面世,它與其他三個芯片配合工作,分別是4001的ROM,4002的RAM,以及移位寄存器4003。而4004負責進行計算。當時,4004在計算器和類似的設備中大量采用,但還未能應用于計算機中,它的最大時鐘速度為740 kHz。
4004之后,一款類似的處理器出現了,稱為4040,它基本上是一款擴展的指令集和更高性能的改進版本的4004。
8008和8080
4004打響了英特爾微處理器業務的第一槍,隨后,英特爾推出了全新的八位處理器,1972年,8008誕生,緊隨其后的是1974年的8080和1975年的8085。8008是由英特爾生產的第一款八位處理器,值得一提的是,8080的速度比4004快,這得益于其八位處理數據的能力,但它的時鐘頻率偏保守,在200kHz~800kHz之間,8008的性能沒有能夠吸引多少系統開發商。8008使用10微米晶體管制程技術。
8080則較為成功。它在8008基礎上加入了新的指令,并過渡到了6微米的晶體管制程。這使其時鐘速率提升了一倍以上,1974年,最高性能的8080芯片運行在2 MHz。8080被應用到了很多設備當中,這導致一些軟件開發商,如那段時間剛成立的微軟,開始關注適用于英特爾處理器的軟件開發。
當8086發布時,它是基于8080,并保持軟件的向后兼容性。8080和關鍵硬件因素已出現在所有基于x86處理器的生產當中,8080的軟件可以運行在任何x86處理器上。
8085是一個不太昂貴,且時鐘頻率更高的變種8080。
8086:x86的開始
英特爾首款16位處理器是8086,相比以前的設計,提高了性能。它不僅是主頻高于8088,還采用16位外部數據總線和一個6字節的預取隊列。它也能夠運行16位的任務(盡管大多數軟件是專為八位處理器設計的)。地址總線擴展到20位,使8086可以訪問1MB內存,性能明顯提高。
8086成為了第一個x86處理器,它使用了x86ISA的第一次修訂,后來,幾乎所有由英特爾和AMD開發的處理器都是建立在8086基礎之上的。
英特爾在同一時間還推出了8088。該處理器是基于8086的,但是有很多數據線和四字節的指令預取隊列都減半,這導致失去平衡,為窄總線切取指令率,迫使其執行單元空閑的時間不多。它具有1MB的RAM,比以前的處理器更高的頻率,但它比8086慢一點。
80186和80188
英特爾跟進8086與其他幾個處理器,所有這些都使用了類似的16位架構。第一次是在80186上,針對嵌入式應用。為推動這項工作,英特爾將主板上的一些硬件進了CPU,包括時鐘發生器、中斷控制器、定時器。對某些指令,即使在相同的時鐘頻率,80186比8086跑得快得多。當然,英特爾自然會提升CPU的頻率,以進一步提高性能。
80188同樣把一些硬件功能塊集成了進去。但同8088一樣,其數據總線減少了一半。
80286:更多的內存,更高的性能
80286與80186在同一年發布,性能幾乎相同,但它的擴展地址總線為24位,使處理器能夠訪問到16MB內存。
iAPX 432
iAPX 432是英特爾早期嘗試從x86投資組合中脫穎而出的一種完全不同的設計。英特爾預計iAPX 432比其他產品快幾倍。然而,該款處理器最終失敗了,原因在于一些設計缺陷。雖然x86處理器相對復雜,但iAPx 432將CISC帶到了一個全新的復雜程度。硬件設計相當大膽,迫使英特爾將其從兩個獨立的die中進行制作。該處理器如果沒有極高的帶寬,則表現不佳。iAPX 432的性能超過了8080和8086,但是它很快就被較新的x86產品超過了,因此,最終被放棄了。
i960:英特爾的第一個RISC處理器
英特爾在1984年推出了其第一個RISC處理器。它不是x86處理器的直接競爭對手,因為它是作為一個安全的嵌入式解決方案。它使用伯克利RISC設計概念的32位超標量架構。第一款i960處理器的時鐘頻率相對較低,其中最慢的模式運行在10 MHz,但多年來,它被改進,并轉變為使用更高的制程,使其達到100 MHz。它還支持4GB的受保護的內存。
i960被廣泛應用在軍事和商業系統。
80386:32位x86處理器
英特爾的第一個32位x86處理器是80386,發布于1985年。該處理器有一個關鍵的優勢是它的32位地址總線,可以支持高達4GB的系統內存。雖然這遠遠超過所有人的使用需求,內存限制往往傷害現有x86的性能和競爭處理器。與現代CPU不同的是,在80386發布的時候,更多的RAM幾乎總是轉化為性能提升。英特爾還實施了幾個架構增強功能,可以將性能提升到80286以上,即使兩個系統都使用相同的RAM數量。它還支持虛擬模式處理,從而增加了多任務支持。
為了更經濟的分割其產品陣容,英特爾還推出了80386SX。這個處理器與80386幾乎相同,它仍然采用32位架構,但其數據總線的一半被削減到16位,以節省成本。
i860
1989年,英特爾又試圖擺脫其x86處理器,它推出了一個稱為i860的新RISC CPU。與早期的i960不同,該CPU被設計為在桌面市場上競爭的高性能模型,但設計證明是有問題的。其最重要的缺陷是處理器的性能完全依賴于編譯器,按照在軟件首次創建時需要執行的順序放置指令,這有助于英特爾保持芯片尺寸和i860的整體復雜性,但是在編譯程序時,幾乎無法正確列出從開始到結束的所有指令,這導致CPU在嘗試解決問題時不斷停止工作。
80486:集成FPU
英特爾的80486在性能方面又是一個重大的進步。其成功的關鍵是將組件更緊密地集成到CPU中。80486是第一個包含L1緩存的x86 CPU。早期的80486型號帶有8KB的裸片,并在1000nm工藝上刻蝕。但隨著設計轉變為600nm,L1緩存大小翻了一番,達到了16KB。
英特爾還將FPU整合到CPU中,到目前為止,這是一個單獨的功能處理單元。通過將這些硬件移動到主機處理器中,它們之間的延遲急劇下降。80486還使用更快的FSB接口來增加帶寬,并且核心有各種其他調整推動IPC。這些變化顯著提高了80486的性能,高端機型比舊式80386快了多倍。
第一個80486處理器達到50 MHz,后來使用改進的600nm工藝的型號高達100 MHz。為了針對經濟型用戶,英特爾還發布了一款名為80486SX的80486版本,其中FPU已被禁用。
P5:第一個奔騰處理器
Pentium于1993年出現,是第一款不遵循80x86號碼系統的Intelx86處理器。在內部,Pentium使用了P5架構,這是英特爾首款x86超標量設計。雖然奔騰的速度一般比80486快,但其最突出的特點就是FPU大大提高。原始奔騰的FPU比80486的老化單位快十倍以上。這在英特爾發布奔騰MMX的后期幾年中變得更加顯著。這款處理器在架構上與原始Pentium相同,但支持英特爾新的MMXSIMD指令集,可大幅提升性能。
英特爾還相對于80486增加了奔騰處理器的L1緩存。初始Pentium包含16KB,而Pentium MMX則上升到32KB。當然,這些處理器也以較高的時鐘速率運行。第一臺Pentium處理器使用800nm晶體管制程,可能只能達到60 MHz,但隨后轉變為英特爾250nm工藝,并將頻率推高至300MHz。
P6:Pentium Pro
英特爾計劃以Pentium Pro為基礎的P6架構快速跟隨奔騰,但遇到了技術難題。由于其無序(OoO)設計,Pentium Pro在32位操作中比Pentium快得多。它具有重新設計的內部架構,將指令解碼為微操作,然后在通用執行單元上執行。由于附加的解碼硬件,它還使用了顯著擴展的14級流水線。
由于第一款Pentium Pro處理器面向服務器市場,英特爾將地址總線再次擴展到36位,并增加了PAE技術,使其能夠支持高達64GB的RAM。這遠遠超過一般用戶的需求,但是能夠支持更大量的RAM是英特爾服務器的關鍵。
處理器的緩存系統也被重做。L1緩存限于兩個分段的8KB緩存,一個用于指令,一個用于數據。為了彌補與Pentium MMX相比的16KB的缺陷,英特爾在附加到CPU包的單獨芯片上放置了256KB和1MB的L2緩存。它使用背面總線(BSB)連接到CPU。
英特爾最初計劃將Pentium Pro推向消費者,但最終將其限制為服務器產品。Pentium Pro具有幾項革命性的功能,但在性能方面卻與Pentium和Pentium MMX相悖。在16位操作中,較早的Pentium部件都顯著增加,16位軟件在當時仍然被大量使用。處理器也不支持MMX指令集,這導致奔騰MMX在MMX優化軟件中表現優于Pentium Pro。
Pentium Pro可能在消費市場上有機會,但由于包含L2緩存的獨立芯片,生產成本也相當高昂。最快的PentiumPro處理器的運行頻率為200 MHz,采用500到350nm之間的晶體管制程。
P6:奔騰II
英特爾并沒有放棄P6架構,而是等到1997年發布了Pentium II。奔騰II設法克服了Pentium Pro幾乎所有的負面因素。其基礎架構與Pentium Pro類似,并且繼續使用一個14階段的管道,對內核進行了幾項改進,以改進IPC。L1增長到16KB數據+ 16KB指令高速緩存。
英特爾也轉移到更加經濟實惠的高速緩存芯片,連接到更大的硅封裝以降低生產成本。這是使Pentium II成本更低的有效方法,但這些內存模塊無法以CPU的速度運行。相反,L2緩存以半頻率運行,而這些早期的處理器足以提高性能。
英特爾還增加了對MMX指令集的支持。Pentium II內部使用的代碼為“Klamath”和“Deschutes”的CPU內核也被銷售為服務器的至強和奔騰II Overdrive產品。最高性能型號包含512KB的L2緩存,運行頻率為450 MHz。
P6:1 GHz的奔騰III
英特爾計劃使用基于其Netburst架構的處理器來跟蹤奔騰II,但尚未準備好。相反,英特爾將P6架構再次推出為Pentium III。
這些處理器中的第一個代號為“Katmai”,與Pentium II非常相似,因為它使用了一個含有低質量二級緩存的插槽式墨盒,占據CPU速度的一半。底層架構納入其他重大變化,因為14級管道的幾個部分融合在一起,將其縮短到10個等級。由于更新的管道和時鐘速度的提高,奔騰III處理器中的第一個處理器通常以小幅度優于其Pentium II對手。
Katmai使用250nm晶體管制程。然而,隨著邁向180nm制造工藝,英特爾能夠顯著提升Pentium III的性能。這個更新的實現,代號為“Coppermine”,將L2緩存移動到CPU中,并將其容量減少一半(低至256KB)。但是由于能夠以處理器的頻率運行,性能仍然高漲。
Coppermine是英特爾與AMD Athlon的競爭產品,在競爭中打破了1GHz。英特爾試圖生產1.13GHz的型號,但是湯姆硬件公司的Tom Pabst博士調查發現,這是不穩定的情況后,最終才被召回。這使得1 GHz型號成為最快的Coppermine Pentium III。
Pentium III內核的最后一個命名為“Tualatin”。它采用130nm工藝,時鐘頻率高達1.4GHz。它還將L2緩存增加到512KB,這有助于提高性能。
P5和P6:賽揚和至強
在奔騰II發布之前,英特爾還推出了其Celeron和Xeon產品系列。這些產品使用與Pentium II或Pentium III相同的內核,但具有不同數量的緩存。基于Pentium II的第一款Celeron品牌處理器根本沒有二級緩存,導致了可怕的性能。與Pentium III相比,之前基于Pentium III的型號的二級緩存的一半禁用。這導致Celeron處理器使用的Coppermine內核只包含128KB的L2緩存;基于Tualatin的后期模型將其增加到256KB。
這些半高速緩存衍生產品被稱為Coppermine-128和Tualatin-256。英特爾以與Pentium III相當的時鐘速度出貨,這使得他們表現良好,使其對AMD的Duron處理器具有很強的競爭力。微軟使用了以733 MHz為單位的Coppermine-128 Celeron處理器,作為Xbox游戲機的CPU。
第一個Xeon處理器類似,但它們包含更多的L2緩存。基于Pentium II的至強處理器至少包含512KB,與Pentium II CPU相同,而高端機型則可能高達2MB。
Netburst
在討論英特爾Netburst架構和奔騰4之前,重要的是要檢查其深層流程背后的想法,該思路描述了指令通過核心的過程。線程通常執行多個任務,但有時它們專門用于單個功能。通過添加新硬件或將一個線程分為多個線程,可以擴展執行通道。處理器流水線也可以通過刪除硬件或將多個組件下載到單個線程來縮小。
管道的長度或深度對延遲,IPC,時鐘速度和架構的吞吐量有直接影響。較長的管道通常需要大量的帶寬,但是如果流水線保持適當的數據饋送,那么管道中的每個階段都保持忙碌狀態。具有更長管道的處理器通常能夠以更高的時鐘速率運行。
在處理器內部的權衡是更高的延遲,因為流經它的數據必須在每個階段停止一定數量的時鐘周期。使用長管道的處理器也傾向于具有較低的IPC,這就是為什么它們依靠更高的頻率來提高性能。多年來,執行這兩種理念的處理器已經證明是成功的。
Netburst:奔騰4Willamette和Northwood
在2000年,英特爾的Netburst架構終于準備好了,并被推出了奔騰4。這個組合將在未來六年內領銜英特爾的高端CPU。第一個被命名為“Willamette”,它在其生命的頭兩年承載了Netburst和Pentium 4。然而,這對英特爾來說是一個困擾的時期,芯片的競爭力超過奔騰III。Netburst能夠顯著提高頻率,Willamette設法達到2 GHz,但在某些任務中,1.4 GHz的Pentium III仍然更快。AMD的Athlon處理器在此期間表現良好。
Willamette的問題是,英特爾將管道延伸到20個線程,并計劃獲得超過2GHz的時鐘頻率,但由于功耗和散熱問題,它無法實現這些目標。英特爾的130nm設計被稱為“Northwood”,情況有所改善,擴大到3.2 GHz,二級緩存從256KB翻一番,達到512KB。Netburst的功耗和散熱依然存在。然而,Northwood卻表現較好,對AMD的競爭非常激烈。
在高端機型上,英特爾還推出了超線程技術,以提高強調多任務的環境中的資源利用率。超線程在Northwood上并不像現在的Core i7處理器那樣有利,但是它的性能提高了幾個百分點。
Willamette和Northwood也在Celeron和Xeon品牌的CPU中發布。與上一代基于Celeron和Xeon的產品一樣,英特爾提升或降低了二級緩存大小,以區分其性能。
P6:奔騰M
由于Netburst被設計為一個功能強大的高性能架構,并沒有將其轉化為移動系統。相反,在2003年,英特爾創建了專門為筆記本電腦設計的第一個架構。Pentium-M基于P6架構,但具有更長的12-14級流水線。這也是英特爾的第一個可變長度管道,這意味著如果指令所需的信息已經加載到緩存中,則可以在僅僅12個階段之后執行指令。如果沒有,它必須經過兩個額外的階段來加載數據。
這些處理器中的第一個采用130nm晶體管制程,并包含1MB二級緩存。它設法達到1.8 GHz,而功耗僅為24.5W。被稱為“Dothan”的后續版本于2004年發布,轉換為90nm制程。這使得英特爾將L2緩存增加到2MB,并結合許多核心增強功能,提供了體面的IPC吞吐量改進。CPU也擴大到2.27 GHz,功率略微增加到27W。
Pentium-M架構最終在Stealey A100移動CPU內部使用,之后被Intel的Atom處理器所取代。
Netburst: Prescott
Northwood從2002年至2004年將Netburst架構運行,之后英特爾推出了Prescott,并進行了大量改進。它采用了90nm的制造工藝,使Intel能夠將L2緩存增加到1MB。英特爾還推出了新的LGA 775接口,其特點是支持DDR2內存和比第一個基于Northwood的CPU更快的四泵浦FSB。這些變化導致Prescott的帶寬明顯高于Northwood,這對于提高凈爆彈的表現至關重要。Prescott還是英特爾第一款64位x86處理器,允許它一次訪問更多的RAM并運行64位。
普雷斯科特應該是英特爾基于Netburst處理器系列的失敗案例。英特爾再次延長其執行流程,此次達到31個階段。該公司希望提高時鐘速率足以抵消更長的管道,但只能達到3.8 GHz。普雷斯科特太熱了,功耗高。英特爾預計采用90nm制程以緩解這個問題,但晶體管密度的增加使得制冷更加困難。由于無法達到更高的頻率,普雷斯科特的進化變化會損害整體性能。
即使有了所有的增強功能和額外的緩存,Prescott在任何給定的時鐘速率下,都與Northwood一樣。大約在同一時間,AMD的K8處理器也正在向更小的晶體管制程轉移,從而使其處于更高的頻率。在這個短暫的時間內,AMD主宰了桌面CPU市場。
Netburst:奔騰D
2005年,這場比賽是為了生產第一個面向消費者的雙核處理器。AMD已經宣布了其雙核Athlon 64,英特爾通過使用包含兩個Prescott芯片的多核模塊(MCM)擊敗AMD。該公司稱其雙核處理器為奔騰D,而第一款型號為“史密斯菲爾德”。
然而,奔騰D面臨著同樣困擾普雷斯科特的問題。兩個基于Netburst的die的熱能和功率最大限制了時鐘頻率為3.2 GHz。由于架構受帶寬限制,Smithfield的IPC吞吐量分在兩個內核之間。運作也不是特別順暢。而AMD的雙核CPU由一個模塊構建,被認為是優越的。
隨后,史密斯菲爾德被普雷斯勒(Presler)所接受,后者轉向了65nm制程技術它在MCM上包含兩個Ceder Mill的die。這有助于降低處理器的熱量和功耗,并讓英特爾將其時鐘頻率提高到3.8 GHz。
普雷斯勒有兩個關鍵的步驟。第一個具有更高的125W TDP,而后者下降到95W。由于芯片尺寸更小,英特爾能夠將二級緩存增加一倍,因此每個模塊都有2MB。一些型號還提供超線程,允許CPU同時處理四個線程。
所有Pentium D處理器都支持64位軟件,可以利用超過4GB的RAM。
結語
好了,今天先介紹這些吧,明天會繼續為您帶來該公司后來開發的、直到今天的經典CPU。
(未完待續......)
-
cpu
+關注
關注
68文章
10829瀏覽量
211196 -
intel
+關注
關注
19文章
3480瀏覽量
185763
原文標題:35款經典CPU帶你回顧英特爾的成長軌跡(上)
文章出處:【微信號:Anxin-360ic,微信公眾號:芯師爺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論