上世紀50年代,成就了“20世紀最偉大發明”的“晶體管之父”的肖克利博士,有著名的八大門徒。這八位青年科學家后來離肖克利而去,集體成立了仙童半導體公司,肖克利怒不可遏地罵他們是“八叛逆”(The Traitorous Eight)。
在仙童期間,以諾伊斯為首的“八叛徒”在晶體管的基礎上設計出了基于硅的IC(集成電路),他本人與德州儀器的基爾比并稱“集成電路之父”。
后來由于仙童公司的經營問題,“八叛徒”分道揚鑣,這八位均在未來成為了赫赫有名的硅谷大佬,其中有兩位諾伊斯和摩爾于1968年創辦了在今天大名鼎鼎的IT巨頭——英特爾。
喬布斯(左)與諾伊斯(右)
1978年英特爾發布了新款16位微處理器8086,也同時開創了一個新時代:X86架構誕生了。X86指的是微處理器執行的計算機語言指令集,定義了芯片的基本使用規則。而真正將X86架構發揚光大的是英特爾另外兩位合作伙伴——IBM和微軟。
1981年IBM生產出了世界上第一臺PC,它的處理器和操作系統分別選擇了當時并非一流的英特爾和微軟。出人意料的是,各個并非一流的組件組合成強大的產品,風頭蓋過產業先驅蘋果公司。
世界上第一臺PC
在蓋茨的建議下,IBM開放架構允許其他計算機制造商仿制和改進,使得IBMPC成為世界標準,這就是IBM兼容機的由來。讓IBM始料不及的是,PC廠商百花齊放,而操作系統和CPU卻是微軟和英特爾一枝獨秀。
借著IBM PC的影響力,英特爾與微軟開始坐大,成為IBM兼容機廠商的供貨商,并逐漸在眉來眼去中形成了事實上的Wintel聯盟。
90年代英特爾推出了具有劃時代意義的奔騰芯片系列,而微軟則“珠聯璧合”地推出了Windows95。從那時起,大部分PC都采用了英特爾的X86處理器,而微軟的Windows是主流的操作系統。
曾有PC廠商老總無奈地說,“賣一臺PC能賺100元,其中英特爾拿去了70元,微軟拿去了40元。”而這種無奈,正是世紀之初國家下定決心要造中國人自己的CPU的直接動力。
潰敗
1999年,在專家加強對國內芯片企業支持力度的提議下,當時的國家經貿委政策司與信息產業部組成聯合小組,并起草了相關芯片企業優惠政策條款,這些條款最終在2000年6月形成了《鼓勵軟件產業和集成電路產業發展的若干政策》(18號文)。
受到使命感召,大批有海外留學經驗、在頂級芯片公司工作多年的半導體人才,在這一時期回到中國。90年代末,先后任職于摩托羅拉、日立(美國)的李德磊,回國成立一家百拓立克(BBT)公司,主要靠李德磊介紹外包業務。
1997年,離開摩托羅拉的李德磊加入日立,擔任微處理器設計總監,BBT承接的外包業務也從摩托羅拉轉向后者,主要做基于日立芯片的相關業務。
1999年,李德磊通過內部消息得知,日立美國要停止外包給BBT的一切項目。此時李德磊想到了一個人——聯想集團前總工程師倪光南,并詢問后者的建議。李德磊在80年代進入中科院計算所讀研時,倪李二人便已相熟。
聯想集團前總工程師倪光南
倪光南提出了自己的看法,“雖然當時日立的項目沒做完,但我發現通過這個項目,BBT在編譯器設計、芯片設計以及操作系統設計方面的人才積累已經很完善,基本具備自主研發CPU的技術能力。”而擁有一支做CPU的完整技術隊伍,是倪光南夢寐以求的。
李德磊同意了倪光南的建議。2000年3月8日,北京中芯微系統技術有限公司(“方舟科技”前身)在京注冊成立。倪光南幫助李德磊找錢、找政府、找資源,用自己的信譽和國產芯片巨大的前景,打動了一位熱心的深圳民營企業家,后者立即拍板投資2000多萬元。
那時,倪光南又找回了在聯想時的研發熱情。作為倪光南助手的梁寧在日后回憶道:“倪光南院士給我講方舟CPU+Linux操作系統,做成瘦客戶機NC,‘云+端’解決方案,替代Wintel架構的時候,我當時興奮得緊緊攥住拳頭……”
有了CPU和SOC(系統級芯片)的技術,政府給的錢也到位了,2001年4月,第一片中國人自己設計的嵌入式芯片“方舟1號”問世。國家幾個部委召開了盛大新聞發布會,主辦單位陣容豪華,多個部委代表出席。這在中國工程院歷史是破天荒的第一次。
李德磊手持方舟芯片
貨真價實的芯片造出來了,然而真正的考驗才剛剛開始……
梁寧在《一段關于國產芯片和操作系統的往事》中談及,做CPU最難的不是開發,而是要在Wintel之外建立一個全新的游戲規則。方舟不是寫不出英特爾那樣的設計,而是他們打不起官司。
自英特爾成立那天起,專利保護就是其核心競爭力之一,當2000年中國決定自主研發CPU時,英特爾幾乎把X86體系相關的專利全注冊了。對方舟團隊來說,不是X86體系的技術難度高,而是在這條路上的每一步,都會遇到英特爾的專利。
所以,倪光南做的技術路線選擇是,走RISC結構,做嵌入式,繞開X86體系。
CPU是做出來了,但是根本沒有一家下游企業可以使用。當時生產主板的中國廠商拿著方舟的CPU做不了產品原型開發,一直都是基于英特爾或它的設計工廠(design house)的公板進行再開發。也就是說,方舟芯片沒有它的目標客戶。
顯然,我們與英特爾的差距不是一塊CPU,而是一個基于CPU的開發生態系統。
無奈之下,方舟在做完CPU后,又建立硬件團隊,自己做出了公板,做出了NC的產品原型,終于可以交付市場……當時為了支持NC,北京市政府直接訂購了幾萬臺NC機。北京市副市長劉志華專門把各個行業的頭召集起來,“逼著”他們支持推廣NC。
NC主要靠政府推,李德磊認為只要做好政府就行了,不需要什么市場推廣。在連續拒絕了前兩家客戶后,2002年經政府牽線搭橋,脫胎于聯想集團的神州數碼成為方舟真正意義上的第一家客戶。
2002年11月4月,雙方召開了盛大的新聞發布會,神州數碼于當天宣布正式推出基于方舟1號的網絡計算機。有媒體以“迎接PC時代后的NC風潮”為標題報道了這場發布會。
2002年《e點天下》雜志
2002年12月,方舟2號系統級芯片高調上市。聯想、京東方、泰豐、長城等知名廠商紛紛跟進。到2003年,在政府采購中勝出的網絡計算機均采用了方舟系列芯片。
但是NC的缺點顯然易見,Linux系統的操作復雜性姑且不論,更關鍵是沒有任何配套軟件可用。Windows早期依托IBM PC成為最普遍的操作系統,所有的配套軟件都圍繞Windows進行開發,而這些軟件均不能被Linux兼容。
為了解決這一問題,當時北京市先后發起了“揚帆計劃”“啟航計劃”,針對Linux桌面的13大類50多個問題,在全國進行招標,包括瀏覽器、OFFICE、播放器等,召集中國的所有Office高手一起破解微軟的文檔格式,以期能讀能存。
但是效果不好,用戶體驗極差,紛紛要求換回Wintel。比如當時重點推廣NC的學校,一有領導來視察,這些校長就嚷嚷“NC不能用啊,讓我們換PC吧”。啟航計劃的破產,也宣告了內嵌方舟芯片的NC徹底失敗。
隨著NC被逐步證明并不適用,從2003年底開始,NC從政府采購中淡出。方舟CPU的銷售也開始受到影響,財務狀況持續惡化。2004年被曝出挪用1538萬科研基金,方舟科技接受調查,CPU停止開發。兩年后漢芯騙局敗露,國產芯片事業跌入谷底。
時至今日,在PC端,Windows+X86 CPU的格局依然無法打破。目前商業化做的最好的海光、兆芯,其主打產品還是X86 CPU,而且性能遠不如英特爾和AMD的產品。而與方舟走同一條路的龍芯,研發歷程長達18年,至今仍未實現商業化。
希望
2002年,年僅19歲的陳云霽從中科大少年班畢業,意氣風發。
就在一年前,中國自主研發的第一塊CPU方舟1號面世,中科院計算所的龍芯課題組也正式成立,同樣畢業于中科大的胡偉武博士是該項目的首席科學家。而成為胡偉武的學生,是陳云霽當時最大的志向。
這年夏天,陳云霽終于如愿以償,憑借優異的成績,來到中科院計算所碩博連讀,他的導師正是胡偉武博士。
當時由于龍芯研發人手短缺,胡偉武將19歲的陳云霽安排進了龍芯研發團隊,成為團隊中最年輕的成員。而陳云霽也如福星一般,就在他加入團隊的這個夏天,我國首款通用CPU龍芯1號代號X1A50流片成功。
“龍芯之父”胡偉武
與方舟不同的是,龍芯團隊并沒有做CPU方面的經驗,沒有海外留學經歷,胡偉武更將自己戲稱為“土鱉派”。此外,胡偉武啟用了大量學生,處于一種邊學習邊開發的狀態,陳云霽碩博連讀期間的最大收獲就是全程參與了龍芯的研發工作。
因為技術不成熟、學生比例較大的緣故,龍芯項目的進程相對緩慢,從龍芯1號到3號歷時7年時間,直到2010年龍芯中科公司成立,才開始產業探索。項目進程緩慢,對于陳云霽有一個好處就是在芯片開發領域打下堅實的基礎。
就這樣,陳云霽在龍芯團隊一待就是12年,24歲取得中科院計算所博士學位,29歲晉升為研究員。目前國內最新的計算機體系結構教材,就是胡偉武和陳云霽在2011年合作編寫的。
這位14歲就進入中科大的天才科學家,還有一位比他小兩歲的弟弟——陳天石,自認為不輸于哥哥的陳天石,2001年16歲的他追隨哥哥的腳步來到中科大少年班。后來,正是這位少年改變了中國芯受制于人的窘境。
陳云霽(左)與陳天石(右)
實際上,陳天石在中科大最早的專業并不是計算機。本在數學專業的他,卻因成績太差擔心以后“沒飯吃”,只能考慮換專業。百般糾結之后,陳天石通過抓鬮的方式在物理和計算機專業中選擇了計算機。
由于之前學的是數學專業,因此陳天石沒有寫代碼的經驗,但慶幸的是,當時計算機系的導師對學生十分寬容,并沒有嫌棄他成績差。本科畢業后,頗具天賦的陳天石順利進入中科大計算機系讀研究生,并一直讀到博士畢業。
在那期間,陳天石的導師是現在擔任南科大系主任的姚新老師。姚新老師不僅發現了陳天石的“慧根”,還順利地“忽悠”他學習人工智能(AI),此后更是成為他的主攻方向。
因為愛人在北京的關系,陳天石讀博的最后一年,經常跟導師找借口說去北京計算所做基礎研究。一來二去,陳天石漸漸熟知了哥哥所負責的龍芯項目,并且得到了胡偉武的賞識。
在陳天石博士畢業之時,導師告訴他可以考慮留校工作,同時胡偉武也邀請陳天石加入龍芯工作。雖然他在此前完全沒有處理器架構相關的基礎知識,但是盛情難卻,陳天石最終還是答應了。
實際上這是一個非常需要勇氣的決定,當時的AI遠沒有現在火熱,甚至有很多人因找不到工作選擇轉行,而計算所大都選擇做芯片,陳天石在計算所感覺無用武之地。
終于,厭倦了畫版圖的陳天石,產生了一個非常“不靠譜”的想法:既然自己從事人工智能的研究,而且計算所又有芯片研發的基礎,是不是可以將AI和芯片結合在一起呢?
興奮不已的陳天石將這個“不靠譜”的想法告訴了哥哥陳云霽,沒想到二人一拍即合。就這樣,陳天石、陳云霽決定聯手做人工智能和芯片設計的交叉研究。盡管芯片設計落后發達國家幾十年,人工智能同樣落后幾十年,但是AI+芯片,陳氏兄弟稱得上是先驅者。
雖然做AI芯片的想法看似非常“不靠譜”,但是陳氏兄弟也認真地尋找可以支持自己想法的理論依據。當時,陳氏兄弟甚至以自動駕駛作為例子去說服計算所的領導。2010年得到計算所李院士支持的陳氏兄弟決定繼續AI芯片的研發工作。
2012年,陳云霽、陳天石帶著幾個計算所的師弟,包括后來在寒武紀任高管的劉少禮、郭崎、劉道福、杜子東等,以及首次提出“AI加速器”概念的Olivier Temam教授,啟動了神經網絡處理器(AI芯片)項目,這也是寒武紀的技術來源。
項目命名非常直白,就是漢語拼音DianNao(電腦),據說是在Olivier教授的建議下定的這個名字,與其取一個平淡的英文名字,還不如反其道而行用中文的拼音來命名,這樣對外國人來說是“外語”,他們反而會覺得十分“洋氣”。
2014年3月,陳氏兄弟團隊公開提出國際首個深度學習處理器學術架構DianNao,該學術論文獲處理器架構領域頂級國際學術會議ASPLOS最佳論文獎,這是亞洲學術研究成果首獲處理器架構領域頂尖會議最佳論文。
同年12月,團隊在DianNao的基礎上公開提出國際首個多核深度學習處理器學術架構DaDianNao,該學術論文獲處理器架構領域頂級國際學術會議MICRO最佳論文獎。這也是MICRO自1963年創辦以來,第一次由美國以外的研究者摘得該獎項。
后來,團隊又相繼開發出了PuDianNao(普電腦,通用機器學習處理器)、ShiDianNao(視電腦,圖像識別處理器)等。2016年發布國際首個智能處理器指令集Cambricon ISA,最初命名為DianNaoYu(電腦語)。
首個智能處理器指令集Cambricon ISA
2015年,陳云霽入選年度《麻省理工科技評論》35歲以下的全球最佳35名創新人士,又在第二年榮獲中國青年科技獎和中科院青年科學家獎。
截至目前,陳氏兄弟團隊在計算機體系結構方面的系列技術成果已經獲得國際四大頂級會議的認可,包括ASPLOS上有兩篇,ISCA上有兩篇,MICRO與HPCA上各有一篇。
破局
在論文獲得國際學術界的認可之后,陳氏兄弟團隊的研究工作開始得到更多關注。2015年,團隊獲得了中科院先導專項數千萬元的資助,在這筆資金的支持下,僅20人的研發團隊研發出世界首款深度學習專用處理器原型芯片。
但是實驗室的成就不是陳氏兄弟的終極目標,他們要讓科研成果走出實驗室,給人們的生活帶來改變。但是,要成立公司就必須拉到投資,這對長期從事科研的陳氏兄弟是個不小的挑戰。雖然對項目感興趣的投資人較多,但真正看得懂也愿意投資的人很少。
2015年12月,陳云霽以“深度學習處理器芯片”為名申報的項目入圍蘇州工業園區第九屆科技領軍,獲領軍人才稱號。緣于蘇州工業園區的推薦,陳云霽得以結識元禾原點的投資人樂金鑫,并給后者留下了深刻印象。
元禾原點合伙人 樂金鑫(左)
兩個時間安排很緊湊的人約到一塊兒談事情,從上午10點開始聊,聊到午飯來不及吃,聊到最終各自都取消了另外的行程安排。雙方聊得情投意合,投資寒武紀的決策也就進行得很迅速。
終于在2016年3月,北京中科寒武紀科技有限公司在中關村注冊成立,行事謹慎的陳天石擔任公司CEO,而陳云霽選擇繼續在計算所搞科研,為寒武紀的首席科學家。
之所以將公司命名為“寒武紀”,根據陳天石介紹,“‘寒武紀’這個地質紀年是生物多樣性大爆發的時代,這項科研成果之所以取這個名字,就是希望人工智能也能像生命一樣出現大爆發。”
而“寒武紀”也的確名副其實,公司在成立當年就發布了世界首款終端人工智能專用處理器(寒武紀1A),面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備,并入選世界互聯網大會評選的十五項“世界互聯網領先科技成果”。
寒武紀1A處理器支持視覺、語音、自然語言處理等多種智能任務,一經推出便被華為看中,集成到華為海思的麒麟970芯片中。麒麟970被公認為全球首款內置獨立NPU(神經網絡單元)的智能手機AI計算平臺,而NPU指的就是寒武紀1A處理器。
華為麒麟970芯片發布會
“寒武紀1A就是在計算機里用虛擬的神經元和虛擬的突觸把他們聯結在一起,構成多層次的人工神經元網絡。在語音識別和視頻識別領域里,它的識別精度已經超越了人類。”陳天石介紹,“每秒可以處理160億個神經元和超過2萬億個突觸,功耗卻只有原來的1/10。”
2017年10月,首款采用麒麟970的華為手機Mate 10正式發布,這是全球手機行業首次引入人工智能概念。后來的事實證明,搭載寒武紀1A的華為麒麟970以每分鐘識別2005張照片擊敗了蘋果A11芯片每分鐘的889張照片。
用陳天石的話來說,“這一成功合作已成為全球手機和智能芯片發展史中的標志性事件,吹響了手機進入智慧時代的號角,為中國高科技公司的商業合作樹立了典范。”
麒麟970名聲大噪,寒武紀也因此一炮而紅,拿到了上億元的訂單。同時,寒武紀獲得了國投創業、阿里巴巴、聯想創投、國科投資等共計1億美元的A輪融資,成立僅一年時間,寒武紀估值已達10億美元,成為全球智能芯片領域誕生的第一個獨角獸公司。
2017年11月6日,寒武紀迎來自己的榮耀時刻,公司成立以來的首場發布會在北京泰富酒店隆重召開。對于寒武紀短短一年就成為一家獨角獸公司,站在臺上的陳天石毫不掩飾自己內心的喜悅,哥哥陳云霽則在臺下注視著口若懸河的陳天石。
發布會臺上的陳天石
在發布會上,寒武紀發布了第二代終端處理器:寒武紀1H16和寒武紀1H8,以及面向開發者的人工智能軟件平臺Cambricon NeuWare。與上一代1A相比,寒武紀1H16具備更高性能、更低能耗,能效比達到了1A的2.3倍,而寒武紀1H8對比1H16又有更低的功耗和成本。
2018年5月,寒武紀再接再厲,發布了第三代終端處理器寒武紀1M,在臺積電7nm工藝下8位運算的效能比達每瓦5萬億次運算,是1A性能的10倍,可廣泛應用于智能手機、智能音箱、智能攝像頭、智能駕駛等不同領域當中。
而更加引人注目的是,寒武紀還發布了第一代云端AI芯片MLU100(MLU即機器學習處理器),以及搭載MLU100的云端智能處理卡。
寒武紀MLU100芯片可獨立完成各種復雜的云端智能任務,理論峰值速度達每秒128萬億次定點運算,達到世界先進水平。更可以與寒武紀1A/1H/1M系列終端處理器完美適配。
之所以要做云端芯片,陳天石的解釋是,“過去大部分芯片廠商都是主攻端(如ARM)或者主攻云(如Intel)。兩者兼顧的很少,因為端云的任務生態都區別比較大。但是智能時代,我們認為這個局面會被全面打破,因為端和云的AI任務是一體的,編程和使用的生態也是一致的。”
“MLU100芯片是寒武紀發展歷程上全新的里程碑,標志著寒武紀已成為中國第一家(也是世界上少數幾家)同時擁有終端和云端智能處理器產品的商業公司。”
陳天石手持MLU100芯片,身旁是他的導師陳國良院士
而據陳天石透露,寒武紀MLU100芯片已進入大規模量產階段,中國最大的三家服務器提供商——浪潮、聯想、曙光都將對外發售搭載寒武紀MLU100芯片的AI服務器產品,多家頂尖互聯網公司都在緊鑼密鼓地進行產品導入。
到2020年底,力爭占據中國高性能智能芯片市場的30%份額,力爭將寒武紀終端智能處理器集成進入超過10億臺設備。如果這兩個目標都能實現,寒武紀將初步支撐起中國主導的智能產業生態。
就在云端芯片發布后的一個月,寒武紀完成了數億美元的B輪融資,領投的機構為清一色的國家隊,投后公司整體估值達25億美元,領跑全球人工智能芯片的創業公司。
A輪、B輪均由“國家隊”領投
2018年10月11日,華為宣布全面采用自研架構,外界一度解讀為華為已經放棄與寒武紀在芯片 IP 層面的合作。
但是10月底搭載麒麟980的華為Mate 20系列手機發布后,寒武紀官方發文《寒武紀1H加持華為麒麟980 帶來更強端側AI算力》,文中表示,繼寒武紀1A智能終端處理器助力麒麟970成為全球首款人工智能手機芯片后,寒武紀1H雙核處理器繼續為麒麟980帶來更強大、更卓越、更穩定的移動端AI計算力。用實際行動打消了外界的疑慮。
根據華為官方公布,2018年發布的兩款手機,mate20系列的出貨量超過了750萬臺,較早發布的P20系列更是超過1700萬臺,其中寒武紀1A/1H系列芯片功不可沒。
未來
從方舟1號到寒武紀,我之所以要用“破局”這樣的字眼,因為相比于第一代“芯片人”的切膚之痛,寒武紀確實打開了芯片事業的新領域,在芯片和人工智能都不占先的情況下,創造性地將二者結合,并在短時間內掌握世界領先的技術,就憑這一點,寒武紀也配得上“破局”二字。
回顧那段歲月,第一代“芯片人”梁寧用到了激情、失落、懷疑、愧疚等一系列極端的字眼來表達當時復雜的情緒。NC機的潰敗讓后來者不敢踏入這一領域,漢芯騙局讓幾乎所有的國產芯片背上“詐騙”的罵名,就連中科院的龍芯也沒少被口誅筆伐。
之所以會有這段芯酸往事,應當歸結于生態的缺失,早期的芯片開發只能在Wintel制定的游戲規則下進行,要用Windows,就必須X86。而想繞過X86就意味著要重新構建一個生態,這對于已經落后美國幾十年的中國PC產業來說談何容易。
直到今天,應用于PC的芯片依然沒有可以替代X86的,即使在國內處于領先地位的龍芯,也找不到任何一臺投放到市場的電腦嵌入了它的芯片,在PC領域已經鮮有突破口。
以在移動時代崛起的ARM為例,這家在90年代平平無奇的英國公司,21世紀乘著手機行業的東風攻城略地,目前全世界超過95%的智能手機和平板電腦都采用ARM架構,這就是時代的力量。
后來我們又迎來了智能時代,用戶已經不滿足于拍照片、看視頻和玩游戲,產生了更多智能化的需求,比如圖像識別、語音識別、機器翻譯等。雖然CPU、GPU也能實現這些功能,但是功耗卻是難以克服的問題。
以2016年風靡全球的AlphaGo為例,使用了一千多塊CPU及一百多塊GPU,每盤棋局耗電成本3000美元。如果集成一塊專門用于處理智能化問題的NPU,就能大大減少CPU的運算任務,而寒武紀要做的正是這件事。
這一次,我們終于不再苦苦追趕美國人的腳步。直到今天,陳天石都十分感激自己在十年前做的那個“不靠譜”的決定。
陳云霽曾說,“寒武紀的長期奮斗目標是,讓人工智能芯片計算效率提高一萬倍,功耗降低一萬倍。”這意味著我們可以把AlphaGo放到手機里,讓手機幫我們做各種各樣的事情,甚至通過長期觀察和深度學習后,最終可能出現人類想象不到的智能。
-
晶體管
+關注
關注
77文章
9634瀏覽量
137850 -
深度學習
+關注
關注
73文章
5493瀏覽量
120979 -
寒武紀
+關注
關注
11文章
185瀏覽量
73858
原文標題:一文看懂寒武紀的前世今生與未來
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論