精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

今年Hot Chips大會上的一些有趣的討論

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-09-05 10:20 ? 次閱讀

今年夏天,全球芯片領(lǐng)域的年度大事——Hot Chips大會,一共舉辦了25場會議,其中有16場或多或少都聚焦于處理人工智能(AI)任務(wù)的芯片上。這些芯片應(yīng)用涉及范圍廣泛,從瞄準物聯(lián)網(wǎng)(IoT)和智能手機的超低功耗組件,到數(shù)據(jù)中心所需的高耗電芯片等。

曾經(jīng)圍繞著x86架構(gòu)的產(chǎn)業(yè)整并,使得這一微處理器年度盛事有好幾年變得不那么有趣。而今,隨著機器學(xué)習(xí)的崛起,Hot Chips再度成為專注于芯片架構(gòu)的工程師熱烈參與的年度盛會。

不管你相不相信,芯片業(yè)近來關(guān)注的重點并不只是深度學(xué)習(xí)。例如,大會中的一位發(fā)言人還介紹了可能取代DRAM的競爭方案,并呼吁探討更多關(guān)于內(nèi)存技術(shù)的話題

賽靈思(Xilinx)展示了一款針對AI打造的全新FPGA變化版本,并邀請與會者針對基于安全的全新運算架構(gòu)展開設(shè)計移動。

Alphabet董事長John Hennessey在發(fā)表專題演講時指出,在Google計算機架構(gòu)師發(fā)現(xiàn)安全漏洞之前,業(yè)界廣泛使用的推測執(zhí)行(speculative execution)技術(shù)易于遭受旁路攻擊(side-channel attack)的情況已經(jīng)存在長達20年了。

Insight64分析師Nathan Brookwood說:“這不禁令人懷疑還有什么是我們以往沒有注意到的......鑒于這些產(chǎn)品如此復(fù)雜卻仍能有效作業(yè),這一點真的令人驚訝。”。

接下來,我們將重點介紹在今年Hot Chips大會上的一些有趣的討論。我們將從其中一些令人印象深刻的創(chuàng)新想法和目標設(shè)計開始談起。

新創(chuàng)公司Tachyum挑戰(zhàn)Xeon

新創(chuàng)公司Tachyum無疑是其中最具有膽識的,但卻并不被看好。該公司的目標在于透過其Prodigy芯片,從而在主流服務(wù)器(server)用處理器和AI加速器市場分一杯羹。Tachyum宣稱其Prodigy芯片的核心“比英特爾(Intel)的Xeon更快,也比Arm核心更小”。

該公司表示,這款7納米(nm) 290 mm2芯片支持多達64個核心,可在4GHz執(zhí)行頻率下提供高達2TFlops的運算效能,預(yù)計明年出樣。

事實上,如果沒有重大的性能升級以及經(jīng)過多方測試,數(shù)據(jù)中心營運商不太可能在其x86架構(gòu)中采用新創(chuàng)公司的芯片和軟件。因此,分析師Brookwood對于Tachyum采用超長指令字(VLIW)架構(gòu)抱持懷疑態(tài)度,畢竟這是英特爾在其Itanium中未能完美掌握的技術(shù)。他補充說,如果該芯片能取得任何市場吸引力,Tachyum很可能面臨來自英特爾等巨擘的專利訴訟。

Tachyum的Prodigy芯片支持九階整數(shù)和14階浮點運算管線架構(gòu)(本文圖片來源:Hot Chips)

Optane引發(fā)法規(guī)爭議?

英特爾描述其最新的14nm Xeon服務(wù)器處理器Cascade Lake。該公司在不久前的一場活動中才發(fā)布這款芯片,但在Hot Chips大會上提供了更多細節(jié),但也引發(fā)一些爭議。

Cascade Lake采用與英特爾現(xiàn)有14nm Xeon相同的機制、散熱和插槽接口,也支持相同的核心數(shù)、快取結(jié)構(gòu)以及I/O速度。新增部份包括微調(diào)14nm工藝,以提高一點性能和降低一些功耗。此外,該芯片還支持新的AI指令和硬件,以避免暴露于Meltdown/Spectre的旁路通道攻擊。

但其重點在于,Cascade Lakes是第一款帶有內(nèi)存控制器的Xeon,可支持Intel Optane (即3D XPoint內(nèi)存),可為每插槽提供高達3TB主存儲器以及帶來超越DRAM的讀/寫速度。

介紹該新產(chǎn)品的英特爾工程師并未評論Optane的耐用性。然而,他表示,這些主板使用的Jedec DDR4電氣總線采用英特爾的專有協(xié)議,這已能讓競爭對手近期內(nèi)都望塵莫及。

Brookwood說:“我認為這并不至于構(gòu)成法律挑戰(zhàn)。”

“如果我是IBM或AMD,當(dāng)Optane DIMM普及于數(shù)據(jù)中心而我卻無法取得時,那么我可能會要大發(fā)牢騷了!英特爾占據(jù)了98%的服務(wù)器市場,在我看來,這就是一種壟斷。”

英特爾目前正主導(dǎo)儲存網(wǎng)絡(luò)產(chǎn)業(yè)協(xié)會(SNIA),為Optane等替代主流內(nèi)存打造軟件平臺

NEC加速器低價挑戰(zhàn)Nvidia V100

NEC描述一款新的向量引擎,可搭載PCIe Gen 3板卡,而功耗還不到200W。該芯片專為搭配SX-Aurora超級計算機與Linux服務(wù)器中的x86主機而設(shè)計,據(jù)稱其價格要比Nvidia V100更低得多。

NEC聲稱其向量芯片可提供高達307GFlops的雙精度性能。在大多數(shù)基準檢驗下,其性能可介于Xeon和V100二者之間。該公司還指出,NEC芯片的內(nèi)存帶寬略高,而且在一些工作負載上的性能功耗比幾乎相當(dāng)于Nvidia GPU

相較于Nvidia V100芯片尺寸約840 mm2,NEC的1.6GHz、16nm向量芯片尺寸相對較小——480-mm2。此外,NEC的芯片支持多達6個Hi8或Hi4 HBM2內(nèi)存堆棧,可提供高達48GB的總內(nèi)存容量。

為IoT打造超低功耗AI加速器

美國哈佛大學(xué)(Harvard University)和Arm的研究人員連手發(fā)表一種用于物聯(lián)網(wǎng)中執(zhí)行深度學(xué)習(xí)任務(wù)的超低功耗加速器。這款所謂的SMIV芯片采用臺積電(TSMC) 16-nm FFC工藝打造,芯片尺寸約為25 mm2。

SMIV可說是使用Arm Cortex-A核心的首款學(xué)術(shù)界開發(fā)芯片。它在always-on的加速器叢集中使用近閾值操作,并透過嵌入式FPGA模塊提供大約80個硬件MAC和44Kbits RAM

因此,該芯片能以低功率提供更高精確度。同時,相較于競爭方案,它的功率和面積效率都提高了近10倍。

MIT打造更低功耗導(dǎo)航芯片

美國麻省理工學(xué)院(MIT)的研究人員則為機器人無人機打造了一款客制設(shè)計的導(dǎo)航芯片,據(jù)稱該芯片的功耗較Arm CPU核心更低。這款Navion導(dǎo)航芯片采用65nm CMOS制造,在20-mm2芯片面積上打造視覺慣性測距引擎。

研究人員稱,該芯片的性能是標準CPU的2倍至3倍,并可縮減多達5.4倍的內(nèi)存占用空間。它在最大配置下的功耗為24mW,而在優(yōu)化配置時的功耗僅2mW,而仍能實現(xiàn)實時導(dǎo)航。

在Hot Chips大會的多場會議中只針對已發(fā)布的組件(有的甚至都已經(jīng)出貨)提供較多細節(jié)。接下來我們將先介紹用于客戶端系統(tǒng)的AI加速器和CPU,并將關(guān)注焦點轉(zhuǎn)向服務(wù)器處理器和加速器。

Arm展示新款機器學(xué)習(xí)核心實力

Arm深入探討其預(yù)計將在年底出現(xiàn)在芯片中的機器學(xué)習(xí)核心。新款機器學(xué)習(xí)核心可在1GHz提供約4TOPS運算性能,以及在以7nm制造的2.5-mm2核心上提供超過3TOPS/W性能。其乘法累加單元支持8個16位寬點乘積。

Arm介紹其機器學(xué)習(xí)核心上的8 x 8區(qū)塊壓縮

三星提升智能手機性能

三星舉例說明聰明的工程師如何在工藝技術(shù)進展趨緩時顯著提升性能。因此,從一系列基準檢驗來看,目前在其智能手機中使用的2.7GHz M3應(yīng)用處理器,輕輕松松地就能超越前一代M2至少50%以上。

這項進展來自于在其分支預(yù)測器中使用神經(jīng)網(wǎng)絡(luò),以及利用德州農(nóng)工大學(xué)(Texas A&M )教授Daniel A. Jiménez的學(xué)術(shù)研究成果。不過,M3應(yīng)用處理器的芯片尺寸是M2的2倍以上,但采用了10 LPP工藝——這是三星10 LPE工藝的微幅升級。

Mythic展示內(nèi)存處理器最新進展

Mythic描述其內(nèi)存處理器(PIM)設(shè)計細節(jié),它可用于處理具有0.5 picojoules/MAC的深度學(xué)習(xí)影像。該芯片設(shè)計針對監(jiān)控和工廠相機,功耗約為5W,包括所有數(shù)字控制邏輯。

PIM概念已出現(xiàn)多年了,但一直到最近才被應(yīng)用于AI。Mythic打造基于NOR單元的可變電阻器數(shù)組,但并不在內(nèi)存單元寫入和讀取深度學(xué)習(xí)權(quán)重。相反地,它將電壓施加到數(shù)組線,以求和并讀取電流級,進一步達到省電的效果。

初始芯片可處理有限數(shù)量的權(quán)重,但基于磚式(tile)的設(shè)計可為全標線芯片擴展多達5倍權(quán)重。此外,還可以添加Arm核心以創(chuàng)建可編程組件,而且多個芯片間可以協(xié)同工作以執(zhí)行更大的應(yīng)用程序(app)或更快地執(zhí)行。但缺點之一在于無法利用神經(jīng)網(wǎng)絡(luò)的稀疏特性。

Mythic聲稱,這款40nm芯片的功耗只有GPU的一小部份。該公司預(yù)計明年年中提供樣片,并預(yù)計于2019年底量產(chǎn)。

Mythic的PIM目的在于以MCU功率提供GPU性能,而不至于影響稀疏神經(jīng)網(wǎng)絡(luò)

Google側(cè)寫Pixel Visual Core

Google介紹在其最新智能手機中的Pixel Visual Core。這款基于A53的可編程引擎,專為手機攝影機執(zhí)行目前仍在發(fā)展中的最新版HDR +算法。一位Google工程師打趣地說:“它能讓你的社交媒體圖片看來不會太糟糕。”

有趣的是,三星內(nèi)存部門的一位工程師問道,未來世代是否會放棄典型的圖像處理管線,轉(zhuǎn)而采用新興的深度學(xué)習(xí)技術(shù)?Google工程師回復(fù)說:“但我們還沒在這個領(lǐng)域發(fā)布太多AI算法啊!”

Google聲稱其28nm Pixel核心執(zhí)行HDR+作業(yè)的速度比10nm移動應(yīng)用處理器的CPU快至少2.8倍

IBM強化Power 9服務(wù)器系統(tǒng)

針對服務(wù)器領(lǐng)域,IBM與英特爾似乎都在14nm節(jié)點停擺一段時間了。IBM這次在Hot Chips介紹其最新的計劃,為基于其Power 9處理器的系統(tǒng)強化I/O和內(nèi)存帶寬,不過,至少要到2020年或之后才會針對新工藝提供新設(shè)計了。

IBM的目標是在其Power 9服務(wù)器上發(fā)掘更多內(nèi)存帶寬,同時為基于7-nm處理器的設(shè)計做好準備

富士通將Arm核心帶入超級計算機

富士通(Fujitsu)描述了7-nm A64FX,其設(shè)計目標在于成為超級計算機中的首批Arm核心之一。該512位SIMD芯片為Arm架構(gòu)帶來向量擴展,以執(zhí)行傳統(tǒng)的超級運算和新的AI任務(wù)。52核心的芯片使用32GB HBM2內(nèi)存,可提供2.7TFlops性能和1,024GB/s的內(nèi)存帶寬。

富士通的首款post-Sparc設(shè)計A64FX,瞄準用于將在2021年發(fā)表的日本新一代Post-K超級計算機

Nvidia展示其GPU服務(wù)器實力

Nvidia透過其DGX-2及其內(nèi)部NVLink互連,從芯片進一步擴展到系統(tǒng)。該公司展示了幾項基準檢驗,包括以DGX-2展現(xiàn)超越標準雙GPU系統(tǒng)的性能。

英特爾、AMD以及…中東和平?

英特爾介紹如何使用其嵌入式多芯片互連橋接(EMIB)技術(shù),將其Kaby Lake桌上型x86 CPU與AMD Radeon RX Vega M GPU連接在一個模塊(下圖)中,以用于輕薄型筆記本電腦

分析師Brookwood還與英特爾主講人開玩笑說,“不管是誰來談成這項協(xié)議的,接下來應(yīng)該可以派他去進行中東和平的任務(wù)。“

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    453

    文章

    50406

    瀏覽量

    421840
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2903

    文章

    44275

    瀏覽量

    371271
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8377

    瀏覽量

    132409

原文標題:Hot Chips 2018大會上13款最“熱”芯片

文章出處:【微信號:FPGAer_Club,微信公眾號:FPGAer俱樂部】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    分享一些常見的電路

    理解模電和數(shù)電的電路原理對于初學(xué)者來說可能比較困難,但通過一些生動的教學(xué)方法和資源,可以有效地提高學(xué)習(xí)興趣和理解能力。 下面整理了一些常見的電路,以動態(tài)圖形的方式展示。 整流電路 單相橋式整流
    的頭像 發(fā)表于 11-13 09:28 ?203次閱讀
    分享<b class='flag-5'>一些</b>常見的電路

    NVIDIA生成式AI閃耀CNCC2024大會

    在當(dāng)前數(shù)字化轉(zhuǎn)型的浪潮中,探索生成式 AI 如何對新質(zhì)生產(chǎn)力提供強力賦能,正成為推動社會進步的重要課題。此前,10 月 24 - 26 日在橫店舉行的 CNCC2024 大會上,這議題被視為核心討論內(nèi)容。
    的頭像 發(fā)表于 11-06 14:04 ?204次閱讀

    谷歌Wear OS智能手表更新

    在去年的 Google I/O 大會上,我們推出了適用于 Wear OS 的 "表盤格式 (Watch Face Format)"。今年,作為我們與 Samsung 持續(xù)合作
    的頭像 發(fā)表于 09-09 16:05 ?445次閱讀

    OpenAI硬件負責(zé)人熱議AI基礎(chǔ)設(shè)施擴展與節(jié)能方案

    在近日于斯坦福大學(xué)舉辦的Hot Chips 2024大會上,OpenAI的硬件設(shè)施負責(zé)人Trevor Cai發(fā)表了場深入人心的演講,其核心聚焦于“構(gòu)建可擴展的AI基礎(chǔ)設(shè)施”。Trev
    的頭像 發(fā)表于 09-02 16:20 ?501次閱讀

    英特爾至強6系列處理器:全能核心,滿足各種工作需求

    英特爾在去年Hot Chips大會上宣布,全新至強6系列處理器分為全能效核與全性能核兩大產(chǎn)品線,分別以“Granite Rapids”和“Sierra Forest”為代號。前者專攻計算密集型和人工智能工作負載,后者則面向高密度
    的頭像 發(fā)表于 08-30 15:15 ?491次閱讀

    NVIDIA 在 Hot Chips 大會展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    、在處理器及系統(tǒng)架構(gòu)師領(lǐng)域的深度技術(shù)盛會,Hot Chips 已經(jīng)成為價值萬億美元的數(shù)據(jù)中心計算市場的個重要論壇。 在本周舉行的 Hot Chip
    的頭像 發(fā)表于 08-28 16:38 ?334次閱讀
    NVIDIA 在 <b class='flag-5'>Hot</b> <b class='flag-5'>Chips</b> <b class='flag-5'>大會</b>展示提升數(shù)據(jù)中心性能和能效的創(chuàng)新技術(shù)

    泰晶科技亮相2024年世界移動通信大會上

    6月26日-28日,2024年世界移動通信大會上海(MWC上海)在上海新國際博覽中心和上海浦東嘉里大酒店舉行。今年的展會以“未來先行”為主題,涵蓋“超越 5G、數(shù)智制造和人工智能經(jīng)濟”三大技術(shù)主題
    的頭像 發(fā)表于 07-02 14:41 ?508次閱讀

    新華三集團閃耀2024世界移動通信大會上海站

    在科技浪潮洶涌澎湃的當(dāng)下,2024年世界移動通信大會上海站(MWC上海)于6月26日至28日在新國際博覽中心隆重舉行。這場匯聚了全球移動通信領(lǐng)域精英的盛會,無疑是科技前沿的次大閱兵。而在此次大會中,紫光股份旗下的新華三集團,以
    的頭像 發(fā)表于 06-28 16:23 ?655次閱讀

    中國移動楊杰在2024年世界移動通信大會上展望數(shù)智化革命

    在2024年世界移動通信大會上海(MWC上海)的璀璨開幕式上,中國移動的領(lǐng)航者——董事長楊杰,以深邃的洞察力和前瞻性的視野,發(fā)表了激動人心的演講。他站在時代的前沿,為我們描繪了幅波瀾壯闊的“數(shù)智化革命”畫卷,展示了新質(zhì)生產(chǎn)力的無限可能。
    的頭像 發(fā)表于 06-28 14:56 ?659次閱讀

    芯訊通亮相2024 MWC世界移動通信大會上海展

    6月26-28日, 2024 MWC世界移動通信大會上海展在新國際博覽中心舉辦。本屆大會以“未來先行”為主題,聚焦“超越5G”、“人工智能經(jīng)濟”、“數(shù)智制造”。作為全球知名物聯(lián)網(wǎng)通信模組提供商,芯訊通攜全制式模組產(chǎn)品精彩亮相展會現(xiàn)場,與行業(yè)伙伴共襄盛舉。
    的頭像 發(fā)表于 06-27 09:37 ?696次閱讀

    亞馬遜云科技在re:Inforce 2024全球大會上推出眾多安全服務(wù)新功能

    北京2024年6月12日?/美通社/ -- 亞馬遜云科技在re:Inforce 2024全球大會上宣布推出多項安全服務(wù)新功能,涵蓋惡意軟件防護、生成式AI驅(qū)動安全、身份訪問和管理等,幫助用戶更輕
    的頭像 發(fā)表于 06-12 17:31 ?346次閱讀

    主流GPU/TPU集群組網(wǎng)方案深度解析

    用于連接 GPU 服務(wù)器中的 8 個 GPU 的 NVLink 交換機也可以用于構(gòu)建連接 GPU 服務(wù)器之間的交換網(wǎng)絡(luò)。Nvidia 在 2022 年的 Hot Chips 大會上展示了使用 NVswitch 架構(gòu)連接 32 個
    發(fā)表于 04-24 10:05 ?840次閱讀
    主流GPU/TPU集群組網(wǎng)方案深度解析

    GPU/TPU集群網(wǎng)絡(luò)組網(wǎng)間的連接方式

    用于連接 GPU 服務(wù)器中的 8 個 GPU 的 NVLink 交換機也可以用于構(gòu)建連接 GPU 服務(wù)器之間的交換網(wǎng)絡(luò)。Nvidia 在 2022 年的 Hot Chips 大會上展示了使用 NVswitch 架構(gòu)連接 32 個
    發(fā)表于 04-16 11:43 ?707次閱讀
    GPU/TPU集群網(wǎng)絡(luò)組網(wǎng)間的連接方式

    英特爾研究院將在NeurIPS大會上展示業(yè)界領(lǐng)先的AI研究成果

    英特爾研究院將在NeurIPS 2023大會上展示系列富有價值、業(yè)界領(lǐng)先的AI創(chuàng)新成果。面向廣大開發(fā)者、研究人員和學(xué)界人士,這AI和計算機視覺領(lǐng)域的全球頂會將于12月10日至16日在美國新奧爾良
    的頭像 發(fā)表于 12-08 19:15 ?521次閱讀

    英特爾研究院將在NeurIPS大會上展示業(yè)界領(lǐng)先的AI研究成果

    英特爾研究院將重點展示31項研究成果,它們將推進面向未來的AI創(chuàng)新。 ? ? ? ?英特爾研究院將在NeurIPS 2023大會上展示系列富有價值、業(yè)界領(lǐng)先的AI創(chuàng)新成果。面向廣大開發(fā)者、研究人員
    的頭像 發(fā)表于 12-08 09:17 ?683次閱讀