日本理论片在线观看_久久成年免费电影_99国产精品永久免费视频_国产成人精品无码一区二区三区_日本理论午夜中文字幕第一页_亚洲手机在线看片av_性色av一二三天美传媒_男女做爰猛烈叫床视频免费网站_国产偷录视频叫床高潮

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）現(xiàn)在各種應(yīng)用場(chǎng)景對(duì)算力的需求越來越大，為了滿足需求，各廠商不斷提升AI 芯片的峰值算力，而傳統(tǒng)指令集架構(gòu)的芯片利用率卻難以提升，大多數(shù)在10-40%，這讓芯片的實(shí)測(cè)性能大打折扣，那么如何突破呢?

與指令集架構(gòu)不同，數(shù)據(jù)流架構(gòu)的顯著特點(diǎn)就是依托數(shù)據(jù)流的流動(dòng)次序控制計(jì)算執(zhí)行次序，而非指令執(zhí)行次序，因此把它用在AI上可以讓芯片利用率大幅提升，芯片利用率直至逼近100%。

數(shù)據(jù)流架構(gòu)如何提升芯片利用率

目前市場(chǎng)上的芯片主要有兩種架構(gòu)形式：一種是大家熟知的指令集架構(gòu)，主要包括X86架構(gòu)、ARM架構(gòu)、精簡指令集運(yùn)算RISC-V開源架構(gòu)，以及SIMD架構(gòu)；另外一種就是數(shù)據(jù)流架構(gòu)。

指令集架構(gòu)采用馮諾依曼計(jì)算方式，通過指令執(zhí)行次序控制計(jì)算順序，并通過分離數(shù)據(jù)搬運(yùn)與數(shù)據(jù)計(jì)算提供計(jì)算通用性。數(shù)據(jù)流架構(gòu)采用數(shù)據(jù)流引擎計(jì)算，它允許編譯器同時(shí)調(diào)度多個(gè)順序循環(huán)和功能，具有更高的吞吐量和更低的延遲，顯著特點(diǎn)是能夠大幅提升芯片利用率。

如下圖左側(cè)，指令集架構(gòu)首先執(zhí)行函數(shù)A，完成之后再執(zhí)行函數(shù)B，依次類推直至執(zhí)行完所有程序。下圖右側(cè)，在數(shù)據(jù)流架構(gòu)的情形下，編譯器可以安排每個(gè)函數(shù)在數(shù)據(jù)可用時(shí)立即執(zhí)行，這樣可以大大縮短等待和間隔的時(shí)間。

雖然數(shù)據(jù)流架構(gòu)沒有指令集架構(gòu)那么廣為人知，然而不可忽視的是，目前數(shù)據(jù)流架構(gòu)已經(jīng)在專用硬件中成功應(yīng)用，比如數(shù)字信號(hào)處理、網(wǎng)絡(luò)路由、圖形處理、遙感檢測(cè)、以及數(shù)據(jù)庫處理等，在許多軟件體系結(jié)構(gòu)中，包括數(shù)據(jù)庫引擎設(shè)計(jì)和并行計(jì)算框架，它也占據(jù)重要地位。

1994年，帝國理工學(xué)院教授、英國皇家工程院院士、鯤云科技聯(lián)合創(chuàng)始人和首席科學(xué)家Wayne Luk陸永青院士率先將數(shù)據(jù)流架構(gòu)定制化并運(yùn)用到AI領(lǐng)域。如今國內(nèi)外對(duì)數(shù)據(jù)流技術(shù)的關(guān)注日益增多，包括國外的SambaNova、Groq、Wave computing，以及國內(nèi)的鯤云科技。鯤云科技已經(jīng)于去年量產(chǎn)了全球首款數(shù)據(jù)流AI芯片CAISA，脫胎于斯坦福大學(xué)的SambaNova，產(chǎn)品處于小規(guī)模試用階段，而前谷歌TPU核心團(tuán)隊(duì)創(chuàng)辦的Groq，現(xiàn)在還未推出產(chǎn)品。

數(shù)據(jù)流架構(gòu)如何提升芯片利用率？我們通過全球唯一量產(chǎn)數(shù)據(jù)流AI芯片的公司鯤云科技來看一下，鯤云的核心技術(shù)就是他們的定制數(shù)據(jù)流CAISA架構(gòu)，這是一款為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)定制的高性能AI計(jì)算架構(gòu)。CAISA架構(gòu)通過數(shù)據(jù)流流動(dòng)次序來控制計(jì)算順序，消除指令操作導(dǎo)致的額外時(shí)間開銷，讓CNN網(wǎng)絡(luò)的算子級(jí)數(shù)據(jù)流圖可以實(shí)現(xiàn)高效流水線運(yùn)算。同時(shí)CAISA可并行執(zhí)行數(shù)據(jù)訪問和數(shù)據(jù)計(jì)算，進(jìn)一步減少計(jì)算單元的空閑時(shí)間，最大化地利用芯片的計(jì)算資源，從而提供更高的實(shí)測(cè)算力。

圖片來自鯤云科技官網(wǎng)

鯤云科技合伙人、首席運(yùn)營官王少軍博士在接受電子發(fā)燒友網(wǎng)采訪時(shí)表示，之所以投身于定制數(shù)據(jù)流架構(gòu)芯片的研發(fā)，首先是鯤云科技有數(shù)據(jù)流架構(gòu)技術(shù)研發(fā)基礎(chǔ)，公司創(chuàng)始團(tuán)隊(duì)來自數(shù)據(jù)流技術(shù)的源頭實(shí)驗(yàn)室，該實(shí)驗(yàn)室是全球三大定制計(jì)算實(shí)驗(yàn)室之一，從90年代開始就深耕數(shù)據(jù)流架構(gòu)與不同領(lǐng)域的領(lǐng)域?qū)Ｓ眉軜?gòu)研發(fā)，具備深厚的研發(fā)和迭代積累。

其次更為重要的是底層芯片技術(shù)存在算力瓶頸，隨著摩爾定律發(fā)展，依靠摩爾定律提升芯片性能的成本越來越高，比如一款5nm芯片的研發(fā)成本就高達(dá)數(shù)億美元，針對(duì)特定領(lǐng)域?qū)崿F(xiàn)領(lǐng)域?qū)Ｓ眉軜?gòu)的性能獲益會(huì)越來越高，直到大幅領(lǐng)先通用計(jì)算芯片，鯤云科技認(rèn)為在算力猛增的時(shí)代，行業(yè)需要一顆高算力性價(jià)比的人工智能專用芯片，數(shù)據(jù)流架構(gòu)的重大意義在于它突破了傳統(tǒng)芯片架構(gòu)對(duì)芯片利用率的約束，最大化發(fā)揮芯片本身的峰值性能。

因此鯤云科技在早期數(shù)據(jù)流架構(gòu)技術(shù)的積累下，針對(duì)人工智能領(lǐng)域開發(fā)出CAISA架構(gòu)，并最終實(shí)現(xiàn)從0到1完成首顆數(shù)據(jù)流AI芯片量產(chǎn)。

鯤云CAISA芯片利用率高達(dá)95.4%

鯤云科技于去年6月正式量產(chǎn)了全球首款數(shù)據(jù)流AI芯片CAISA，芯片利用率達(dá)到95.4%，面向數(shù)據(jù)中心和邊緣端AI推斷應(yīng)用，該芯片采用28nm工藝，這個(gè)制程并不高，不過因?yàn)樾酒寐矢撸词乖诒容^低的制程情況下，CAISA芯片也可以帶來很高的實(shí)測(cè)性能。

同時(shí)鯤云科技還基于CAISA芯片推出三款高性能計(jì)算平臺(tái)，包括面向邊緣端的星空X3加速卡、面向數(shù)據(jù)中心的星空X9加速卡、面向邊緣AI應(yīng)用的星空X6A邊緣小站。星空X3加速卡面向8-16路視頻實(shí)時(shí)結(jié)構(gòu)化分析，星空X6A邊緣小站面向8路視頻處理應(yīng)用。

目前CAISA芯片及加速卡產(chǎn)品已在多領(lǐng)域?qū)崿F(xiàn)應(yīng)用，包括智慧安監(jiān)、智能制造、智慧電力、智慧城市等。王少軍博士認(rèn)為，對(duì)于這些場(chǎng)景，特別是國民生產(chǎn)支柱行業(yè)而言，“降本增效”是剛需，比如在油田的應(yīng)用場(chǎng)景，傳統(tǒng)的安防監(jiān)控系統(tǒng)已經(jīng)比較成熟，端側(cè)的攝像頭監(jiān)控系統(tǒng)基本部署完成，但視頻結(jié)構(gòu)化利用率低，單純依靠人工巡檢，作業(yè)區(qū)域廣，環(huán)境復(fù)雜，耗時(shí)長，數(shù)據(jù)采集維度單一，人工識(shí)別難度大，而且預(yù)警不及時(shí)，漏報(bào)概率高，事后取證難。

針對(duì)這些行業(yè)痛點(diǎn)，鯤云科技提供算法算力平臺(tái)一體化方案，基于數(shù)據(jù)流AI芯片的底層算力優(yōu)勢(shì)，以及算力和算法聯(lián)合優(yōu)化的技術(shù)優(yōu)勢(shì)，對(duì)現(xiàn)場(chǎng)接入的500路視頻進(jìn)行數(shù)據(jù)處理，對(duì)漏油、安全帽、工服、抽煙、打電話、人員闖入和采油設(shè)備運(yùn)行狀態(tài)進(jìn)行識(shí)別，可以做到從視頻流獲取到輸出報(bào)警時(shí)間為1s，為油區(qū)的生產(chǎn)情況提供更可靠的安全保障。在油田智能化升級(jí)過程中，數(shù)據(jù)流AI芯片就凸顯出了其市場(chǎng)價(jià)值，可以充分利舊、快速部署、控制成本。

未來解決算力需求的主流方法

數(shù)據(jù)流AI芯片的商用落地，證實(shí)了數(shù)據(jù)流和深度學(xué)習(xí)融合的價(jià)值，王少軍博士認(rèn)為數(shù)據(jù)流架構(gòu)具備成為下一代計(jì)算平臺(tái)的潛力。他談到，在計(jì)算平臺(tái)的演進(jìn)過程中，十倍核心性能指標(biāo)的提升，是計(jì)算架構(gòu)代際更替的主要指標(biāo)，比如，從X86到RISC計(jì)算平臺(tái)，能效比提升了10倍以上；從X86到CUDA計(jì)算平臺(tái)，峰值算力也提升了超過10倍。

從歷史脈絡(luò)來看，相對(duì)上一代主流算力平臺(tái)，新的算力平臺(tái)在某個(gè)指標(biāo)上需要高出10倍，才能實(shí)現(xiàn)實(shí)測(cè)性能的大幅提升，隨著摩爾定律的放緩，業(yè)界越來越關(guān)注下一代芯片應(yīng)該如何發(fā)展，而底層架構(gòu)創(chuàng)新是這幾年業(yè)界的共識(shí)，行業(yè)需要新的技術(shù)路線來實(shí)現(xiàn)底層算力的突破。

王少軍博士認(rèn)為，下一代有望帶來10倍以上突破的指標(biāo)就是芯片利用率，這可能是未來解決算力需求的主流方法，而數(shù)據(jù)流架構(gòu)可以實(shí)現(xiàn)這一點(diǎn)，鯤云科技認(rèn)為未來會(huì)有更多新興AI芯片廠商加入到數(shù)據(jù)流AI技術(shù)路線中。對(duì)于現(xiàn)有芯片廠商來說，技術(shù)路線的選擇是公司的一大核心戰(zhàn)略，而其已有的開發(fā)生態(tài)和技術(shù)積累使其很難轉(zhuǎn)換賽道，但有些玩家也看到了數(shù)據(jù)流技術(shù)的價(jià)值，比如英偉達(dá)就推出了TensorCore，在指令集架構(gòu)的基礎(chǔ)上，該模塊采用了數(shù)據(jù)流技術(shù)的原理，來提升其在特定領(lǐng)域的芯片利用效率。

總結(jié)

整體來說，數(shù)據(jù)流架構(gòu)可以大幅提升芯片利用率，鯤云定制數(shù)據(jù)流CAISA新芯片的量產(chǎn)商用，也證實(shí)了數(shù)據(jù)流與深度學(xué)習(xí)融合的價(jià)值，給AI帶來了一個(gè)新的技術(shù)研究方向，相信未來會(huì)有更多AI芯片廠商加入到數(shù)據(jù)流架構(gòu)技術(shù)的研究中。

現(xiàn)在AI芯片在很多場(chǎng)景都有落地剛需，尤其在邊緣端，很多場(chǎng)景還存在“碎片化”需求，因此廠商除了考慮提升芯片利用率，做到更高算力性價(jià)比之外，還需要思考如何提升更通用、軟件易用性等，全面提升芯片性能，促進(jìn)專用AI芯片規(guī)模化量產(chǎn)，賦能各產(chǎn)業(yè)智能化升級(jí)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

鯤云科技

鯤云科技

+關(guān)注

關(guān)注
0

文章
29

瀏覽量
3810
算力

算力

+關(guān)注

關(guān)注
1

文章
936

瀏覽量
14750

評(píng)論

相關(guān)推薦

《算力芯片高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

在數(shù)據(jù)挖掘工作中，我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù)，這讓我對(duì)GPU架構(gòu)和張量運(yùn)算充滿好奇。閱讀《算力

發(fā)表于 11-24 17:12

理解ECU數(shù)據(jù)流的分析方法

分析ECU數(shù)據(jù)流，技術(shù)人員可以快速定位故障源頭，減少維修時(shí)間和成本。性能優(yōu)化：通過監(jiān)控ECU數(shù)據(jù)，可以對(duì)車輛性能進(jìn)行調(diào)整，以適應(yīng)不同的駕駛條件和駕駛者需求。安全監(jiān)控：實(shí)時(shí)監(jiān)控ECU數(shù)據(jù)

發(fā)表于 11-05 11:07 ?293次閱讀

華納云：什么是負(fù)載均衡？優(yōu)化資源利用率的策略

負(fù)載均衡是現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)架構(gòu)中不可或缺的一部分，它通過智能分配請(qǐng)求和任務(wù)，確保系統(tǒng)資源的高效利用。本文將探討負(fù)載均衡的概念、工作原理、優(yōu)化資源利用率的策略及其在實(shí)際應(yīng)用中的重要性。 1. 什么是負(fù)載

發(fā)表于 10-28 16:07 ?120次閱讀

交換機(jī)內(nèi)存利用率過高會(huì)是什么問題

在現(xiàn)代網(wǎng)絡(luò)架構(gòu)中，交換機(jī)扮演著至關(guān)重要的角色，負(fù)責(zé)在網(wǎng)絡(luò)設(shè)備之間高效地轉(zhuǎn)發(fā)數(shù)據(jù)包。然而，隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和數(shù)據(jù)流量的增加，交換機(jī)的內(nèi)存資源可能會(huì)變得緊張，導(dǎo)致內(nèi)存利用率過高。這種情況

發(fā)表于 10-18 09:53 ?440次閱讀

名單公布！【書籍評(píng)測(cè)活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

的強(qiáng)有力競爭者；蘋果、Cerebras、Ampere、特斯拉等企業(yè)的加入讓這場(chǎng)“算力芯片戰(zhàn)爭”更加熱鬧。 CPU、GPU、NPU等芯片是推動(dòng)科技創(chuàng)新的基石，算

發(fā)表于 09-02 10:09

今日看點(diǎn)丨小鵬自研芯片流片！算力是同行三倍；加拿大將對(duì)中國電動(dòng)汽車征收100%關(guān)稅

1. 小鵬自研芯片流片！算力是同行三倍 ? 據(jù)報(bào)道，小鵬汽車自研的智能駕駛芯片已經(jīng)成功流片。有知

發(fā)表于 08-27 11:22 ?1149次閱讀

異構(gòu)混訓(xùn)整合不同架構(gòu)芯片資源，提高算力利用率

的解決方案。通過混合使用多種異構(gòu)芯片，可以充分利用不同芯片的優(yōu)勢(shì)，提高算力利用率，降低算力成本，

發(fā)表于 07-18 00:11 ?3367次閱讀

DC/AC電源模塊：提升光伏發(fā)電系統(tǒng)的能源利用率

BOSHIDA DC/AC電源模塊：提升光伏發(fā)電系統(tǒng)的能源利用率 隨著環(huán)境保護(hù)意識(shí)的提高和能源需求的增加，光伏發(fā)電系統(tǒng)作為一種清潔能源的代表，受到了越來越多的關(guān)注。然而，光伏發(fā)電系統(tǒng)在實(shí)際應(yīng)用中還

發(fā)表于 06-17 13:53 ?332次閱讀

NAND Flash供應(yīng)商產(chǎn)能利用率提升，今年有望盈利

據(jù)了解，本月以來鎧俠和西數(shù)產(chǎn)能利用率已接近飽和，而其他業(yè)者則生產(chǎn)保持平穩(wěn)。此外，TrendForce集邦咨詢補(bǔ)充道，考慮到明年第四季度原料短缺的情況以及AndES Store新品上市等需求激增

發(fā)表于 03-20 10:22 ?447次閱讀

潞晨科技Colossal-AI + 浪潮信息AIStation，大模型開發(fā)效率提升10倍

的潞晨科技Colossal-AI系統(tǒng)，用戶可實(shí)現(xiàn)在本地算力平臺(tái)一鍵訓(xùn)練、微調(diào)、推理、部署大模型，將大模型開發(fā)效率提升10倍

發(fā)表于 03-01 09:43 ?458次閱讀

臺(tái)積電晶圓廠產(chǎn)能利用率將全面提高

消息來源表示，TSMC 8英寸及12英寸晶圓工廠的利用率已分別回升至70-80%和80%。尤其值得注意的是，28納米制程的利用率已重返80%的常態(tài)范圍；而7/6納米與5/4納米制程的利用率更分別達(dá)到75%以及接近飽和狀態(tài)。

發(fā)表于 01-17 13:56 ?686次閱讀

產(chǎn)能利用率降至四成！電池行業(yè)迎深度洗牌

據(jù)統(tǒng)計(jì)，我國電池生產(chǎn)的平均產(chǎn)能利用率低于50%，即便是龍頭企業(yè)寧德時(shí)代上半年產(chǎn)能利用率也降至60.5%，三季度也僅回升至70%以上，仍處于歷史較低水平。

發(fā)表于 12-28 17:16 ?822次閱讀

淺談為AI大算力而生的存算-體芯片

大模型爆火之后，存算一體獲得了更多的關(guān)注與機(jī)會(huì)，其原因之一是因?yàn)榇嫠阋惑w芯片的裸算力相比傳統(tǒng)架構(gòu)的AI芯片，能帶來十

發(fā)表于 12-06 15:00 ?370次閱讀

產(chǎn)能利用率低迷，傳臺(tái)積電7nm將降價(jià)10%！

早在今年10月的法說會(huì)上，臺(tái)積電總裁魏哲家就曾被外資當(dāng)面詢問7nm產(chǎn)能利用率不斷下滑的問題，臺(tái)積電7nm在總營收當(dāng)中的占比持續(xù)滑落，從第二季度的23%降至了第三季度17%，相比去年同期的26%更是下跌了近10個(gè)百分點(diǎn)。

發(fā)表于 12-04 17:16 ?845次閱讀

SPWM與SVPWM—調(diào)制比與電壓利用率

學(xué)習(xí)調(diào)制方法時(shí)，**調(diào)制比**與**電壓利用率**是個(gè)重要的概念。我發(fā)現(xiàn)教材中卻對(duì)這兩個(gè)內(nèi)容介紹的很模糊，網(wǎng)上也沒有很多包含具體推導(dǎo)過程的公式。

發(fā)表于 12-01 17:04 ?2.1w次閱讀