精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Speedster7t FPGA中可編程邏輯的架構

Achronix ? 來源:Achronix ? 作者:Achronix ? 2022-07-05 15:37 ? 次閱讀

概述

隨著數據中心、人工智能自動駕駛5G、計算存儲和先進測試等應用的數據量和數據流量不斷增大,不僅需要引入高性能、高密度FPGA來發揮其并行計算和可編程硬件加速功能,而且還對大量數據在FPGA芯片內外流動提出了更高的要求。于是,在FPGA芯片中集成包括片上二維網絡(2D NoC)和各種最新高速接口的新品類FPGA芯片應運而生,成為FPGA產業和相關應用的新熱點。

拉開這場FPGA芯片創新大幕的是全球最大的獨立FPGA技術和產品提供商Achronix半導體公司,其采用7nm工藝打造的Achronix Speedster7t FPGA不僅擁有諸多高性能外圍Hard IP,而且是全球第首次在FPGA的邏輯陣列上集成了2D NoC,一經推出就在市場得到了積極的響應,并引來競爭對手的模仿和跟隨。

Speedster7t這款專門針對人工智能/機器學習AI / ML)和高帶寬應用進行優化的高性能、高密度FPGA,包括了革命性的二維片上網絡(2D NoC)、新型機器學習處理器(MLP)、400G以太網和PCIe Gen5端口,以及高帶寬GDDR6和DDR4/5存儲控制器。Speedster7t FPGA架構如圖1所示。

0e8f62bc-fc35-11ec-ba43-dac502259ad0.png

圖1 Speedster7t FPGA結構圖

Achronix Speedster7t FPGA除了在外圍Hard IP上都采用目前業內領先的大帶寬高速率IP,在內部的可編程邏輯的架構中也做了大量的優化去進一步提高內部可編程邏輯的性能,從而適配外圍IP超高帶寬需求。本文首先談談Speedster7t FPGA的片上SRAM,也就是Block RAM針對傳統的結構所做出的一些優化。

Speedster7t FPGA中可編程邏輯的架構

Speedster7t FPGA中內部的可編程資源是按列排布,包括LUT、FF、ALU、MUX、MLP、Block RAM、Logic RAM。如圖2所示。

0ecf9238-fc35-11ec-ba43-dac502259ad0.png

圖2 Speedster7t FPGA可編程邏輯結構

其中MLP、Block RAM、Logic RAM是集成在一起,他們之間的連接用的是專有的走線,不占用可編程邏輯走線資源,這樣做的目的主要是為了提高性能,同時也可以節省可編程邏輯走線資源,這個架構對于AI,還有需要用到MLP的一些復雜算法的性能優化是非常明顯的,在我們的MLP系列文章中會詳細講到,這里我們只重點說一下Block RAM。 Speedster7t FPGA的Block RAM特點 Speedster7t FPGA內部的Block RAM是一個容量為72k bit的簡單雙端口RAM,有一個讀端口,一個寫端口。兩個端口的時鐘完全獨立,并且可以完全獨立的配置讀寫位寬。它可以靈活的配置成簡單雙端口RAM或者ROM。

Block RAM的主要特性如表1所示。

表1 Block RAM的關鍵特性

0f142a56-fc35-11ec-ba43-dac502259ad0.png

Block RAM框圖如圖3所示。

0f340204-fc35-11ec-ba43-dac502259ad0.png

圖3 Block RAM內部結構

Speedster7t FPGA的Block RAM級聯結構

Speedster7t FPGA的Block RAM最大的特點是增加了Block RAM間的級聯走線,級聯走線是BRAM間專有的連線,不占用可編程邏輯的走線資源,可以極大的提升多個Block RAM級聯的性能。圖4顯示了Block RAM間級聯走線的架構。

0f5735da-fc35-11ec-ba43-dac502259ad0.png

圖4 Block RAM級聯結構

由圖4可以看出,讀寫地址線和數據線都有專有的級聯線連接。這樣的架構在一些場景中都會有應用,比如:需要從外部端口接收數據或者從GDDR6讀數據去初始化大量Block RAM的場景,AI的神經網絡就是一個典型的應用,在每一層的卷積算法中,系統都會從GDDR6讀出圖像數據和權重數據放入每個引擎的Block RAM中,引擎計算完畢以后再存入到GDDR6中供下一次運算使用。

有了這樣的級聯架構,我們在寫入數據去初始化大量Block RAM的時候不需要外部數據有很大的扇出,直接通過同一列Block RAM的級聯線就可以輕松完成,具體實現可以參考Achronix MLP_Conv2D參考設計。另外一個例子就是在需要多個Block RAM去構成更大容量的RAM的時候,如果利用級聯線可以大大提升系統的性能。我們針對這個專門做了一個工程比較一下,生成一個位寬64bit,深度16384的一個簡單雙端口RAM,需要用到16個Block RAM。我們分別用專有級聯線和內部可編程邏輯去拼深度兩種方法來對比。可以看到用專有的級聯線資源更省,而且性能有了很大的提高。

使用專有的級聯線資源占用和性能:

0f7a5dda-fc35-11ec-ba43-dac502259ad0.png

使用可編程邏輯資源占用和性能:

0f9b4658-fc35-11ec-ba43-dac502259ad0.png

后面我們會繼續深入了解Speedster7t FPGA可編程邏輯的各種特性,并且會用一些例子來說明如何更高效的利用這些特性,以將Speedster7t這款業界首創的高數據帶寬FPGA芯片與更多的創新智能化應用結合起來。

此外,Achronix也提供Speedcore嵌入式FPGA硅知識產權(IP)產品,用來幫助用戶在應用規模進一步擴大后,去開發帶有eFPGA邏輯陣列的ASIC或者SoC產品,它們由Achronix的ACE FPGA開發工具提供支持,從而可以重用FPGA開發成果,這是Achronix在率先引入2D NoC和MLP之外,另一個層面上的創新。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1626

    文章

    21665

    瀏覽量

    601809
  • 芯片
    +關注

    關注

    453

    文章

    50387

    瀏覽量

    421786
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132406

原文標題:超高數據流通量FPGA新品類中的Block RAM級聯架構

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Achronix Speedster7t FPGA與GPU解決方案的比較

    這篇針對大模型推理跟GPU對比分析,雖然以Llama2為例,也適用于最新的Llama3,模型的日新月易也更進一步說明硬件平臺的可編程可擴展的重要性,FPGA是其中一個不錯的選擇。
    的頭像 發表于 09-18 16:19 ?239次閱讀
    Achronix <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>與GPU解決方案的比較

    基于Achronix Speedster7t FPGA器件的AI基準測試

    Achronix半導體公司推出了為AI優化的Speedster7t系列FPGA芯片,該系列包含專門針對AI工作負載的強化計算引擎。隨著AI在各個領域變得普遍,在FPGA芯片上部署AI應用的需求促使了
    的頭像 發表于 09-18 16:10 ?422次閱讀
    基于Achronix <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>器件的AI基準測試

    什么是現場可編程邏輯陣列?它有哪些特點和應用?

    在電子工程領域,現場可編程邏輯陣列(Field Programmable Logic Array,簡稱FPLA)是一種具有強大靈活性和可編程性的半導體器件。它屬于可編程邏輯器件(PLD)的一種,通過
    的頭像 發表于 05-23 16:25 ?807次閱讀

    中高端FPGA如何選擇

    和Intel在高端FPGA的地位? 1.高速IP Achronix的Speedster7t支持PCIe Gen5和112G Serdes,而AMD的高端系列Virtex
    發表于 04-24 15:09

    FPGA零基礎學習系列精選:半導體存儲器和可編程邏輯器件簡介

    。它是作為專用集成電路(ASIC)領域中的一種半定制電路而出現的,既解決了定制電路的不足,又克服了原有可編程器件門電路數有限的缺點。FPGA 器件屬于專用集成電路的一種半定制電路,是可編程
    發表于 03-28 17:41

    現場可編程門陣列的基本結構和優缺點

    現場可編程門陣列(FPGA)的基本結構主要包括可編程輸入/輸出單元、基本可編程邏輯單元、嵌入式塊RAM、豐富的布線資源、底層嵌入功能單元和內
    的頭像 發表于 03-27 14:49 ?542次閱讀

    現場可編程門陣列的原理和應用

    FPGA是一種可編程的硬件邏輯器件,其核心組成部分是可編程邏輯單元(PLU)和可編程互連資源(I
    的頭像 發表于 03-27 14:49 ?624次閱讀

    現場可編程門陣列簡介

    現場可編程門陣列(FPGA)是一種由半導體材料制成的集成電路,用戶購買后可以重新編程或配置,以滿足特定功能或應用需求。其控制程序存儲在內存,加電后,程序自動裝載到芯片執行。
    的頭像 發表于 03-27 14:48 ?508次閱讀

    現場可編程門陣列是什么

    現場可編程門陣列(Field Programmable Gate Array,簡稱FPGA)是一種超大規模可編程邏輯器件,由可編程邏輯資源、
    的頭像 發表于 03-16 16:38 ?2402次閱讀

    fpga芯片架構介紹

    FPGA(現場可編程門陣列)芯片架構是一種高度靈活和可編程的集成電路架構,它以其獨特的結構和功能,在現代電子系統
    的頭像 發表于 03-15 14:56 ?696次閱讀

    fpga是什么架構

    FPGA(現場可編程門陣列)的架構主要由可配置邏輯模塊(CLB)、輸入/輸出模塊(IOB)以及可編程互連資源組成。
    的頭像 發表于 03-14 17:05 ?820次閱讀

    可編程邏輯器件的特征及優勢科普

    可編程邏輯器件是一種集成電路,具有可編程功能的特性。它們可以根據用戶的需求進行編程,從而實現不同的邏輯功能。
    的頭像 發表于 02-26 18:24 ?1078次閱讀

    可編程邏輯陣列PLA內部邏輯結構示意

    可編程邏輯陣列(Programmable Logic Array,PLA)和可編程陣列邏輯(Programmable Array Logic,PAL)都是數字邏輯電路中常見的
    發表于 02-02 11:41 ?2450次閱讀
    <b class='flag-5'>可編程邏輯</b>陣列PLA內部<b class='flag-5'>邏輯</b>結構示意

    FPGA現場可編程門陣列的綜合指南

    現場可編程門陣列 (FPGA) 是可以在制造后進行編程和重新編程以實現數字邏輯功能的半導體器件。
    的頭像 發表于 12-07 17:15 ?663次閱讀
    <b class='flag-5'>FPGA</b>現場<b class='flag-5'>可編程</b>門陣列的綜合指南

    可編程邏輯芯片電流過大會影響使用嗎

    可編程邏輯芯片(例如FPGA或CPLD)的電流過大可能會影響使用,具體影響取決于電流過大的原因以及電路設計的特性。
    的頭像 發表于 12-07 10:03 ?640次閱讀