欧美激情αV一区二区三区_人妻少妇精品久久久久久_五月天综合在线_久久天堂AV女色优精品

卷積占據(jù)了CNN網(wǎng)絡(luò)中絕大部分運(yùn)算，進(jìn)行乘法運(yùn)算通常都是使用FPGA中的DSP，這樣算力就受到了器件中DSP資源的限制。比如在zynq7000器件中，DSP資源就較少，神經(jīng)網(wǎng)絡(luò)的性能就無(wú)法得到提升。利用xilinx器件中LUT的結(jié)構(gòu)特征，設(shè)計(jì)出的乘法器不但能靈活適應(yīng)數(shù)據(jù)位寬，而且能最大限度降低LUT資源使用。

Xilinx ultrascale器件LUT結(jié)構(gòu)

在這里簡(jiǎn)要介紹一下ultrascale系列器件中的LUT結(jié)構(gòu)，有助于后邊對(duì)乘法器設(shè)計(jì)思路的理解。CLB（configuratble logic block）是主要的資源模塊，其包含了8個(gè)LUT，16個(gè)寄存器，carry邏輯，以及多路選通器等。其中LUT可以用作6輸入1輸出，或者兩個(gè)5輸入LUT，但是這兩個(gè)LUT公用輸入，具有不同輸出。每個(gè)LUT輸出可以連接到寄存器或者鎖存器，或者從CLB輸出。LUT可以用于64x1和32X2的分布式RAM，一個(gè)CLB內(nèi)最大可以支持512X1大小的RAM。RAM的讀寫地址和輸入的讀寫數(shù)據(jù)是共享的，數(shù)據(jù)通道可以使用x和I接口。LUT還可以配置用于4:1選通器，CLB最大能夠支持到32:1的選通器。CLB中的carry邏輯含有異或門和產(chǎn)生進(jìn)位的門，用于生成進(jìn)位數(shù)據(jù)。

圖1.1 LUT結(jié)構(gòu)

LUT還可以被動(dòng)態(tài)配置成32bit移位寄存器，這個(gè)功能在乘法器設(shè)計(jì)中可以用于改變乘法器的乘數(shù)和被乘數(shù)。在寫入LUT數(shù)據(jù)的時(shí)候，每個(gè)時(shí)鐘周期從D接口進(jìn)入數(shù)據(jù)，依次寫入32bit數(shù)據(jù)。讀數(shù)據(jù)的時(shí)候，可以通過(guò)地址來(lái)定位任何32bit中的數(shù)據(jù)。這樣就可以配置成任何小于32bit的移位寄存器。移位輸出Q31可以進(jìn)入下一級(jí)LUT用于串聯(lián)產(chǎn)生更大移位寄存器。在一個(gè)CLB中最大可以串聯(lián)產(chǎn)生256bit移位寄存器。

圖1.2 移位寄存器配置

LUT乘法器原理

首先假設(shè)我們處理整數(shù)乘法，小數(shù)乘法也可以用這樣的方法。基本思想就是將m bit大小的數(shù)據(jù)進(jìn)行分割表示：

其中0<=di<2^q。乘以一個(gè)常數(shù)K：

這樣就將兩個(gè)數(shù)據(jù)乘法分解成低bit數(shù)據(jù)乘法，結(jié)果是一個(gè)常數(shù)K和di相乘，然后再進(jìn)行移位求和。M bit數(shù)據(jù)分解后的低bit數(shù)據(jù)位寬通常都適配LUT輸入寬度，這樣能最大利用LUT資源。現(xiàn)在乘法只有K*di，由于bit位寬較小，這部分可以用LUT查找表的形式來(lái)。預(yù)先將0K到（2^q-1）K的數(shù)據(jù)存儲(chǔ)到LUT中，然后通過(guò)di來(lái)選擇對(duì)應(yīng)的數(shù)據(jù)。如果是負(fù)數(shù)乘法，那么數(shù)據(jù)使用補(bǔ)碼表示，那么LUT中存儲(chǔ)的數(shù)據(jù)是從-2^(q-1)K到（2^(q-1)-1）K。針對(duì)以上介紹的ultrascale器件的LUT6，q可以選擇為5。但是在本論文中使用的是LUT4器件，其只有4輸入，因此選擇了q=3，為什么沒(méi)有選擇4呢？另外1bit是為了用于半加器的實(shí)現(xiàn)。

基本結(jié)構(gòu)

實(shí)現(xiàn)上述累加的方法有很多種，論文中采用了進(jìn)位鏈加法器。圖2.1中是m bit和n bit數(shù)據(jù)乘法，每個(gè)E結(jié)構(gòu)計(jì)算di*K，并且和上一個(gè)結(jié)構(gòu)求和，輸出的低3bit直接作為最終結(jié)果，而n bit傳輸?shù)较乱患?jí)進(jìn)行計(jì)算。q=3的計(jì)算單元E有[m/3]個(gè)。K*di是有n+3bit的查找表實(shí)現(xiàn)的。查找表的結(jié)果由di選擇，然后再通過(guò)一個(gè)求和器和之前數(shù)據(jù)求和。這是一個(gè)最基本的結(jié)構(gòu)，論文又針對(duì)這個(gè)結(jié)構(gòu)做了優(yōu)化，用一個(gè)LUT同時(shí)實(shí)現(xiàn)了一個(gè)查找表和半加器。具體來(lái)講，其中3bit輸入用于di，還有1bit用于上一次輸出，LUT中存放數(shù)據(jù)是di*K和上一次結(jié)果第j bit的半加結(jié)果，實(shí)際上是第j bit數(shù)據(jù)LUT中結(jié)果的異或。而進(jìn)位數(shù)據(jù)由CLB中相應(yīng)的carry邏輯來(lái)計(jì)算。相比于粗暴的進(jìn)行數(shù)據(jù)求和，這樣精確的來(lái)控制LUT能夠大大節(jié)省資源。

圖2.1 基本結(jié)構(gòu)

圖2.2 LUT實(shí)現(xiàn)乘法和半加，外圍carry邏輯實(shí)現(xiàn)進(jìn)位

動(dòng)態(tài)配置LUT內(nèi)容

Xilinx的LUT結(jié)構(gòu)允許在運(yùn)行過(guò)程中改變LUT中的內(nèi)容，這樣的乘法器就能改變被乘數(shù)據(jù)K。這可以實(shí)現(xiàn)在神經(jīng)網(wǎng)絡(luò)計(jì)算中需要更新權(quán)重參數(shù)。論文中使用的是LUT4，所以一個(gè)LUT可以被配置成16bit移位寄存器。通過(guò)這16bit寄存器可以來(lái)配置LUT中的內(nèi)容，每個(gè)時(shí)鐘周期更新1bit數(shù)據(jù)，16個(gè)時(shí)鐘周期可以完成一個(gè)LUT中數(shù)據(jù)更新。是否進(jìn)行LUT內(nèi)容更新通過(guò)CE使能信號(hào)控制。

如何產(chǎn)生LUT中數(shù)據(jù)的值呢？如果上一次輸出數(shù)據(jù)對(duì)應(yīng)bit為0，那么LUT中就存放0*K到7*K的值，如果上一次對(duì)應(yīng)bit為1，那么存放值為對(duì)以上數(shù)據(jù)取反。圖4.1表示了獲得LUT中內(nèi)容的電路圖。首先數(shù)據(jù)被初始化為0*K，下一次對(duì)應(yīng)著求和進(jìn)位為1的情況，取反，然后再加K得到1*K的值，這樣每隔兩個(gè)時(shí)鐘周期就得到下一個(gè)乘法的數(shù)據(jù)值，依次對(duì)LUT進(jìn)行更新。上述中針對(duì)的是正整數(shù)，如果對(duì)于負(fù)數(shù)乘法更新，可以在上述求整數(shù)乘法的電路基礎(chǔ)上做一下改進(jìn)，如圖4.2。當(dāng)最高位為0的時(shí)候，輸出結(jié)果就是之前求得的乘法結(jié)果。如果最高位是1，那么負(fù)數(shù)的補(bǔ)碼表示是乘法的原碼結(jié)果減去最高位數(shù)值。

圖4.1 LUT中內(nèi)容更新電路圖

圖4.2 負(fù)數(shù)乘法結(jié)果更新電路

結(jié)果分析

最后我們來(lái)看看這種乘法器的實(shí)現(xiàn)效果，圖5.1表示對(duì)多級(jí)進(jìn)位不適用pipeline結(jié)構(gòu)的時(shí)鐘頻率隨著被乘數(shù)K位寬變化，可以看到隨著級(jí)數(shù)E的增加，頻率降低很多，這主要是進(jìn)位鏈邊長(zhǎng)導(dǎo)致。而隨著K位寬增加，頻率也有降低，這主要是因?yàn)閷?shí)現(xiàn)di*K乘法的LUT資源增加導(dǎo)致。

圖5.1 沒(méi)有pipeline下頻率MHz

圖5.2是不同乘法位寬下的使用slice數(shù)量。論文中考慮了兩種極端情況，一種是完全pipeline下，即每級(jí)計(jì)算單元都經(jīng)過(guò)寄存器，另外一種是完全沒(méi)有pipeline，所有級(jí)E都是串聯(lián)。

圖5.2 slice資源

結(jié)論

上述通過(guò)LUT來(lái)設(shè)計(jì)乘法器的方法，可以應(yīng)用于CNN中的卷積運(yùn)算當(dāng)中，因?yàn)闄?quán)重可以被當(dāng)做被乘數(shù)，用于LUT內(nèi)容的配置，在更換權(quán)重時(shí)，可以對(duì)LUT內(nèi)容更新，這樣就能避免了DSP資源的限制，不失為一種增加算力的方法。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

dsp

dsp

+關(guān)注

關(guān)注
552

文章
7962

瀏覽量
348308
移位寄存器

移位寄存器

+關(guān)注

關(guān)注
2

文章
258

瀏覽量
22238
鎖存器

鎖存器

+關(guān)注

關(guān)注
8

文章
905

瀏覽量
41448
乘法器

乘法器

+關(guān)注

關(guān)注
8

文章
205

瀏覽量
36984
LUT

LUT

+關(guān)注

關(guān)注
0

文章
49

瀏覽量
12487

原文標(biāo)題：用LUT來(lái)搭建乘法器

文章出處：【微信號(hào)：zhuyandz，微信公眾號(hào)：FPGA之家】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

應(yīng)用于CNN中卷積運(yùn)算的LUT乘法器設(shè)計(jì)

。利用xilinx器件中LUT的結(jié)構(gòu)特征，設(shè)計(jì)出的

發(fā)表于 11-30 11:45 ?2750次閱讀

應(yīng)用于CNN<b class='flag-5'>中</b>卷積運(yùn)算的<b class='flag-5'>LUT</b><b class='flag-5'>乘法器</b>設(shè)計(jì)

乘法器和混頻器的區(qū)別

乘法器和混頻器的區(qū)別表面上看，都是做“乘法”了，其實(shí)區(qū)別很大。 乘法器，一般叫模擬乘法器，是用于

發(fā)表于 11-13 16:37

FPGA乘法器設(shè)計(jì)

剛接觸學(xué)習(xí)FPGA，懂得verilog HDL的基礎(chǔ)語(yǔ)法，有一塊帶XILINX的ZYNQ xc7z020的開發(fā)板，開發(fā)軟件用的是vivado；現(xiàn)在要設(shè)計(jì)一個(gè)16位的乘法器，功能已經(jīng)實(shí)現(xiàn)。但需要考查

發(fā)表于 02-25 16:03

如何分析傳統(tǒng)乘法器和vedic乘法器的時(shí)序延遲？

我正在研究一種適用于Vedic Maths算法的乘法器。我想對(duì)傳統(tǒng)乘法器和vedic乘法器的時(shí)序延遲進(jìn)行比較分析。我有spartan 3e和Xilinx 12.1時(shí)序分析器。請(qǐng)任何人都

發(fā)表于 07-04 06:36

怎么設(shè)計(jì)基于FPGA的WALLACETREE乘法器？

在數(shù)字信號(hào)處理中，乘法器是整個(gè)硬件電路時(shí)序的關(guān)鍵路徑。速度和面積的優(yōu)化是乘法器設(shè)計(jì)過(guò)程的兩個(gè)主要考慮因素。由于現(xiàn)代可編程邏輯芯片F(xiàn)PGA的集成度越來(lái)越高，及其相對(duì)于ASIC設(shè)計(jì)難度較低和產(chǎn)品設(shè)計(jì)

發(fā)表于 09-03 07:16

乘法器的基本概念

乘法器的基本概念 乘法器是一種完成兩個(gè)互不相關(guān)的模擬信號(hào)相乘作用的電子器件。理想乘法器的輸出特性方程可由下式表示： UO

發(fā)表于 05-18 14:03 ?1.4w次閱讀

1/4平方乘法器

1/4平方乘法器 這種乘法器是根據(jù)數(shù)學(xué)關(guān)系設(shè)計(jì)而成的，因此稱為1/4平方乘法電路，或稱1/4平方乘法器。其

發(fā)表于 05-18 14:08 ?1968次閱讀

脈沖-寬度-高度調(diào)制乘法器

脈沖-寬度-高度調(diào)制乘法器 脈沖-寬度-高度調(diào)制乘法器雙稱為時(shí)間分割乘法器。這類乘法器電路原理圖如圖5.4-24A所示。圖中，三角波電壓UT和模擬輸入電壓UY

發(fā)表于 05-18 14:23 ?2012次閱讀

脈沖-寬度-高度調(diào)制<b class='flag-5'>乘法器</b>

變跨導(dǎo)乘法器

變跨導(dǎo)乘法器 這種乘法器現(xiàn)在已經(jīng)成為一種工業(yè)上的標(biāo)準(zhǔn)方法，是應(yīng)用極為廣泛的優(yōu)質(zhì)乘法器。

發(fā)表于 05-18 16:00 ?1231次閱讀

乘法器在通信電路中的應(yīng)用

乘法器在通信電路中的應(yīng)用普通振幅調(diào)制

發(fā)表于 05-18 17:46 ?1379次閱讀

基于IP核的乘法器設(shè)計(jì)

實(shí)驗(yàn)?zāi)康?1、熟悉Xilinx的ISE 軟件的使用和設(shè)計(jì)流程； 2、掌握Modelsim仿真軟件的使用方法； 3、用乘法運(yùn)算符實(shí)現(xiàn)一個(gè)16*16 乘法器模塊； 4、用IP核實(shí)現(xiàn)一個(gè)16*16

發(fā)表于 05-20 17:00 ?68次下載

硬件乘法器是什么？

硬件乘法器是現(xiàn)代計(jì)算機(jī)中必不可少的一部分，其基礎(chǔ)是加法器結(jié)構(gòu)。

發(fā)表于 05-11 10:52 ?8835次閱讀

乘法器的使用方法你知道哪些？

在做項(xiàng)目的過(guò)程中，經(jīng)常遇到乘法計(jì)算，乘法器的設(shè)計(jì)就尤為重要。乘法器決定了最終電路功能能否實(shí)現(xiàn)，資源使用量多少以及時(shí)序性能優(yōu)劣等。

發(fā)表于 07-04 09:41 ?9565次閱讀

使用verilogHDL實(shí)現(xiàn)乘法器

本文在設(shè)計(jì)實(shí)現(xiàn)乘法器時(shí)，采用了4-2和5-2混合壓縮器對(duì)部分積進(jìn)行壓縮，減少了乘法器的延時(shí)和資源占用率；經(jīng)XilinxISE和QuartusII兩種集成開發(fā)環(huán)境下的綜合仿真測(cè)試，與用

發(fā)表于 12-19 13:30 ?1.1w次閱讀

乘法器原理_乘法器的作用

乘法器（multiplier）是一種完成兩個(gè)互不相關(guān)的模擬信號(hào)相乘作用的電子器件。它可以將兩個(gè)二進(jìn)制數(shù)相乘，它是由更基本的加法器組成的。乘法器可以通過(guò)使用一系列計(jì)算機(jī)算數(shù)技術(shù)來(lái)實(shí)現(xiàn)。

發(fā)表于 02-18 15:08 ?2.6w次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

如何利用xilinx器件中LUT的結(jié)構(gòu)特征設(shè)計(jì)乘法器呢？