精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于FPGA設(shè)計的sysGen算法系統(tǒng)設(shè)計

電子設(shè)計 ? 來源:CSDN 博主 ? 作者: 沒落騎士 ? 2020-12-30 12:59 ? 次閱讀

一、前言

利用FPGA設(shè)計算法一直以來都是熱點,同樣也是難點。將復(fù)雜的數(shù)學(xué)公式 模型通過硬件系統(tǒng)來搭建,在低延時 高并行性等優(yōu)勢背后極大提高了設(shè)計難度和開發(fā)周期。Xilinx公司的sysGen(system generator)工具擴展了MATLABsimulink,提供很多IP Catalog中沒有的基礎(chǔ)模塊和針對DSP應(yīng)用的硬件模型。工程師利用豐富的模塊和MATLAB強大的數(shù)據(jù)處理及可視化能力能夠更快速完成設(shè)計與仿真驗證工作。

二、sysGen算法系統(tǒng)設(shè)計

本文以個最簡單的例子講述利用sysGen搭建算法IP核,并集成到IP Integrator中作為ZYNQ PS端CPU的“定制外設(shè)”。僅用于測試目的。設(shè)計需求:在sysGen中搭建系統(tǒng),將輸入定點整數(shù)數(shù)據(jù)*2后輸出,輸入位寬為8bit。

pIYBAF9uKDmAGlS-AACLMgeqkdk369.png

在System Generator token中設(shè)定仿真步長為1sec。點擊需要觀測的信號連線,右擊選擇Xilinx add to viewer。啟動仿真并啟動Xilinx waveform viewer:

本質(zhì)上就是調(diào)用Vivado的XSim工具進行行為仿真。仿真結(jié)果可見完成預(yù)期目標,現(xiàn)雙擊System Generator token ,選擇Compiliation類型為IP Catalog并勾選Create testbench,按下Generate生成IP核。

三、仿真測試

根據(jù)User Guide介紹sysGen是“周期和比特精準的”,我們還是在Vivado環(huán)境下再次驗證下。netlist文件夾內(nèi)子文件夾ip_catalog中為IP核示例工程,由于自動生成了testbench,打開后直接進行行為仿真。sysGen在創(chuàng)建testbench時會將經(jīng)過gatein和gateout的數(shù)據(jù)儲存到文件中,testbench進行的工作為:將gatein數(shù)據(jù)作為測試激勵送入到相應(yīng)設(shè)計輸入端口,之后把設(shè)計輸出得到結(jié)果與gateout文件數(shù)據(jù)進行逐一比較從而驗證設(shè)計是否與sysGen環(huán)境下仿真結(jié)果一致。

發(fā)現(xiàn)個比較有意思的現(xiàn)象,自動生成的testbench中clock生成并約束的50MHz,而是認為進行了拓展。

仿真波形如圖:

將clock處改動為50MHz后,經(jīng)過測試發(fā)現(xiàn)如果系統(tǒng)一開始就輸入數(shù)據(jù),前幾個數(shù)據(jù)沒有被真正處理,輸出錯誤。可能是軟件BUG吧,不過這種情況也非常少見,實際系統(tǒng)中輸入數(shù)據(jù)大多情況會啟動一段時間后才輸入。這里等待100ns后再啟動clock翻轉(zhuǎn):

改動后仿真波形:

四、AXI-Stream總線形式IP

到此算法IP的設(shè)計與驗證結(jié)束。如果想將這個IP核導(dǎo)入到IP Integrator中作為CPU的外設(shè),其接口必須滿足AXI總線標準,因此回到sysGen中更改端口名稱和位寬。端口要符合AXI-Stream標準信號名稱,位寬為8bit整數(shù)倍。

o4YBAF9uKEiAVeSPAARNJArcqqo731.png

生成IP核后,打開新的工程,導(dǎo)入該IP核到repository。

五、Block Design系統(tǒng)搭建

系統(tǒng)結(jié)構(gòu)與上一篇該系列博文類似,均是以AXI DMA為核心的Loop系統(tǒng),只是將AXI-Stream Data FIFO改成了自定義IP核。由于IP核slave和master接口只包含tdata和tvalid信號,因此需要添加接口銜接的一些簡單邏輯。tready信號和tkeep信號直接連接constant使用常數(shù)驅(qū)動,DMA的s_axis_s2mm接口的tlast由wrapper內(nèi)計數(shù)器邏輯驅(qū)動,將system中FCLK_CLK0 peripheral_aresetn m_axis_tvalid和s_axis_s2mm_tlast信號引出到wrapper中。

有一點比較坑:自定義IP通過AXI總線與DMA互聯(lián)時,總線下相應(yīng)的接口不一定會正確對應(yīng),所以需要分別將兩端的每個接口相連。可以通過打開綜合后的設(shè)計來確認連線無誤。

自動生成wrapper后改動添加代碼如下:
`timescale 1 ps / 1 ps

module user_wrapper
(DC,
DDR_addr,
DDR_ba,
DDR_cas_n,
DDR_ck_n,
DDR_ck_p,
DDR_cke,
DDR_cs_n,
DDR_dm,
DDR_dq,
DDR_dqs_n,
DDR_dqs_p,
DDR_odt,
DDR_ras_n,
DDR_reset_n,
DDR_we_n,
//FCLK_CLK0,
FIXED_IO_ddr_vrn,
FIXED_IO_ddr_vrp,
FIXED_IO_mio,
FIXED_IO_ps_clk,
FIXED_IO_ps_porb,
FIXED_IO_ps_srstb,
RES,
SCLK,
SDIN,
VBAT,
VDD
//m_axis_tvalid,
//peripheral_aresetn,
//s_axis_s2mm_tlast
);
output DC;
inout [14:0]DDR_addr;
inout [2:0]DDR_ba;
inout DDR_cas_n;
inout DDR_ck_n;
inout DDR_ck_p;
inout DDR_cke;
inout DDR_cs_n;
inout [3:0]DDR_dm;
inout [31:0]DDR_dq;
inout [3:0]DDR_dqs_n;
inout [3:0]DDR_dqs_p;
inout DDR_odt;
inout DDR_ras_n;
inout DDR_reset_n;
inout DDR_we_n;
//output FCLK_CLK0;
inout FIXED_IO_ddr_vrn;
inout FIXED_IO_ddr_vrp;
inout [53:0]FIXED_IO_mio;
inout FIXED_IO_ps_clk;
inout FIXED_IO_ps_porb;
inout FIXED_IO_ps_srstb;
output RES;
output SCLK;
output SDIN;
output VBAT;
output VDD;
//output [0:0]m_axis_tvalid;
//output [0:0]peripheral_aresetn;
//input s_axis_s2mm_tlast;

localparam DATA_NUM = 256;

wire DC;
wire [14:0]DDR_addr;
wire [2:0]DDR_ba;
wire DDR_cas_n;
wire DDR_ck_n;
wire DDR_ck_p;
wire DDR_cke;
wire DDR_cs_n;
wire [3:0]DDR_dm;
wire [31:0]DDR_dq;
wire [3:0]DDR_dqs_n;
wire [3:0]DDR_dqs_p;
wire DDR_odt;
wire DDR_ras_n;
wire DDR_reset_n;
wire DDR_we_n;
wire FCLK_CLK0;
wire FIXED_IO_ddr_vrn;
wire FIXED_IO_ddr_vrp;
wire [53:0]FIXED_IO_mio;
wire FIXED_IO_ps_clk;
wire FIXED_IO_ps_porb;
wire FIXED_IO_ps_srstb;
wire RES;
wire SCLK;
wire SDIN;
wire VBAT;
wire VDD;
wire [0:0]m_axis_tvalid;
wire [0:0]peripheral_aresetn;
wire s_axis_s2mm_tlast;

reg [8-1:0] cnt;
wire add_cnt;
wire end_cnt;

system system_i
(.DC(DC),
.DDR_addr(DDR_addr),
.DDR_ba(DDR_ba),
.DDR_cas_n(DDR_cas_n),
.DDR_ck_n(DDR_ck_n),
.DDR_ck_p(DDR_ck_p),
.DDR_cke(DDR_cke),
.DDR_cs_n(DDR_cs_n),
.DDR_dm(DDR_dm),
.DDR_dq(DDR_dq),
.DDR_dqs_n(DDR_dqs_n),
.DDR_dqs_p(DDR_dqs_p),
.DDR_odt(DDR_odt),
.DDR_ras_n(DDR_ras_n),
.DDR_reset_n(DDR_reset_n),
.DDR_we_n(DDR_we_n),
.FCLK_CLK0(FCLK_CLK0),
.FIXED_IO_ddr_vrn(FIXED_IO_ddr_vrn),
.FIXED_IO_ddr_vrp(FIXED_IO_ddr_vrp),
.FIXED_IO_mio(FIXED_IO_mio),
.FIXED_IO_ps_clk(FIXED_IO_ps_clk),
.FIXED_IO_ps_porb(FIXED_IO_ps_porb),
.FIXED_IO_ps_srstb(FIXED_IO_ps_srstb),
.RES(RES),
.SCLK(SCLK),
.SDIN(SDIN),
.VBAT(VBAT),
.VDD(VDD),
.m_axis_tvalid(m_axis_tvalid),
.peripheral_aresetn(peripheral_aresetn),
.s_axis_s2mm_tlast(s_axis_s2mm_tlast));

always @(posedge FCLK_CLK0)begin
if(!peripheral_aresetn)begin
cnt end
else if(add_cnt)begin
if(end_cnt)
cnt else
cnt end
end

assign add_cnt = m_axis_tvalid;
assign end_cnt = add_cnt && cnt== DATA_NUM-1;

assign s_axis_s2mm_tlast = end_cnt;

endmodule

user_wrapper

當自定義IP核輸出256個數(shù)據(jù)時,拉高tlast信號結(jié)束傳輸。打開綜合后的設(shè)計,添加調(diào)試探針,抓取DMA與自定義IP之間的接口信號,set up debug后完成接下來的流程。

六、軟硬件聯(lián)調(diào)

在硬件系統(tǒng)中定義數(shù)據(jù)幀長度為256個,數(shù)據(jù)位寬為16bit,因此C代碼中DMA啟動傳輸函數(shù)中數(shù)據(jù)長度參數(shù)為512byte。測試數(shù)據(jù)生成與檢測代碼非常簡單:

我們直接查看ILA抓取AXI S總線波形:


看到CPU產(chǎn)生數(shù)據(jù)從1到4重復(fù)遞增,IP核輸出結(jié)果從2到8重復(fù)遞增,輸出為輸入的2倍。

傳輸完成后進入DMA發(fā)送和接收中斷,軟件檢測結(jié)果正確。在Memory窗口能夠直接查看內(nèi)存絕對地址里的數(shù)據(jù),選定DDR接收緩存區(qū)起始地址,其中的數(shù)據(jù)與AXI總線傳回數(shù)據(jù)一致,證明系統(tǒng)聯(lián)調(diào)成功。之后任意算法模塊均可采用本文方式進行設(shè)計和集成,可以說一勞永逸!

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    為什么FPGA屬于硬件,還需要搞算法

    交流學(xué)習(xí),共同進步。 交流問題(一) Q:為什么FPGA屬于硬件,還需要搞算法? 剛?cè)腴T準備學(xué)fpga但一開始學(xué)的是語法,感覺像是電路用軟件語言描述出來,fpga
    發(fā)表于 09-09 16:54

    基于 FPGA 的會議系統(tǒng)設(shè)計

    比較好的魯棒性。Adaboost 是一種 迭代算法,其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的弱分類器,然后把這些弱 分類器集合起來,構(gòu)成一個更強的最終分類器。Adaboost 算法系統(tǒng)具有較高的 檢測
    發(fā)表于 08-01 18:40

    FPGA能實現(xiàn)什么樣的算法

    FPGA功能如此強大,請問用FPGA能實現(xiàn)或者比較適合實現(xiàn)什么樣的算法
    發(fā)表于 05-26 20:18

    基于FPGA的實時邊緣檢測系統(tǒng)設(shè)計,Sobel圖像邊緣檢測,FPGA圖像處理

    摘要 :本文設(shè)計了一種 基于 FPGA 的實時邊緣檢測系統(tǒng) ,使用OV5640 攝像頭模塊獲取實時的視頻圖像數(shù)據(jù),提取圖像邊緣信息并通過 VGA顯示。FPGA 內(nèi)部使用流水線設(shè)計和 并行運算加速
    發(fā)表于 05-24 07:45

    算法系列:彩色轉(zhuǎn)灰度

    今天和大俠簡單聊一聊彩色轉(zhuǎn)灰度的算法,話不多說,上貨。 一、基礎(chǔ)  對于彩色轉(zhuǎn)灰度,有一個很著名的心理學(xué)公式: Gray = R*0.299 + G*0.587 + B*0.114 二
    發(fā)表于 05-22 19:02

    基于FPGA的常見的圖像算法模塊總結(jié)

    意在給大家補充一下基于FPGA的圖像算法基礎(chǔ),于是講解了一下常見的圖像算法模塊,經(jīng)過個人的總結(jié),將知識點分布如下所示。
    的頭像 發(fā)表于 04-28 11:45 ?416次閱讀
    基于<b class='flag-5'>FPGA</b>的常見的圖像<b class='flag-5'>算法</b>模塊總結(jié)

    基于 FPGA 的光纖混沌加密系統(tǒng)

    FPGA 設(shè)計加密算法具有安全性高,加密速度快,開發(fā)周期短,開發(fā)成本較低,可重配,可靠性高以及移植性好等優(yōu)點。 3.2 混沌序列密鑰設(shè)計 混沌序列的產(chǎn)生主要有兩類:一類是利用微分方程表示的混沌系統(tǒng)
    發(fā)表于 04-26 17:18

    算法系列:基于 FPGA 的圖像邊緣檢測系統(tǒng)設(shè)計(sobel算法

    今天給大俠帶來基于 FPGA 的圖像邊緣檢測設(shè)計,話不多說,上貨。 設(shè)計流程如下:mif文件的制作→ 調(diào)用 ip 核生成rom以及仿真注意問題→ 灰度處理→ 均值濾波:重點是3*3 像素陣列
    發(fā)表于 03-26 16:40

    怎么用FPGA算法 如何在FPGA上實現(xiàn)最大公約數(shù)算法

    FPGA算法的優(yōu)點在于它們可以提供高度的定制化和靈活性,使得算法可以根據(jù)實際需求進行優(yōu)化和調(diào)整。此外,FPGA還可以實現(xiàn)硬件加速,提供比傳統(tǒng)處理器更高的計算性能和吞吐量。因此,
    的頭像 發(fā)表于 01-15 16:03 ?1527次閱讀

    FPGA圖像處理之CLAHE算法

    FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。
    的頭像 發(fā)表于 01-04 12:23 ?2103次閱讀
    <b class='flag-5'>FPGA</b>圖像處理之CLAHE<b class='flag-5'>算法</b>

    浮點LMS算法FPGA實現(xiàn)

    運算的運算步驟遠比定點運算繁瑣,運算速度慢且所需硬件資源大大增加,因此基于浮點運算的LMS算法的硬件實現(xiàn)一直以來是學(xué)者們研究的難點和熱點。 本文正是基于這種高效結(jié)構(gòu)的多輸入FPA,在FPGA上成功實現(xiàn)了基于浮點運算的LMS算法
    的頭像 發(fā)表于 12-21 16:40 ?598次閱讀

    fpga布局布線算法加速

    現(xiàn)代電子設(shè)備中,針對復(fù)雜的數(shù)字電路,FPGA(Field-Programmable Gate Array)是一種非常優(yōu)秀的可編程邏輯器件。在FPGA的設(shè)計過程中,布局布線算法是關(guān)鍵步驟之一,其主要
    的頭像 發(fā)表于 12-20 09:55 ?594次閱讀

    基于FPGA的窄帶干擾抑制算法的實現(xiàn)方案

    電子發(fā)燒友網(wǎng)站提供《基于FPGA的窄帶干擾抑制算法的實現(xiàn)方案.pdf》資料免費下載
    發(fā)表于 11-07 09:29 ?0次下載
    基于<b class='flag-5'>FPGA</b>的窄帶干擾抑制<b class='flag-5'>算法</b>的實現(xiàn)方案

    自動兵力生成算法系統(tǒng)有哪些

    智慧華盛恒輝自動兵力生成算法通常涉及到人工智能和機器學(xué)習(xí)的技術(shù),用于在游戲中自動生成具有智能和行為的虛擬兵力。以下是一些常見的自動兵力生成算法: 第一名華盛恒輝科技有限公司上榜理由:華盛恒輝是一家
    的頭像 發(fā)表于 10-31 15:57 ?301次閱讀

    智慧礦山ai算法系列解析 堵料檢測算法功能優(yōu)勢

    智慧礦山AI算法系列中的堵料檢測算法的功能優(yōu)勢,了解其重要性和帶來的價值
    的頭像 發(fā)表于 09-28 18:48 ?569次閱讀
    智慧礦山ai<b class='flag-5'>算法系</b>列解析 堵料檢測<b class='flag-5'>算法</b>功能優(yōu)勢