關(guān)鍵詞: dsp , RFID , 模擬視頻 , 數(shù)字圖像
引 言
圖像處理系統(tǒng)中圖像源獲取手段有很多種,同樣圖像的傳感器也是多種多樣的。現(xiàn)在比較流行的傳感器有CCD、CMOS、CIS等等。這些傳感器對(duì)于圖像數(shù)據(jù)輸出的格式各不相同,例如CCD輸出的是模擬信號(hào),需要通過A/D的采樣才能得到圖像處理所需要的數(shù)字圖像信號(hào);而CMOS傳感器則直接輸出數(shù)字信號(hào)。這樣必然會(huì)對(duì)圖像處理系統(tǒng)的通用性造成很大的影響。當(dāng)圖像傳感器更改或者圖像的分辨率發(fā)生更改以后,都會(huì)導(dǎo)致圖像處理系統(tǒng)做出相應(yīng)的修改,這樣在很大程度上限制了專用圖像處理板的應(yīng)用范圍以及通用性。
由于電視技術(shù)早已得到了廣泛的普及,為了保證電視的通用性,世界上早已對(duì)其可以使用的模擬視頻信號(hào)做出了統(tǒng)一的規(guī)定。在歐洲以及中國(guó),模擬視頻信號(hào)主要采取的是PAL制式;而在北美以及日本,模擬視頻信號(hào)主要采取的是NTSC制式。正是由于模擬視頻信號(hào)制式的統(tǒng)一,所以導(dǎo)致很多技術(shù)成熟的圖像獲取設(shè)備,例如攝像機(jī)、照相機(jī)等都有模擬視頻信號(hào)的輸出接口。
本設(shè)計(jì)方案旨在利用上述 的有利條件,提出一套基于TMS320C6x11系列DSP的圖像獲取方案,利用模擬視頻信號(hào)的統(tǒng)一性,實(shí)現(xiàn)隨意更換帶有標(biāo)準(zhǔn)模擬視頻信號(hào)輸出接口的圖像設(shè)備而無需在圖像處理系統(tǒng)的硬件和軟件上作修改。同時(shí),本方案還需提供一個(gè)相對(duì)通用的數(shù)字視頻接口,可以適應(yīng)TMS320C6xll系列DSP的接口。本設(shè)計(jì)的主要技術(shù)要求有:
①支持標(biāo)準(zhǔn)的模擬視頻輸入接口,可以對(duì)標(biāo)準(zhǔn)的模擬視頻信號(hào)解碼得到數(shù)字圖像數(shù)據(jù);
②在不降低圖像幅面的前提下,圖像采集速度快,滿足一定的實(shí)時(shí)性要求;
③占用CPU時(shí)間少,使得圖像采集過程在后臺(tái)自主完成;
④數(shù)字圖像接口通用性好,可以在TMS320C6u1l系列乎臺(tái)上通用互換。
1 總體方案設(shè)計(jì)
1.1 方案的選擇
目前,解碼模擬視頻信號(hào)主要的方法有:采用A/D采樣模擬視頻信號(hào)和采用專用的模擬視頻信號(hào)解碼器。對(duì)于前一種方案需要的外部芯片較少,只需A/D轉(zhuǎn)換芯片即可;但是需要占用大量的CPU時(shí)間,在采集圖像的過程中CPU基本沒有額外的時(shí)間處理圖像。這個(gè)問題通常會(huì)導(dǎo)致圖像處理系統(tǒng)處理圖像的時(shí)間嚴(yán)重不足。后一種方案采用專門的模擬視頻信號(hào)解碼器,需要一些額外的接口芯片,但是可以節(jié)約大量的CPU時(shí)間,圖像采集過程可以全部在后臺(tái)完成,基本上不需要CPU的干預(yù)。這個(gè)優(yōu)點(diǎn)對(duì)于圖像處理系統(tǒng),特別是算法比較復(fù)雜的處理系統(tǒng)(例如視頻監(jiān)控系統(tǒng))有著非常大的吸引力,所以本方案決定采用后者。
本方案中一個(gè)難點(diǎn)是:由模擬視頻信號(hào)解碼得出的數(shù)字視頻信號(hào)數(shù)據(jù)量非常大,而且由于是實(shí)時(shí)視頻信號(hào),所以數(shù)據(jù)輸出速率也非常高;但是相反,DSP外部存儲(chǔ)器接口的讀出速率卻比較慢。為了解決這個(gè)問題,本方案采取了兩種緩沖方式.首先是使用高速FIFO,對(duì)數(shù)據(jù)進(jìn)行暫存以緩解速度上的差異,但是這樣的緩沖還不足以平衡兩者之間的速度差異。
于是在本方案中提出了“隔行采樣”的思想。通常,隔行采樣會(huì)使得分辨率下降,例如每四行采樣一行數(shù)據(jù),會(huì)使得圖像垂直方向上的行數(shù)下降到原來的1/4。這不是設(shè)計(jì)所希望的,所以為了保證圖像的分辨率,設(shè)計(jì)中在隔行采樣的同時(shí),將一整幅圖像的行數(shù)據(jù)交錯(cuò)分多次采樣,然后再重新組合成一幅完整的圖像。這樣既起到了緩沖速度差異的作用,又保證了圖像的分辨率。
最后本方案確定的思路是,采用FIFO來暫存一行圖像數(shù)據(jù),視頻解碼器直接向FIF0中寫入圖像數(shù)據(jù)。當(dāng)FIFO中寫入了有效圖像數(shù)據(jù)后,由CPLD向DSP發(fā)出中斷請(qǐng)求;同時(shí),DSP接到中斷請(qǐng)求后,啟動(dòng)DMA方式將一行圖像數(shù)據(jù)從FIFO中讀入到其外部RAM中存放。CPLD主要完成“隔行采樣”的實(shí)現(xiàn)、控制解碼器向FIFO中寫入數(shù)據(jù)以及DSF從FIFO中讀出數(shù)據(jù)。
另外,本方案目前主要是針對(duì)PAL制式模擬信號(hào)的。PAL制模擬信號(hào)傳輸?shù)膱D像幅面大小為720×576像素。下面的設(shè)計(jì)主要針對(duì)該格式的視頻信號(hào)展開。如果需要對(duì)NSTC等其他制式視頻信號(hào)解碼,只需要在軟件上作一些修改即可。
1.2 系統(tǒng)框圖
在本方案中,模擬視頻信號(hào)解碼器采用的是Philips公司的SAA7111A。對(duì)于PAL制式模擬視頻信號(hào),l行圖像數(shù)據(jù)有720個(gè)像素;同時(shí)由于YUV分量采用了4:2:2抽樣,所以需要1440字節(jié)的存儲(chǔ)空間存儲(chǔ)1行數(shù)據(jù)。由于本方案中需要用到FIFO對(duì)1行數(shù)據(jù)暫存,所以FIFO的存儲(chǔ)深度必須大于1440字節(jié),最后選定高速FIFO采用IDT公司的IDT72V23l,其具有2K×9位的存儲(chǔ)深度。同時(shí)還使用了Laittice公司的CPLD——LC4128V,作為中間邏輯接口控制“隔行采樣”的完成、解碼器對(duì)FIFO的寫操作以及DSP對(duì)FIFO的讀操作,系統(tǒng)框圖如圖l所示。
2 硬件方案設(shè)計(jì)
2.1 芯片介紹
本方案選用SAA7111A作為前端視頻解碼器。SAA71llA視頻解碼器是雙通道模擬預(yù)處理電路、自動(dòng)鉗位和增益控制電路、時(shí)鐘產(chǎn)生電路、數(shù)字多標(biāo)準(zhǔn)解碼器、亮度/對(duì)比度/飽和度控制電路、彩色空間矩陣的組合,是一款功能完善的視頻處理器。SAA711lA只需要單一的3.3V電源供電,與C6x11的I/O電壓一 致。SAA7111A接收CVBS(復(fù)合視頻)或S-video模擬視頻輸入,可以將PAL、SECAM、NTSC模式的彩色視頻信號(hào)解碼為CCIR-60l/656兼容的彩色數(shù)字分量值,器件功能通過I2C接口控制。
SAA7111A的主要性能特點(diǎn)如下:
◆4路模擬輸入一一4路CVBS或2路Y/C或1路Y/C和2路CVBS;
◆主通道靜態(tài)增益可編程,自動(dòng)增益控制選擇的CVBS或Y/C通道;
◆2個(gè)8位視頻CMOS模數(shù)轉(zhuǎn)換器;
◆片上時(shí)鐘產(chǎn)生器,只需要24.576 MHz單一時(shí)鐘輸入;
◆自動(dòng)探測(cè)50 Hz和60 Hz場(chǎng)頻,自動(dòng)在PAL和NTSC標(biāo)準(zhǔn)間切換;
◆可以處理PALBGHI、PALN、PAL M、NTSC M、NTSC N、NTSC 4.43、NTSC-Japan和SECAM信號(hào)。從以上特點(diǎn)可以看出,SAA7111A功能強(qiáng)大,性能全面,可以滿足各種視頻轉(zhuǎn)換處理的需要,完全符合本系統(tǒng)的要求。SAA7111A已經(jīng)在各種視頻處理系統(tǒng)中得到廣泛的應(yīng)用,技術(shù)性能已得到充分的證明。采用SAA7111A具有很高的性價(jià)比。
2.2 DSP與FOFO接口技術(shù)
TMS320C6xll的外部存儲(chǔ)器接口(EMIF)提供了功能十分強(qiáng)大的外部接口,可以實(shí)現(xiàn)與諸多種類的存儲(chǔ)器的無縫接口,如SBSRAM、SDRAM、SRAM、ROM等等。但是其對(duì)FIFO的接口并不能做到真正的無縫接口,需要增加一些外部邏輯來調(diào)整它們之間的時(shí)序。
本方案中采用的FIFO一一IDT72V23,是標(biāo)準(zhǔn)的同步FIFO,具有兩個(gè)獨(dú)立的讀寫時(shí)鐘——RCLK、WCLK;同時(shí)還具有讀寫控制信號(hào)WENl、WEN2、REN1和REN2。
對(duì)于本設(shè)計(jì)而言,要求DSP從FIFO中將數(shù)據(jù)讀出,故關(guān)鍵考慮DSP對(duì)IDT72V23l的讀時(shí)序。圖2是IDT72V31數(shù)據(jù)讀出的時(shí)序。
圖2中,tENS為REN1(REN2)的最短建立時(shí)間(SETUP),tDS為數(shù)據(jù)的最短建立時(shí)間(SETUP)。由圖2可以看出IDT72V231與一般SRAM讀時(shí)序的一個(gè)很大區(qū)別是:當(dāng)RCLK上升沿到來以后,需要有一個(gè)比較長(zhǎng)的延時(shí)tA才會(huì)有有效數(shù)據(jù)出現(xiàn)在總線上。此前一段時(shí)間內(nèi)總線上的數(shù)據(jù)是不穩(wěn)定的,并且該延時(shí)最長(zhǎng)可達(dá)到12ns。
但是對(duì)于TMS320C6x11而言,數(shù)據(jù)的讀入是在ARE信號(hào)的上升沿完成的,故這里設(shè)計(jì)的主要問題是FIFO的RCLK時(shí)鐘怎樣提供。本設(shè)計(jì)中采用的解決辦法如下:
RCLK=!(ARE)
REN1&REN2=CEx+AOE+Address
也就是說,RCLK是由DSP的ARE信號(hào)取反得到的,而REN1和REN2信號(hào)是由DSP的AOE信號(hào)經(jīng)過地址譯碼后提供。這樣設(shè)計(jì)的TMS320C6xll與FIFO接口為了配合FIFO讀出時(shí)序的要求,還必須要求DSP的讀時(shí)序(主要是Setup/Strobe/Hold三個(gè)時(shí)序段)滿足以下要求:
Setup≥(tENS+tSKEW)/tcyc
Strobe≥(tA+tDS)/tcyc
Strobe≥(tCLKH(min)/tcyc
Hold+Setup≥(tCLKL(min)/tcyc
Setup+Strobe+Setup≥(trc(min)/tcyc
從時(shí)序圖上的數(shù)據(jù)可以看出,tENS≥5ns,tA≤12 ns,tDS≥5 ns;同時(shí),由于IDT72V23l的要求,RCLK高電平時(shí)間(tCLKH(min)大于等于8ns、RCLK低電平時(shí)間(tCLKL(min)大于等于8 ns以及讀寫周期(trc(min)必須大于等于20ns。加上一定的冗余,最后計(jì)算可以得到:
Setup≥20ns
Strobe≥30 ns
Hold≥l0ns
在本設(shè)計(jì)的TMS320C6211的系統(tǒng)板上,EMIF的外部時(shí)鐘頻率是100 MHz,所以tcyc=10ns。這樣可以得出DSP中CExCTL寄存器中Setup值設(shè)置為2,Strobe值設(shè)置為3,Hold值設(shè)置為1。
實(shí)際系統(tǒng)實(shí)現(xiàn)證明。通過這樣的硬件接口設(shè)計(jì)后,TMS320C621l可以很穩(wěn)定地從FIF0中讀出數(shù)據(jù)。
2.3 隔行采樣技術(shù)
由于DSP接口與FIFO的接口速度只能達(dá)到15MB/s的速度,同時(shí)當(dāng)DSP把圖像數(shù)據(jù)從FIFO中讀出來以后還需要將數(shù)據(jù)存入其外部存儲(chǔ)器中,這樣DSP與FIFO的接口速度是完全不可能跟上解碼器SAA7111A的有效數(shù)據(jù)輸出速度(最低19.8 MB/s)的,所以DSP無法實(shí)時(shí)地從視頻流中抓出一幅完整的圖像。 因此,在DSP與SAA711lA的接口之間采用高速FIFO進(jìn)行緩沖的同時(shí),還采取了“隔行采樣”的方法來緩沖速度上的差異。通過計(jì)算得出DSP每隔4行有效視頻信號(hào)采1行視頻數(shù)據(jù)是合理的。(把DSP將獲取的數(shù)據(jù)存人其外部存儲(chǔ)器中所需要的時(shí)間考慮在內(nèi)。)
“隔行采樣”的結(jié)果會(huì)導(dǎo)致所獲取的圖像垂直分辨率下降(對(duì)于PAL制式視頻信號(hào)由原來的576行/幅下降到144行/幅)。為了保證圖像的分辨率,本設(shè)計(jì)中將每幅圖像分成連續(xù)的4次采樣.在連續(xù)的4次采樣中,分別抓取圖像中不同的144行數(shù)據(jù),也就是說,現(xiàn)在DSP抓取1幅完整幅面(720×576)大小的圖像需要分4次獲取,然后對(duì)數(shù)據(jù)重排組合得到完整的圖像。PAL制信號(hào)是按照50Hz的場(chǎng)頻對(duì)圖像進(jìn)行輸出的,即每秒種可以傳輸25幅圖像,現(xiàn)在由于“隔行采樣”的原因,DSP每秒鐘可以從PAL制信號(hào)中解碼出6.25幅完整幅面大小的圖像。這個(gè)速度完全可以滿足很多實(shí)時(shí)系統(tǒng)的要求,如視頻監(jiān)控系統(tǒng)。
“隔行采樣”功能的具體實(shí)現(xiàn)是由CPLD配合SAA7111A輸出的同步信號(hào)(行同步、場(chǎng)同步信號(hào))來完成的。由于IDT72V231(FIFO)的寫入控制是通過WEN信號(hào)完成的,因此CPLD可以通過控制WEN信號(hào)來實(shí)現(xiàn)圖像的隔四行一采樣。具體WEN信號(hào)的產(chǎn)生邏輯如圖3所示。
由圖3可以清晰地看出,通過這種采樣方式以后,每次輸出的圖像行是隔4行輸出l行,而連續(xù)4次獲取的圖像則是一整幅圖像576行圖像數(shù)據(jù)中互不相同的144行數(shù)據(jù),這四部分圖像按照一定規(guī)律組合便可以得到一幅幅面為720×576像素的完整數(shù)宇圖像。
另外由圖3可以看出,SAA7111A每向FIFO中寫入一行圖像數(shù)據(jù)(需要53.3μs),DSP則有相當(dāng)于4行圖像數(shù)據(jù)輸出的時(shí)間(約256μs)來讀出這一行圖像數(shù)據(jù)。因此“隔行采樣”有效地緩沖了數(shù)據(jù)輸出和數(shù)據(jù)讀入速度上的差距。
3 軟件方案設(shè)計(jì)
解碼器DSP方軟件的設(shè)計(jì)主要分成兩個(gè)部分:①將圖像數(shù)據(jù)從FIFO中讀出來存人到DSP的外部RAM中去;②對(duì)讀出的數(shù)據(jù)進(jìn)行重排,組合成完整的圖像。下面分成兩部分來說明。
3.1 QDMA方式數(shù)據(jù)的讀入
由于DSP將數(shù)據(jù)從外部讀人到RAM中通常是圖像處理系統(tǒng)的一個(gè)圖像獲取過程,所以如果使CPU一直處于讀入數(shù)據(jù)的操作中,顯然是不合理的。
為了保證盡可能少地占用CPU時(shí)間,即在第n幅圖像讀入到RAM中的同時(shí),DSP仍然可以有足夠的時(shí)間來處理第n-1幅圖像(對(duì)其做需要的處理,例如去噪、壓縮、識(shí)別等等)。本設(shè)計(jì)中采取了下面這種讀出方式:視頻解碼器通過一個(gè)中斷信號(hào)通知DSP目前已有數(shù)據(jù)寫入到FIFO中,然后DSP在中斷中采用DMA方式,將數(shù)據(jù)從FIFO中成塊地搬移到RAM中去。
這種操作的好處是顯而易見的:當(dāng)DSP正在處理某一幀圖像時(shí),如果有數(shù)據(jù)需要讀入,那么DSP將進(jìn)入中斷,然后僅僅只需要開啟DMA讀出操作便可退出中斷服務(wù)于程序,繼續(xù)沒有處理完的工作;而DMA控制器則在后臺(tái)將一塊區(qū)域連續(xù)的圖像數(shù)據(jù)讀入到RAM中。這樣圖像的獲取可以實(shí)規(guī)在后臺(tái)完成,圖像的處理和圖像的獲取很好地并行進(jìn)行,大大提高了CPU的利用率。
具體在本方案中,由于使用的FIFO的深度是2 K×9位,所以采取的是DMA每次搬移一行圖像數(shù)據(jù)(也就是720×2=1440字節(jié))到RAM中去。同時(shí),TMS320C6x11提供了 十分強(qiáng)大的EDMA功能。為了加快DSP在中斷中開啟DMA讀出操作的速度,本設(shè)計(jì)采用了其QDMA的功能.這樣申請(qǐng)一次QDMA僅僅需要幾條指令即可。具體申請(qǐng)QDMA的操作代碼如下:
QSRC="SourceAddress",
//設(shè)置FIFO在系統(tǒng)中的地址
QCNT="0x000005A0";
//設(shè)置一次需要讀出的數(shù)據(jù)量
//(1440)
QDST=(int)DesAddress; //設(shè)置數(shù)據(jù)讀出的目的地址
QIDX="0x00000001"; //設(shè)置QDMA傳送的間距
DesAddress="DesAddress"+0x5A0;
//更新數(shù)據(jù)讀出目的地址
QSOPT="0x30300000"; //啟動(dòng)QDMA通道傳輸
3.2 圖像數(shù)據(jù)的重排
由于本方案中采用了隔四行一采樣的方法來平衡速度上的差異,所以最后載人RAM中的數(shù)據(jù)需要重排。這個(gè)重排可以在讀入FIFO中的數(shù)據(jù)時(shí)就進(jìn)行,也可以在所有數(shù)據(jù)全部讀人到RAM中后再進(jìn)行重排;但是重排的方案和流程是一樣的。
如果是采用全部數(shù)據(jù)都讀完后再重排,由于隔四行采樣的原因,圖像數(shù)據(jù)是分四個(gè)連續(xù)的數(shù)據(jù)塊存放的,并且每個(gè)數(shù)據(jù)塊中是按照奇偶場(chǎng)分布的。那么,以第一個(gè)數(shù)據(jù)塊為例,它的奇場(chǎng)部分存儲(chǔ)的實(shí)際上是圖像的第1,9,17,…,561,569行數(shù)據(jù);而其偶場(chǎng)部分存儲(chǔ)的實(shí)際上是圖像的第2,10,18,…,562,570行數(shù)據(jù)。另外,三個(gè)數(shù)據(jù)塊里面存儲(chǔ)的圖像數(shù)據(jù)在整幅圖像中的行數(shù)分布依此類推。具體分布和重排過程如圖4所示。
通過圖4所示方式的重排處理以后,全部圖像數(shù)據(jù)分成了兩大塊:奇場(chǎng)區(qū)和偶場(chǎng)區(qū)。這時(shí)可以根據(jù)需要來處理這兩個(gè)區(qū)域。本設(shè)計(jì)中采用的是將奇偶場(chǎng)合并,同時(shí)將YUV分量分開到三個(gè)獨(dú)立的存儲(chǔ)區(qū)域中去,程序流程如圖5所示。
4 總結(jié)及展望
本文提出了一種基于TMS320C6xll接口的圖像獲取方案。它利用目前大多數(shù)成熟的圖像獲取設(shè)備都配備了通用的模擬視頻輸出接口這一特點(diǎn),提出了一個(gè)從模擬編碼的視頻信號(hào)中抓出靜止的數(shù)字圖像的方案。由于其數(shù)字部分接口非常通用(8位),使得可以很容易地在通用圖像處理系統(tǒng)中加入實(shí)時(shí)圖像獲取接口。通過具體實(shí)現(xiàn)證明此方案可行、穩(wěn)定、高效;可以實(shí)現(xiàn)每秒鐘6.25幅720×576幅面的彩色圖像的獲取,具有通用性好、性能穩(wěn)定、占用CPU時(shí)間少等特點(diǎn)。防碰撞模塊對(duì)SELECT命令的響應(yīng)是正確的。
5 結(jié) 語
A型卡RFID技術(shù)已經(jīng)廣泛應(yīng)用于智能卡、票物、安檢、物流和防偽等領(lǐng)域。本文根據(jù)RFID防碰撞協(xié)議規(guī)定,在數(shù)字硬件上實(shí)現(xiàn)了A型卡的防碰撞模塊,用VHDL語言進(jìn)行了仿真和綜合后,通過了Xilinx公司的XC4010XLFPGA驗(yàn)證,電路規(guī)模5000門左右,達(dá)到預(yù)定指標(biāo)要求。最后,采用O.35μm的工藝與電子防偽標(biāo)簽的其他模塊一起進(jìn)行了MPW流片,實(shí)際應(yīng)用測(cè)試證明,該模塊運(yùn)行正確、穩(wěn)定。
評(píng)論
查看更多