本文只要是關于TMS320C6000的相關介紹,并著重對TMS320C6000和DSP的編程實現進行了詳盡的闡述。
DSP
現代社會對數據通信需求正向多樣化、個人化方向發展。而無線數據通信作為向社會公眾迅速、準確、安全、靈活、高效地提供數據交流的有力手段,其市場需求也日益迫切。正是在這種情況下,3G、4G通信才會不斷地被推出,但是無論是3G還是4G,未來通信都將離不開DSP技術(數字信號處理器),DSP作為一種功能強大的特種微處理器,主要應用在數據、語音、視像信號的高速數學運算和實時處理方面,可以說DSP將在未來通信領域中起著舉足輕重的作用。
為了確保未來的通信能在各種環境下自由高效地工作,這就要求組成未來通信的DSP要具有非常高的處理信號的運算速度,才能實現各種繁雜的計算、解壓縮和編譯碼。而目前DSP按照功能的側重點不一樣,可以分為定點DSP和浮點DSP,定點DSP以成本低見長,浮點DSP以速度快見長。如果單一地使用一種類型的DSP,未來通信的潛能就不能得到最大程度的發揮。為了能將定點與浮點的優勢集于一身,突破DSP技術上的瓶頸,人們又推出了一種高級多重處理結構--VLIW結構,該結構可以在不提高時鐘速度的情況下,實現很強的數字信號處理能力,而且它能同時具備定點DSP和浮點DSP所有的優點。為了能推出一系列更高檔的新技術平臺,人們又開始注重DSP的內核技術的開發,因為DSP的內核就相當于計算機的CPU一樣,被譽為DSP的心臟,大量的算法和操作都得通過它來完成,因此該內核結構的質量如何,將會直接影響整個DSP芯片的性能、功耗和成本。
考慮到未來無線訪問Internet因特網和開展多媒體業務的需要,現在美國的Sun公司又開始準備準將該公司的拳頭產品--PersonalJava語言嵌入到DSP中,以便能進一步提高DSP在處理信號方面的自動化程度和智能化程度。當然,在以前DSP中也潛入了其他軟件語言,例如高級C語言,但這種語言在處理網絡資源以及多媒體信息方面無能為力;而PersonalJava是一種適合個人網絡連接和應用的Java環境,基于該環境的個人通信系統可以從網絡和Internet網上下載數據和圖像。此外,人們還在研究開發符合MPEG-4無線解壓縮標準DSP,該壓縮標準將為未來通信傳輸各種多媒體信息提供了依據。
作為一個案例研究,我們來考慮數字領域里最通常的功能:濾波。簡單地說,濾波就是對信號進行處理,以改善其特性。例如,濾波可以從信號里清除噪聲或靜電干擾,從而改善其信噪比。為什么要用微處理器,而不是模擬器件來對信號做濾波呢?我們來看看其優越性:模擬濾波器(或者更一般地說,模擬電路)的性能要取決于溫度等環境因素。而數字濾波器則基本上不受環境的影響。數字濾波易于在非常小的寬容度內進行復制,因為其性能并不取決于性能已偏離正常值的器件的組合。一個模擬濾波器一旦制造出來,其特性(例如通帶頻率范圍)是不容易改變的。使用微處理器來實現數字濾波器,就可以通過對其重新編程來改變濾波的特性。
TMS320C6000
TI高速信號處理器TMS320C5X和TMS320C6X需要從外部的存儲器(ROM或FLASH)中引導應用程序這是開發中的重點和難點之一,關系到系統的可靠性和處理速度。以TMS320C6000 DSP為例,介紹了應用程序的三種引導方式;以實際工程為背景詳細敘述了從ROM中引導程序的實現方法,并鐘對其中重要的命令文件和用戶引導程序,給出了相應的示例文件和程序。 關鍵詞:TMS320C6000 DSP CMD 引導1 TMS320C6000 DSP硬件結構概述TMS320C6000是TI公司生產的TMS320系列產品中新一代高性能的DSP芯片,適用于高速數字信號處理。TMS320C6000主要由三個部分組成:CPU內核、外設和存儲器。CPU中8個功能單元可以并行工作,這些功能單元被分成類似的兩組,每組由4個基本功能單元組成。CPU有兩組寄存器,每組寄存器由16個32位寄存器組成。由于在運行期間不做硬件數據相關性檢查,所以程序運行時可以同時執行8條指令,極大地提高了芯片處理速度,這使得該系列的芯片在電子測量、測控、圖像、雷達、聲納和軟件無線電等領域得到了廣泛的應用。
2 加電后DSP的運行過程系統加電后,RESET信號為低,芯片復位。在RESET信號上升沿處,鎖存BOOTMODE[4:0]信號,借以決定芯片的存儲器映射方式、地址0處的存儲器類型以及復位后芯片的自舉模式,復位結束后,芯片從存儲器的0地址開始執行指令。TMS320C6000器件可以設置成三種自舉方式,其加載過程分別敘述如下:(1)不加載。CPU直接從存儲器的0地址處開始執行指令。如果系統中使用的是SDRAM,那么CPU會先掛起,直到SDRAM的初始化完成。TMS320C621X/C671X不具有這類方式。(2)ROM加載。位于外部空間的ROM中的程序首先通過DMA/EDMA搬入地址0處。盡管加載過程是在芯片外部被復位信號釋放以后才開始的,但是當芯片仍處于內部復位保持時,就開始了上述的傳輸過程了。用戶可以指定外部ROM的存儲寬度,EMIF會自動將相鄰的8bit/16bit數據合并成32bit。ROM中的程序必須以little endian的格式存儲。
TMS320C6000 DSP的編程實現
開發DSP系統應用板,最終要脫離仿真器而獨立運行,這時就需要一個能在斷電后保存程序及初始化數據的存儲器。系統上電時,由引導程序將DSP的應用程序從該存儲器引導到DSP應用板上的高速存儲器(如內部SRAM,SDRAM等)中。由于FLASH具有電信號刪除功能?且刪除速度快,集成度高,因而已成為此種存儲器的首選。
將用戶程序代碼寫入FLASH的方法有兩種:第一種是用專門的FLASH編程器實現,第二種是通過系統微處理器與FLASH的接口來實現。第一種方法的主要優點是使用方便可靠,但要求FLASH只能是雙列直插等一些可插拔的封裝形式,由于芯片制造工藝的提高,芯片的集成度越來越高,FLASH正向小型化、貼片式發展,從而使表面貼裝或PLCC封裝的FLASH難以利用編程器編程。第二種方法克服了第一種方法的缺點,且使用靈活,因而在DSP系統中的應用日益廣泛。
由于FLASH的存取速度較慢,寫入FLASH的程序將在系統上電時被DSP裝載到快速的存儲器中運行,這個過程稱為boot loader。不同的DSP有不同的引導方式,本文將以TMS320C6713為例來介紹TMS320C6000系列的boot loader方式。
1 FLASH的工作方式及在系統編程
目前,市場上的FLASH型號很多,但工作方式大體相同,下面以AM29LV160D為例進行介紹。
1.1 AM29LV160D FLASH存儲器簡介
AM29LV160D是AMD公司生產的2M×8bit/1M×16bit FLASH存儲器,它的數據寬度為8位、16位可選,采用3.3V供電,完全兼容JEDEC標準,并支持在系統編程,用戶只需向其內部的命令寄存器寫入命令序列即可實現部分擦除、全部擦除、數據寫入等功能;同時可提供硬件和軟件方法來檢查FLASH的操作執行情況。
圖1
1.2 編程方法
對FLASH的在系統編程就是通過一定的編程命令序列來控制FLASH的工作方式,這些命令序列是一些特定字符的組合,只要向FLASH中的特定寄存器以特定的順序輸入這些字符即可進入相應的編程模式。AM29LV160D中的主要命令序列和寫入地址如圖1所示。具體說明如下:
●復位命令序列:對FLASH中任一地址寫入“F0”,即可實現復位。
● 自動選擇模式:此模式主要用于編程器編程時,由編程器根據從數據線DQ7~DQ0讀出的識別碼自動配置編程邏輯,當然也可以通過命令序列在在系統情況下將自動選擇碼讀出。
●編程命令序列:程序可以以字節方式或字方式寫入,這主要根據FLASH外部引腳BYTE的狀態而定。
●芯片擦除命令序列:FLASH編程時應先執行擦除命令,這是因為編程指令只能將數據由1變為0,反之則不行。
● 扇區擦除命令序列:為了編程方便及保護有用數據,數據擦除可以只擦除某些無用的扇區。
● 擦除暫停和恢復命令序列:這個命令序列只在進行扇區擦除時有效,它允許編程者中斷一個扇區的擦除操作,接著從沒有被擦除的扇區讀出或寫入數據。
●寫入命令:也分為字節模式和字模式,分別對應FLASH的8位和16位工作方式,具體為哪種模式,可由FLASH的BYTE腳的輸入來決定,低電平為字節模式,高電平為字模式。
在對FLASH進行編程時,FLASH提供硬件和軟件機制來獲得FLASH的狀態,以確定數據寫入或擦除操作是否完成。硬件方法主要是利用FLASH的外部引腳RY/BY的輸出信號在命令序列的最后一個寫脈沖(WE)的上升沿之后有效。當該輸出為低電平時,表示FLASH正在編程或擦除中,而當該輸出腳為高電平時,即表示編程或擦除已完成。將此引腳與TMS320C671x系列DSP的ARDY引腳相連,即可實現硬件的自動編程或擦除的完成判斷。C6000系列DSP與FLASH的連線圖如圖2所示。
軟件方法是利用從FLASH數據線讀取的數據來判斷FLASH的狀態,讀取數據中的主要判斷位為DQ2、DQ3、DQ5、DQ6和DQ7,它們之間的相互組合提供了幾種軟件判斷狀態的方法,應用較多且較為簡便的方法是在命令序列寫入后,如果寫入的是編程命令,則選擇一個地址,并循環讀取這個地址的數據。若裝置仍處于編程狀態之中,DQ7輸出為寫入數據的補碼,而在編程完成后,DQ7輸出的是所選地址上的正確數據。如果寫入的是擦除命令,那么?當裝置處于擦除狀態時,則DQ7輸出為0,若擦除完成或擦除被中斷?DQ7輸出為1。選擇地址時應注意:若地址所在區域屬于FLASH中的保護區域,則DQ7輸出的FLASH狀態信息有效,有效時間只能持續大約1μs,然后輸出正確數據。而擦除命令擦除的范圍如果包括FLASH中的保護區域,那么命令將被忽略,此時DQ7輸出狀態信息有效,持續時間大約100μs。對FLASH的操作有時會出錯,出錯時,FLASH將處于不正常狀態,DQ7可能永遠也不會輸出地址上的正確數據,此時就需讀取DQ5的輸出信息,若為1則表示操作失敗。其軟件流程圖如圖3所示。
對FLASH的編程既可以用匯編語言,也可以用C語言,以下給出部分C代碼。該程序代碼可采用TI公司專門用于TI公司系列DSP編程的Code Com-poser Studio 編程工具進行編寫。
void erase_flash(short * flash_ptr)
{
short * ctrl_addr1=(short *)((int)flash_ptr+(0x555<<2));
/*此處0x555地址左移兩位,按16位存儲器來看,本來只需左移一位,但在計算式中?地址flash_ptr是先轉換成int型再計算的,而要寫入命令的地址0x555為16位地址,所以需乘2,因此應當再左移一位*/
short * ctrl_addr2=(short *)((int)flash_ptr+(0x2aa<<2));?
* ctrl_ addr1=0x00aa;
* ctrl_addr2=0x0055;
* ctrl_addr1=0x0080;
* ctrl_addr1=0x00aa;
* ctrl_addr2=0x0055;
* ctrl_addr1=0x0010;
}
void program_flash(short * source_ptr?short * flash ptr,short length)
{
short i?
short * ctrl_addr1=(short *)((int)flash_ptr+(0x555<<2));??
short * ctrl_addr2=(short *)((int)flash_ptr+0x2aa<<2));?
for(i=0;i<length;i++)
{
* ctrl_addr1=0x00aa;
* ctrl_addr2=0x0055;
* ctrl_addr1=0x00a0;
* flash_ptr++=*source_ptr?
}
}
在上面的程序中,對FLASH的命令序列的寫入地址有一個左移指令,即若應寫入命令的寄存器地址為0x555,實際編程時,應先對0x555左移若干位,然后再對得到的地址寫入命令。這是因為,TMS320C6000系列DSP為32位DSP,它的外部地址總線引腳的最低位(LSB)為EA2,即輸出地址的最低位為實際地址的第2位,而不會輸出第1位和第0位,但實際外接的FLASH可以是8位、16位、32位不等。如果連接非32位存儲器,在讀數據時?DSP的外部存儲器接口(EMIF)會自動將實際地址左移若干位,以使外部地址總線引腳的最低位EA2根據FLASH位數的不同輸出實際地址的第0位或第1位,然后再將幾次讀入的數據合成一個32位的值(外接FLASH的位數可以在EMIF寄存器中設置),而在寫數據時,就需要編程者手動進行移位,具體方法是?外接8位存儲器時左移2位,外接16位存儲器時左移1位。
2 用FLASH實現DSP的程序自引導
TMS320C6000系列DSP包括多個型號,各個型號的程序自引導方法一致,下面以TMS320C6713為例來介紹程序自引導的實現過程。
2.1 TMS320C6713DSP簡介
TMS320C6713是TI公司推出的TMS320C67xx系列浮點DSP中最新的一種芯片。TMS320C6713每周期可以執行8條32位指令;支持32/64位數據;具有最高225MHz、4.4ns指令周期的運行速度和1800MIPS或1350MFLOPS的處理能力;同時是有強大的外設支持能力;外部存儲器接口(EMIF)可以很方便地和SDRAM、SBSRAM、FLASH、SRAM等同步和異步存儲器相連,16位HPI接口可以和各種處理器?如PC、POWERPC等?接口;另外還有優化的多通道緩存串口和多通道音頻串口(僅TMS320C6713),這些外部接口使設計人員可以很容易實現自己的應用系統。
2.2 TMS320C6713程序自引導功能的實現
斷電時用慢速ROM或FLASH存儲程序和初始化數據,上電后引導到內部或外部快速RAM中運行是現在普遍采用的一種設計DSP電路板的方法,該方法可靠、方便、靈活且成本較低。但對于不同的DSP有不同的程序自引導方法。本文只討論TMS320C6000系列DSP的引導方法。
和以往TI公司的DSP(如3x、4x)采用引導表由固化在DSP內部的引導程序實現程序的自引導不同,TMS320C6000系列DSP采用的是一種新的引導方法,對于TMS320C6713,上電后,若選擇從EMIF引導程序,則DSP自動將位于地址空間CE1(0x90000000~0x9FFFFFFF)開頭的1kB代碼傳輸到地址空間0處。它的數據傳輸采用默認時序,用戶可以選擇外部程序存儲器的寬度(8位/16位/32位),然后由EMIF自動將幾次讀入的數據合成32位數據。傳輸由DSP中的EDMA通道以單幀的形式自動進行,傳輸完成后,程序從地址0處開始運行。因此,要在TMS320C671x中實現基于FLASH的自引導功能,必須將FLASH配置在DSP的CE1地址空間中。
以上工作均由DSP自動完成。很明顯,自動傳輸的代碼并不能滿足絕大多數編程者對代碼長度的要求,因此可在這段代碼中加入數據傳輸功能,從而將實際工作中遠大于1kB的代碼由FLASH中讀入到用戶指定的存儲空間,然后再將程序跳到實際有用的代碼處運行。對FLASH編程并實現程序自引導的具體過程如下:
(1)對DSP正常運行程序的處理
Code Composer Studio(CCS)是TI公司開發的用于DSP產品的軟件開發工具。由CCS得到的代碼為目標文件格式(COFF),這種格式文件不能直接寫入FLASH,而要先用其它語言(如C)編寫文件,然后由轉換工具進行轉化。
在COFF格式下,程序被分成很多段(包括程序段、初始化數據段、未初始化數據段、自定義段等),每段都占據連續的存儲空間,段與段之間相互獨立。另外,在COFF文件中,除了段內的用戶程序和數據外,還包含一些額外的信息,其中有COFF文件的版本、段的數量、段的長度和起始地址等,分析清楚這些信息,就可以編寫自己的文件轉換工具了。具體方法是:讀入COFF文件,根據格式分析該文件的內容,再把用戶程序和數據部分提取出來,仍分成一個個段,并在每個段前加入起始位置和段長度信息,同時在最后一個段的末尾加上結束標志,最后寫入一個新的文件。在此過程中,因為COFF文件的字長為32bit,而FLASH寬度可能為8bit或16bit,因而要在兩者之間進行手工轉化。
(2)編寫boot程序
boot程序的大小不能超過1kB,它主要完成以下幾個功能:第一是配置DSP的EMIF寄存器,然后從FLASH中把各個段中的程序和數據拷貝到用戶指定的存儲器物理地址中,同時跳到程序的入口點。在此應當注意:C程序的入口點并非main(),而是c_int00,這是因為在調用main()函數之前,系統必須先建立C語言的運行環境。如為系統堆棧定義.stack段、建立初始化堆棧和禎指針、初始化全局和靜態變量等。另外,由于boot程序本身也是COFF文件格式,所以也需格式轉換。
(3)編寫FLASH燒寫程序
FLASH的燒寫程序可以根據前面的介紹來編寫,但要注意,應將boot程序寫入CE1空間開始的1kB中,而將DSP正常工作程序寫入1kB以后的地址空間中。
3 結束語
本文介紹了FLASH在系統編程和基于FLASH實現TMS320C6713 DSP程序自引導的過程。實際上,TMS320C6000系列DSP中其它類型(如C6201、C6701等)的boot也與本文所述相同,因此,完全可以相互借鑒。
結語
關于TMS320C6000的相關介紹就到這了,如有不足之處歡迎指正。
評論
查看更多