微控制器的開發方案
微控制器開發團隊與編譯器開發人員的合作成果是生成的代碼效率更高,性能更好。本文介紹的是為了使ATMEL AVR微控制器系列更適合C編譯器,開發者在編譯器開發階段對微控制器架構和指令集所進行的調整。
AVR架構的核心是一個可快速訪問RISC寄存器文件。該文件由32個8位通用寄存器構成。微控制器可在一個單時鐘周期內加載該文件中的任意兩個寄存器到算術邏輯單元(Arithmetic Logical Unit, ALU),完成所要求的操作,將結果寫回到任意一個寄存器。ALU支持寄存器間或某一寄存器與一個常數之間的運算和邏輯功能,單寄存器操作也是在ALU中執行的。微控制器使用一個哈佛(Harvard)架構,在該架構中,程序存儲器空間與數據存儲器空間是相互隔離的。程序存儲器采用單級管道訪問技術,當一條指令被執行的同時,下一條指令已從程序存儲器中被預先提取。由于其算術和邏輯操作都真正地在單周期內完成,因此AVR微控制器的性能達到每MHz一個MIPS。
圖1 AVR 架構
細調微控制器
采用高級語言(High Level Languange, HLL)代替匯編語言來開發微控制器應用程序有許多優勢,但一直都有一個重大缺點,即代碼量不斷增加。我們在開發AVR微控制器時考慮了使用C語言來開發應用,使得我們有可能為器件構建出一個高效C編譯器。為了進一步提升這項特性,我們在AVR的架構和指令集未完成前就開始著手C編譯器的開發。我們先讓瑞典 IAR Systems的編譯器專業開發人員對我們的AVR架構和指令集進行評測,最后開發出非常適合運行C編譯器生成代碼的微控制器。
尋址模式
為讓編譯器生成高效的代碼,重要的是讓尋址模式匹配C語言的需要。AVR架構原來配了兩個指針寄存器(Pointer Register)。這兩個指針可用于間接尋址、算后增量(post increment)間接尋址、算前減量(pre-decrement)間接尋址,以及帶位移(displacement)的間接尋址,能夠很好地支持指針操作。此外,還有一個用于訪問數據存儲器中變量的頁面直接尋址模式。
指針位移
帶位移的間接尋址是一種非常有用的尋址模式,即使從C編譯器的角度亦如此。例如,將指針指向某一結構(struct)的第一個成員,就可以訪問該結構內位移量所允許的其他任何位置,無須變更16位指針。帶位移的間接尋址模式也常常用于訪問軟件堆棧上的變量。函數參數和autos常常放在軟件堆棧上,這樣,不用變更指針就可進行讀寫操作。位移尋址在定位數組成員(addressing elements in an array)時也非常有用。
盡管位移模式在許多情況下非常有用,但仍存在一個位移受限的問題。位移原本被限制在16個位置以內,而實際應用往往超出該數量。這樣,在位移模式無法訪問的位置,就必須加載一個新的指針。為擴展位移模式的訪問范圍,我們不得不改變指令集的其他部分,以獲得足夠的編碼空間。同時,我們還得知,C編譯器很難使用頁面直接尋址模式。于是,取消了頁面直接尋址模式,使用騰出的空間將位移模式擴展為64個位置,足以滿足大多數間接尋址的要求。原來的頁面直接尋址模式變成一個兩個字長的非頁面直接尋址模式。
存儲器指針數
AVR微控制器原來配置了兩個16位存儲器指針。如要采用C編譯器,那么其中一個指針必須專門用作軟件堆棧,這樣,就只剩一個存儲器指針。在許多情況下,需要將存儲器從一個區域復制到另一個區域。但由于只有一個指針,需要讀1字節,設置指針,確定寫入目標位置,寫入這字節,然后再將指針設回數據源位置。如果增加第三個存儲器指針(精簡功能),完成存儲器區域復制就不需要設置指針。如下例所示,只要使用算后增量間接尋址模式就可構建非常高效的存儲器讀寫循環(假設:將指針Z指向源的第一字節,X指向目標的第一字節):
?LDI R16,0x60 ?;Load byte count
loop: ?LD R17,Z+ ?;Load byte,????
?increment pointer
?ST X+,R17 ?;Store??
?byte, increment pointer
?SUBI R16,1?;Decrement
?counter
?BRNE loop?; Branch
?if more bytes
具備指針算后增量(post increment)、算前減量(pre-decrement) (+1、-1)操作的可能性對于實現堆棧也非常有效。這當然也可用于軟件運行時間堆棧。
直接尋址
如在指針位移一節所述, AVR原來有一個頁面直接尋址模式,但是,對于編譯器該模式難于使用,且效率較低。由于我們需要更多的編碼空間來增加位移量,因此取消了頁面直接尋址模式。不過,如果完全沒有直接尋址模式,代碼效率也會降低,因為在有些情況下需要訪問存放在數據存儲器中的變量。尤其是處理靜態字符時,代碼開銷將會很大(達到50%),因為靜態變量必須保存在數據存儲器中,不能自動放置到寄存器中。為了克服代碼效率低下的問題,我們占用一個16位地址來增加一些非頁面直接尋址指令。這樣,就可用一條指令來完成64KB數據空間的尋址。要訪問如此大的一個存儲器區域,訪問指令必須是兩個16位字。
如果訪問的字節數少(例如讀取一個字符),使用這種尋址方式的效率高于指針方式。對于較大的區域,可能仍然是使用間接尋址比較有效(參見下面的示例)。
Loading of a character:
Indirect addressing (6 Bytes): ??Direct addressing (4 Bytes):
LDI R30,LOW(CHARVAR) ??LDS R16,CHARVAR
LDI R31,HIGH(CHARVAR)
LD R16, Z
Loading of a long integer:
Indirect addressing (12 Bytes) ??Direct addressing (16 Bytes)
LDI R30,LOW(LONGVAR) ??LDS R0,LONGVAR
?LDI R31,HIGH(LONGVAR) ??LDS R1,LONGVAR+1
LDD R0,Z ????LDS R2,LONGVAR+2
LDD R1,Z+1 ????LDS R3,LONGVAR+3
LDD R2,Z+2
LDD R3,Z+3
零標志傳播
為實現條件轉移,需要使用一些指令來操作由一些標志(flag)構成的AVR狀態寄存器。跟在這類指令之后的條件轉移指令(conditional branch instruction)是否執行轉移,取決于這些標志的設置。使用運算指令操作這些標志,就可檢查一個數A與另一個數B之間的大小關系。當被檢查的數為8位的數時,不存在什么問題,因為所有標志都依賴一條指令設置的標志值。當被檢查的數為16位或32位的數時(這在C語言中是常有的情況),問題就有點棘手了,例如一個32位減法操作就相當于要連續進行4個8位減法操作,而每做一次8位減法,就會產生一組新的標志。
為傳播進位標志,大多數處理器都包含一些能處理進位標志先前設置值的指令。例如,帶進位的減法(SBC)指令;執行SBC A,B語句就相當于將A變成進位位。但要正確完成所有的條件轉移操作,這里還有另一個標志需要傳播,即零標志。
示例:
A=R3:R2:R1:R0, ?
B=R7:R6:R5:R4
我們打算從A中減去B,并如果A=B就跳轉到一個指定位置。如果這個零標志只依賴于最后的運算指令,那么下面的指令將不會執行:
SUB R0,R4
SBC R1,R5
SBC R2,R6
SBC R3,R7 ?; R3=R7
=> Zero flag set
BREQ destination
這是因為BREQ指令使用的標志值只取決于最后的SBC指令設置的標志值。如果大多數高位直接相等,即便32位數不相等,零標志也將被置位,而轉移也會被執行。這種問題也會出現在其他的條件轉移上。
有兩種辦法可以解決這個問題。一是保存每個指令產生的標志,然后在第四個減法完成后檢查所有的零標志。另一個更精細的方法是在進位指令中傳播零標志(參見下面方式):
Znew =Not(R7) AND
Not(R6) AND
...
Not(R0) AND
Zold
使用這種方式傳播零標志,所有條件轉移在最后一個減法操作完成后都會被執行,因為參與標志(溢出和正數標志)所剩部分只取決于最高位字節。
評論
查看更多