單片機的可靠性設計是一項系統工程,單片機系統的可靠性必須從軟件、硬件以及結構設計等方面全面考慮。硬件系統的可靠性設計是單片機系統可靠性的根本,而軟件系統的可靠性設計起到抑制外來干擾的作用。軟件系統的可靠性設計的主要方法有:開機自檢、軟件陷阱(進行程序“跑飛”檢測)、設置程序運行狀態標記、輸出端口刷新、輸入多次采樣、軟件“看門狗”等。通過軟件系統的可靠性設計,達到最大限度地降低干擾對系統工作的影響,確保單片機及時發現因干擾導致程序出現的錯誤,并使系統恢復到正常工作狀態或及時報警的目的。
一、開機自檢 開機后首先對單片機系統的硬件及軟件狀態進行檢測,一旦發現不正常,就進行相應的處理。開機自檢程序通常包括對RAM、ROM、I/O口狀態等的檢測。
1?檢測RAM 檢查RAM讀寫是否正常,實際操作是向RAM單元寫“00H”,讀出也應為“00H”,再向其寫“FFH”,讀出也應為“FFH”。如果RAM單元讀寫出錯,應給出RAM出錯提示(聲光或其它形式),等待處理。
2?檢查ROM單元的內容 對ROM單元的檢測主要是檢查ROM單元的內容的校驗和。所謂ROM的校驗和是將ROM的內容逐一相加后得到一個數值,該值便稱校驗和。ROM單元存儲的是程序、常數和表格。一旦程序編寫完成,ROM中的內容就確定了,其校驗和也就是唯一的。若ROM校驗和出錯,應給出ROM出錯提示(聲光或其它形式),等待處理。
3?檢查I/O口狀態 首先確定系統的I/O口在待機狀態應處的狀態,然后檢測單片機的I/O口在待機狀態下的狀態是否正常(如是否有短路或開路現象等)。若不正常,應給出出錯提示(聲光或其它形式),等待處理。
4?其它接口電路檢測 除了對上述單片機內部資源進行檢測外,對系統中的其它接口電路,比如擴展的E2PROM、A/D轉換電路等,又如數字測溫儀中的555單穩測溫電路,均應通過軟件進行檢測,確定是否有故障。
只有各項檢查均正常,程序方能繼續執行,否則應提示出錯。
二、軟件陷阱 在程序存儲器中總會有一些區域未使用,如果因干擾導致單片機的指令計數器PC值被錯置,程序跳到這些未用的程序存儲空間,系統就會出錯。軟件陷阱是在程序存儲器的未使用的區域中,加上若干條空操作和無條件跳轉指令,無條件跳轉指令指向程序“跑飛”處理子程序的入口地址。如果程序跳到這些未用區域,就會執行無條件跳轉指令,轉到相應的程序出錯“跑飛”處理程序。除程序未用區域外,還可以在程序段之間(如子程序之間及一段處理程序完成后)及一頁的末尾處插入軟件陷阱,效果會更好。下面是一段帶軟件陷阱的程序;
DSP:……;顯示子程序
RET
NOP;軟件陷阱
NOP
NOP
LIMP FLY
D10MS:MOV R0,#010H;延時子程序
……
RET
NOP ;軟件陷阱
NOP
NOP
LJMP FLY
……
FLY:…… ;“跑飛”處理子程序
RET
三、程序“跑飛”處理 要進行程序“跑飛”處理,就要分清程序“跑飛”所造成的影響,以及程序“跑飛”前運行的進程,這就需要的設置相應的標志。
RAM數據正常標志 RAM數據正常標志是檢測RAM區的數據是否已經因程序“跑飛”或其它干擾而改變。如果RAM區的數據確因程序“跑飛”或其它干擾而改變,則系統無法自行恢復到原來的出錯地點,只能由人工或由軟件復位從頭開始執行。要進行RAM區數據正常檢測,首先應在初始化程序中,對RAM的若干單元設置RAM數據正常標志。通常是在RAM區中選數個單元,在初始化程序中將其置成固定的數,如“55H”或“0AAH”,只要程序正常運行,這些單元的內容是不會被修改的,若因程序“跑飛”或其它干擾導致這些RAM單元中的任何單元的數據發生變化,說明其它RAM單元的內容也可能發生變化,無法反映程序運行的結果和狀態,不能根據RAM區中的標志去恢復程序運行現場。
程序運行標記 程序運行狀態標記是在RAM區中設立一些標志位,這些標志位分別代表程序運行的不同階段及運行后的狀態。在初始化程序中,首先對這些單元置初值,在程序運行的不同階段,這些單元的內容將被改變成特定值,標記程序運行的階段和運行后的狀態。這些標志除了在程序正常運行中起到條件轉移的作用外,還能在程序“跑飛”,而RAM區數據正常時起到恢復程序運行現場的作用。
程序“跑飛”處理 程序“跑飛”處理就是在程序由軟件陷阱檢測到“跑飛”后,轉入“跑飛”處理程序。“跑飛”處理程序判斷“跑飛”影響的程度,根據影響程度的不同,決定是報警復位還是自動恢復現場。如自動恢復現場,則需根據程序運行狀態標記進行。具體如何進行程序“跑飛”處理,要根據控制系統的設計要求進行。
四、輸出端口刷新 由于單片機的I/O口很容易受到外部信號的干擾,輸出口的狀態也可能因此而改變。在程序中周期性地添加輸出端刷新指令,可以降低干擾對輸出口狀態的影響。在程序中指定RAM單元存儲輸出口當時應處的狀態,在程序運行過程中根據這些RAM單元的內容去刷新I/O口。
五、輸入多次采樣 干擾對單片機的輸入,會造成輸入信號瞬間采樣的誤差或誤讀。要排除干擾的影響,通常采取重復采樣、加權平均的方法。
比如對于外部電平采樣(如按鍵),采取軟件每隔10ms讀一次鍵盤或連續讀若干次,每次讀出的數據都相同或者采取表決的方法確認輸入的鍵值。又如在用單穩電路檢測溫度的系統中(參《電子報》1999年第51期第九版)采取對單穩電路的脈沖寬度計數,然后查表求溫度值的方法。為排除干擾的影響,可以采取三次采樣求平均值,也可以采取兩次采樣、差值小于設定值為有效,然后求平均值的方法(又稱軟件濾波)。總之,對輸入信號進行多次采樣,其后如何進行處理是要根據具體對象實際處理的效果來優選的,讀者可通過實驗室調試時施加干擾及現場環境調試時的效果來確定。
六、軟件“看門狗” 軟件陷阱是在程序運行到ROM的非法區域時檢測程序出錯的方法。而“看門狗”是根據程序在運行指定時間間隔內未進行相應的操作,即未按時復位看門狗定時器,來判斷程序運行出錯的。
在系統成本允許的情況下,應選擇專門的看門狗電路芯片或片內帶看門狗定時器的單片機。如果條件不允許,應加軟件“看門狗”。
一、開機自檢 開機后首先對單片機系統的硬件及軟件狀態進行檢測,一旦發現不正常,就進行相應的處理。開機自檢程序通常包括對RAM、ROM、I/O口狀態等的檢測。
1?檢測RAM 檢查RAM讀寫是否正常,實際操作是向RAM單元寫“00H”,讀出也應為“00H”,再向其寫“FFH”,讀出也應為“FFH”。如果RAM單元讀寫出錯,應給出RAM出錯提示(聲光或其它形式),等待處理。
2?檢查ROM單元的內容 對ROM單元的檢測主要是檢查ROM單元的內容的校驗和。所謂ROM的校驗和是將ROM的內容逐一相加后得到一個數值,該值便稱校驗和。ROM單元存儲的是程序、常數和表格。一旦程序編寫完成,ROM中的內容就確定了,其校驗和也就是唯一的。若ROM校驗和出錯,應給出ROM出錯提示(聲光或其它形式),等待處理。
3?檢查I/O口狀態 首先確定系統的I/O口在待機狀態應處的狀態,然后檢測單片機的I/O口在待機狀態下的狀態是否正常(如是否有短路或開路現象等)。若不正常,應給出出錯提示(聲光或其它形式),等待處理。
4?其它接口電路檢測 除了對上述單片機內部資源進行檢測外,對系統中的其它接口電路,比如擴展的E2PROM、A/D轉換電路等,又如數字測溫儀中的555單穩測溫電路,均應通過軟件進行檢測,確定是否有故障。
只有各項檢查均正常,程序方能繼續執行,否則應提示出錯。
二、軟件陷阱 在程序存儲器中總會有一些區域未使用,如果因干擾導致單片機的指令計數器PC值被錯置,程序跳到這些未用的程序存儲空間,系統就會出錯。軟件陷阱是在程序存儲器的未使用的區域中,加上若干條空操作和無條件跳轉指令,無條件跳轉指令指向程序“跑飛”處理子程序的入口地址。如果程序跳到這些未用區域,就會執行無條件跳轉指令,轉到相應的程序出錯“跑飛”處理程序。除程序未用區域外,還可以在程序段之間(如子程序之間及一段處理程序完成后)及一頁的末尾處插入軟件陷阱,效果會更好。下面是一段帶軟件陷阱的程序;
DSP:……;顯示子程序
RET
NOP;軟件陷阱
NOP
NOP
LIMP FLY
D10MS:MOV R0,#010H;延時子程序
……
RET
NOP ;軟件陷阱
NOP
NOP
LJMP FLY
……
FLY:…… ;“跑飛”處理子程序
RET
三、程序“跑飛”處理 要進行程序“跑飛”處理,就要分清程序“跑飛”所造成的影響,以及程序“跑飛”前運行的進程,這就需要的設置相應的標志。
RAM數據正常標志 RAM數據正常標志是檢測RAM區的數據是否已經因程序“跑飛”或其它干擾而改變。如果RAM區的數據確因程序“跑飛”或其它干擾而改變,則系統無法自行恢復到原來的出錯地點,只能由人工或由軟件復位從頭開始執行。要進行RAM區數據正常檢測,首先應在初始化程序中,對RAM的若干單元設置RAM數據正常標志。通常是在RAM區中選數個單元,在初始化程序中將其置成固定的數,如“55H”或“0AAH”,只要程序正常運行,這些單元的內容是不會被修改的,若因程序“跑飛”或其它干擾導致這些RAM單元中的任何單元的數據發生變化,說明其它RAM單元的內容也可能發生變化,無法反映程序運行的結果和狀態,不能根據RAM區中的標志去恢復程序運行現場。
程序運行標記 程序運行狀態標記是在RAM區中設立一些標志位,這些標志位分別代表程序運行的不同階段及運行后的狀態。在初始化程序中,首先對這些單元置初值,在程序運行的不同階段,這些單元的內容將被改變成特定值,標記程序運行的階段和運行后的狀態。這些標志除了在程序正常運行中起到條件轉移的作用外,還能在程序“跑飛”,而RAM區數據正常時起到恢復程序運行現場的作用。
程序“跑飛”處理 程序“跑飛”處理就是在程序由軟件陷阱檢測到“跑飛”后,轉入“跑飛”處理程序。“跑飛”處理程序判斷“跑飛”影響的程度,根據影響程度的不同,決定是報警復位還是自動恢復現場。如自動恢復現場,則需根據程序運行狀態標記進行。具體如何進行程序“跑飛”處理,要根據控制系統的設計要求進行。
四、輸出端口刷新 由于單片機的I/O口很容易受到外部信號的干擾,輸出口的狀態也可能因此而改變。在程序中周期性地添加輸出端刷新指令,可以降低干擾對輸出口狀態的影響。在程序中指定RAM單元存儲輸出口當時應處的狀態,在程序運行過程中根據這些RAM單元的內容去刷新I/O口。
五、輸入多次采樣 干擾對單片機的輸入,會造成輸入信號瞬間采樣的誤差或誤讀。要排除干擾的影響,通常采取重復采樣、加權平均的方法。
比如對于外部電平采樣(如按鍵),采取軟件每隔10ms讀一次鍵盤或連續讀若干次,每次讀出的數據都相同或者采取表決的方法確認輸入的鍵值。又如在用單穩電路檢測溫度的系統中(參《電子報》1999年第51期第九版)采取對單穩電路的脈沖寬度計數,然后查表求溫度值的方法。為排除干擾的影響,可以采取三次采樣求平均值,也可以采取兩次采樣、差值小于設定值為有效,然后求平均值的方法(又稱軟件濾波)。總之,對輸入信號進行多次采樣,其后如何進行處理是要根據具體對象實際處理的效果來優選的,讀者可通過實驗室調試時施加干擾及現場環境調試時的效果來確定。
六、軟件“看門狗” 軟件陷阱是在程序運行到ROM的非法區域時檢測程序出錯的方法。而“看門狗”是根據程序在運行指定時間間隔內未進行相應的操作,即未按時復位看門狗定時器,來判斷程序運行出錯的。
在系統成本允許的情況下,應選擇專門的看門狗電路芯片或片內帶看門狗定時器的單片機。如果條件不允許,應加軟件“看門狗”。
評論
查看更多