對(duì)于其他的stm32芯片或者其他ARM Cortex-M芯片,其實(shí)解決方法都相通。建議先完整閱讀了本文之后,再對(duì)照著你所遇到問題的現(xiàn)象進(jìn)行調(diào)試。
1.基礎(chǔ)知識(shí)
在ARM Cortex-M系列處理器中,有若干個(gè)系統(tǒng)異常專用于 fault 處理。CM3 中的 Faults 可分為以下幾類:
(1).總線 faults;
(2).存儲(chǔ)器管理 faults;
(3).用法 faults;
(4).硬 fault;
1.1.總線 faults
當(dāng) AHB 接口上正在傳送數(shù)據(jù)時(shí),如果回復(fù)了一個(gè)錯(cuò)誤信號(hào)(error response),則會(huì)產(chǎn)生總線faults,產(chǎn)生的場合可以是:
(1).取指,通常被稱作“預(yù)取流產(chǎn)”(prefetch abort);
(2).數(shù)據(jù)讀/寫,通常被稱作“數(shù)據(jù)流產(chǎn)”(data abort);
在 CM3 中,執(zhí)行如下動(dòng)作時(shí),如果地址有誤,亦會(huì)觸發(fā)總線異常:
(1).中斷處理起始階段的堆棧 PUSH 動(dòng)作。此時(shí)若發(fā)生總線 fault,則稱為“入棧錯(cuò)誤”;
(2).中斷處理收尾階段的堆棧 POP 動(dòng)作。此時(shí)若發(fā)生總線 fault,則稱為“出棧錯(cuò)誤”;
(3).在處理器啟動(dòng)中斷服務(wù)序列(sequence)后讀取向量時(shí)。這是一種極度罕見的特殊情況,被歸類為硬 fault。
總線 fault 狀態(tài)寄存器(BFSR),地址:0xE000_ED29,BFSR的各個(gè)位的定義如下:
Snipaste_2020-12-11_14-13-31
1.2.存儲(chǔ)器管理 faults
存儲(chǔ)器管理 faults 多與 MPU 有關(guān),其誘因常常是某次訪問觸犯了 MPU 設(shè)置的保護(hù)規(guī)范。另外,某些非法訪問,例如,在不可執(zhí)行的存儲(chǔ)器區(qū)域試圖取指,也會(huì)觸發(fā)一個(gè) MemManage fault,而且在這種場合下,即使沒有 MPU 也會(huì)觸發(fā) MemMange fault。MemManage faults 的常見誘因如下所示:
(1).訪問了所有 MPU regions 覆蓋范圍之外的地址;
(2).訪問了沒有存儲(chǔ)器與之對(duì)應(yīng)的空地址;
(3).往只讀 region 寫數(shù)據(jù);
(4).用戶級(jí)下訪問了只允許在特權(quán)級(jí)下訪問的地址;
存儲(chǔ)器管理 fault 狀態(tài)寄存器(MFSR),地址:0xE000_ED28,MFSR的各個(gè)位的定義如下:
Snipaste_2020-12-11_14-19-19
1.3.用法 faults
用法 faults 發(fā)生的場合可以是:
(1).執(zhí)行了協(xié)處理器指令。Cortex-M3 本身并不支持協(xié)處理器,但是通過 fault 異常機(jī)制,可以建立一套“軟件模擬”的機(jī)制,來執(zhí)行一段程序模擬協(xié)處理器的功能,從而可以方便地在其它 Cortex 處理器間移植。
(2).執(zhí)行了未定義的指令。同上一點(diǎn)的道理,亦可以軟件模擬未定義指令的功能。
(3).嘗試進(jìn)入 ARM 狀態(tài)。因?yàn)?CM3 不支持 ARM 狀態(tài),所以用法 fault 會(huì)在切換時(shí)產(chǎn)生。軟件可以利用此機(jī)制來測試某處理器是否支持 ARM 狀態(tài)。
(4).無效的中斷返回(LR 中包含了無效/錯(cuò)誤的值);
(5).使用多重加載/存儲(chǔ)指令時(shí),地址沒有對(duì)齊。
另外,如果需要嚴(yán)格要求程序的質(zhì)量,還可以讓 CM3 在遇到除數(shù)為零的時(shí)候,以及遇到未對(duì)齊訪問的時(shí)候也產(chǎn)生用法 fault。在 NVIC 中有兩個(gè)控制位分別與它們對(duì)應(yīng)。通過設(shè)置這兩個(gè)控制位,就可以激活它們。
用法 fault 狀態(tài)寄存器(UFSR),地址:0xE000_ED2A,UFSR的各個(gè)位的定義如下:
Snipaste_2020-12-11_14-24-49
1.4.硬 fault
硬 fault 是上文討論的總線 fault、存儲(chǔ)器管理 fault 以及用法 fault 上訪的結(jié)果。如果這些 fault 的服務(wù)例程無法執(zhí)行,它們就會(huì)成為“硬傷” ——上訪( escalation)成硬 fault。另外,在取向量(異常處理時(shí)對(duì)異常向量表的讀取)時(shí)產(chǎn)生的總線 fault 也按硬 fault 處理。在 NVIC中有一個(gè)硬 fault 狀態(tài)寄存器(HFSR),它指出產(chǎn)生硬 fault 的原因。如果不是由于取向量造成的,則硬 fault 服務(wù)例程必須檢查其它的 fault 狀態(tài)寄存器,以最終決定是誰上訪的。
硬 fault 狀態(tài)寄存器(HFSR),地址:0xE000_ED2C,HFSR的各個(gè)位的定義如下:
Snipaste_2020-12-11_14-29-38
2.UsageFault INVPC置1解決過程
最近在使用RTOS增加DMA驅(qū)動(dòng)時(shí),在對(duì)內(nèi)存到設(shè)備和設(shè)備到內(nèi)存的DMA傳輸測試時(shí),出現(xiàn)了UsageFault,并且UFSR中的INVPC置1了。最開始,單獨(dú)測試DMA發(fā)送是沒有問題的,但是DMA發(fā)送和接收一起測試時(shí),就會(huì)出現(xiàn)UsageFault(INVPC置1)。這個(gè)異常不太好定位出現(xiàn)問題的具體位置,因此就檢查DMA驅(qū)動(dòng),并且逐步調(diào)試吧。最終,DMA驅(qū)動(dòng)檢查和修改好了,仍然出現(xiàn)UsageFault,實(shí)在沒法了,還是從為什么會(huì)出現(xiàn)UsageFault(INVPC置1)開始分析吧。
2.1.出現(xiàn)UsageFault(INVPC置1)的原因
如果LR中的EXC_RETURN不是合法的值(合法值見下圖,包括企圖返回ARM狀態(tài)),則引起用法fault。如果用法fault被除能,也上訪成硬fault。此時(shí),用法Fault狀態(tài)寄存器(UFSR,地址:0xE000_ED2A)中的INVPC位(位偏移:2),或者是INVSTATE位(位偏移:1)置位。
Snipaste_2020-12-11_15-13-23
上面就是出現(xiàn)該異常的文字分析了。
2.2.UsageFault(INVPC置1)的解決過程
因?yàn)樵摦惓J钱惓m憫?yīng)期間才可能出現(xiàn)的異常(<
我這里是每次開始DMA測試之后,就進(jìn)入U(xiǎn)sageFault異常,并且我的系統(tǒng)中目前就打開了SysTick,PendSV,DMA1_STREAM5,DMA1_STREAM6,NMI,HardFault,MemFault,BusFault,UsageFault這些異常和中斷。因此我在開始DMA測試的時(shí)候打一個(gè)斷點(diǎn),在程序運(yùn)行到DMA測試開始的斷點(diǎn)處時(shí),再在DMA1_STREAM5,DMA1_STREAM6,NMI,HardFault,MemFault,BusFault,UsageFault這些函數(shù)的入口打斷點(diǎn),在PendSV的返回處打斷點(diǎn),SysTick就暫時(shí)先不管。然后全力運(yùn)行,發(fā)現(xiàn)每次都會(huì)在PendSV的異常返回?cái)帱c(diǎn)處停留(因?yàn)槿蝿?wù)切換嘛)總共在PendSV的斷點(diǎn)處停留了大概7到8次,就進(jìn)入到了UsageFault。
有了上面步驟的鋪墊,先去除中斷和異常中的斷點(diǎn),還是先在DMA測試開始處打斷點(diǎn),等運(yùn)行到DMA測試開始處,再在上述的中斷和異常相關(guān)位置打斷點(diǎn)。接下來我就慢慢的調(diào)試,在開始DMA測試之后,全速運(yùn)行,在退出PendSV異常時(shí),執(zhí)行單步運(yùn)行到下一步,重復(fù)7到8次,從PendSV就進(jìn)入了UsageFault,在這7到8次中,我看在退出PendSV時(shí),LR寄存器中的值都是0xFFFFFFFD,是合法的啊,當(dāng)時(shí)仔細(xì)一想,有可能是退出異常時(shí)硬件再將堆棧中的PC賦值給PC時(shí)出問題,導(dǎo)致進(jìn)入了UsageFault。果不其然,在PenSV退出之前,我查看每個(gè)PSP(0xFFFFFFFD:返回線程模式,并使用線程堆棧)對(duì)應(yīng)內(nèi)存數(shù)值,能夠正常退出PendSV的寄存器和PSP堆棧內(nèi)容如下圖所示:
Snipaste_2020-12-11_16-38-20
Snipaste_2020-12-11_16-43-28
進(jìn)入U(xiǎn)sageFault異常之前的寄存器和PSP堆棧內(nèi)容如下圖所示:
Snipaste_2020-12-11_16-45-35
Snipaste_2020-12-11_16-47-17
此處堆棧中的內(nèi)容,明顯的0x20003D94堆棧中的PC值是有問題的,我的程序是燒寫到flash中的PC地址應(yīng)該是08xxxxxx,然而現(xiàn)在堆棧中的PC地址是0x20003DA8,這個(gè)地址是SRAM中的地址,SRAM存儲(chǔ)的數(shù)據(jù)而不是代碼,出現(xiàn)這個(gè)問題的原因,猜想一下,應(yīng)該就是任務(wù)堆棧溢出導(dǎo)致,當(dāng)我增加任務(wù)堆棧的大小之后,哈哈,程序正常運(yùn)行,世界是如此美好。
3.調(diào)試小結(jié)
3.1.解決過程小結(jié)
其實(shí)上面的步驟2,是我自己的一個(gè)調(diào)試解決問題的過程,這里給大家提供一個(gè)比較直接的解決方式。在開始運(yùn)行程序之前,直接在UsageFault異常入口函數(shù)中打一個(gè)斷點(diǎn),然后全速運(yùn)行程序,等程序停止在UsageFault異常函數(shù)的斷點(diǎn)處時(shí),需要注意以下幾點(diǎn):
(1).如果LR是合法值,那么根據(jù)LR判斷退出異常時(shí)使用的堆棧,然后在Memory查看窗口中,查看堆棧中R0,R1,R2,R3,R12,LR,PC,xPSR這些寄存器的值,根據(jù)這些寄存器的值,判斷是否是堆棧溢出導(dǎo)致該異常發(fā)生;如果不是堆棧溢出導(dǎo)致該異常發(fā)生,那么就要根據(jù)PC值,在匯編窗口中跳轉(zhuǎn)到PC值對(duì)應(yīng)的代碼處,分析導(dǎo)致異常發(fā)生的原因;
(2).如果LR不是合法值,就要分析下你的代碼中,有哪些地方修改過LR的值,確保修改的值要是合法的。
3.2.關(guān)于UsageFault 如何才能讓INVPC置1
(1).在退出異常或中斷時(shí),執(zhí)行BX LR時(shí),LR的值是非法的,此時(shí)就會(huì)觸發(fā)UsageFault異常,并且INVPC置1。
(2).在退出異常或中斷時(shí),執(zhí)行BX LR時(shí),LR的值是合法的,但是退出異常之后要使用的堆棧中,堆棧里面的PC值是有問題的,此時(shí)就有可能觸發(fā)UsageFault異常,并且INVPC置1。
對(duì)于上面的兩點(diǎn)的模擬其實(shí)也比較好做,在PendSV或者其他異常的退出的地方打一個(gè)斷點(diǎn),然后手動(dòng)修改LR或者堆棧中PC的值,就能觸發(fā)UsageFault異常,并且INVPC置1。這里注意一下,修改堆棧中PC的值,我這里測試時(shí)候,設(shè)置PC值為其他值可能引起其他的異常,貌似修改PC的值為RAM中數(shù)據(jù)區(qū)的地址才會(huì)出現(xiàn)該異常,不太清楚為什么會(huì)這樣,可能是數(shù)據(jù)區(qū)是沒有執(zhí)行代碼的權(quán)限,因此出異常吧,不太確定,有知道的朋友,歡迎留言講解。
審核編輯:劉清
-
ARM
+關(guān)注
關(guān)注
134文章
8967瀏覽量
365054 -
存儲(chǔ)器
+關(guān)注
關(guān)注
38文章
7366瀏覽量
163096 -
中斷處理
+關(guān)注
關(guān)注
0文章
94瀏覽量
10933 -
Cortex-M
+關(guān)注
關(guān)注
2文章
227瀏覽量
29660 -
STM32芯片
+關(guān)注
關(guān)注
0文章
38瀏覽量
4341
原文標(biāo)題:ARM Cortex-M 異常-HardFault(UsageFault) INVPC置1解決過程
文章出處:【微信號(hào):嵌入式那些事,微信公眾號(hào):嵌入式那些事】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論