嵌入式系統是在有限的空間和有限的資源中運行,高效地實現某種特定功能或功能集合的裝置。
它的開發通常受到很多客觀條件的限制,諸如較弱的CPU處理能力、較小的內存空間、較少的可供選擇的外設、有限的電源供應等。每個嵌入式系統的開發無不是精打細算,以求用有限的資源發揮最大的功效。在各種嵌入式系統上運行的操作系統中,嵌入式Linux以其免費、高可靠性、廣泛的硬件支持以及開放源碼等眾多特性正在獲得越來越多的關注。其源碼開放特性使得開發者可以針對特定的嵌入式系統對Linux內核進行修改,以滿足開發要求,達到系統最優化的目的。嵌入式Linux應用中的一大問題是Linux的實時性問題。實時系統必須在限定時間內對外部事件作出正確響應,重點放在對滿足突發性、暫時性的處理需求上。而Linux作為傳統的分時操作系統,關注更多的是系統的整體數據吞吐量。如何提高Linux的實時性能是擺在廣大嵌入式系統級開發人員面前的挑戰。
1 相關研究
目前市面上有各種Linux發行版,但嚴格來說,Linux指的是Linus Torvalds維護的(及通過主要和鏡像網站發布的)內核。建立嵌入式系統不需要特別的內核,一個嵌入式Linux系統只是代表一個基于Linux內核的嵌入式系統,本文后面提及的Linux均指Linux內核。目前已有很多改善Linux實時性能的工作在進行中。最新的2.6版Linux已經實現了可搶占式的內核任務調度,但是不確定的中斷延時問題沒有得到解決。即2.6版的Linux高優先級內核空間進程雖然能像在用戶空間里那樣搶占低優先級進程的系統資源,但是從中斷發出開始到中斷服務程序的第1條指令開始執行的時間是不確定的。
除了Linux開發者的改進工作之外,還有一些組織、公司為提高Linux的實時性做了大量工作。其中有代表性的是Fsm Labs公司的RT-Linux、Monta Vista公司的MontaVista Linux、由Paolo Mantegazza等人維護的RTAI(Realtime Application InteRFace)項目。這些項目采用的方法可歸納為兩類:
(1)直接修改Linux內核。MontaVista Linux采用的就是這種方法。它將Linux修改成稱為Relatively Fully Preemptable Kernel的可搶占式內核,并使現了實時調度機制和算法,增加了一個細粒度定時器,這樣就將Linux修改成為一個軟實時內核。
(2)“雙內核”方式。RTAI項目和RT-Linux采用了這種方法。這種方法將傳統Linux“架空”,作為新增加的小型實時內核的一個優先級最低的任務執行,而實時任務則作為優先級最高的任務。即在實時任務存在的情況下運行實施任務,否則才運行Linux本身的任務。
MontaVista和RT-Linux的局限性在于它是一個商用軟件,不遵循GNU 的源代碼開放原則。若要在系統中使用這種Linux,則需要支付一筆頗為可觀的授權費用,這就違背了使用Linux的初衷—— 開源、免費,能夠發展自己的知識產權。
RTAI為了實時性能舍棄了Linux固有的很多優點:對大量硬件的廣泛支持,優秀的穩定性、可靠性。開發者一方面要針對RTAI自定義的一個硬件抽象層RTHAL(Real Time Hardware Abstraction Layer)重新編寫驅動程序,而且龐大的Linux開發社區的成果也無法方便地應用到實時核心中。
2 影響Linux實時性的因素
2.1 任務切換及其延時
任務切換延時是Linux從一個進程切換到另一個進程所需的時間,即高優先級進程從發出CPU 資源申請到進程的第1條指令開始執行的間隔。在實時系統中,任務切換延時必須越短越好。如之前所提到的,Linux 2.6.X已經實現了可搶占式內核,高優先級內核空間進程可以像在用戶空間中那樣讓CPU在任何時候停止低優先級進程轉而執行自己。但是有2種例外情況:
(1)進程在臨界區(Critical Section)中執行的時候不能被其他進程搶占;
(2)中斷服務程序(Interrupt Service Routine)不能被其他進程搶占。
2.2 基于優先級的調度算法
在Linux 2.6中,采用了O(1)調度算法。它是一個基于優先級的搶先式調度器,為每一個進程分配一個唯一的優先級,調度器保證在所有等待運行的任務中,首先被執行的總是高優先級的任務,為此高優先級的任務能夠搶占低優先級的任務。
這個調度器開銷恒定,與當前系統開銷無關,能夠改善系統實時性能。但是調度系統沒有提供除CPU以外的其他資源剝奪運行,實時性能沒有得到根本改觀。如果兩個任務需要使用同一個資源(如高速緩存),高優先級的任務已準備就緒,而此刻低優先級的任務正在用這個資源,高優先級的任務就必須等待,直到低優先級任務結束釋放了該資源后才能被執行,這被稱為優先級倒置。
2.3 中斷延時、中斷服務程序
中斷延時指的是從外設發出中斷信號開始到ISR的第1條指令開始執行的時間間隔。由外部中斷引起的實時任務需求是實時系統處理量的主要組成部分,足夠快地中斷響應和迅速地中斷服務程序處理是衡量實時系統的重要性能指標。不同的ISR執行時間是不一樣的,即使是相同的ISR也可能因為有多個出口而有不同的執行時間。而ISR執行時外部中斷是被禁用的,造成這樣一種情況,即使Linux的中斷延時非常小,如果在一個ISR執行時某個外設也產生了一個中斷信號,因為正在執行的ISR運行時間的不確定性和不可搶占性,也會產生Linux的中斷延時的不可預測性。
3 系統實時性能的提高
3.1 任務切換機倒的建立
在2.1節中提到進程在臨界區中執行的時候不能被搶占的問題,為了不影響系統穩定性、減少調試和測試的時間,我們不打算對此進行修改,而引入一個機制保證實時任務能夠得到優先執行。即在實時系統中,只有當進程的臨界區能在下一個實時任務開始之前結束才被允許進入。
如何判斷下一個實時任務中斷信號的產生時間,一般來說中斷信號是為了那些開始時間不可預測的任務而設定的,它的產生是完全隨機的。為了使中斷信號的時間能夠被預測,將中斷信號的產生與時鐘中斷掛鉤:中斷信號只能與時鐘中斷同時產生。時鐘中斷由系統計時硬件以周期性間隔產生。這個間隔由內核根據Hz值設定。Hz是一個與體系結構有關的常數,在文件中定義。當前的Linux為大多數平臺定義的Hz值是100,亦即時鐘中斷周期是10ms。顯然這是達不到實時系統定時精度要求的。提高Hz值能夠帶來系統性能提升,但卻是以增加系統開銷為代價。這就必須仔細權衡實時性要求和系統開銷的平衡。一種方法是通過大量的測試確定的實時任務中斷請求發生的時間間隔和進程在臨界區中的執行時間,取一個稍大于大多數實時任務中斷間隔和臨界區執行時間的數值。
Linux提供了一些機制讓我們得以計算函數的執行時間,gettimefoday()函數是其中之一。函數的原型及需要使用的一個數據結構如下:
其中,gettimeofday()將當前時間保存在tv結構中,tz一般不需要用到,可用NULL代替。使用示例如下:
如此即可得出進程在臨界區function_in_critical_section()所耗費的時間,以供參考。將Hz值設定在2000,此時系統時鐘中斷周期為0.5ms,精度提高了20倍。
如圖1、圖2所示,當進程進入臨界區之前,它比較自身的平均執行時間T(NP)和T(REMAIN)的值,當T(NP)≤T(REMAIN)的時候,進程才被允許進入臨界區,否則進程進入工作隊列等待下一次判斷。
本文嘗試用數學方法來分析采用這種機制對實時性能的提高。首先給出一個定義:當預定在時刻t時執行的實時任務推遲到時刻t‘時才執行,則t’-t稱作系統延遲,用Lat(OS)表示。在普通Linux中,Lat(OS)如下:
Lat(OS)=T(NP)+ T(SHED)
設任意時刻 ,T(NP)≤T(REMAIN)的機率為ρ,則普通Linux中的平均Lat(OS)為
AvLat(OS)=ρ[T(NP)+ T(SHED)] +(1-ρ)[T(NP)+ 2T(SHED)]
引入前述機制后,由于總是優先保證實時任務的執行,Lat(RT-OS)固定式為:
Lat(RT-OS)=T(SHED)
采用該機制前后系統廷遲的變化為
δ=AvLat(NOR-OS)-Lat(RT-OS)=T(NP)+(2-ρ)T(SHED)
在一個特定系統里,ρ是固定的,而在Linux 2.6中,采用O(1)算法后T(SHED)也是固定的,由前式可得出結論:在臨界區的進程執行時間長的系統中,引入該機制前后平均系統廷遲下降的越大,系統實時性能的改善越明顯。
3.2 優先級量頂
試描述一個如下場景:低優先級的任務L和高優先級H任務需要占用同一共享資源,低優先級任務開始后不久,高優先級任務也準備就緒,發現所需共享資源被占用后,任務H被掛起,等待任務L結束釋放該資源。此時一個不需要該資源的中優先級任務M 出現,調度器依據優先原則轉而執行任務M。這就進一步廷長了任務H的等待時間,如圖3所示。更加惡劣的情況是,如果出現了更多的類似任務M0,M1,M2,。..,將有可能使任務H錯過臨界期限(Critical Deadline),而導致系統崩潰。
在一個不太復雜的實時系統中,可采用優先級置頂的方法解決這一問題。該方案對每一個可能被共享的資源分配一個優先級,該優先級為有可能使用這個資源的最高優先級的進程的優先級(如下偽代碼中的RESOURCE_X_PRIO)。由調度器將優先級傳給使用該資源的進程,進程結束后其自身的優先級(如下偽代碼中的TASK_A_PRIO)才恢復正常。這樣就避免了上面場景中任務L被任務M搶占,而導致任務H始終處于掛起狀態。優先級置頂的示例代碼如下:
3.3 內核線程
中斷服務程序(ISR)是不能被搶占的。一旦CPU 開始執行ISR,除非程序結束,否則不可能轉而執行其他的任務。Linux用自旋鎖(Spinlock)來實現ISR對CPU的獨占。采用了自旋鎖的ISR是不能進入休眠的,而且此時系統的中斷也被完全禁止。內核線程是由內核創建和撤銷的,用來執行一個指定的函數。內核線程具有自己的內核堆棧,能夠被單獨調用。我們用內核線程代替ISR,并且用互斥量(Mutex)替換自旋鎖。內核線程能夠進入休眠,而且執行時是不禁用外部中斷的。系統接到中斷信號后,喚醒相應的內核線程,內核線程代替原來的ISR執行完任務后繼續進入休眠狀態。這樣中斷廷時就是可預測的,并且占用時間也很少。
根據LynuxWorks公司的測試數據,在Pentium III 1GHz的PC上,Linux 2.4內核的平均任務響應時間為1133us,平均中斷響應時間為252us;而Linux 2.6內核的平均響應時間為132us,平均中斷響應時間僅為14us,比Linux 2.4內核提高了一個數量級。在此基礎上,采用這種方法能夠針對具體的系統進一步加快特定中斷的響應時間,提高應用系統的實時性能。
4 總結與展望
本文以Linux 2.6為基礎探討了提高Linux實時性的方法。引入了在實時系統中,只有當進入臨界區的進程能在下一個實時任務開始之前結束時才被允許執行的機制,保證實時任務總是優先得到執行;采用了優先級置頂的方法避免了出現優先級倒置的情況;用內核線程代替中斷服務程序,改變了了一般中斷服務程序執行中不能進入休眠狀態的情況,并且執行時不禁用外部中斷,使系統的中斷廷時變得短小和可預測。本文所述方法的缺點在于,提高系統時鐘中斷頻率帶會增大系統開銷問題。為了在實時性能提升和系統開銷增大之間找到一個平衡點,開發者不得不對具體系統做大量測試,具體問題具體分析,使得該方法在適用性上打了折扣。Linux因其免費、性能強大、工具眾多的特點,必將在嵌入式系統領域得到大量的應用。我們應該及時跟蹤國內外Linux發展動態,同時積累在此領域的開發經驗,走出自己的路來。
評論
查看更多