Linux是一套免費使用和自由傳播的類Unix操作系統,是一個基于POSIX和UNIX的多用戶、多任務、支持多線程和多CPU的操作系統。它能運行主要的UNIX工具軟件、應用程序和網絡協議。它支持32位和64位硬件。Linux繼承了Unix以網絡為核心的設計思想,是一個性能穩定的多用戶網絡操作系統。
Linux操作系統誕生于1991 年10 月5 日(這是第一次正式向外公布時間)。Linux存在著許多不同的Linux版本,但它們都使用了Linux內核。Linux可安裝在各種計算機硬件設備中,比如手機、平板電腦、路由器、視頻游戲控制臺、臺式計算機、大型機和超級計算機。
嚴格來講,Linux這個詞本身只表示Linux內核,但實際上人們已經習慣了用Linux來形容整個基于Linux內核,并且使用GNU 工程各種工具和數據庫的操作系統。
I/O端口
CPU與外部設備、存儲器的連接和數據交換都需要通過接口設備來實現,前者被稱為I/O接口,而后者則被稱為存儲器接口。存儲器通常在CPU的同步控制下工作,接口電路比較簡單;而I/O設備品種繁多,其相應的接口電路也各不相同,因此,習慣上說到接口只是指I/O接口。
I/O內存
CPU沒有專門用于設備I/O的指令。這就是所謂的“I/O內存”方式。另一類CPU(典型地如X86)將外設的寄存器看成一個獨立的地址空間,所以訪問內存的指令不能用來訪問這些寄存器,而要為對外設寄存器的讀/寫設置專用指令,如IN和OUT指令。
Linux設備驅動之I/O端口與I/O內存
從CPU連出來一把線:數據總線、地址總線、控制總線,這把線上掛著N個接口,有相同的,有不同的,名字叫做存儲器接口、中斷控制接口、DMA接口、并行接口、串行接口、AD接口……一個設備要想接入,就用自己的接口和總線上的某個匹配接口對接……于是總線上出現了各種設備:內存、硬盤,鼠標、鍵盤,顯示器……
對于CPU而言,如果它要發數據到某個設備,其實是發到對應的接口,接口電路里有多個寄存器(也稱為端口),訪問設備實際上是訪問相關的端口,所有的信息會由接口轉給它的設備。那么CPU會準備數據到數據總線,但是諸多接口,該發給誰呢?這時就須要為各接口分配一個地址,然后把地址放在地址總線上,需要的控制信息放到控制總線上,就可以和設備通信了。
對一個系統而言,通常會有多個外設,每個外設的接口電路中,又會有多個端口,每個端口都需要一個地址,為他們標識一個具體的地址值,是系統必須解決的事,與此同時,你還有個內存條,可能是512M或1G或更大的金士頓、現代DDR2之類,他們的每一個地址也都需要分配一個標識值,另外,很多外設有自己的內存、緩沖區,就像你的內存條一樣,你同樣需要為它們分配內存……你的CPU可能需要和它們的每一個字節都打交道,所以:別指望偷懶,它們的每一寸土地都要規劃好!這聽起來就很煩,做起來可能就直接導致腦細胞全部陣亡。但事情總是得有人去做,ARM可能會這樣做:他這次設計的CPU是32位的,最多也就能尋址2^32=4G空間,于是把這4GB空間丟給內存和端口,讓他們瓜分。但英特爾或許有更好的分配方式……
1、地址的概念
1)物理地址:CPU地址總線傳來的地址,由硬件電路控制其具體含義。物理地址中很大一部分是留給內存條中的內存的,但也常被映射到其他存儲器上(如顯存、BIOS等)。在程序指令中的虛擬地址經過段映射和頁面映射后,就生成了物理地址,這個物理地址被放到CPU的地址線上。
物理地址空間,一部分給物理RAM(內存)用,一部分給總線用,這是由硬件設計來決定的,因此在32 bits地址線的x86處理器中,物理地址空間是2的32次方,即4GB,但物理RAM一般不能上到4GB,因為還有一部分要給總線用(總線上還掛著別的許多設備)。在PC機中,一般是把低端物理地址給RAM用,高端物理地址給總線用。
2)總線地址:總線的地址線或在地址周期上產生的信號。外設使用的是總線地址,CPU使用的是物理地址。
物理地址與總線地址之間的關系由系統的設計決定的。在x86平臺上,物理地址就是總線地址,這是因為它們共享相同的地址空間——這句話有點難理解,詳見下面的“獨立編址”。在其他平臺上,可能需要轉換/映射。比如:CPU需要訪問物理地址是0xfa000的單元,那么在x86平臺上,會產生一個PCI總線上對0xfa000地址的訪問。因為物理地址和總線地址相同,所以憑眼睛看是不能確定這個地址是用在哪兒的,它或者在內存中,或者是某個卡上的存儲單元,甚至可能這個地址上沒有對應的存儲器。
3)虛擬地址:現代操作系統普遍采用虛擬內存管理(Virtual Memory Management)機制,這需要MMU(Memory Management Unit)的支持。MMU通常是CPU的一部分,如果處理器沒有MMU,或者有MMU但沒有啟用,CPU執行單元發出的內存地址將直接傳到芯片引腳上,被內存芯片(物理內存)接收,這稱為物理地址(Physical Address),如果處理器啟用了MMU,CPU執行單元發出的內存地址將被MMU截獲,從CPU到MMU的地址稱為虛擬地址(Virtual Address),而MMU將這個地址翻譯成另一個地址發到CPU芯片的外部地址引腳上,也就是將虛擬地址映射成物理地址。
Linux中,進程的4GB(虛擬)內存分為用戶空間、內核空間。用戶空間分布為0~3GB(即PAGE_OFFSET,在0X86中它等于0xC0000000),剩下的1G為內核空間。程序員只能使用虛擬地址。系統中每個進程有各自的私有用戶空間(0~3G),這個空間對系統中的其他進程是不可見的。
CPU發出取指令請求時的地址是當前上下文的虛擬地址,MMU再從頁表中找到這個虛擬地址的物理地址,完成取指。同樣讀取數據的也是虛擬地址,比如mov ax, var. 編譯時var就是一個虛擬地址,也是通過MMU從也表中來找到物理地址,再產生總線時序,完成取數據的。
2、編址方式
1)外設都是通過讀寫設備上的寄存器來進行的,外設寄存器也稱為“I/O端口”,而IO端口有兩種編址方式:獨立編址和統一編制。
統一編址:外設接口中的IO寄存器(即IO端口)與主存單元一樣看待,每個端口占用一個存儲單元的地址,將主存的一部分劃出來用作IO地址空間,如,在PDP-11中,把最高的4K主存作為IO設備寄存器地址。端口占用了存儲器的地址空間,使存儲量容量減小。
統一編址也稱為“I/O內存”方式,外設寄存器位于“內存空間”(很多外設有自己的內存、緩沖區,外設的寄存器和內存統稱“I/O空間”)。
如,Samsung的S3C2440,是32位ARM處理器,它的4GB地址空間被外設、RAM等瓜分:
0x8000 1000 LED 8*8點陣的地址
0x4800 0000 ~ 0x6000 0000 SFR(特殊暫存器)地址空間
0x3800 1002 鍵盤地址
0x3000 0000 ~ 0x3400 0000 SDRAM空間
0x2000 0020 ~ 0x2000 002e IDE
0x1900 0300 CS8900
獨立編址(單獨編址):IO地址與存儲地址分開獨立編址,I/O端口地址不占用存儲空間的地址范圍,這樣,在系統中就存在了另一種與存儲地址無關的IO地址,CPU也必須具有專用與輸入輸出操作的IO指令(IN、OUT等)和控制邏輯。獨立編址下,地址總線上過來一個地址,設備不知道是給IO端口的、還是給存儲器的,于是處理器通過MEMR/MEMW和IOR/IOW兩組控制信號來實現對I/O端口和存儲器的不同尋址。如,intel 80x86就采用單獨編址,CPU內存和I/O是一起編址的,就是說內存一部分的地址和I/O地址是重疊的。
獨立編址也稱為“I/O端口”方式,外設寄存器位于“I/O(地址)空間”。
對于x86架構來說,通過IN/OUT指令訪問。PC架構一共有65536個8bit的I/O端口,組成64K個I/O地址空間,編號從0~0xFFFF,有16位,80x86用低16位地址線A0-A15來尋址。連續兩個8bit的端口可以組成一個16bit的端口,連續4個組成一個32bit的端口。I/O地址空間和CPU的物理地址空間是兩個不同的概念,例如I/O地址空間為64K,一個32bit的CPU物理地址空間是4G。如,在Intel 8086+Redhat9.0 下用“more /proc/ioports”可看到:
0000-001f : dma1
0020-003f : pic1
0040-005f : timer
0060-006f : keyboard
0070-007f : rtc
0080-008f : dma page reg
00a0-00bf : pic2
00c0-00df : dma2
00f0-00ff : fpu
0170-0177 : ide1
……
不過Intel x86平臺普通使用了名為內存映射(MMIO)的技術,該技術是PCI規范的一部分,IO設備端口被映射到內存空間,映射后,CPU訪問IO端口就如同訪問內存一樣。看Intel TA 719文檔給出的x86/x64系統典型內存地址分配表:
系統資源 占用
------------------------------------------------------------------------
BIOS 1M
本地APIC 4K
芯片組保留 2M
IO APIC 4K
PCI設備 256M
PCI Express設備 256M
PCI設備(可選) 256M
顯示幀緩存 16M
TSEG 1M
對于某一既定的系統,它要么是獨立編址、要么是統一編址,具體采用哪一種則取決于CPU的體系結構。 如,PowerPC、m68k等采用統一編址,而X86等則采用獨立編址,存在IO空間的概念。目前,大多數嵌入式微控制器如ARM、PowerPC等并不提供I/O空間,僅有內存空間,可直接用地址、指針訪問。但對于Linux內核而言,它可能用于不同的CPU,所以它必須都要考慮這兩種方式,于是它采用一種新的方法,將基于I/O映射方式的或內存映射方式的I/O端口通稱為“I/O區域”(I/O region),不論你采用哪種方式,都要先申請IO區域:request_resource(),結束時釋放它:release_resource()。
linux I/O端口與I/O內存
IO端口:當一個寄存器或者內存位于IO空間時;
IO內存:當一個內存或者寄存器位于內存空間時;
在一些CPU制造商在其芯片上實現了一個單地址空間(統一編址)的同時,其它的CPU制造商認為外設不同于內存,應該有一個獨立的地址空間給外設(單獨編址),其生產處理器(特別是x86家族)的I/O端口有自己的讀寫信號線和特殊的CPU指令來存取端口。因為外設要與外設總線相匹配,并且大部分流行的I/O總線都是以個人計算機(主要是x86家族)作為模型,所以即便那些沒有單獨地址空間給I/O端口的處理器,也必須在訪問外設時模擬成讀寫端口。這通常通過外部芯片組(PC中的南北橋)或者在CPU核中附加額外電路來實現(基于嵌入式應用的處理器)。
由于同樣的理由,Linux在所有計算機平臺上都實現了I/O端口,甚至在那些單地址空間的CPU平臺上(模擬I/O端口)。但并不是所有的設備都會將其寄存器映射到I/O端口。雖然ISA設備普遍使用I/O端口,但大部分PCI設備將寄存器映射到某個內存地址區。這種I/O內存方法通常是首選的,因為它無需使用特殊的處理器指令,CPU存取內存也更有效率,并且編譯器在存取內存時在寄存器分配和尋址模式的選擇上有更多自由。
1.IO寄存器和常規內存
I/O寄存器和RAM的主要不同是I/O操作有邊際效應(side effect),而內存操作沒有:訪問內存只是在內存某一位置存儲數值。因為內存存取速度嚴重影響CPU的性能,編譯器可能會對源碼進行優化,主要是:使用高速緩存和重排讀/寫指令的順序。對于傳統內存(至少在單處理器系統)這些優化是透明有益的,但是對于I/O 寄存器,這可能是致命錯誤,因為它們干擾了那些“邊際效應”(驅動程序存取I/O 寄存器就是為了獲取邊際效應)。因此,驅動程序必須確保在存取寄存器時,不能使用高速緩存并且不能重新編排讀寫指令的順序。
side effect 是指:訪問I/O寄存器時,不僅僅會像訪問普通內存一樣影響存儲單元的值,更重要的是它可能改變CPU的I/O端口電平、輸出時序或CPU對I/O端口電平的反應等等,從而實現CPU的控制功能。CPU在電路中的意義就是實現其side effect 。舉個例子,有些設備的中斷狀態寄存器只要一讀取,便自動清零。
硬件緩沖的問題是最易解決的:只要將底層硬件配置(或者自動地或者通過Linux 初始化代碼)為當存取I/O區時,禁止任何硬件緩沖(不管是I/O 內存還是I/O 端口)。
編譯器優化和硬件重編排讀寫指令順序的解決方法是:在硬件或處理器必須以一個特定順序執行的操作之間安放一個內存屏障(memory barrier)。
2.操作IO端口(申請,訪問,釋放):
I/O 端口是驅動用來和很多設備通訊的方法。
(1)申請I/O 端口:
在驅動還沒獨占設備之前,不應對端口進行操作。內核提供了一個注冊接口,以允許驅動聲明其需要的端口:
/* request_region告訴內核:要使用first開始的n個端口。參數name為設備名。如果分配成功返回值是非NULL;否則無法使用需要的端口(/proc/ioports包含了系統當前所有端口的分配信息,若request_region分配失敗時,可以查看該文件,看誰先用了你要的端口) */
struct resource *request_region(unsigned long first, unsigned long n, const char *name);
(2)訪問IO端口:
在驅動成功請求到I/O 端口后,就可以讀寫這些端口了。大部分硬件會將8位、16位和32位端口區分開,無法像訪問內存那樣混淆使用。驅動程序必須調用不同的函數來訪問不同大小的端口。
Linux 內核頭文件(體系依賴的頭文件《asm/io.h》) 定義了下列內聯函數來存取I/O端口:
/* inb/outb:讀/寫字節端口(8位寬)。有些體系將port參數定義為unsigned long;而有些平臺則將它定義為unsigned short。inb的返回類型也是依賴體系的 */
unsigned inb(unsigned port);
void outb(unsigned char byte, unsigned port);
/* inw/outw:讀/寫字端口(16位寬) */
unsigned inw(unsigned port);
void outw(unsigned short word, unsigned port);
/* inl/outl:讀/寫32位端口。longword也是依賴體系的,有的體系為unsigned long;而有的為unsigned int */
unsigned inl(unsigned port);
void outl(unsigned longword, unsigned port);
(3)釋放IO端口:
/* 用完I/O端口后(可能在模塊卸載時),應當調用release_region將I/O端口返還給系統。參數start和n應與之前傳遞給request_region一致 */
void release_region(unsigned long start, unsigned long n);
3.操作IO內存(申請,映射,訪問,釋放):
盡管 I/O 端口在x86世界中非常流行,但是用來和設備通訊的主要機制是通過內存映射的寄存器和設備內存,兩者都稱為I/O 內存,因為寄存器和內存之間的區別對軟件是透明的。
I/O 內存僅僅是一個類似于RAM 的區域,處理器通過總線訪問該區域,以實現對設備的訪問。同樣,讀寫這個區域是有邊際效應。
根據計算機體系和總線不同,I/O 內存可分為可以或者不可以通過頁表來存取。若通過頁表存取,內核必須先重新編排物理地址,使其對驅動程序可見,這就意味著在進行任何I/O操作之前,你必須調用ioremap;如果不需要頁表,I/O內存區域就類似于I/O端口,你可以直接使用適當的I/O函數讀寫它們。
由于邊際效應的緣故,不管是否需要 ioremap,都不鼓勵直接使用I/O內存指針,而應使用專門的I/O內存操作函數。這些I/O內存操作函數不僅在所有平臺上是安全,而且對直接使用指針操作 I/O 內存的情況進行了優化。
(1)申請I/O 內存:
I/O 內存區在使用前必須先分配。分配內存區的函數接口在《linux/ioport.h》定義中:
/* request_mem_region分配一個開始于start,len字節的I/O內存區。分配成功,返回一個非NULL指針;否則返回NULL。系統當前所有I/O內存分配信息都在/proc/iomem文件中列出,你分配失敗時,可以看看該文件,看誰先占用了該內存區 */
struct resource *request_mem_region(unsigned long start, unsigned long len, char *name);
(2)映射:
在訪問I/O內存之前,分配I/O內存并不是唯一要求的步驟,你還必須保證內核可存取該I/O內存。訪問I/O內存并不只是簡單解引用指針,在許多體系中,I/O 內存無法以這種方式直接存取。因此,還必須通過ioremap 函數設置一個映射。
/* ioremap用于將I/O內存區映射到虛擬地址。參數phys_addr為要映射的I/O內存起始地址,參數size為要映射的I/O內存的大小,返回值為被映射到的虛擬地址 */
void *ioremap(unsigned long phys_addr, unsigned long size);
(3)訪問IO內存:
經過 ioremap之后,設備驅動就可以存取任何I/O內存地址。注意,ioremap返回的地址不可以直接解引用;相反,應當使用內核提供的訪問函數。訪問I/O內存的正確方式是通過一系列專門用于實現此目的的函數:
#include 《asm/io.h》
/* I/O內存讀函數。參數addr應當是從ioremap獲得的地址(可能包含一個整型偏移); 返回值是從給定I/O內存讀取到的值 */
unsigned int ioread8(void *addr);
unsigned int ioread16(void *addr);
unsigned int ioread32(void *addr);
/* I/O內存寫函數。參數addr同I/O內存讀函數,參數value為要寫的值 */
void iowrite8(u8 value, void *addr);
void iowrite16(u16 value, void *addr);
void iowrite32(u32 value, void *addr);
/* 以下這些函數讀和寫一系列值到一個給定的 I/O 內存地址,從給定的buf讀或寫count個值到給定的addr。參數count表示要讀寫的數據個數,而不是字節大小 */
void ioread8_rep(void *addr, void *buf, unsigned long count);
void ioread16_rep(void *addr, void *buf, unsigned long count);
void ioread32_rep(void *addr, void *buf, unsigned long count);
void iowrite8_rep(void *addr, const void *buf, unsigned long count);
void iowrite16_rep(void *addr, const void *buf, unsigned long count);
void iowrite32_rep(void *addr,,onst void *buf,,nsigned long count);
/* 需要操作一塊I/O 地址時,使用下列函數(這些函數的行為類似于它們的C庫類似函數): */
void memset_io(void *addr, u8 value, unsigned int count);
void memcpy_fromio(void *dest, void *source, unsigned int count);
void memcpy_toio(void *dest, void *source, unsigned int count);
/* 舊的I/O內存讀寫函數,不推薦使用 */
unsigned readb(address);
unsigned readw(address);
unsigned readl(address);
void writeb(unsigned value, address);
void writew(unsigned value, address);
void writel(unsigned value, address);
(4)釋放IO內存步驟:
void iounmap(void * addr); /* iounmap用于釋放不再需要的映射 */
void release_mem_region(unsigned long start, unsigned long len); /* iounmap用于釋放不再需要的映射 */
4、像IO內存一樣使用端口
一些硬件有一個有趣的特性: 有些版本使用 I/O 端口;而有些版本則使用 I/O 內存。不管是I/O 端口還是I/O 內存,處理器見到的設備寄存器都是相同的,只是訪問方法不同。為了統一編程接口,使驅動程序易于編寫,2.6 內核提供了一個ioport_map函數:
/* ioport_map重新映射count個I/O端口,使它們看起來I/O內存。此后,驅動程序可以在ioport_map返回的地址上使用ioread8和同類函數。這樣,就可以在編程時,消除了I/O 端口和I/O 內存的區別 */
void *ioport_map(unsigned long port, unsigned int count);
void ioport_unmap(void *addr);/* ioport_unmap用于釋放不再需要的映射 */
注意,I/O 端口在重新映射前必須使用request_region分配分配所需的I/O 端口。
5、ARM體系的IO操作接口
s3c24x0處理器使用的是I/O內存,也就是說:s3c24x0處理器使用統一編址方式,I/O寄存器和內存使用的是單一地址空間,并且讀寫I/O寄存器和讀寫內存的指令是相同的。所以推薦使用I/O內存的相關指令和函數。但這并不表示I/O端口的指令在s3c24x0中不可用。如果你注意過s3c24x0關于I/O方面的內核源碼,你就會發現:其實I/O端口的指令只是一個外殼,內部還是使用和I/O內存一樣的代碼。注意以下幾點:
1)所有的讀寫指令(I/O操作函數)所賦的地址必須都是虛擬地址,你有兩種選擇:使用內核已經定義好的地址,如在include/asm-arm/arch-s3c2410/regs-xxx.h中定義了s3c2410處理器各外設寄存器地址(其他處理器芯片也可在類似路徑找到內核定義好的外設寄存器的虛擬地址;另一種方法就是使用自己用ioremap映射的虛擬地址。絕對不能使用實際的物理地址,否則會因為內核無法處理地址而出現oops。
2)在使用I/O指令時,可以不使用request_region和request_mem_region,而直接使用outb、ioread等指令。因為request的功能只是告訴內核端口被誰占用了,如再次request,內核會制止(資源busy)。但是不推薦這么做,這樣的代碼也不規范,可能會引起并發問題(很多時候我們都需要獨占設備)。
3)在使用I/O指令時,所賦的地址數據有時必須通過強制類型轉換為 unsigned long ,不然會有警告。
4)在includeasm-armarch-s3c2410hardware.h中定義了很多io口的操作函數,有需要可以在驅動中直接使用,很方便。
評論
查看更多