這篇文章將對linux下udp socket編程重要知識點進行總結,無論是開發人員應知應會的,還是說udp socket的一些偏僻知識點,本文都會講到。盡可能做到,讀了一篇文章之后,大家對udp socket有一個比較全面的認識。本文分為兩個專題,第一個是常用的upd socket框架,第二個是一些udp socket并不常用但又相當重要的知識點。
一、基本的udp socket編程
1. UDP編程框架
要使用UDP協議進行程序開發,我們必須首先得理解什么是什么是UDP?這里簡單概括一下。
UDP(user datagram protocol)的中文叫用戶數據報協議,屬于傳輸層。UDP是面向非連接的協議,它不與對方建立連接,而是直接把我要發的數據報發給對方。所以UDP適用于一次傳輸數據量很少、對可靠性要求不高的或對實時性要求高的應用場景。正因為UDP無需建立類如三次握手的連接,而使得通信效率很高。
UDP的應用非常廣泛,比如一些知名的應用層協議(SNMP、DNS)都是基于UDP的,想一想,如果SNMP使用的是TCP的話,每次查詢請求都得進行三次握手,這個花費的時間估計是使用者不能忍受的,因為這會產生明顯的卡頓。所以UDP就是SNMP的一個很好的選擇了,要是查詢過程發生丟包錯包也沒關系的,我們再發起一個查詢就好了,因為丟包的情況不多,這樣總比每次查詢都卡頓一下更容易讓人接受吧。
UDP通信的流程比較簡單,因此要搭建這么一個常用的UDP通信框架也是比較簡單的。以下是UDP的框架圖。
由以上框圖可以看出,客戶端要發起一次請求,僅僅需要兩個步驟(socket和sendto),而服務器端也僅僅需要三個步驟即可接收到來自客戶端的消息(socket、bind、recvfrom)。
2. UDP程序設計常用函數
#include #include int socket(int domain, int type, int protocol);
參數domain:用于設置網絡通信的域,socket根據這個參數選擇信息協議的族
Name ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Purpose?????????????????????????
AF_UNIX,?AF_LOCAL ? ? ? ? ?Local?communication??????????????
AF_INET ? ? ? ? ? ? ? ? ? ? ? ? ? IPv4?Internet?protocols??????????//用于IPV4
AF_INET6 ? ? ? ? ? ? ? ? ? ? ? ? IPv6?Internet?protocols??????????//用于IPV6
AF_IPX ? ? ? ? ? ? ? ? ? ? ? ? ? ? IPX?-?Novell?protocols
AF_NETLINK ? ? ? ? ? ? ? ? ? ? Kernel?user?interface?device?????
AF_X25 ? ? ? ? ? ? ? ? ? ? ? ? ? ?ITU-T?X.25?/?ISO-8208?protocol???
AF_AX25 ? ? ? ? ? ? ? ? ? ? ? ? ?Amateur?radio?AX.25?protocol
AF_ATMPVC ? ? ? ? ? ? ? ? ? ? ?Access?to?raw?ATM?PVCs
AF_APPLETALK ? ? ? ? ? ? ? ? AppleTalk????????????????????????
AF_PACKET ? ? ? ? ? ? ? ? ? ? ?Low?level?packet?interface???????
AF_ALG ? ? ? ? ? ? ? ? ? ? ? ? ? Interface?to?kernel?crypto?API
對于該參數我們僅需熟記AF_INET和AF_INET6即可
小插曲:PF_XXX和AF_XXX
我們在看Linux網絡編程相關代碼時會發現PF_XXX和AF_XXX會混著用,他們倆有什么區別呢?以下內容摘自《UNP》。
AF_前綴表示地址族(Address?Family),而PF_前綴表示協議族(Protocol?Family)。歷史上曾有這樣的想法:單個協議族可以支持多個地址族,PF_的值可以用來創建套接字,而AF_值用于套接字的地址結構。但實際上,支持多個地址族的協議族從來就沒實現過,而頭文件中為一給定的協議定義的PF_值總是與此協議的AF_值相同。
所以我在實際編程時還是偏向于使用AF_XXX。
參數type(只列出最重要的三個):
SOCK_STREAM ? ? ? ? Provides?sequenced,?reliable,?two-way,?connection-based?byte?streams. ? //用于TCP
SOCK_DGRAM ? ? ? ? ?Supports?datagrams?(connectionless,?unreliable?messages ).?//用于UDP
SOCK_RAW ? ? ? ? ? ? ?Provides?raw?network?protocol?access.??//RAW類型,用于提供原始網絡訪問
參數protocol:置0即可
返回值:成功:非負的文件描述符
失敗:-1
#include #include ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);
第一個參數sockfd:正在監聽端口的套接口文件描述符,通過socket獲得
第二個參數buf:發送緩沖區,往往是使用者定義的數組,該數組裝有要發送的數據
第三個參數len:發送緩沖區的大小,單位是字節
第四個參數flags:填0即可
第五個參數dest_addr:指向接收數據的主機地址信息的結構體,也就是該參數指定數據要發送到哪個主機哪個進程
第六個參數addrlen:表示第五個參數所指向內容的長度
返回值:成功:返回發送成功的數據長度
失敗:?-1
?
#include #include ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);
第一個參數sockfd:正在監聽端口的套接口文件描述符,通過socket獲得
第二個參數buf:接收緩沖區,往往是使用者定義的數組,該數組裝有接收到的數據
第三個參數len:接收緩沖區的大小,單位是字節
第四個參數flags:填0即可
第五個參數src_addr:指向發送數據的主機地址信息的結構體,也就是我們可以從該參數獲取到數據是誰發出的
第六個參數addrlen:表示第五個參數所指向內容的長度
返回值:成功:返回接收成功的數據長度
失敗:?-1
#include #include int bind(int sockfd, const struct sockaddr* my_addr, socklen_t addrlen);
第一個參數sockfd:正在監聽端口的套接口文件描述符,通過socket獲得
第二個參數my_addr:需要綁定的IP和端口
第三個參數addrlen:my_addr的結構體的大小
返回值:成功:0
失敗:-1
#include int close(int fd);
close函數比較簡單,只要填入socket產生的fd即可。
3. 搭建UDP通信框架
server:
1 #include 2 #include 3 #include 4 #include in.h> 5 #include
client:
1 #include 2 #include 3 #include 4 #include in.h> 5 #include
以上的框架用于一臺主機不同端口的UDP通信,現象如下:
我們先建立server端,等待服務;然后我們建立client端請求服務。
server端:
client端:
自己主機跟自己通信不是很爽,我們想跟其他主機通信怎么搞?很簡單,上面client的代碼的第49行的注釋打開,并注釋掉下面那行,在宏定義里填入自己想通信的serverip就可以了。現象如下:
server端:
client端:
這樣我們就實現了主機172.0.5.183和172.0.5.182之間的網絡通信。
UDP通用框架搭建完成,我們可以利用該框架跟指定主機進行通信了。
如果想學習UDP的基礎知識,以上的知識就足夠了;如果想繼續深入學習一下UDP SOCKET一些高級知識(奇技淫巧),可以花點時間往下看。
二、高級udp socket編程
1. udp的connect函數
什么?UDP也有conenct?connect不是用于TCP編程的嗎?
是的,UDP網絡編程中的確有connect函數,但它僅僅用于表示確定了另一方的地址,并沒有其他含義。
有了以上認識后,我們可以知道UDP套接字有以下區分:
1)未連接的UDP套接字
2)已連接的UDP套接字
對于未連接的套接字,也就是我們常用的的UDP套接字,我們使用的是sendto/recvfrom進行信息的收發,目標主機的IP和端口是在調用sendto/recvfrom時確定的;
在一個未連接的UDP套接字上給兩個數據報調用sendto函數內核將執行以下六個步驟:
1)連接套接字
2)輸出第一個數據報
3)斷開套接字連接
4)連接套接字
5)輸出第二個數據報
6)斷開套接字連接
對于已連接的UDP套接字,必須先經過connect來向目標服務器進行指定,然后調用read/write進行信息的收發,目標主機的IP和端口是在connect時確定的,也就是說,一旦conenct成功,我們就只能對該主機進行收發信息了。
已連接的UDP套接字給兩個數據報調用write函數內核將執行以下三個步驟:
1)連接套接字
2)輸出第一個數據報
3)輸出第二個數據報
由此可以知道,當應用進程知道給同一個目的地址的端口號發送多個數據報時,顯示套接字效率更高。
下面給出帶connect函數的UDP通信框架
具體框架代碼不再給出了,因為跟上面不帶connect的代碼大同小異,僅僅多出一個connect函數處理而已,下面給出處理conenct()的基本步驟。
void udp_handler(int s, struct sockaddr* to){ char buf[1024] = "TEST UDP !"; int n = 0; connect(s, to, sizeof(*to); n = write(s, buf, 1024); read(s, buf, n);}
2. udp報文丟失問題
因為UDP自身的特點,決定了UDP會相對于TCP存在一些難以解決的問題。第一個就是UDP報文缺失問題。
在UDP服務器客戶端的例子中,如果客戶端發送的數據丟失,服務器會一直等待,直到客戶端的合法數據過來。如果服務器的響應在中間被路由丟棄,則客戶端會一直阻塞,直到服務器數據過來。
防止這樣的永久阻塞的一般方法是給客戶的recvfrom調用設置一個超時,大概有這么兩種方法:
1)使用信號SIGALRM為recvfrom設置超時。首先我們為SIGALARM建立一個信號處理函數,并在每次調用前通過alarm設置一個5秒的超時。如果recvfrom被我們的信號處理函數中斷了,那就超時重發信息;若正常讀到數據了,就關閉報警時鐘并繼續進行下去。
2)使用select為recvfrom設置超時
設置select函數的第五個參數即可。
3. udp報文亂序問題
所謂亂序就是發送數據的順序和接收數據的順序不一致,例如發送數據的順序為A、B、C,但是接收到的數據順序卻為:A、C、B。產生這個問題的原因在于,每個數據報走的路由并不一樣,有的路由順暢,有的卻擁塞,這導致每個數據報到達目的地的順序就不一樣了。UDP協議并不保證數據報的按序接收。
解決這個問題的方法就是發送端在發送數據時加入數據報序號,這樣接收端接收到報文后可以先檢查數據報的序號,并將它們按序排隊,形成有序的數據報。
4. udp流量控制問題
總所周知,TCP有滑動窗口進行流量控制和擁塞控制,反觀UDP因為其特點無法做到。UDP接收數據時直接將數據放進緩沖區內,如果用戶沒有及時將緩沖區的內容復制出來放好的話,后面的到來的數據會接著往緩沖區放,當緩沖區滿時,后來的到的數據就會覆蓋先來的數據而造成數據丟失(因為內核使用的UDP緩沖區是環形緩沖區)。因此,一旦發送方在某個時間點爆發性發送消息,接收方將因為來不及接收而發生信息丟失。
解決方法一般采用增大UDP緩沖區,使得接收方的接收能力大于發送方的發送能力。
int?n?=?220?*?1024;?//220kB
setsocketopt(sockfd,?SOL_SOCKET,?SO_RCVBUF,?&n,?sizeof(n));
這樣我們就把接收方的接收隊列擴大了,從而盡量避免丟失數據的發生。
?
評論
查看更多