1.什么是 Netlink
什么是Netlink?Netlink是linux提供的用于內(nèi)核和用戶態(tài)進(jìn)程之間的通信方式。但是注意雖然Netlink主要用于用戶空間和內(nèi)核空間的通信,但是也能用于用戶空間的兩個(gè)進(jìn)程通信。只是進(jìn)程間通信有其他很多方式,一般不用Netlink。除非需要用到Netlink的廣播特性時(shí)。
那么Netlink有什么優(yōu)勢(shì)呢?一般來(lái)說(shuō)用戶空間和內(nèi)核空間的通信方式有三種:/proc、ioctl、Netlink。而前兩種都是單向的,但是Netlink可以實(shí)現(xiàn)雙工通信。
Netlink協(xié)議基于BSDsocket和AF_NETLINK地址簇(addressfamily),使用32位的端口號(hào)尋址(以前稱作PID),每個(gè)Netlink協(xié)議(或稱作總線,man手冊(cè)中則稱之為netlinkfamily),通常與一個(gè)或一組內(nèi)核服務(wù)/組件相關(guān)聯(lián),如NETLINK_ROUTE用于獲取和設(shè)置路由與鏈路信息、NETLINK_KOBJECT_UEVENT用于內(nèi)核向用戶空間的udev進(jìn)程發(fā)送通知等。netlink具有以下特點(diǎn):
①支持全雙工、異步通信(當(dāng)然同步也支持)
②用戶空間可使用標(biāo)準(zhǔn)的BSDsocket接口(但netlink并沒(méi)有屏蔽掉協(xié)議包的構(gòu)造與解析過(guò)程,推薦使用libnl等第三方庫(kù))
③在內(nèi)核空間使用專用的內(nèi)核API接口
④支持多播(因此支持“總線”式通信,可實(shí)現(xiàn)消息訂閱)
⑤在內(nèi)核端可用于進(jìn)程上下文與中斷上下文
如何學(xué)習(xí)Netlink?我覺(jué)得最好的方式就是將Netlink和UDPsocket對(duì)比學(xué)習(xí)。因?yàn)樗麄冋娴暮軐?duì)地方相似。AF_NETLINK和AF_INET對(duì)應(yīng),是一個(gè)協(xié)議族,而NETLINK_ROUTE、NETLINK_GENERIC這些是協(xié)議,對(duì)應(yīng)于UDP。
那么我們主要關(guān)注Netlink和UDPsocket之間的不同點(diǎn),其中最重要的一點(diǎn)就是:使用UDPsocket發(fā)送數(shù)據(jù)包時(shí),用戶無(wú)需構(gòu)造UDP數(shù)據(jù)包的包頭,內(nèi)核協(xié)議棧會(huì)根據(jù)原、目的地址(sockaddr_in)填充頭部信息。但是Netlink需要我們自己構(gòu)造一個(gè)包頭(這個(gè)包頭有什么用,我們后面再說(shuō))。
一般我們使用Netlink都要指定一個(gè)協(xié)議,我們可以使用內(nèi)核為我們預(yù)留的NETLINK_GENERIC(定義在linux/netlink.h中),也可以使用我們自定義的協(xié)議,其實(shí)就是定義一個(gè)內(nèi)核還沒(méi)有占用的數(shù)字。下面我們用NETLINK_TEST做為我們定義的協(xié)議寫一個(gè)例子(注意:自定義協(xié)議不一定非要添加到linux/netlink.h中,只要用戶態(tài)和內(nèi)核態(tài)代碼都能找到該定義就行)。我們知道使用UDP發(fā)送報(bào)文有兩種方式:sendto和sendmsg,同樣Netlink也支持這兩種方式。下面先看使用sendmsg的方式。
2.用戶態(tài)數(shù)據(jù)結(jié)構(gòu)
首先看一下幾個(gè)重要的數(shù)據(jù)結(jié)構(gòu)的關(guān)系:
2.1structmsghdr
msghdr這個(gè)結(jié)構(gòu)在socket變成中就會(huì)用到,并不算Netlink專有的,這里不在過(guò)多說(shuō)明。只說(shuō)明一下如何更好理解這個(gè)結(jié)構(gòu)的功能。我們知道socket消息的發(fā)送和接收函數(shù)一般有這幾對(duì):recv/send、readv/writev、recvfrom/sendto。當(dāng)然還有recvmsg/sendmsg,前面三對(duì)函數(shù)各有各的特點(diǎn)功能,而recvmsg/sendmsg就是要囊括前面三對(duì)的所有功能,當(dāng)然還有自己特殊的用途。msghdr的前兩個(gè)成員就是為了滿足recvfrom/sendto的功能,中間兩個(gè)成員msg_iov和msg_iovlen則是為了滿足readv/writev的功能,而最后的msg_flags則是為了滿足recv/send中flag的功能,剩下的msg_control和msg_controllen則是滿足recvmsg/sendmsg特有的功能。
2.2Structsockaddr_ln
Structsockaddr_ln為Netlink的地址,和我們通常socket編程中的sockaddr_in作用一樣,他們的結(jié)構(gòu)對(duì)比如下。
structsockaddr_nl{}的詳細(xì)定義和描述如下:
1
2
3
4
5
6
7
struct sockaddr_nl
{
sa_family_t nl_family; /*該字段總是為AF_NETLINK */
unsigned short nl_pad; /* 目前未用到,填充為0*/
__u32 nl_pid; /* process pid */
__u32 nl_groups; /* multicast groups mask */
};
(1)nl_pid:在Netlink規(guī)范里,PID全稱是Port-ID(32bits),其主要作用是用于唯一的標(biāo)識(shí)一個(gè)基于netlink的socket通道。通常情況下nl_pid都設(shè)置為當(dāng)前進(jìn)程的進(jìn)程號(hào)。前面我們也說(shuō)過(guò),Netlink不僅可以實(shí)現(xiàn)用戶-內(nèi)核空間的通信還可使現(xiàn)實(shí)用戶空間兩個(gè)進(jìn)程之間,或內(nèi)核空間兩個(gè)進(jìn)程之間的通信。該屬性為0時(shí)一般指內(nèi)核。
(2)nl_groups:如果用戶空間的進(jìn)程希望加入某個(gè)多播組,則必須執(zhí)行bind()系統(tǒng)調(diào)用。該字段指明了調(diào)用者希望加入的多播組號(hào)的掩碼(注意不是組號(hào),后面我們會(huì)詳細(xì)講解這個(gè)字段)。如果該字段為0則表示調(diào)用者不希望加入任何多播組。對(duì)于每個(gè)隸屬于Netlink協(xié)議域的協(xié)議,最多可支持32個(gè)多播組(因?yàn)閚l_groups的長(zhǎng)度為32比特),每個(gè)多播組用一個(gè)比特來(lái)表示。
2.3structnlmsghdr
Netlink的報(bào)文由消息頭和消息體構(gòu)成,structnlmsghdr即為消息頭。消息頭定義在文件里,由結(jié)構(gòu)體nlmsghdr表示:
1
2
3
4
5
6
7
8
struct nlmsghdr
{
__u32 nlmsg_len; /* Length of message including header */
__u16 nlmsg_type; /* Message content */
__u16 nlmsg_flags; /* Additional flags */
__u32 nlmsg_seq; /* Sequence number */
__u32 nlmsg_pid; /* Sending process PID */
};
消息頭中各成員屬性的解釋及說(shuō)明:
(1)nlmsg_len:整個(gè)消息的長(zhǎng)度,按字節(jié)計(jì)算。包括了Netlink消息頭本身。
(2)nlmsg_type:消息的類型,即是數(shù)據(jù)還是控制消息。目前(內(nèi)核版本2.6.21)Netlink僅支持四種類型的控制消息,如下:
a)NLMSG_NOOP-空消息,什么也不做;
b)NLMSG_ERROR-指明該消息中包含一個(gè)錯(cuò)誤;
c)NLMSG_DONE-如果內(nèi)核通過(guò)Netlink隊(duì)列返回了多個(gè)消息,那么隊(duì)列的最后一條消息的類型為NLMSG_DONE,其余所有消息的nlmsg_flags屬性都被設(shè)置NLM_F_MULTI位有效。
d)NLMSG_OVERRUN-暫時(shí)沒(méi)用到。
(3)nlmsg_flags:附加在消息上的額外說(shuō)明信息,如上面提到的NLM_F_MULTI。
那消息體怎么設(shè)置呢?可以使用NLMSG_DATA,具體見(jiàn)后面例子。
3.用戶態(tài)范例一
客戶端1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define MAX_PAYLOAD 1024 // maximum payload size
#define NETLINK_TEST 25 //自定義的協(xié)議
int main(int argc, char* argv[])
{
int state;
struct sockaddr_nl src_addr, dest_addr;
struct nlmsghdr *nlh = NULL; //Netlink數(shù)據(jù)包頭
struct iovec iov;
struct msghdr msg;
int sock_fd, retval;
int state_smg = 0;
// Create a socket
sock_fd = socket(AF_NETLINK, SOCK_RAW, NETLINK_TEST);
if(sock_fd == -1){
printf("error getting socket: %s", strerror(errno));
return -1;
}
// To prepare binding
memset(&src_addr, 0, sizeof(src_addr));
src_addr.nl_family = AF_NETLINK;
src_addr.nl_pid = 100; //A:設(shè)置源端端口號(hào)
src_addr.nl_groups = 0;
//Bind
retval = bind(sock_fd, (struct sockaddr*)&src_addr, sizeof(src_addr));
if(retval < 0){
printf("bind failed: %s", strerror(errno));
close(sock_fd);
return -1;
}
// To orepare create mssage
nlh = (struct nlmsghdr *)malloc(NLMSG_SPACE(MAX_PAYLOAD));
if(!nlh){
printf("malloc nlmsghdr error!\n");
close(sock_fd);
return -1;
}
memset(&dest_addr,0,sizeof(dest_addr));
dest_addr.nl_family = AF_NETLINK;
dest_addr.nl_pid = 0; //B:設(shè)置目的端口號(hào)
dest_addr.nl_groups = 0;
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
nlh->nlmsg_pid = 100; //C:設(shè)置源端口
nlh->nlmsg_flags = 0;
strcpy(NLMSG_DATA(nlh),"Hello you!"); //設(shè)置消息體
iov.iov_base = (void *)nlh;
iov.iov_len = NLMSG_SPACE(MAX_PAYLOAD);
//Create mssage
memset(&msg, 0, sizeof(msg));
msg.msg_name = (void *)&dest_addr;
msg.msg_namelen = sizeof(dest_addr);
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
//send message
printf("state_smg\n");
state_smg = sendmsg(sock_fd,&msg,0);
if(state_smg == -1)
{
printf("get error sendmsg = %s\n",strerror(errno));
}
memset(nlh,0,NLMSG_SPACE(MAX_PAYLOAD));
//receive message
printf("waiting received!\n");
while(1){
printf("In while recvmsg\n");
state = recvmsg(sock_fd, &msg, 0);
if(state<0)
{
printf("state<1");
}
printf("Received message: %s\n",(char *) NLMSG_DATA(nlh));
}
close(sock_fd);
return 0;
}
上面程序首先向內(nèi)核發(fā)送一條消息;“Helloyou”,然后進(jìn)入循環(huán)一直等待讀取內(nèi)核的回復(fù),并將收到的回復(fù)打印出來(lái)。如果看上面程序感覺(jué)很吃力,那么應(yīng)該首先復(fù)習(xí)一下UDP中使用sendmsg的用法,特別時(shí)structmsghdr的結(jié)構(gòu)要清楚,這里再贅述。下面主要分析與UDP發(fā)送數(shù)據(jù)包的不同點(diǎn):
1.socket地址結(jié)構(gòu)不同,UDP為sockaddr_in,Netlink為structsockaddr_nl;
2.與UDP發(fā)送數(shù)據(jù)相比,Netlink多了一個(gè)消息頭結(jié)構(gòu)structnlmsghdr需要我們構(gòu)造。
注意代碼注釋中的A、B、C三處分別設(shè)置了pid。首先解釋一下什么是pid,網(wǎng)上很多文章把這個(gè)字段說(shuō)成是進(jìn)程的pid,其實(shí)這完全是望文生義。這里的pid和進(jìn)程pid沒(méi)有什么關(guān)系,僅僅相當(dāng)于UDP的port。對(duì)于UDP來(lái)說(shuō)port和ip標(biāo)示一個(gè)地址,那對(duì)我們的NETLINK_TEST協(xié)議(注意Netlink本身不是一個(gè)協(xié)議)來(lái)說(shuō),pid就唯一標(biāo)示了一個(gè)地址。所以你如果用進(jìn)程pid做為標(biāo)示當(dāng)然也是可以的。當(dāng)然同樣的pid對(duì)于NETLINK_TEST協(xié)議和內(nèi)核定義的其他使用Netlink的協(xié)議是不沖突的(就像TCP的80端口和UDP的80端口)。
下面分析這三處設(shè)置pid分別有什么作用,首先A和B位置的比較好理解,這是在地址(sockaddr_nl)上進(jìn)行的設(shè)置,就是相當(dāng)于設(shè)置源地址和目的地址(其實(shí)是端口),只是注意B處設(shè)置pid為0,0就代表是內(nèi)核,可以理解為內(nèi)核專用的pid,那么用戶進(jìn)程就不能用0做為自己的pid嗎?這個(gè)只能說(shuō)如果你非要用也是可以的,只是會(huì)產(chǎn)生一些問(wèn)題,后面在分析。接下來(lái)看為什么C處的消息頭仍然需要設(shè)置pid呢?這里首先要知道一個(gè)前提:內(nèi)核不會(huì)像UDP一樣根據(jù)我們?cè)O(shè)置的原、目的地址為我們構(gòu)造消息頭,所以我們不在包頭寫入我們自己的地址(pid),那內(nèi)核怎么知道是誰(shuí)發(fā)來(lái)的報(bào)文呢?當(dāng)然如果內(nèi)核只是處理消息不需要回復(fù)進(jìn)程的話舍不設(shè)置這個(gè)消息頭pid都可以。
所以每個(gè)pid的設(shè)置功能不同:A處的設(shè)置是要設(shè)置發(fā)送者的源地址,有人會(huì)說(shuō)既然源地址又不會(huì)自動(dòng)填充到報(bào)文中,我們?yōu)槭裁催€要設(shè)置這個(gè),因?yàn)槟氵€可能要接收回復(fù)啊。就像寄信,你連“門牌號(hào)”都沒(méi)有,即使你在寫信時(shí)候?qū)懮夏愕牡刂肥?00號(hào),對(duì)方回信目的地址也是100號(hào),但是郵局發(fā)現(xiàn)根本沒(méi)有這個(gè)地址怎么可能把信送到你手里呢?所以A的主要作用是注冊(cè)源地址,保證可以收到回復(fù),如果不需要回復(fù)當(dāng)然可以簡(jiǎn)單將pid設(shè)置為0;B處自然就是收信人的地址,pid為0代表內(nèi)核的地址,假如有一個(gè)進(jìn)程在101號(hào)上注冊(cè)了地址,并調(diào)用了recvmsg,如果你將B處的pid設(shè)置為101,那數(shù)據(jù)包就發(fā)給了另一個(gè)進(jìn)程,這就實(shí)現(xiàn)了使用Netlink進(jìn)行進(jìn)程間通信;C相當(dāng)于你在信封上寫的源地址,通常情況下這個(gè)應(yīng)該和你的真實(shí)地址(A)處注冊(cè)的源地址相同,當(dāng)然你要是不想收到回信,又想惡搞一下或者有特殊需求,你可以寫成其他進(jìn)程注冊(cè)的pid(比如101)。這和我們現(xiàn)實(shí)中寄信是一樣的,你給你朋友寫封情書,把寫信人寫成你的另一個(gè)好基友,然后后果你懂得……
好了,有了這個(gè)例子我們就大概知道用戶態(tài)怎么使用Netlink了,至于我們沒(méi)有用到的nl_groups等其他信息后面講到再說(shuō),下面看下內(nèi)核是怎么處理Netlink的。
4.內(nèi)核 Netlinkapi
4.1創(chuàng)建 netlinksocket
1
2
3
4
struct sock *netlink_kernel_create(struct net *net,
int unit,unsigned int groups,
void (*input)(struct sk_buff *skb),
struct mutex *cb_mutex,struct module *module);
參數(shù)說(shuō)明:
(1)net:是一個(gè)網(wǎng)絡(luò)名字空間namespace,在不同的名字空間里面可以有自己的轉(zhuǎn)發(fā)信息庫(kù),有自己的一套net_device等等。默認(rèn)情況下都是使用init_net這個(gè)全局變量。
(2)unit:表示netlink協(xié)議類型,如NETLINK_TEST、NETLINK_SELINUX。
(3)groups:多播地址。
(4)input:為內(nèi)核模塊定義的netlink消息處理函數(shù),當(dāng)有消息到達(dá)這個(gè)netlinksocket時(shí),該input函數(shù)指針就會(huì)被引用,且只有此函數(shù)返回時(shí),調(diào)用者的sendmsg才能返回。
(5)cb_mutex:為訪問(wèn)數(shù)據(jù)時(shí)的互斥信號(hào)量。
(6)module:一般為THIS_MODULE。
4.2發(fā)送單播消息 netlink_unicast
1
int netlink_unicast(struct sock *ssk, struct sk_buff *skb, u32 pid, int nonblock)
參數(shù)說(shuō)明:
(1)ssk:為函數(shù)netlink_kernel_create()返回的socket。
(2)skb:存放消息,它的data字段指向要發(fā)送的netlink消息結(jié)構(gòu),而skb的控制塊保存了消息的地址信息,宏NETLINK_CB(skb)就用于方便設(shè)置該控制塊。
(3)pid:為接收此消息進(jìn)程的pid,即目標(biāo)地址,如果目標(biāo)為組或內(nèi)核,它設(shè)置為0。
(4)nonblock:表示該函數(shù)是否為非阻塞,如果為1,該函數(shù)將在沒(méi)有接收緩存可利用時(shí)立即返回;而如果為0,該函數(shù)在沒(méi)有接收緩存可利用定時(shí)睡眠。
4.3發(fā)送廣播消息 netlink_broadcast
int netlink_broadcast(struct sock *ssk, struct sk_buff *skb, u32 pid, u32 group, gfp_t allocation)
前面的三個(gè)參數(shù)與netlink_unicast相同,參數(shù)group為接收消息的多播組,該參數(shù)的每一個(gè)位代表一個(gè)多播組,因此如果發(fā)送給多個(gè)多播組,就把該參數(shù)設(shè)置為多個(gè)多播組組ID的位或。參數(shù)allocation為內(nèi)核內(nèi)存分配類型,一般地為GFP_ATOMIC或GFP_KERNEL,GFP_ATOMIC用于原子的上下文(即不可以睡眠),而GFP_KERNEL用于非原子上下文。
4.4釋放 netlinksocket
1
int netlink_broadcast(struct sock *ssk, struct sk_buff *skb, u32 pid, u32 group, gfp_t allocation)
5.內(nèi)核態(tài)程序范例一
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
#include
#include
#include
#include
#include
#include
#include
#define NETLINK_TEST 25
#define MAX_MSGSIZE 1024
int stringlength(char *s);
int err;
struct sock *nl_sk = NULL;
int flag = 0;
//向用戶態(tài)進(jìn)程回發(fā)消息
void sendnlmsg(char *message, int pid)
{
struct sk_buff *skb_1;
struct nlmsghdr *nlh;
int len = NLMSG_SPACE(MAX_MSGSIZE);
int slen = 0;
if(!message || !nl_sk)
{
return ;
}
printk(KERN_ERR "pid:%d\n",pid);
skb_1 = alloc_skb(len,GFP_KERNEL);
if(!skb_1)
{
printk(KERN_ERR "my_net_link:alloc_skb error\n");
}
slen = stringlength(message);
nlh = nlmsg_put(skb_1,0,0,0,MAX_MSGSIZE,0);
NETLINK_CB(skb_1).pid = 0;
NETLINK_CB(skb_1).dst_group = 0;
message[slen]= '\0';
memcpy(NLMSG_DATA(nlh),message,slen+1);
printk("my_net_link:send message '%s'.\n",(char *)NLMSG_DATA(nlh));
netlink_unicast(nl_sk,skb_1,pid,MSG_DONTWAIT);
}
int stringlength(char *s)
{
int slen = 0;
for(; *s; s++)
{
slen++;
}
return slen;
}
//接收用戶態(tài)發(fā)來(lái)的消息
void nl_data_ready(struct sk_buff *__skb)
{
struct sk_buff *skb;
struct nlmsghdr *nlh;
char str[100];
struct completion cmpl;
printk("begin data_ready\n");
int i=10;
int pid;
skb = skb_get (__skb);
if(skb->len >= NLMSG_SPACE(0))
{
nlh = nlmsg_hdr(skb);
memcpy(str, NLMSG_DATA(nlh), sizeof(str));
printk("Message received:%s\n",str) ;
pid = nlh->nlmsg_pid;
while(i--)
{//我們使用completion做延時(shí),每3秒鐘向用戶態(tài)回發(fā)一個(gè)消息
init_completion(&cmpl);
wait_for_completion_timeout(&cmpl,3 * HZ);
sendnlmsg("I am from kernel!",pid);
}
flag = 1;
kfree_skb(skb);
}
}
// Initialize netlink
int netlink_init(void)
{
nl_sk = netlink_kernel_create(&init_net, NETLINK_TEST, 1,
nl_data_ready, NULL, THIS_MODULE);
if(!nl_sk){
printk(KERN_ERR "my_net_link: create netlink socket error.\n");
return 1;
}
printk("my_net_link_4: create netlink socket ok.\n");
return 0;
}
static void netlink_exit(void)
{
if(nl_sk != NULL){
sock_release(nl_sk->sk_socket);
}
printk("my_net_link: self module exited\n");
}
module_init(netlink_init);
module_exit(netlink_exit);
MODULE_AUTHOR("yilong");
MODULE_LICENSE("GPL");
附上內(nèi)核代碼的Makefile文件:
1
2
3
4
5
6
7
8
ifneq ($(KERNELRELEASE),)
obj-m :=netl.o
else
KERNELDIR ?=/lib/modules/$(shell uname -r)/build
PWD :=$(shell pwd)
default:
$(MAKE) -C $(KERNELDIR) M=$(PWD) modules
endif
6.程序結(jié)構(gòu)分析
我們將內(nèi)核模塊insmod后,運(yùn)行用戶態(tài)程序,結(jié)果如下:
這個(gè)結(jié)果復(fù)合我們的預(yù)期,但是運(yùn)行過(guò)程中打印出“state_smg”卡了好久才輸出了后面的結(jié)果。這時(shí)候查看客戶進(jìn)程是處于D狀態(tài)的(不了解D狀態(tài)的同學(xué)可以google一下)。這是為什么呢?因?yàn)檫M(jìn)程使用Netlink向內(nèi)核發(fā)數(shù)據(jù)是同步,內(nèi)核向進(jìn)程發(fā)數(shù)據(jù)是異步。什么意思呢?也就是用戶進(jìn)程調(diào)用sendmsg發(fā)送消息后,內(nèi)核會(huì)調(diào)用相應(yīng)的接收函數(shù),但是一定到這個(gè)接收函數(shù)執(zhí)行完用戶態(tài)的sendmsg才能夠返回。我們?cè)趦?nèi)核態(tài)的接收函數(shù)中調(diào)用了10次回發(fā)函數(shù),每次都等待3秒鐘,所以內(nèi)核接收函數(shù)30秒后才返回,所以我們用戶態(tài)程序的sendmsg也要等30秒后才返回。相反,內(nèi)核回發(fā)的數(shù)據(jù)不用等待用戶程序接收,這是因?yàn)閮?nèi)核所發(fā)的數(shù)據(jù)會(huì)暫時(shí)存放在一個(gè)隊(duì)列中。
再來(lái)回到之前的一個(gè)問(wèn)題,用戶態(tài)程序的源地址(pid)可以用0嗎?我把上面的用戶程序的A和C處pid都改為了0,結(jié)果一運(yùn)行就死機(jī)了。為什么呢?我們看一下內(nèi)核代碼的邏輯,收到用戶消息后,根據(jù)消息中的pid發(fā)送回去,而pid為0,內(nèi)核并不認(rèn)為這是用戶程序,認(rèn)為是自身,所有又將回發(fā)的10個(gè)消息發(fā)給了自己(內(nèi)核),這樣就陷入了一個(gè)死循環(huán),而用戶態(tài)這時(shí)候進(jìn)程一直處于D。
另外一個(gè)問(wèn)題,如果同時(shí)啟動(dòng)兩個(gè)用戶進(jìn)程會(huì)是什么情況?答案是再調(diào)用bind時(shí)出錯(cuò):“Addressalreadyinuse”,這個(gè)同UDP一樣,同一個(gè)地址同一個(gè)port如果沒(méi)有設(shè)置SO_REUSEADDR兩次bind就會(huì)出錯(cuò),之后我用同樣的方式再Netlink的socket上設(shè)置了SO_REUSEADDR,但是并沒(méi)有什么效果。
7.用戶態(tài)范例二
之前我們說(shuō)過(guò)UDP可以使用sendmsg/recvmsg也可以使用sendto/recvfrom,那么Netlink同樣也可以使用sendto/recvfrom。具體實(shí)現(xiàn)如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define MAX_PAYLOAD 1024 // maximum payload size
#define NETLINK_TEST 25
int main(int argc, char* argv[])
{
struct sockaddr_nl src_addr, dest_addr;
struct nlmsghdr *nlh = NULL;
int sock_fd, retval;
int state,state_smg = 0;
// Create a socket
sock_fd = socket(AF_NETLINK, SOCK_RAW, NETLINK_TEST);
if(sock_fd == -1){
printf("error getting socket: %s", strerror(errno));
return -1;
}
// To prepare binding
memset(&src_addr, 0, sizeof(src_addr));
src_addr.nl_family = AF_NETLINK;
src_addr.nl_pid = 100;
src_addr.nl_groups = 0;
//Bind
retval = bind(sock_fd, (struct sockaddr*)&src_addr, sizeof(src_addr));
if(retval < 0){
printf("bind failed: %s", strerror(errno));
close(sock_fd);
return -1;
}
// To orepare create mssage head
nlh = (struct nlmsghdr *)malloc(NLMSG_SPACE(MAX_PAYLOAD));
if(!nlh){
printf("malloc nlmsghdr error!\n");
close(sock_fd);
return -1;
}
memset(&dest_addr,0,sizeof(dest_addr));
dest_addr.nl_family = AF_NETLINK;
dest_addr.nl_pid = 0;
dest_addr.nl_groups = 0;
nlh->nlmsg_len = NLMSG_SPACE(MAX_PAYLOAD);
nlh->nlmsg_pid = 100;
nlh->nlmsg_flags = 0;
strcpy(NLMSG_DATA(nlh),"Hello you!");
//send message
printf("state_smg\n");
sendto(sock_fd,nlh,NLMSG_LENGTH(MAX_PAYLOAD),0,(struct sockaddr*)(&dest_addr),sizeof(dest_addr));
if(state_smg == -1)
{
printf("get error sendmsg = %s\n",strerror(errno));
}
memset(nlh,0,NLMSG_SPACE(MAX_PAYLOAD));
//receive message
printf("waiting received!\n");
while(1){
printf("In while recvmsg\n");
state=recvfrom(sock_fd,nlh,NLMSG_LENGTH(MAX_PAYLOAD),0,NULL,NULL);
if(state<0)
{
printf("state<1");
}
printf("Received message: %s\n",(char *) NLMSG_DATA(nlh));
memset(nlh,0,NLMSG_SPACE(MAX_PAYLOAD));
}
close(sock_fd);
return 0;
}
熟悉UDP編程的同學(xué)看到這個(gè)程序一定很熟悉,除了多了一個(gè)Netlink消息頭的設(shè)置。但是我們發(fā)現(xiàn)程序中調(diào)用了bind函數(shù),這個(gè)函數(shù)再UDP編程中的客戶端不是必須的,因?yàn)槲覀儾恍枰裊DPsocket與某個(gè)地址關(guān)聯(lián),同時(shí)再發(fā)送UDP數(shù)據(jù)包時(shí)內(nèi)核會(huì)為我們分配一個(gè)隨即的端口。但是對(duì)于Netlink必須要有這一步bind,因?yàn)镹etlink內(nèi)核可不會(huì)為我們分配一個(gè)pid。再?gòu)?qiáng)調(diào)一遍消息頭(nlmsghdr)中的pid是告訴內(nèi)核接收端要回復(fù)的地址,但是這個(gè)地址存不存在內(nèi)核并不關(guān)心,這個(gè)地址只有用戶端調(diào)用了bind后才存在。
再說(shuō)一個(gè)體外話,我們看到這兩個(gè)例子都是用戶態(tài)首先發(fā)起的,那Netlink是否支持內(nèi)核態(tài)主動(dòng)發(fā)起的情況呢?當(dāng)然是可以的,只是內(nèi)核一般需要事件觸發(fā),這里,只要和用戶態(tài)約定號(hào)一個(gè)地址(pid),內(nèi)核直接調(diào)用netlink_unicast就可以了。
?
評(píng)論
查看更多