浙江溫州皮鞋濕,下雨進(jìn)水不會(huì)胖。周六的雨夜,期待明天的雨會(huì)更大更冷。
已經(jīng)多久沒(méi)有編程了?很久了吧…其實(shí)我本來(lái)就不怎么會(huì)寫(xiě)代碼,時(shí)不時(shí)的也就是為了驗(yàn)證一個(gè)系統(tǒng)特性,寫(xiě)點(diǎn)玩具而已,工程化的代碼,對(duì)于我而言,實(shí)在是吃力。
最近遇到一些問(wèn)題,需要特定的解法,也就有機(jī)會(huì)手寫(xiě)點(diǎn)代碼了。其實(shí)這個(gè)話(huà)題記得上一次遇到是在8年前,時(shí)間過(guò)得好快。
替換一個(gè)已經(jīng)在內(nèi)存中的函數(shù),使得執(zhí)行流流入我們自己的邏輯,然后再調(diào)用原始的函數(shù),這是一個(gè)很古老的話(huà)題了。比如有個(gè)函數(shù)叫做funcion,而你希望統(tǒng)計(jì)一下調(diào)用function的次數(shù),最直接的方法就是 如果有誰(shuí)調(diào)用function的時(shí)候,調(diào)到下面這個(gè)就好了 :
void new_function()
{
count++;
return function();
}
網(wǎng)上很多文章給出了實(shí)現(xiàn)這個(gè)思路的Trick,而且一直以來(lái)計(jì)算機(jī)病毒也都采用了這種偷梁換柱的伎倆來(lái)實(shí)現(xiàn)自己的目的。然而,當(dāng)你親自去測(cè)試時(shí),發(fā)現(xiàn)事情并不那么簡(jiǎn)單。
網(wǎng)上給出的許多方法均不再適用了,原因是在早期,這樣做的人比較少,處理器和操作系統(tǒng)大可不必理會(huì)一些不符合常規(guī)的做法,但是隨著這類(lèi)Trick開(kāi)始做壞事影響到正常的業(yè)務(wù)邏輯時(shí),處理器廠商以及操作系統(tǒng)廠商或者社區(qū)便不得不在底層增加一些限制性機(jī)制,以防止這類(lèi)Trick繼續(xù)起作用。
常見(jiàn)的措施有兩點(diǎn):
可執(zhí)行代碼段不可寫(xiě)
這個(gè)措施便封堵住了你想通過(guò)簡(jiǎn)單memcpy的方式替換函數(shù)指令的方案。
內(nèi)存buffer不可執(zhí)行
這個(gè)措施便封堵住了你想把執(zhí)行流jmp到你的一個(gè)保存指令的buffer的方案。
stack不可執(zhí)行
別看這些措施都比較low,一看誰(shuí)都懂,它們卻避免了大量的緩沖區(qū)溢出帶來(lái)的危害。
那么如果我們想用替換函數(shù)的Trick做正常的事情,怎么辦?
我來(lái)簡(jiǎn)單談一下我的方法。首先我不會(huì)去HOOK用戶(hù)態(tài)的進(jìn)程的函數(shù),因?yàn)檫@樣意義不大,改一下重啟服務(wù)會(huì)好很多。所以說(shuō),本文特指HOOK內(nèi)核函數(shù)的做法。畢竟內(nèi)核重新編譯,重啟設(shè)備代價(jià)非常大。
我們知道,我們目前所使用的幾乎所有計(jì)算機(jī)都是馮諾伊曼式的統(tǒng)一存儲(chǔ)式計(jì)算機(jī),即指令和數(shù)據(jù)是存在一起的,這就意味著我們必然可以在操作系統(tǒng)層面隨意解釋內(nèi)存空間的含義。
我們?cè)谧稣?dāng)?shù)氖虑椋晕壹僭O(shè)我們已經(jīng)拿到了系統(tǒng)的root權(quán)限并且可以編譯和插入內(nèi)核模塊。那么接下來(lái)的事情似乎就是一個(gè)流程了。
是的,修改頁(yè)表項(xiàng)即可,即便無(wú)法簡(jiǎn)單地通過(guò)memcpy來(lái)替換函數(shù)指令,我們還是可以用以下的步驟來(lái)進(jìn)行指令替換:
重新將函數(shù)地址對(duì)應(yīng)的物理內(nèi)存映射成可寫(xiě);
用自己的jmp指令替換函數(shù)指令;
解除可寫(xiě)映射。
非常幸運(yùn),內(nèi)核已經(jīng)有了現(xiàn)成的 text_poke/text_poke_smp 函數(shù)來(lái)完成上面的事情。
同樣的,針對(duì)一個(gè)堆上或者棧上分配的buffer不可執(zhí)行,我們依然有辦法。辦法如下:
編寫(xiě)一個(gè)stub函數(shù),實(shí)現(xiàn)隨意,其代碼指令和buffer相當(dāng);
用上面重映射函數(shù)地址為可寫(xiě)的方法用buffer重寫(xiě)stub函數(shù);
將stub函數(shù)保存為要調(diào)用的函數(shù)指針。
是不是有點(diǎn)意思呢?下面是一個(gè)步驟示意圖:
下面是一個(gè)代碼,我稍后會(huì)針對(duì)這個(gè)代碼,說(shuō)幾個(gè)細(xì)節(jié)方面的東西:
#include
#include
#include
#include
#include
#define OPTSIZE5
// saved_op保存跳轉(zhuǎn)到原始函數(shù)的指令
char saved_op[OPTSIZE] = {0};
// jump_op保存跳轉(zhuǎn)到hook函數(shù)的指令
char jump_op[OPTSIZE] = {0};
static unsigned int (*ptr_orig_conntrack_in)(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state);
static unsigned int (*ptr_ipv4_conntrack_in)(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state);
// stub函數(shù),最終將會(huì)被保存指令的buffer覆蓋掉
static unsigned int stub_ipv4_conntrack_in(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state)
{
printk("hook stub conntrack\n");
return 0;
}
// 這是我們的hook函數(shù),當(dāng)內(nèi)核在調(diào)用ipv4_conntrack_in的時(shí)候,將會(huì)到達(dá)這個(gè)函數(shù)。
static unsigned int hook_ipv4_conntrack_in(const struct nf_hook_ops *ops, struct sk_buff *skb, const struct net_device *in, const struct net_device *out, const struct nf_hook_state *state)
{
printk("hook conntrack\n");
// 僅僅打印一行信息后,調(diào)用原始函數(shù)。
return ptr_orig_conntrack_in(ops, skb, in, out, state);
}
static void *(*ptr_poke_smp)(void *addr, const void *opcode, size_t len);
static __init int hook_conn_init(void)
{
s32 hook_offset, orig_offset;
// 這個(gè)poke函數(shù)完成的就是重映射,寫(xiě)text段的事
ptr_poke_smp = kallsyms_lookup_name("text_poke_smp");
if (!ptr_poke_smp) {
printk("err");
return -1;
}
// 嗯,我們就是要hook住ipv4_conntrack_in,所以要先找到它!
ptr_ipv4_conntrack_in = kallsyms_lookup_name("ipv4_conntrack_in");
if (!ptr_ipv4_conntrack_in) {
printk("err");
return -1;
}
// 第一個(gè)字節(jié)當(dāng)然是jump
jump_op[0] = 0xe9;
// 計(jì)算目標(biāo)hook函數(shù)到當(dāng)前位置的相對(duì)偏移
hook_offset = (s32)((long)hook_ipv4_conntrack_in - (long)ptr_ipv4_conntrack_in - OPTSIZE);
// 后面4個(gè)字節(jié)為一個(gè)相對(duì)偏移
(*(s32*)(&jump_op[1])) = hook_offset;
// 事實(shí)上,我們并沒(méi)有保存原始ipv4_conntrack_in函數(shù)的頭幾條指令,
// 而是直接jmp到了5條指令后的指令,對(duì)應(yīng)上圖,應(yīng)該是指令buffer里沒(méi)
// 有old inst,直接就是jmp y了,為什么呢?后面細(xì)說(shuō)。
saved_op[0] = 0xe9;
// 計(jì)算目標(biāo)原始函數(shù)將要執(zhí)行的位置到當(dāng)前位置的偏移
orig_offset = (s32)((long)ptr_ipv4_conntrack_in + OPTSIZE - ((long)stub_ipv4_conntrack_in + OPTSIZE));
(*(s32*)(&saved_op[1])) = orig_offset;
get_online_cpus();
// 替換操作!
ptr_poke_smp(stub_ipv4_conntrack_in, saved_op, OPTSIZE);
ptr_orig_conntrack_in = stub_ipv4_conntrack_in;
barrier();
ptr_poke_smp(ptr_ipv4_conntrack_in, jump_op, OPTSIZE);
put_online_cpus();
return 0;
}
module_init(hook_conn_init);
static __exit void hook_conn_exit(void)
{
get_online_cpus();
ptr_poke_smp(ptr_ipv4_conntrack_in, saved_op, OPTSIZE);
ptr_poke_smp(stub_ipv4_conntrack_in, stub_op, OPTSIZE);
barrier();
put_online_cpus();
}
module_exit(hook_conn_exit);
MODULE_DESCRIPTION("hook test");
MODULE_LICENSE("GPL");
MODULE_VERSION("1.1");
測(cè)試是OK的。
在上面的代碼中,saved_op中為什么沒(méi)有old inst呢?直接就是一個(gè)jmp y,這豈不是將原始函數(shù)中的頭幾個(gè)字節(jié)的指令給遺漏了嗎?
其實(shí)說(shuō)到這里,還真有個(gè)不好玩的Trick,起初我真的就是老老實(shí)實(shí)保存了前5個(gè)自己的指令,然后當(dāng)需要調(diào)用原始ipv4_conntrack_in時(shí),就先執(zhí)行那5個(gè)保存的指令,也是OK的。隨后我objdump這個(gè)函數(shù)發(fā)現(xiàn)了下面的代碼:
0000000000000380
380: e8 00 00 00 00 callq 385
385: 55 push %rbp
386: 49 8b 40 18 mov 0x18(%r8),%rax
38a: 48 89 f1 mov %rsi,%rcx
38d: 8b 57 2c mov 0x2c(%rdi),%edx
390: be 02 00 00 00 mov $0x2,%esi
395: 48 89 e5 mov %rsp,%rbp
398: 48 8b b8 e8 03 00 00 mov 0x3e8(%rax),%rdi
39f: e8 00 00 00 00 callq 3a4
3a4: 5d pop %rbp
3a5: c3 retq
3a6: 66 2e 0f 1f 84 00 00 nopw %cs:0x0(%rax,%rax,1)
3ad: 00 00 00
注意前5個(gè)指令: e8 00 00 00 00 callq 385
可以看到,這個(gè)是可以忽略的。因?yàn)椴还茉趺凑f(shuō)都是緊接著執(zhí)行下面的指令。所以說(shuō),我就省去了inst的保存。
如果按照我的圖示中常規(guī)的方法的話(huà),代碼稍微改一下即可:
char saved_op[OPTSIZE+OPTSIZE] = {0};
...
// 增加一個(gè)指令拷貝的操作
memcpy(saved_op, (unsigned char *)ptr_ipv4_conntrack_in, OPTSIZE);
saved_op[OPTSIZE] = 0xe9;
orig_offset = (s32)((long)ptr_ipv4_conntrack_in + OPTSIZE - ((long)stub_ipv4_conntrack_in + OPTSIZE + OPTSIZE));
(*(s32*)(&saved_op[OPTSIZE+1])) = orig_offset;
但是以上的只是玩具。
有個(gè)非常現(xiàn)實(shí)的問(wèn)題。在我保存原始函數(shù)的頭n條指令的時(shí)候,n到底是多少呢?在本例中,顯然n是5,符合如今Linux內(nèi)核函數(shù)第一條指令幾乎都是callq xxx的慣例。
然而,如果一個(gè)函數(shù)的第一條指令是下面的樣子:
op d1 d2 d3 d4 d5
即一個(gè)操作碼需要5個(gè)操作數(shù),我要是只保存5個(gè)字節(jié),最后在stub中的指令將會(huì)是下面的樣子:
op d1 d2 d3 d4 0xe9 off1 off2 off3 off4
這顯然是錯(cuò)誤的,op操作碼會(huì)將jmp指令0xe9解釋成操作數(shù)。
解藥呢?當(dāng)然有咯。
我們不能魯莽地備份固定長(zhǎng)度的指令,而是應(yīng)該這樣做:
curr = 0
if orig[0] 為單字節(jié)操作碼
saved_op[curr] = orig[curr];
curr++;
else if orig[0] 攜帶1個(gè)1字節(jié)操作數(shù)
memcpy(saved_op, orig, 2);
curr += 2;
else if orig[0] 攜帶2字節(jié)操作數(shù)
memcpy(saved_op, orig, 3);
curr += 3;
...
saved_op[curr] = 0xe9; // jmp
offset = ...
(*(s32*)(&saved_op[curr+1])) = offset;
這是正確的做法。
-
Linux
+關(guān)注
關(guān)注
87文章
11339瀏覽量
210117 -
函數(shù)
+關(guān)注
關(guān)注
3文章
4345瀏覽量
62867
原文標(biāo)題:Linux內(nèi)核如何替換內(nèi)核函數(shù)并調(diào)用原始函數(shù)
文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論