****虛擬機概覽
所謂虛擬機保護技術,是指將代碼翻譯為機器和人都無法識別的一串偽代碼字節(jié)流;在具體執(zhí)行時再對這些偽代碼進行一一翻譯解釋,逐步還原為原始代碼并執(zhí)行。
這段用于翻譯偽代碼并負責具體執(zhí)行的子程序就叫作虛擬機VM(好似一個抽象的CPU)。它以一個函數(shù)的形式存在,函數(shù)的參數(shù)就是字節(jié)碼的內存地址。
將虛擬機應用到商業(yè)中的保護殼現(xiàn)有三款:Vmprotect,themida和 execrypt。
**** 虛擬機架構
我們知道,代碼中的指令多種多樣,組織形式也千變萬化;虛擬機不可能針對每一種具體情況都進行翻譯處理。必須對所有可能遇到的指令先進行抽象歸類,然后分解為若干簡單的小指令,再交由各個專門的子程序(handler)去處理。
學過編譯原理的同學應該都知道三元式代碼吧,也叫做3地址代碼(three adress code)。即不論多么復雜的賦值公式,都可以分解為數(shù)個3地址代碼式序列。(什么是3地址代碼,1段3地址代碼只完成1次運算,譬如1次二目運算、1次比較,或者1次分支跳轉運算。)
與此類似,不論多么復雜的指令,都可以分解為一串不可再分割的原子指令序列。
虛擬機(CPU)的體系架構可分為3種,基于堆棧的(Stack based),基于寄存器的(Register based)和3地址機器。我們只講述基于堆棧的虛擬機架構(Stack based);這種架構的虛擬機需要頻繁操作堆棧,其使用的虛擬寄存器(虛擬的eax、ebx等等)保存在堆棧中;每個原子指令的handler都需要push、pop。
現(xiàn)在的CPU都有大量的寄存器,堆棧一般只是在函數(shù)傳遞參數(shù)時使用(譬如PC機用的x86系列CPU)。但也有一些CPU只操作內存,沒有堆棧,也沒有寄存器。使用這種CPU的機器稱之為3地址機器。
基于堆棧的CPU或虛擬機沒有臨時變量、寄存器的概念,所有的東西都放入堆棧。由于指令中不需要指定操作數(shù),所以其指令相對基于寄存器的要短。也因此相對簡單,在嵌入式系統(tǒng)中運用較多。用于保護代碼,我們也選擇這種。
舉例,譬如指令add,基于堆棧的CPU首先從堆棧里Pop兩個數(shù),然后將兩數(shù)相加,再把和Push到堆棧。Add指令只占用1個字節(jié)。而基于寄存器的CPU對應指令為 add Reg1,Reg2,需要3個字節(jié)。請仔細想象一下沒有寄存器的CPU,它的指令是怎樣的,該會是多么簡潔。當然,指令簡潔帶來的缺點就是效率低下。
我們這里談的虛擬機保護技術,就是把基于寄存器的CPU代碼,改造成基于堆棧的CPU的偽代碼。然后再由基于堆棧的虛擬機(CPU)對偽代碼解釋執(zhí)行。
**** 指令系統(tǒng)
關鍵在于設計一個虛擬的基于堆棧的虛擬機(CPU)的指令系統(tǒng)。這個指令系統(tǒng)越簡潔,復用性越高越好。
還是以add 指令為例。X86系列CPU的add指令有許多格式,譬如:add reg,imm 、add reg,reg、add reg,mem、add mem,reg等等。而基于堆棧的虛擬機CPU則沒有這么多花樣,就一個單單的add指令,參數(shù)和返回都是在堆棧里。
我們需要為我們的虛擬機CPU模擬實現(xiàn)這樣的add命令:
而原有的add命令的參數(shù),我們需要翻譯為 push 命令 。根據(jù)push 的對象不同,需要不同的實現(xiàn):
有Push指令了,也得有Pop指令:
基于堆棧的虛擬機指令系統(tǒng)就是這樣簡單的:單字節(jié)的動作指令(譬如add、dec),以及各式各樣的push、pop等堆棧操作指令。沒有復雜的寄存器與內存操作。我們需要把x86的CPU指令翻譯成虛擬機CPU的指令,譬如:
Call指令相對麻煩一點,因為Call的函數(shù)未必是虛擬機的偽代碼了。所以碰到Call指令,就要退出虛擬機,交由真實的CPU去處理了。代碼類似下面:
其余,要注意標志位的處理、不可模擬指令,以及指令的優(yōu)化。還有異常處理,這里就不展開了。
VStartVM是虛擬機的入口,負責保存運行環(huán)境(各個寄存器的值)、以及初始化堆棧(虛擬機使用的變量全部在堆棧中)。
Bytecode是偽代碼;VMDispatcher對偽代碼逐個閱讀處理,然后分發(fā)給下面的各個子程序(Handler)。
加殼程序先把已知的X86指令解釋成了字節(jié)碼,放在PE文件中,然后將原處代碼刪掉,改成類似的代碼進入虛擬機執(zhí)行循環(huán)。
VStartVM初始化后,堆棧情形如下:
edi指向VMcontext;esi指向偽代碼的地址;ebp指向真實堆棧的棧頂; 這三個寄存器在VM內不要再改了。
VMContext是虛擬機VM使用的虛擬環(huán)境結構:
VM之所以使用堆棧保存自己的寄存器結構,是考慮到多線程程序的兼容。
大家都知道脫殼時的堆棧平衡原理吧。同樣的,虛擬機在執(zhí)行翻譯后的程序代碼時,也不可以隨便變動原來的堆棧地址。還需經(jīng)常檢查在堆棧中的VMcontext結構不被沖掉。
-
機器
+關注
關注
0文章
784瀏覽量
40778 -
代碼
+關注
關注
30文章
4823瀏覽量
68896 -
虛擬機
+關注
關注
1文章
931瀏覽量
28359
發(fā)布評論請先 登錄
相關推薦
評論