1.引言
虛擬機最初是美國計算機科學家波佩克(Popek)與戈德堡(Gerald)在虛擬化需求中給出了定義,專指有效的、孤立的真實計算機的副本,現在則指可像真實計算機一樣運行程序的軟件實現,包括跟任何真實計算機無關的虛擬機。根據運用和與機器的相關性可分為系統虛擬機和程序虛擬機,一個提供了完整的操作系統,另一個則以運行單個計算機程序為主。
在嵌入式應用領域,嵌入式系統相關的CPU芯片和微計算機硬件系統種類繁多,并且不斷推陳出新,甚至多核處理器已被普遍采用。但是在新平臺上,難以針對每一種芯片或平臺制定一種計算機語言來編程。解決的方法一是可采用公共計算機語言,用不同的編譯器來生成機器碼,但該方法需要具有該語言的編譯器,在新平臺上往往難以具備。另一種方法即建立一個虛擬機,然后用一個計算機語言,用一個解釋器來解釋執行。采用該方法,難點在于嵌入式虛擬機的構建,要能夠適應多種環境、快速構建、可擴展。
FORTH是一種與眾不同的計算機程序設計語言。它具有極強的擴展性,通過字的定義,可實現不斷堆疊和擴展。同時,它又具有極好的交互性,指令可解釋執行,這就為應用的調試帶來了極大的便捷。本文基于FORTH語言,以自主構建的JLPFORTH虛擬平臺為例,詳細闡述FORTH虛擬機的實現原理和核心實現方法,模擬和實現了通用的交互式計算機結構,實現了真實計算機的典型工作流程[4],并且一改過去FORTH代碼和數據混合存儲的方式,在內存的存儲上以分段的方式將內存分為CS、VS、DS、SS四個段,分別存儲指令和數據,這樣,就實現了系統指令和用戶數據的分離,有效地提高了代碼和系統的安全性,并且調試方便、擴展性強,尤其適合應用于對安全性、兼容性、移植性、擴展性、交互性要求高的嵌入式系統領域。
2.FORTH虛擬機實現原理
真實計算機的基本工作原理是存儲和控制。計算機在控制器的指揮下,取出預先存儲的指令序列(即程序)和數據,通過控制器譯碼,按指令的要求,取出數據完成運算,再把結果重新存儲起來,如此循環,直至完成全部指令。對真實計算機來說,這個過程依托中央處理器CPU來實現,CPU包括運算器、控制器和寄存器。如果描述CPU核心工作過程,主要包括以下步驟:
(1)提取程序計數器值,該值指向的地址即指令地址;
(2)從該地址取出指令;
(3)程序計數器增加指令長度,即指向下一條指令地址;
(4)解碼執行指令;
(5)返回結果。
由于FORTH虛擬機是工作在真實計算機上的,因此要實現FORTH虛擬機必須用對應關系依托真實計算機的代碼來實現這個核心過程。
在FORTH虛擬機中,用核心算法--NEXT模擬了這個過程,將虛擬機指令和真實計算機指令實現對應,通過建立字典表,設置地址跳轉,以串線碼的方式將虛擬機命令字和直接機器指令實現對應,依托真實計算機指令完成了CPU的處理過程。如圖1所示。
具體過程是:在FORTH定義字時創建鏈結構的字典表,在其中存儲各個字的名稱、長度、狀態、指令碼以及鏈接指針。例如定義FORTH字S:S DUP *;在字典表存放了各個FORTH高級字的名稱和代碼執行地址,其中也有S字的定義,在S字的代碼場中存有S字的代碼執行地址,該代碼執行地址與code所描述的直接機器執行代碼相對應,構成間接串線編碼。當執行該指令時,首先查找字典表,找到S定義后,取出其WPF指令碼中存放的地址,然后跳轉到代碼場該地址中,由于是FORTH高級字定義,所以首先執行“:”機器碼將程序計數器所記錄的下一條指令返回地址壓入棧,然后跳轉到參數場地址依序執行,直到最后的“;”返回指令執行后,再將原先存入棧的返回地址彈出,這樣即完成一條指令的執行。其中,代碼場和參數場分別存儲指令和參數。以下以JLP FORTH虛擬機為例,詳細描述其字典表、代碼場、參數場的定義、虛擬機存儲和指針的分配,以及核心算法。
3.指令的定義和存儲
FORTH虛擬計算機采用該虛擬指令的存儲地址來表示該指令,稱為“地址碼”.虛擬計算機的每個指令用名稱(例如+、-、*)來表示,稱為“字(Word)”.FORTH虛擬計算機的指令包括“復合字”和“基本字”.基本字也稱為“低級字”,由真實計算機機器碼和數據組成的,低級字組合可構成“復合字”,所以,“復合字”也稱為“高級字”.
高級字和低級字都可通過定義擴展。擴展高級字用“:”冒號定義,通過高級字定義用已有的指令形成新的指令。格式如下:
:名字 … leave … ;其中執行leave指令可以跳出該FORTH字的執行,忽略掉其后的指令。擴展低級字則用機器碼定義,格式如下:
CODE 名字 … … NEXT, END-CODE其中NEXT,指令可以讓計算機執行下一條虛擬機指令。
對于真實計算機,用編譯器生成的指令碼序列中不需要保留指令名稱。FORTH虛擬計算機不同,由于需要虛擬機執行和構造新的虛擬機指令,因此在虛擬計算機中要保留FORTH字的名稱,用于存儲FORTH字的存儲空間就是“字典表”.在JLP FORTH虛擬平臺中,字典表結構如表1,在圖1中也有標注。
WPF里存儲的指令碼即FORTH字在存儲空間的地址。由于允許FORTH字的名稱長度不一樣,因此采用鏈表結構可有效地存儲它們,在LPF中即存放了下一個字的定義地址。
代碼場和參數場用于共同存儲FORTH字,如表2.
其中CFA存放實現虛擬機功能的CPU機器碼開始地址。PFA依次存放組成它的虛擬機指令。對于基本字PFA的內容不一樣。對于一個常數基本字,PFA就直接存放這個常數。對于一個變量基本字,PFA就存放數據段中這個變量的地址[6].
4.內存和指針分配
以往FORTH并未將代碼和數據分開,在嵌入式應用中,往往指令和程序相對固定,而代碼和數據混合致使調試不方便,同時在系統安全上也帶來問題。在JLP FORTH虛擬機上,將內存分為代碼段CS、代碼空間VS、數據段DS、系統段SS四個部分。
(1)代碼段CS:存放真實計算機的機器指令、內存分配信息以及與硬件有關的系統數據。
(2)“代碼”空間VS:用來存放虛擬計算機的指令和字典。
(3)數據段DS:用來存放用戶數據和虛擬機的堆棧等數據。
(4)系統段SS:用來存放系統堆棧和多任務系統數據表等,達到分離系統任務和用戶,保證系統安全的目的。
采用這種存放方式,就可將CS和VS放在FLASH中,將DS和SS放在RAM,如此實現程序和數據的分離。這種新的虛擬機架構不僅可以適合嵌入式系統,也適合PC結構系統,而且更有利于內存保護的實現。
真實計算機主要依靠寄存器來實現加減乘除等運算。例如將AX和BX寄存器的內容相加結果放到AX中,因此寄存器的數量是衡量CPU運算能力的一個指標。FORTH虛擬計算機則采用直接面向運算過程的方法,采用堆棧的方式來實現簡單的運算,例如取出堆棧頂上的兩個數相加后,結果放回堆棧頂。對于復雜運算,直接用復合字或者機器碼寫出面向數據的算法,比如對矢量和矩陣的運算等。由于沒有寄存器的概念,只有表示系統工作狀態的各種系統變量以及實現系統運行的各種指針。為了提高虛擬計算機的執行效率,用間接尋址的CPU寄存器來實現。對應關系如下(注:箭頭為在X86計算機中對應的寄存器)。
通過這些指針的定義,FORTH虛擬機可實現各種各樣復雜的算法。
5.NEXT核心算法與函數
FORTH虛擬機的核心算法--NEXT,它完成了指令的控制執行過程。如借用以上描述,用形式化的方法表示為:
由于FORTH虛擬機是工作在真實計算機上,因此要實現FORTH虛擬機必須用真實計算機的代碼來實現這個核心過程,以X86匯編語言為例,其實現FORTH虛擬機核心過程的代碼為(16位地址空間):
ES:BX,SI MOV
SI,#2 ADD
ES:[BX]JMP
從代碼可以看出,它非常象一個子過程或函數的調用。在真實計算機中,函數是非常常用的一個功能,是若干指令的有序集合。
在FORTH虛擬計算機中高級字就可認為是“函數”.表3是真實計算機和FORTH虛擬計算機在函數調用中的執行過程對比。
6.實例
以下采用自下而上的編程方法,構造FORTH字P_DUMP用于查看內存基本信息,以此為例說明FORTH虛擬計算機相關程序的設計方法。參數有查看內存的段地址、偏移地址和區域長度。
7.結論
對于嵌入式應用來說,一個可擴展性好、可移植性好、可裁剪、實現快速,并且便于調試的嵌入式虛擬機,能給嵌入式應用的開發帶來極大的方便。基于FORTH構筑的虛擬機,引入字典表完成指令和機器代碼的對應,并用字定義來完成指令的擴展,使系統的結構具有了極大的靈活性和擴展性,僅僅通過對基本字的堆疊、組合就可完成高級字的層層定義,實現極其復雜的系統。在JLP FORTH中存儲分段使得程序指令和數據能相對獨立,有效地增強了系統的安全性。這些設計思路使得在其上構建的FORTH虛擬機具有了代碼簡單、調試方便、安全性高、擴展性強等特點,特別適合應用于嵌入式系統中。
-
芯片
+關注
關注
456文章
50967瀏覽量
424945 -
cpu
+關注
關注
68文章
10882瀏覽量
212258 -
計算機
+關注
關注
19文章
7520瀏覽量
88262 -
虛擬機
+關注
關注
1文章
919瀏覽量
28290
發布評論請先 登錄
相關推薦
評論