如果編程本身就是一門藝術,那么匯編語言的編程就是編程領域中的皇冠,在這個基礎軟件全面回歸的時代,匯編語言似乎再次煥發了青春,根據 TOBIE 發布的編程語言排行榜,匯編語言重回前十,雖然這是 X86、ARM、單片機等等所有平臺的匯編語言加在一起才取得的成果,不過在印象中上次匯編語言取得這樣的成績還是上個世紀 90 年代的事。
匯編語言對于操作系統,數據庫,人工智能框架等核心基礎軟件有著不可取代的作用,從了解到的情況看,比如龍芯對于 OpenJDK 的貢獻已經達到了全球前五名,這其中最為關鍵的貢獻方向就是將 Java 虛擬機針對 Looongarch 指令集進行專項優化,可以說熟練掌握一種匯編語言是高階程序員的必經之路。
當用戶使用 C、C++ 或任何其他高級語言時,編譯器決定了程序的藝術。然而這一次,我們將自行面對 CPU,新手實現面向指令集編程的藝術,本文使用RISC-V 為例來向大家展示,來如何使用編寫語言設計程序邏輯,并最終將程序邏輯轉換為匯編語言的程序。
譯者對于原文進行了一定的修訂與校對。
1、用合適的語言設計邏輯
對于初學者來說,這是最難的一步,因為現在學生們常用的高級語言中,往往使用更抽象的工具進行邏輯設計,許多學生想直接編寫完整的功能模塊。但是對于匯編語言來說,這是一種注定要失敗的方法。相反,為了把邏輯和語言分開,我們必須用我們理解的語言來設計程序邏輯。
如果一個學生不懂 C 或一些低級語言,那么我建議他們用偽碼寫。因為用太高級的語言如 Java 其實是面向虛擬機編程的,這會增加程序邏輯到匯編語言的轉換難度,而使用太低級的語言會使程序邏輯設計變得困難。因此,我推薦 C 或 C++,在將代碼進行轉換的時候,最好將有對應的代友橫向放在一起,一些編輯可以把它們并排放在一起,這是很有幫助的。
說實話這部分雖然看似平平無奇,但卻讓我頗感到意外,因為 C 語言和匯編的對照完全可以通過 gcc 的 -o -g 參數以及 objdump 實現。
在譯者的理念中,匯編語言是專門用于填補空白,只有當其它語言不能勝任的時候才會考慮用匯編語言上場工作,不過從這篇博文中透露出的信息來看,國外在教學過程中對于匯編語言的運用范圍也是不設限的,而在譯者印象中能用匯編語言實現任何功能的程序員,在國內只有求伯君,嚴援朝等廖廖數人而已,由此可見我們在 IT 基礎教育領域要做的工作還很多。
2、小步快跑,不要試圖一口吃個胖子
很多匯編語言的初學者試著從頭到尾寫完整的程序,而沒有在中間進行過任何測試關鍵,但是我建議在完成部分邏輯時就立刻進行測試。這樣做其實很簡單,比如完成了一個 for 循環,等等一小部分功能就要開始測試。
可以將 C 或 C++ 程序與匯編程序連接起來。通過在 C++ 中原型化組裝函數的名稱實現這一點。按照一般的做法通常會在 C 函數前面加上一個 “c” 來區分。我們可以調用 Show 來運行匯編語言編寫的函數。
其實這部分的建議并不僅僅針對于 RISC-V 甚至不是針對匯編語言,無論是什么語言的編程,當你想到要進行單元測試的時候往往就已經晚了,隨時對于一個細小的模塊進行測試真的是一個好習慣。
3、了解匯編語言的功能定位
這里我們必須要充分認識到沒有匯編語言和有編譯器解釋器的高級語言真的完全不一樣,不養兒不知父母恩,不寫匯編不知各類語言之父有多神。在匯編語言中操作順序都需要程序員自己去掌握。例如,4+3*4 的運算,作何一種語言的編譯器都先執行乘法,然后再加法。然而在匯編語言的編程世界中,我們必須首先選擇乘法指令,然后再選擇加法指令。沒有為我們進行運算符號的優先級重排。
4、了解如何調用函數
在匯編語言中編寫一個函數是一項非常艱苦的任務,大多數 ISA 體系結構(如ARM和RISC-V)的芯片都將附帶專門的工作手冊,當然這些手冊中只是制定了一些基本規則,如何傳遞參數,如何接收返回結果,又如何構造函數棧禎等等具體的話題都值得深入討論。不過幸運的是 RISC-V 寄存器的 “ABI” 命名規則,有助于程序員理解它們的含義。比如:
整數參數在寄存器 A0-A7 中,浮點參數在寄存器 FA0-FA7 中
通過對堆棧指針的 sub 操作去分配函數堆棧。在調用完成后使用 add 操作進行銷毀
堆棧大小必須以 8 的整數倍形式分配
所有參數和臨時寄存器必須在函數調用后,被視為銷毀態
在函數調用之后,已保存寄存器才能被顯式保存。如果使用了任何已保存的寄存器,則必須在函數返回之前還原它們的原始值
通過 a0 寄存器做為返回值,將數據返回給調用方。
以下面這段代碼為例:
我們可以看到先通過 addi sp,sp,-8 的語句構造函數禎,保存所有寄存器后執行相應函數邏輯,接下來將所有包括sp寄存器內的調用環境恢復,最后返回。
5、文檔
建議使用 C 或其他語言編寫匯編語言的注釋,用以下代碼為例:
原始 C 語言代碼進行一個總的注釋,然后將每個匯編語言片段的也使用 C 語言進行注釋。尤其當涉及到運算操作順序時,這樣的方式使我們能夠保證程序可以正確地執行每一步。
責任編輯:tzh
-
cpu
+關注
關注
68文章
10901瀏覽量
212682 -
編程
+關注
關注
88文章
3637瀏覽量
93911 -
編譯器
+關注
關注
1文章
1642瀏覽量
49240 -
RISC-V
+關注
關注
45文章
2322瀏覽量
46396
發布評論請先 登錄
相關推薦
評論