C語言

當前位置 /首頁/計算機/C語言/列表

彙編呼叫c函式為什麼要設定棧

計算機領域,堆疊是一個不容忽視的概念,堆疊是兩種資料結構。堆疊都是一種資料項按序排列的資料結構,只能在一端(稱為棧頂(top))對資料項進行插入和刪除。在微控制器應用中,堆疊是個特殊的儲存區,主要功能是暫時存放資料和地址,通常用來保護斷點和現場。要點:堆,佇列優先,先進先出。棧,先進後出(First-In/Last-Out)。彙編呼叫c函式為什麼要設定棧,下面我們一起來看看。

彙編呼叫c函式為什麼要設定棧
  一.棧的整體作用

(1)儲存現場/上下文

(2)傳遞引數:彙編程式碼呼叫c函式時,需傳遞引數

(3)儲存臨時變數:包括函式的非靜態區域性變數以及編譯器自動生成的其他臨時變數。

  二.為什麼彙編程式碼呼叫c函式需要設定棧

之前看了很多關於uboot的分析,其中就有說要為C語言的執行,準備好棧。而自己在Uboot的start.S彙編程式碼中,關於系統初始化,也看到有棧指標初始化這個動作。但是,從來只是看到有人說系統初始化要初始化棧,即正確給棧指標sp賦值,但是卻從來沒有看到有人解釋,為何要初始化棧。所以,接下來的內容,就是經過一定的探究,試圖來解釋一下,為何要初始化棧。

要明白這個問題,首先要了解棧的作用。關於棧的作用,要詳細講解的話,要很長的篇幅,所以此處只是做簡略介紹。總的來說,棧的作用就是:儲存現場/上下文,傳遞引數,儲存臨時變數

  1.儲存現場/上下文

現場/上下文,意思就相當於案發現場,總有一些現場的情況,要記錄下來的,否則被別人破壞掉之後,你就無法恢復現場了。而此處說的現場,就是指CPU執行的時候,用到了一些暫存器,比如r0,r1等等,對於這些暫存器的值,如果你不儲存而直接跳轉到子函式中去執行,那麼很可能就被其破壞了,因為其函式執行也要用到這些暫存器。因此,在函式呼叫之前,應該將這些暫存器等現場,暫時保持起來(入棧push),等呼叫函式執行完畢返回後(出棧pop),再恢復現場。這樣CPU就可以正確的繼續執行了。

儲存暫存器的值,一般用的是push指令,將對應的某些暫存器的值,一個個放到棧中,把對應的值壓入到棧裡面,即所謂的壓棧。然後待被呼叫的子函式執行完畢的時候,再呼叫pop,把棧中的一個個的值,賦值給對應的那些你剛開始壓棧時用到的暫存器,把對應的值從棧中彈出去,即所謂的出棧。

其中儲存的暫存器中,也包括lr的值(因為用bl指令進行跳轉的話,那麼之前的pc的.值是存在lr中的),然後在子程式執行完畢的時候,再把棧中的lr的值pop出來,賦值給pc,這樣就實現了子函式的正確的返回。

  2.傳遞引數

C語言進行函式呼叫的時候,常常會傳遞給被呼叫的函式一些引數,對於這些C語言級別的引數,被編譯器翻譯成組合語言的時候,就要找個地方存放一下,並且讓被呼叫的函式能夠訪問,否則就沒發實現傳遞引數了。對於找個地方放一下,分兩種情況。一種情況是,本身傳遞的引數不多於4個,就可以通過暫存器傳送引數。因為在前面的儲存現場的動作中,已經儲存好了對應的暫存器的值,那麼此時,這些暫存器就是空閒的,可以供我們使用的了,那就可以放參數。另一種情況是,引數多於4個時,暫存器不夠用,就得用棧了。

  3.臨時變數儲存在棧中

包括函式的非靜態區域性變數以及編譯器自動生成的其他臨時變數。

  4.舉例分析C語言函式呼叫是如何使用棧的

對於上面的解釋的棧的作用顯得有些抽象,此處再用例子來簡單說明一下,就容易明白了:用:arm-inux-objdump–d u-boot >dump_可以得到dump_檔案。該檔案就是中,包含了u-boot中的程式的可執行的彙編程式碼,其中我們可以看到C語言的函式的原始碼,到底對應著那些彙編程式碼。

下面貼出兩個函式的彙編程式碼,一個是clock_init,另一個是與clock_init在同一C原始檔中的,另外一個函式CopyCode2Ram:

(1)clock_init部分的程式碼可以看到該函式第一行:33d009b0: e3a02313 mov r2, #1275068416 ;0x4c000000就沒有我們所期望的push指令,沒有去將一些暫存器的值放到棧中。這是因為,我們clock_init這部分的內容,所用到的r2,r3等等暫存器,和前面呼叫clock_init之前所用到的暫存器r0,沒有衝突,所以此處可以不用push去儲存這類暫存器的值,不過有個暫存器要注意,那就是r14,即lr,其是在前面呼叫clock_init的時候,用的是bl指令,所以會自動把跳轉時候的pc的值賦值給lr,所以也不需要push指令去將PC的值儲存到棧中。而clock_init的程式碼的最後一行:33d009f8:e1a0f00e mov pc, lr就是我們常見的movpc,lr,把lr的值,即之前儲存的函式呼叫時候的PC值,賦值給現在的PC,這樣就實現了函式的正確的返回,即返回到了函式呼叫時候下一個指令的位置。這樣CPU就可以繼續執行原先函式內剩下那部分的程式碼了。

(2)CopyCode2Ram部分的程式碼其第一行:33d0091c:e92d4070 push {r4, r5, r6, lr}就是我們所期望的,用push指令,儲存了r4,r5,r以及lr。用push去儲存r4,r5,r6,那是因為所謂的儲存現場,以後後續函式返回時候再恢復現場,而用push去儲存lr,那是因為此函式裡面,還有其他函式呼叫:33d0092c: ebffffef bl 33d008f0

......

33d00984: ebffff14 bl 33d005dc

......

也用到了bl指令,會改變我們最開始進入clock_init時候的lr的值,所以我們要用push也暫時儲存起來。而對應地,CopyCode2Ram的最後一行:33d009ac:e8bd8070 pop {r4, r5, r6,pc}就是把之前push的值,給pop出來,還給對應的暫存器,其中最後一個是將開始push的lr的值,pop出來給賦給PC,因為實現了函式的返回。另外,我們注意到,在CopyCode2Ram的倒數第二行是:33d009a8:e3a00000 mov r0, #0 ;0x0是把0賦值給r0暫存器,這個就是我們所謂返回值的傳遞,是通過r0暫存器的。此處的返回值是0,也對應著C語言的原始碼中的“return0”。

對於使用哪個暫存器來傳遞返回值:當然你也可以用其他暫時空閒沒有用到的暫存器來傳遞返回值,但是這些處理方式,本身是根據ARM的APCS的暫存器的使用的約定而設計的,你最好不要隨便改變使用方式,最好還是按照其約定的來處理,這樣程式更加符合規範

TAG標籤:設定 彙編 函式 呼叫 #