zoukankan      html  css  js  c++  java
  • 大內高手專欄: .NET中間語言(IL)

    作者:蔡學鏞

    2003 年 09 月

    .NET CLR 和 Java VM 都是堆疊式虛擬機器(Stack-Based VM),也就是說,它們的指令集(Instruction Set)都是採用堆疊運算的方式:執行時的資料都是先放在堆疊中,再進行運算。Java VM 有約 200 個指令(Instruction),每個指令都是 1 byte 的 opcode(操作碼),後面接不等數目的參數;.NET CLR 有超過 220 個指令,但是有些指令使用相同的 opcode,所以 opcode 的數目比指令數略少。特別注意,.NET 的 opcode 長度並不固定,大部分的 opcode 長度是 1 byte,少部分是 2 byte。

    本文章以一個實際的例子,讓你瞭解堆疊式 VM 的運作原理,並對 .NET IL(Intermediate Language)有最基本的領略。

    下面是一個簡單的 C# 原始碼:

     
     
                                        using System;
    
    public class Test {
        public static void Main(String[] args) {
            int i=1;
            int j=2;
            int k=3;
            int answer = i+j+k;
            Console.WriteLine("i+j+k="+answer);
        }
    }
    
                                    
    

    將此原始碼編譯之後,可以得到一個 EXE 檔案。我們可以透過 ILDASM.EXE 來反組譯 EXE 以觀察 IL。我將 Main() 的 IL 反組譯條列如下,這裡共有十八道 IL 指令,有的指令(例如 ldstr 與 box)後面需要接參數,有的指令(例如 ldc.i4.1 與 add)後面不需要接參數。

     
     
    ldc.i4.1
    stloc.0
    ldc.i4.2
    stloc.1
    ldc.i4.3
    stloc.2
    ldloc.0
    ldloc.1
    add
    ldloc.2
    add
    stloc.3
    ldstr      "i+j+k="
    ldloc.3
    box        [mscorlib]System.Int32
    call       string [mscorlib]System.String::Concat(object, object)
    call       void [mscorlib]System.Console::WriteLine(string)
    ret
    
    

    此程式執行時,關鍵的記憶體有三種,分別是:

    • Managed Heap:這是動態配置(Dynamic Allocation)的記憶體,由 Garbage Collector(GC)在執行時自動管理,整個 Process 共用一個 Managed Heap。
    • Call Stack:這是由 .NET CLR 在執行時自動管理的記憶體,每個 Thread 都有自己專屬的 Call Stack。每呼叫一次 method,就會使得 Call Stack 上多了一個 Record Frame;呼叫完畢之後,此 Record Frame 會被丟棄。一般來說,Record Frame 內紀錄著 method 參數(Parameter)、返回位址(Return Address)、以及區域變數(Local Variable)。Java VM 和 .NET CLR 都是使用 0, 1, 2… 編號的方式來識別區域變數。
    • Evaluation Stack:這是由 .NET CLR 在執行時自動管理的記憶體,每個 Thread 都有自己專屬的 Evaluation Stack。前面所謂的堆疊式虛擬機器,指的就是這個堆疊。

    後面有一連串的示意圖,用來解說在執行時此三種記憶體的變化。首先,在進入 Main() 之後,尚未執行任何指令之前,記憶體的狀況如圖 1 所示:

    對 1
    圖 1

    接著要執行第一道指令 ldc.i4.1。此指令的意思是:在 Evaluation Stack 置入一個 4 byte 的常數,其值為 1。執行完此道指令之後,記憶體的變化如圖 2 所示:

    對 2
    圖 2

    接著要執行第二道指令 stloc.0。此指令的意思是:從 Evaluation Stack 取出一個值,放到第 0 號變數(V0)中。這裡的第 0 號變數其實就是原始碼中的 i。執行完此道指令之後,記憶體的變化如圖 3 所示:

    對 3
    圖 3

    後面的第三道指令和第五道指令雷同於第一道指令,且第四道指令和第六道指令雷同於第二道指令。為了節省篇幅,我不在此一一贅述。提醒大家第 1 號變數(V1)其實就是原始碼中的 j,且第 2 號變數(V2)其實就是源碼中的 k。圖 4~7 分別是執行完第三~六道指令之後,記憶體的變化圖:

    對 4
    圖 4

    對 5
    圖 5

    對 6
    圖 6

    對 7
    圖 7

    接著要執行第七道指令 ldloc.0 以及第八道指令 ldloc.1:分別將 V0(也就是 i)和 V1(也就是 j)的值放到 Evaluation Stack,這是相加前的準備動作。圖 8 與圖 9 分別是執行完第七、第八道指令之後,記憶體的變化圖:

    對 8
    圖 8

    對 9
    圖 9

    接著要執行第九道指令 add。此指令的意思是:從 Evaluation Stack 取出兩個值(也就是 i 和 j),相加之後將結果放回 Evaluation Stack 中。執行完此道指令之後,記憶體的變化如圖 10 所示:

    對 10
    圖 10

    接續下頁

  • 相关阅读:
    MySQL数据库的常用命令
    函数返回 局部变量问题
    几种网络I/O模型
    socket的select模型【摘】
    Linux Bash Shell入门教程【转载】
    Shell学习【转】
    unicode 2 utf8 [转]
    linux下多线程的创建与等待详解 【转载】
    运算(93&-8)的结果
    一道腾讯的面试题,关于a和&a
  • 原文地址:https://www.cnblogs.com/zhiji6/p/3026393.html
Copyright © 2011-2022 走看看