ILBC 规范 2 - 走看看

zoukankan html css js c++ java

ILBC 规范 2

接上篇《ILBC 规范》  https://www.cnblogs.com/KSongKing/p/10354824.html ，

ILBC 的目标是跨平台跨设备。

D# / ILBC 可以编写操作系统内核层以上的各种应用，

其实除了进程调度虚拟内存文件系统外，其它的内核模块可以用 D# 编写，比如 Socket 。

D# / ILBC 的设计目标是保持简单，比如 D# 支持 Lambda 表达式，但是 LinQ 应该由库来支持，与语言无关。

另一方面， ILBC 不打算发展一个庞大的优化体系。 C++ , .Net / C# 的优化体系已经庞大复杂到成为大公司也很难承受之重了。

我们不会这么干。

ILBC 认为 “简单就是优化” 。

保持简单设计和模块化，模块化会带来一些性能损耗，这些性能损耗是合理的。

保持简单设计和模块化，对于 ILBC / D# / c3 / …… 以及应用程序都是有益的。

ILBC 的目标是建立一个基础设施平台。

就像容器（比如 docker, kubernetes），容器打算在操作系统之上建立一个基础设施平台，

我们的做法不同，

ILBC 是用语言建立一个基础设施平台。

为了避开 “优化陷阱”，我决定还是启用之前的 “ValueBox” 的想法。 ValueBox 的想法之前想过，但后来又放弃了。

ValueBox 类似 java C# 里的 “装箱” 、 “拆箱” 。

ValueBox 就是对于 int long float double char 等值类型（或者说简单类型），用一个对象（ValueBox）装起来，用于需要按照对象的方式处理的场合。

本来我之前是放弃了这个想法，觉得还是按照 C# 的 “一切都是对象” 的做法，让值类型也作为对象，继承 Object 类，然后让编译器在不需要作为对象，只是对值计算的场合把值类型对象优化回值类型（C 语言里的 int long float double char 等）。

但现在既然谈到优化陷阱，上面说的 “一切都是对象” 的架构就有点呵呵了。

这有一个问题，把值对象优化回值类型，这个优化是放在 C 中间代码里还是 InnerC 编译器里，

放在 C 中间代码是指由高级语言（D# c3 等）编译器来优化，这样高级语言编译生成的 C 中间代码里面就已经是优化过的代码，比如在值计算的地方就是 C 语言的 int long float double char 等，而不是值对象。

但这样要求高级语言的编译器都按照这个标准进行优化，不然在各高级语言写的库之间动态链接时会发生问题。

比如 D# 调用 c3 写的库的 Foo(int a) 方法， c3 做过优化，所以需要的 a 参数是一个 C 语言里的 int 类型，而 D# 未作优化，传给 Foo(int a) 的 a 参数是一个 int 对象，这就出错了，这是不安全的。

但要求高级语言的编译器都按照标准优化，这是一个比较糟糕的事情。

这会让高级语言编译器变得麻烦和做重复工作，且 ILBC 会因规则累赘而缺乏活力。

如果把优化放在 InnerC 编译器里优化，那会和我们的一些想法不符。我们希望 InnerC 是一个单纯的 C 编译器，不要把 IL 层的东西掺杂到里面。

InnerC 是一个单纯的 C 编译器，这也是 ILBC 的初衷和本意。

所以，我们采用这样的设计，值类型就是值类型，对应到 C 语言里的基础类型（int long float double char 等），值类型不是对象，也不继承 Object 类，对象是引用类型，继承 Object 类。

当需要以对象的方式来处理时，把值类型包到 ValueBox 里。

每个值类型会对应一个 ValueBox，比如 int 对应 IntBox， long 对应 LongBox， float 对应 FloatBox， double 对应 DoubleBox， char 对应 CharBox， bool 对应 BoolBox 等等。

ValueBox 的使用代码比如：

IntBox i = new IntBox( 10 ); // 10 就是 IntBox 包装的 Value

或者，

int i = 10;

IntBox iBox = new IntBox( i ); // 把 int 类型的变量 i 的值包装到 IntBox

什么时候需要把值类型包到 ValueBox 里？或者说，什么时候需要以对象的方式来处理值类型？

一般是在需要动态传递参数的时候，

比如， Foo ( object o ) 方法的 o 参数可能传入各种类型，那么可以把 o 参数声明为 object 类型，这样在 Foo() 方法内部判断 o 参数的类型，根据类型执行相关操作。

又比如，反射，通过反射调用方法，参数是通过 object [ ] 数组传入，

这 2 种情况对于参数都是以对象的方式处理，如果参数是值类型的话，就需要包装成 ValueBox 再传入。

D# / ILBC 支持值类型数组、值类型泛型容器。

值类型数组就是数组元素就是值类型，假设 int 类型占 4 个字节，那么 int [ ] 数组的每个元素占用空间也是 4 个字节，这和 C 语言是一样的。

值类型泛型容器比如 List<int> ， List<int> 的内部数组就是 int [ ] 。

值类型数组，值类型泛型容器直接存取值类型，不需要对值类型装箱。

但是要注意，比如 Dictionary<TKey, TValue> ， value 可以是值类型，但 key 需要是对象类型，因为会调用 key.GetHashCode() 方法。

所以，如果 key 是值类型，需要装箱成 ValueBox 。

比如

Dictionary < string , int > ， value 可以是值类型，

Dictionary < IntBox , object > ， key 需要是对象类型，如果是 int ，需要装箱成 IntBox

如果声明 Dictionary < int , object > ，则编译器会对 key 的类型报错，提示应声明为引用类型（对象类型）。

值类型又称简单类型，

引用类型又称对象类型，

（这有点呵呵）

编译器是依据什么检查 key 类型应为引用类型呢？

我们可以在 D# 里加入一个语法，比如， Dictionary 的定义是这样：

public class Dictionary < object TKey , TValue >

{

……

public void Add ( TKey key , TValue value )

{

int hash = key.GetHashCode() ;

……

}

}

可以看到， TKey 的前面加了一个 object ，这表示 TKey 的类型应该是 object 类型或者 object 的子类，

这个 object 可以换成其它的类型，比如其它的类或者接口。

这样的话，如果 TKey 被声明为值类型，比如 Dictionary < int , object > ，由于 int 不是引用类型，当然也就不是 object 或者 object 的子类，于是不满足 TKey 的类型约束，于是编译器就报错了。

如果 TKey 的前面不声明 object ，会怎么样？还是会报错。

因为在 Add ( TKey key , TValue value ) 方法里调用了 key.GetHashCode() 方法，调用方法意味着必须是引用类型（对象类型），所以编译器会要求 Dictionary 的定义里要声明 TKey 的类型，且 TKey 的类型必须是引用类型（对象类型）。

这也有点呵呵。

IntBox override（重写）了 Object 类的 GetHashCode() 方法，用于返回 IntBox 包装的 int 值的 HashCode，不过 int 类型的 GetHashCode() 方法可能是最简单的了，直接返回 int 值就可以。 ^^

String 类会 override（重写） Object 类的 Equals(object o) 方法，并且会增加一个 Equals(string s) 方法， Equals( object o ) 方法内部会调用 Equals( string s ) 方法。 Equals ( object o ) 方法先判断 o 是不是 String 类型，如果不是，则返回 false，如果是，则调用 Equals( string s ) 判断是否相等。

D# 里用 “ == ” 号比较 2 个 String 的代码会被编译器处理成调用 Equals( string s ) 方法。

除了最底层的模块用 C 编写， D# / ILBC 可以编写各个层次各个种类的软件，

用 C 写可以用 InnerC 写，只要符合 ILBC 规范， InnerC 写的代码就可以和 ILBC 程序集同质链接。

从这个意义来看， ILBC / InnerC 可以编写包括操作系统在内的各个层次各个种类的软件，

从这个意义来看， ILBC 是一个软件基础设施平台。

今天看了 C# 8.0 新特性 https://mp.weixin.qq.com/s?__biz=MzAwNTMxMzg1MA==&mid=2654074187&idx=1&sn=e0a6d9c963c3405dcae232a70434f225&chksm=80dbd11eb7ac58085d5357785cae13bbd4a3ccf92e876cd12c1f8faa9ada7629e5f8b2ff030e&mpshare=1&scene=23&srcid=#rd ，

可以看出， C# 8.0 标志着 C# 开始成为 “保姆型” 语言，而不是程序员的语言。

D# 将一直会是程序员的语言，这是 D# 的设计目标和使命。

补充一点， ValueBox 的使用小技巧，

在一段代码中， ValueBox 可以只 new 一个，然后重复使用。

ValueBox 有一个 public value 字段，就是 ValueBox 包装的值，对 value 字段赋上新值就可以重新使用了。

比如， IntBox ，有 public int value 字段，

IntBox i = new IntBox( 1 );

i.value = 2;

i.value = 3;

i.value = 4;

重复使用 ValueBox 可以减少 new ValueBox 和 GC 回收的开销。

有网友提议 D# 的名字可以叫 Dava ，这名字挺好听，挺美丽的，和女神（Diva）相近，好吧，就叫 Dava 吧， D# 又名 Dava 。

接下来我们讨论泛型原理 / 规范，

泛型在 ILBC 里和 C++ 类似，由高级语言编译器生成具体类型，

假设有一个 List<T> 类，这个类的 C 中间代码如下：

struct List<T>

{

T arr [ 20 ] ; // 20 是内部数组的初始化长度

int length = 0 ;

}

void List<T><>Add<>T ( List<T> * this , T element )

{

this -> arr [ this -> length ] = element ;

this -> length ++ ;

}

T List<T><>Get<>T ( List<T> * this , int index )

{

return this -> arr [ index ] ;

}

如果在代码中使用了

List<int> list1 = new List<int>();

List<string> list2 = new List<string>();

那么编译器会为 List<int> 生成一个具体类型 List~int 类，也会为 List<string> 生成一个 List~string 类，代码如下：

struct List~int

{

int arr [ 20 ] ; // 20 是内部数组的初始化长度

int length = 0 ;

}

void List~int<>Add<>int ( List~int * this , int element )

{

this -> arr [ this -> length ] = element ;

this -> length ++ ;

}

int List~int<>Get<>int ( List~int * this , int index )

{

return this -> arr [ index ] ;

}

struct List~string

{

string * arr [ 20 ] ; // 20 是内部数组的初始化长度

int length = 0 ;

}

void List~string<>Add<>string ( List~int * this , string * element )

{

this -> arr [ this -> length ] = element ;

this -> length ++ ;

}

int List~string<>Get<>int ( List~int * this , int index )

{

return this -> arr [ index ] ;

}

可以看出来，把泛型类型里的 List<T> 替换成具体类型（List<int>, List<string>），把 T 替换成泛型参数类型（int , string *）就是具体类型。

注意，值类型把 T 替换为值类型就可以，比如 int，引用类型要把 T 替换成引用（指针），比如 string * 。

这部分由高级语言编译器完成。

复杂一点的情况是，跨程序集的情况，假设有程序集 A , B ， A 引用了 B 里的 List<T> ，那 …… ？

这个需要把 List<T> 的 C 中间代码放在 B 的元数据文件（B.ild）里， A 引用 B.ild ，编译器会从 B.ild 中获取到 List<T> 的 C 中间代码，根据 List<T> 的 C 中间代码生成具体类型的 C 中间代码。

这好像又有点呵呵了。

不过这样看来的话，上文关于泛型对值类型和引用类型的不同处理好像没必要了。

上文举例的 Dictionary<object TKey , TValue> 要把 TKey 声明为 object ，

这其实已经没必要了。

public class Dictionary < TKey , TValue >

{

……

public void Add ( TKey key , TValue value )

{

int hash = key.GetHashCode() ;

……

}

}

如果在代码中写了

Dictionary< int , object > dic ;

则编译器会报错 “TKey 的具体类型 int 不包含 GetHashCode() 方法， int 是值类型，值类型不支持方法，建议改为引用类型。”

假设有 class Foo<T> ，代码如下：

class Foo<T>

{

void M1 ( T t )

{

t.Add();

}

}

Foo<A> foo = new Foo<A>();

A a = new A();

foo.M1 ( a ) ;

A 是引用类型（对象类型），如果 A 没有 Add() 方法，编译器会报错 “泛型参数类型 A 不包含 Add() 方法。”

我们还可以把代码改成：

class Foo<T>

{

T M1 ( T t )

{

return t ++ ;

}

}

Foo<int> foo = new Foo<int>();

int i = 0 ;

int p = foo.M1 ( i ) ;

这可以编译通过，因为 int 支持 ++ 运算符，实际上，只要支持 ++ 运算符的类型都可以使用 Foo<T> ，或者说，只要支持 ++ 运算符的类型都可以作为 Foo<T> 的泛型参数类型 T 。

其实说白了，你按照 C++ 模板来理解 ILBC 泛型就可以了。哈哈哈哈

接下来讨论继承，继承就是继承基类的字段和方法，进一步是重写虚方法。

我们先来看继承基类的字段和方法，

假设

class A1

{

int f1;

}

class A2 : A1

{

int f2;

}

那么， A2 占用的内存空间就是 A1 的空间加上 A2 的空间，就是 f1 和 f2 的空间，

因为 f1, f2 都是 int ，假设 int 是 4 个字节，那么 f1 , f2 共占用 8 个字节的空间，这就是 A2 占用的空间。

所以 new A2() 的时候，就是先从堆里申请 8 个字节的空间，然后再调用 A2 的构造函数初始化， A2 的构造函数会先调用 A1 的构造函数初始化。

假设 A3 继承 A2， A2 继承 A1 ，那么 new A3() 时会先申请 A3 的空间，然后调用 A3 的构造函数， A3 的构造函数是这样：

A3( A3 * this)

{

A2( this );

A3 的初始化工作

}

A2( A2 * this)

{

A1( this );

  A2 的初始化工作

}

A1( A1 * this)

{

  A1 的初始化工作

}

可以看出，会沿继承链依次调用基类的构造函数。

如果基类在另一个程序集里，那么对基类构造函数的调用会编译成动态链接的方式，和普通方法的动态链接一样。

对于方法的继承，编译器会把调用基类方法的地方直接编译成调用基类方法，传入子类对象的 this 指针，这个跟基类对象调用本身的方法一样。

如果是基类在另一个程序集里，就会编译成动态链接的方式，跟基类对象调用本身的方法仍然一样。

对于虚方法，假设有程序集 A , B， B 里有 A1 , A2 类， A2 是 A1 的子类，并 override（重写）了 M1() , M2() 方法。

虚方法通过引用实现，引用里有一个字段是虚函数表。

所以，我们要对引用做一点改进，

之前我们在 C 中间代码里写的引用都是指针，但为了实现虚方法，需要把引用改进成一个结构体：

struct ILBC<>Reference

{

void * objPtr ; // 对象指针

void * virtualMethods ; // 虚函数表指针

}

A 里的代码：

A1 a = new A2();

a.M1();

这段代码会编译成：

ILBC<>Reference a ; // 创建引用 a

a.objPtr = ILBC_gcNew( sizeof(ILBC<>Class<>A2 ) ) ; // 给 A2 对象分配空间

(* ILBC<>Class<>A2<>Constructor) ( a.objPtr ) ; // 调用 A2 构造函数初始化 a

a.virtualMethods = ILBC_GetVirtualMethods( "B.A2", "B.A1" ); // 写入 A2 对于 A1 虚函数表指针

( * ( a.virtualMethods [ ILBC<>Class<>A1<>VirtualMethodNo<>M1 ] ) ) ( ) ; // 调用 a.M1() ;

// ILBC<>Class<>A1<>VirtualMethodNo<>M1 是一个全局变量，保存 A1.M1() 方法的虚方法号，虚方法号由 ILBC 在加载 A1 类时产生并写入这个全局变量

以上就是编译器产生的代码。

ILBC_GetVirtualMethods( "B.A2", "B.A1" ) 方法返回 A2 对于 A1 的虚函数表指针，

参数 "B.A2" 表示 A2 的全名， "B.A1" 表示 A1 的全名，全名包含了名字空间。

ILBC_GetVirtualMethods( subClassFullName, baseClassFullName ) 方法是 ILBC 调度程序提供的 ILBC 系统方法，

这个方法会先根据 subClassFullName, baseClassFullName 查找子类对于父类的虚函数表是否存在，如果不存在，则生成一份，下次直接返回。

虚函数表是一个数组，数组元素是子类对于父类虚函数重写的函数的地址， ILBC 在加载类时会对类的虚函数排一个序，然后对于该类的每个子类的虚函数表，都按照这个顺序把相应的虚函数重写的函数的地址放到数组（虚函数表）里。

如果子类没有重写函数，则存放基类的函数地址。

虚函数排序的序号（从 0 开始）就是虚方法号（VirtualMethodNo），

以虚方法号作为下标（index）从虚函数表里取出的就是这个虚方法的函数地址。

加载类是在 ILBC_GetType( assemblyName, className ) 方法里进行的，实际上应该改成 ILBC_GetType( classFullName ) ，因为 classFullName 已经包含了名字空间，不需要 assemblyName 了，事实上在 ILBC 运行时对于类（Class）的识别就是用 Full Name，不需要涉及 assemblyName ，也可以说，在一个运行时内，不能有相同 Full Name 的 2 个类，不管这 2 个类是不是在一个程序集里。

ILBC_Type( classFullName ) 方法会检查类是否已加载，如果已加载就直接返回 ILBC_Type * ，如果没有则加载并返回 ILBC_Type * 。

ILBC_GetVirtualMethods( “B.A2”, "B.A1" ) 方法会查找 A1 中所有的虚方法，排一个序，并创建一个长度等于虚方法个数的数组（虚方法表），然后从 A2 中按名称逐个查找 A2 对虚方法的重写实现的函数地址，按顺序填入虚方法表中，如果未重写，则直接使用基类的实现，即填入基类的函数地址。

比如 A2 继承 A1， A1 继承 Object ， A2 重写了 Object.GetHashCode() 方法，那么 A2 对于 A1 的虚函数表中 GetHashCode() 方法对应的位置就会写入 A2.GetHashCode() 的函数地址，

如果 A1 重写了 Object.GetHashCode() 而 A2 未重写，则会填入 A1.GetHashCode() 的函数地址，

如果 A1 A2 都没有重写 Object.GetHashCode() ，则会填入 Object.GetHashCode() 的函数地址。

也就是说， ILBC 会沿着继承链向上查找虚函数的重写实现。

比如有以下继承关系：

A3 -> A2 -> A1 -> Object

又有这样的代码：

A1 a1 = new A3();

A2 a2 = new A3();

A3 a3 = new A3();

对于引用 a1 ， a1.virtualMethods 应该是 “A3 对于 A1 的虚函数表”，

什么是  “A3 对于 A1 的虚函数表”，就是 “A3 对象以 A1 的身份运行” 的虚函数表。

所以 a1.virtualMethods 指向的虚函数表应包含 A1 的全部虚方法，

a2.virtualMethods 指向的虚函数表应包含 A2 的全部虚方法，

a3.virtualMethods 指向的虚函数表应包含 A2 的全部虚方法，

A1 的全部虚方法包括 A1 自己声明的虚方法和 Object 的虚方法，

A2 的全部虚方法包括 A2 自己声明的虚方法和 A1 的虚方法和 Object 的虚方法。

A3 的全部虚方法包括 A3 自己声明的虚方法和 A2 的虚方法和 A1 的虚方法和 Object 的虚方法。

所以，虚函数表里的方法也是沿着继承链向上查找的。

接口也是一样的处理方式。

比如

IFoo foo = new A();

表示 A 对象 foo 以 IFoo 的身份运行。

接口可以区分显示实现和隐式实现，这在元数据中可以区分，在创建虚函数表查找元数据的时候可以判断出来。

可以看出，查找和创建虚函数表用到较多根据名字查找成员的操作，所以前文在动态链接的篇幅也提到可以用 HashTable 来实现快速查找，提升反射和动态链接的效率。

查找和创建虚函数表也是反射和动态链接。

我们还可以顺便看一下 Object 类的结构：

struct Object

{

ILBC_Type * type ; // 类型信息

char lock ; // 用于 IL Lock ，当锁定该对象时， lock 字段写入 1，未锁定时 lock 字段是 0

}

昨天一群网友嚷嚷着 “没有结构体（Struct）是如何如何的糟糕，，” ，

ILBC 可以支持结构体，这很容易，结构体有方法，可以继承，但不能多态。

不能多态是指结构体不能声明虚方法，子类结构体也不能重写基类结构体的方法。

加入结构体可以让程序员自己选择栈存储数据还是堆存储数据，可以由程序员自己决定这个设计策略或者说架构。

这很清晰。

目前不打算让 Struct 支持可为空（Nullable）类型，即 Struct ? 类型，可以用一个字段来表示初始等状态，

如果实在想要 null ，那就用 Class 吧， Oh ……

Struct 通过关键字 struct 声明，不继承 ValueType，也不继承 Struct，实际上也没有 ValueType , Struct 这样的基类。

在 ILBC 里， “一切都是对象是不成立的” ，对象（Class）只是数据类型的一种。

DateTime 可以用 Struct 来实现，因为 DateTime 可能就是一个 64 位整数，表示公元元年到某时的 Ticks 数，

如果是这样的话，如网友所说 “引用都比 Struct（DateTime）大” 。

讨论到这里，可以看出来， C# 为了实现 “一切都是对象” 付出了多大的代价，

而且 C# 还支持 Struct 可以是可为空（Nullable）类型，这让人无语，只想呵呵。 ^^ ^^ ^^

到目前为止， ILBC 里的数据类型有 3 种：

1 简单类型（值类型）， int long float double char 等等

2 结构体 Struct （值类型）

3 对象 Class （引用类型）

值类型的优点是：

1 一次寻址，不需要通过引用二次寻址

2 只包含值，不包含类型信息等数据，不冗余

3 存储在栈空间，分配快不需要回收，事实上对于静态分配的栈变量，函数入栈的时候修改了栈顶，则该函数中所有的栈变量都被分配了。

现在有个问题是，一个参数是值类型的方法，如果要通过反射调用，怎么调用？

反射需要把参数放到 object[ ] 数组， object[ ] 数组的元素是引用。

我怀疑 C# 中把 Struct 放到 object[ ] 里时，会对 Struct 装箱。

所以我们也可以对 Struct 进行装箱，可以用 ValueBox 对 Struct 装箱，比如：

[ ValueBox( typeof ( ABox ) ) ] // 告诉 ILBC 运行时 A Struct 对应的 ValueBox 是 ABox

struct A

{

}

class ABox : ValueBox<A>

{

}

ValueBox 是一个泛型类，由 ILBC 基础库提供，代码如下：

class ValueBox<T>

{

T value ;

}

那么，在动态传递参数的场合，比如：

void Foo( object o )

{

……

}

可以这样写：

void Foo ( object o )

{

Type type = o.GetType();

if ( type.IsValueBox ) // IsValueBox 是 Type 的属性，如果 Type 表示的类型是 ValueBox 或者 ValueBox 的子类，则 IsValueBox 返回 true

{

Type valueType = type.GetValueType() ; // GetValueType() 方法是 Type 的方法，如果 Type 表示的类型是 ValueBox 或者 ValueBox 的子类，则返回 ValueBox 包装的值的类型，即 value 字段的类型



if ( valueType == typeof(int) ) // typeof(int) 返回的 Type 对象由编译器生成

// do something for int

else if ( valueType == typeof(A) ) //    typeof(A) 返回的 Type 对象由编译器生成

// do something for A Struct

else if ( …… )

……

return ;

}

// do something for Object （引用类型）

}

我们可以这样调用 Foo() 方法：

Foo ( 1 );

A a = new A() ; // A 是 Struct

Foo ( a );

Foo ( "a string" ) ;

Person person = new Person() ; // Person 是 Class

Foo ( person ) ;

对于反射的情况，可以这样写：

class Class1

{

void Foo ( Struct1 s1 )

{

……

}

}

MethodInfo mi = typeof ( Class1 ).GetMethod( "Foo" ) ;

Struct1 s1 = new Struct1() ;

Struct1Box s1Box = new Struct1Box( s1 ) ;

mi.Invoke ( new object [ ] { s1Box } ) ;

把 s1 装箱到 s1Box 里，再把 s1Box 放到 object [ ] 里，这样 MethodInfo 内部会 “拆箱” 把 s1 传给 Foo() 方法。

如果直接把 s1 放到 object [ ] 里，比如 new object [] { s1 } 会怎么样？会编译报错 “s1 不是对象，不能转换为 object 类型，请考虑用 ValueBox 装箱。” 。

把反射调用方法的参数放到 object [ ] 数组里传入，这一方面是为了统一处理，另一方面也是为了安全，引用是一个固定格式的 Struct，所以 ILBC 可以安全规范的从 object [ ] 中访问每个引用。如果可以直接传递值的话， object [ ] 就会变成 C 的 void * 的情况， void * 容易导致访问内存错误，比如方法访问的地址已经超过了对象的地址范围，或者访问了错误的地址（比如访问 A 字段可能变成了访问 B 字段，或者是把 B 字段中的某个字节的地址作为 A 字段的首地址）。这会造成意想不到的错误或者程序崩溃。也可能被用于攻击。

而在上面 Foo( object o ) 方法里，如果 o 参数实际传入的是 IntBox 的话，

那么，会这样取出里面的 int 值：

Type type = o.GetType () ;

if ( type.IsValueBox )

{

Type valueType = type.GetValueType() ;

if ( valueType == typeof ( int ) )

{

IntBox iBox = ( IntBox ) o ;

int i = iBox.value ; // 取出 int 值

}

}

值类型（int long float double char 结构体）在内存空间里是不包括类型信息的，只单纯的存储值，这是为了执行效率。

但是，没有类型信息的运行期类型转换是不安全的，因为不能检查类型，跟上面假设的反射参数通过 void * 传入的情形一样，会造成内存的错误访问，

但是， ILBC 巧妙的避开了这一点。

首先，编译期类型转换，这个可以由编译器检查，这没有问题。

运行期类型转换，就像上面的代码，

IntBox iBox = ( IntBox ) o ;

int i = iBox.value ; // 取出 int 值

是把 object o 转换成 IntBox ， IntBox 是对象，有类型信息，可以类型检查，所以 IntBox iBox = ( IntBox ) o ; 是安全的。

这其实就是一个正常的引用类型的类型转换。

转换为 IntBox iBox 后， iBox.value 是明确的 int 型，这就可以安全的使用了。

那如果把 o 转换成 ValueBox 会怎样？

ValueBox vBox = ( ValueBox ) o ;

int i = vBox.value ; // 取出 int 值

这样编译时会报错 “不能把泛型参数 T 类型的 vBox.value 字段赋值给 int 类型的 i 变量。” ，

如果对 vBox.value 转型，转型成 int ：

ValueBox vBox = ( ValueBox ) o ;

int i = ( int ) vBox.value ; // 取出 int 值

这样编译时会报错 “不能把泛型参数 T 类型的 vBox.value 字段转型为 int 类型。” 。

我突然觉得 D# Dava 还可以叫 D++ 。哈哈哈哈

上面提到用 ValueBoxAttribute [ ValueBox ( typeof ( ABox ) ) ] 来声明 ABox 作为 A Struct 的 ValueBox，

实际上这没必要， ILBC 可以提供一个 ValueBox 基类， ValueBox<T> 继承 ValueBox 类，那么 ValueType<T> 的具体类型也继承于 ValueBox，

所以， ILBC 只要判断 ABox 是否是 ValueBox 的子类，就可以知道 ABox 是不是 ValueBox，

同时，通过 ValueBox<T> 的泛型参数 T 可以知道 value 的类型。

在反射调用方法的时候，如果传给 MethodInfo 的 Invoke( object [ ] args ) 的 args 数组里包含了 ValueBox 类型的参数，

ILBC 会取出 ValueBox<T> 的 T value 字段的值传给 MethodInfo 包含的方法，

那么，怎么从不同的 ValueBox 里来取出 value 字段的值呢？

比如 IntBox, ABox, DateTimeBox ，

这需要在元数据 ILBC_Type 增加 2 个字段：

struct ILBC_Type

{

……

int valueOffset ; // value 字段的偏移量

int valueSize ; // value 字段的大小

}

对应的 ValueType 的 classLoader 里要增加一段代码，取得当前类型的 value 字段的偏移量和大小，写入当前类型的 ILBC_Type 结构体的 valueOffset , valueSize 字段。

比如，以 IntBox 为例， IntBox 的 classLoader 里会增加这样一段代码：

ILBC_Type * type = ILBC_gcNew( sizeof ( ILBC_Type ) ) ;

……

type -> valueOffset = offsetOf ( IntBox, value ) ; // offsetOf 是 InnerC 提供的关键字，用于取得结构体字段的偏移量

type -> valueSize = sizeOf ( IntBox ) ;

当加载 IntBox 类时，会调用 classLoader，这段代码也会执行，这样就把 IntBox 的 value 字段的偏移量和大小都记录到 IntBox 的元数据 ILBC_Type 中了。

ILBC 的 MethodInfo.Invoke( object [ ] args ) 方法里的代码是这样：

ILBC_Reference o = object [ 0 ] ;

……

int offset = o.type -> valueOffset ; // value 字段在 ValueBox 里的偏移量

int size = o.type -> valueSize ; // value 字段在 ValueBox 里的大小

// 根据 offset 和 size 取出 value 字段的值

以上是代码。

可以看出，以上过程比在代码中

IntBox iBox = new IntBox( 1 );

int i = iBox.value;

强类型直接取得 value 要多 2 次寻址，会增加一些性能损耗。

通过上述设计，程序员可以自由的定义 ValueBox，一个 Value 类型可以有任意多个 ValueType ，

比如 ILBC 基础库提供了 IntBox, DateTimeBox，开发者还可以自己定义任意个 int , DateTiime 的 ValueBox 。

这样一来， ILBC 的数据类型数据结构的架构就打通了。

还有一个问题， ILBC_Type 是元数据，所以每个程序集编译的时候都要 include struct ILBC_Type 所在的头文件（.h 文件），

为什么每个程序集都要引用 ILBC_Type 的头文件？

因为 ILBC 调度程序在加载 Class 时是调用 classLoader 返回 ILBC_Type * ，就是说， ILBC_Type 结构体是在 classLoader 里创建和构造的。

而 classLoader 是属于程序集的，是高级语言编译器编译产生的，

如果程序集和调度程序之间，或者程序集之间的 ILBC_Type 的定义不一样，就会发生错误。

什么是定义不一样，比如 ILBC 2.0 的 ILBC_Type 比 ILBC 1.0 增加了一些字段，或者改变了字段的顺序。

这样，如果把 1.0 的程序集放到 2.0 的调度程序（运行时）里运行就会有问题，或者 2.0 和 1.0 的程序集放在一起使用，也会有问题。

通常，如果 2.0 增加了 ILBC_Type 的字段，那 1.0 的程序集放到 2.0 的调度程序（运行时）会有问题，因为 2.0 的调度程序可能越界访问内存，因为 1.0 的 ILBC_Type 没有 2.0 新增的字段， 2.0 调度程序对 1.0 的 ILBC_Type Struct 方法访问新增的字段就会越界。

如果 2.0 没有新增字段，但是改变了 C 源代码里 ILBC_Type 字段的顺序，那会造成 1.0 中 ILBC_Type 的字段偏移量和 2.0 的字段偏移量不一致，同样会造成字段数据的错误访问。

所以，为了解决这个问题，需要对 ILBC_Type 也进行动态链接，就是把当前调度程序（运行时）的各字段的偏移量告诉各程序集。

但是 ILBC 不会使用加载程序集和类时候的动态链接，而是会用一段专门的代码进行元数据对象比如 ILBC_Type 的动态链接。

ILBC 调度程序会提供 2 个方法：

iint ILBC_GetTypeSize() // 返回 ILBC_Type 的大小（Size）

ILBC_Type * ILBC_GetTypeFieldOffset ( fieldName ) // 返回 ILBC_Type 的名为 fieldName 的字段的偏移量

程序集可以调用这 2 个方法来获得当前 ILBC 调度程序（运行时）的 ILBC_Type 的大小（Size）和字段偏移量。

这会不会有点过度设计了？

查看全文

相关阅读:
BZOJ 2002: [Hnoi2010]Bounce 弹飞绵羊
 众王谈判三谈判
 众王谈判二来客
 众王谈判一陨星
 边缘长梦
 Lua笔记
 来从蜀国游 5
来从蜀国游 4
来从蜀国游 3
来从蜀国游 2

原文地址：https://www.cnblogs.com/KSongKing/p/10440001.html