[翻译] 编写高性能 .NET 代码--第五章通用编码与对象设计 -- 类 vs 结构体

zoukankan html css js c++ java

[翻译] 编写高性能 .NET 代码--第五章通用编码与对象设计 -- 类 vs 结构体
返回目录

本章介绍了本书其它部分未涉及到的一些编码和设计原则。包含了一些.NET的应用场景，有些不会造成太大危害，有些则会造成明显的问题。剩下的则根据你的使用方法会产生不同的效果。如果要对本章节出现的原则做一个总结，那就是：
过度的优化会影响代码的抽象
这意味着，当你希望更高的优化性能，你需要了解每个层次代码的实现细节。本章会有很多相关介绍。

类 vs 结构体

类的实例都是在堆上分配的，通过指针的引用进行访问。传递这些对象代价很低，因为它只是一个指针（4或者8直接）的拷贝。然而，对象也有一些固定开销：8或16字节（32或64位系统）。这些开销包括指向方法表的指针和用于其它目的同步字段。但是，如果通过调试工具查看一个空对象占用的内存，这会发现大了13或者24字节（32位或64位系统）。这是.NET的内存对齐机制导致的。

而结构体则没上面的开销，它的内存使用量就是字段大小的综合。如果结构体是方法（函数）里声明的局部变量，则它在堆栈上分配控件。如果结构体被声明为类的一部分，这结构体使用的内存这是该类的内存布局里的一部分（因此它会分配在堆上）。但你将结构体传递给方法（函数）时，他将对字节数据做复制。因为它不在堆上，结构体是不会导致垃圾回收的。

因此这里有一个折中。你可以找到各种关于结构体尺寸大小的建议，但这里我不会告诉你一个确切的数字。在大多数情况下，你结构体需要保持一个比较小的尺寸，特别是他们需要经常被传递，你需要保证结构体的大小不会造成太大的问题。唯一能确定的是，你需要根据自己的应用场景进行分析。

有些情况下，效率的差别还是蛮大的。当一个对象开销看起来不是很多，但是对比一个对象数组和结构体数组就可以看出差别。在32位系统下，假设一个数据结构包含16字节的数据，数组长度是100w。
使用对象数组占用的空间
8字节数组开销+
(4字节指针地址X1,000,000)+
((8字节头部+16字节数据)X1,000,000)
=28MB

使用结构体数组占用的空间
8字节数组开销+
(16字节数据X1,000,100)
=16MB

如果使用64位系统，对象数组则使用40MB，而结构体数组仍然是16MB。
可以看到，在一个结构数组中，相同大小的数据占用的内存小。随着对象数组里对象的增加，还会增加GC的压力。
除了空间，还有CPU效率问题。CPU有多级缓存。越靠近CPU的缓存越小，但访问速度也会更快，对于顺序保存的数据越容易优化。
对于一个结构体数组，他们在内存里都是连续的值。访问结构体数组里数据很简单，只要找到正确的位置就可以得到对应的值。这就意味着在大数组数据做迭代访问有巨大的差异。如果该值已经在CPU的告诉缓存中，它的访问速度是要比访问RAM要快一个数量级。

如果要访问对象数组里的某一项，需要先获得该对象的指针引用，再去堆里访问。迭代对象数组的时候，就会造成数据指针在堆里跳转，频繁更新CPU的缓存，进而浪费了很多访问CPU缓存数据机会。

在很多时候，通过改进数据保存在内存的位置，降低CPU访问内存的开销是使用结构体的一个主要原因，它可以显著的提升性能。

因为结构体使用的时候总是被复制，所以编码时要很小心，否则你会产生一些有趣的bug。例如下面的栗子，你是无法通过编译的：
```
struct Point
{
    public int x;
    public int y;
}

public static void Main()
{
    List<Point> points = new List<Point>();
    points.Add(new Point() {x = 1, y = 2});
    points[0].x = 3;
}
```
问题是在最后一行，你试图修改列表里Point元素的某个值，这个操作是不行的，因为points[0]返回的是原始值的一个副本。正确的修改值的方式是
```
Point p = points[0];
p.x = 3;
points[0] = p;
```
但是，你可以采取更严格的编码策略：不要修改结构体。一旦结构体创建，永远不要改变他的值。这可以消除了上面的编译问题，并简化了结构体的使用规则。
我之前提到，结构体应该保持小的体积，已避免花费大量的时间来复制他们，但是偶尔也会使用一些大的结构体。例如一个最终商业流程细节的对象，里面需要保存大量的时间戳：
```
class Order
{
    public DateTime ReceivedTime { get; set; }

    public DateTime AcknowledgeTime { get; set; }
    public DateTime ProcessBeginTime { get; set; }
    public DateTime WarehouseReceiveTime { get; set; }
    public DateTime WarehouseRunnerReceiveTime { get; set; }
    public DateTime WarehouseRunnerCompletionTime { get; set; }
    public DateTime PackingBeginTime { get; set; }
    public DateTime PackingEndTime { get; set; }
    public DateTime LabelPrintTime { get; set; }
    public DateTime CarrierNotifyTime { get; set; }
    public DateTime ProcessEndTime { get; set; }
    public DateTime EmailSentToCustomerTime { get; set; }
    public DateTime CarrerPickupTime { get; set; }
    // lots of other data ... 
}
```
为了简化代码，我们可以将时间的数据划分到自己的子结构里，这样我们可以通过这样的方式访问Order对象：
```
Order order = new Order(); 
Order.Times.ReceivedTime = DateTime.UtcNow;
```
我们可以把数据全部放到自己的类里：
```
    class OrderTimes
    {
        public DateTime ReceivedTime { get; set; }
        public DateTime AcknowledgeTime { get; set; }
        public DateTime ProcessBeginTime { get; set; }
        public DateTime WarehouseReceiveTime { get; set; }
        public DateTime WarehouseRunnerReceiveTime { get; set; }
        public DateTime WarehouseRunnerCompletionTime { get; set; }
        public DateTime PackingBeginTime { get; set; }
        public DateTime PackingEndTime { get; set; }
        public DateTime LabelPrintTime { get; set; }
        public DateTime CarrierNotifyTime { get; set; }
        public DateTime ProcessEndTime { get; set; }
        public DateTime EmailSentToCustomerTime { get; set; }
        public DateTime CarrerPickupTime { get; set; }
    }

    class Order
    {
        public OrderTimes Times;
    }
```
但是，这样会为每个Order对象引入额外的12或者24字节的开销。如果你需要将OrderTimes对象作为一个整体传入各种方法函数里，这也许是有一定道理的，但为什么不把Order对象传入方法里呢？如果你同时有数千个Order对象，则可能会导致更多的垃圾回收，这是额外的对象增加的引用导致的。
相反，将OrderTime更改为结构体，通过Order上的属性（例如：Order.Times.ReceivedTime）访问OrderTImes结构体的各个属性，不会导致结构体的副本（.NET会对这个访问做优化）。这样OrderTimes结构体基本上成为Order类的内存布局的一部分，几乎和没有子结构体一样了，你拥有了更加漂亮的代码。
这种技术确实违反了不可变的结构体原理，但这里的技巧就是将OrderTimes结构的字段视为Order对象的字段。你不需要将OrderTimes结构体作为一个实体进行传递，它只是一个代码组织方式。
查看全文

相关阅读:
winrt组件库（包括翻书组件）
WebRequest 获取网页乱码
 OpenNI结合Unity3D Kinect进行体感游戏开发(转)
python(pyqt)开发环境搭建
 win8开发wpf程序遇到的无语问题
 winrt 页面进入动画
 winrt 根据类型生成实例
 性能测试基础
 性能基础入门篇
 项目部署

原文地址：https://www.cnblogs.com/yahle/p/classvsstruct.html

[翻译] 编写高性能 .NET 代码--第五章 通用编码与对象设计 -- 类 vs 结构体

类 vs 结构体

[翻译] 编写高性能 .NET 代码--第五章通用编码与对象设计 -- 类 vs 结构体