A Simple Wrapper of DirectX Math

zoukankan html css js c++ java

A Simple Wrapper of DirectX Math
A Simple Wrapper of DirectX Math

关于DirectX Math
DirectX Math最初叫做XNA Math，是一个跨平台的C++数学库，全SIMD指令优化，目前的版本是3.03，支持x86，x64和arm平台，用于代替DX 9/10中的数学库。

为什么使用DirectX Math
如果你有足够的时间，精力和知识，并且坚定的认为自己写的数学库才是最好，那么可以忽略此文:)。根据gamasutra技术控做的详细介绍，基本上很难再比DXM的实现好了，并且它是完全跨平台的，只包含.h和.inl文件，就算是OpenGL程序也可以用，最后，DXM非常全面，实现了大部分常见的3D计算，甚至还包括了一个简单的碰撞检测库。

正确使用DXM
首先，用 #define _XM_NO_INTRINSICS_ 宏可以取消SIMD加速，生成普通指令，除非希望兼容非常，非常老的CPU，否则不应该使用该宏。虽然DXM对SIMD指令做了封装，你还是需要了解一点相关知识(请仔细阅读DXM文档)。DXM定义了大量常见的数据类型，但只为XMVECTOR 和XMMATRIX定义了各种数学操作。DXM所有的计算都基于XMVECTOR 和XMMATRIX。对x86平台，XMVECTOR的定义如下：
typedef __m128 XMVECTOR;

而XMMATRIX则是一组(4个) XMVECTOR。由于__m128在内存中需要严格的16 byte对齐，因此并不建议直接在程序中使用这两种类型保存数据，比如
Class Camera { XMVECTOR position; XMMATRIX viewMatrix; }
上面的代码基本上不会成功运行，32位下new并不保证16byte对齐，而且由于类成员布局的关系，其中的XMVECTOR也不一定是16byte对齐，访问以上数据，程序可能直接崩溃。因此，DXM定义了大量用来储存数据的类型，比如XMFLOAT4,XMFLOAT3,XMFLOAT4X4等:
Class Camera { XMFLOAT3 position; XMFLOAT4X4 viewMatrix; }
这些类型大部分只是float数组而已，因此不用考虑对齐问题，在需要计算时，再把他们转换为于XMVECTOR 或者XMMATRIX，比如：
XMFLOAT3 position; XMVECTOR myVector = XMLoadFloat3(position) //load to mmx register //perform calculate with SIMD ….. //… XMStoreFloat4(&position,myVector); //save to memory
显然，这种load/store模式确实很麻烦，简单计算两个向量的和也需要编写4,5行代码，于是DX开发组的程序写了一个名为SimpleMath的简单wrapper包含在DirectX Tool Kit中，为普通类型添加计算功能。然而，SimpleMath只是简单的包装了load，store而已：
struct Vector2 : public XMFLOAT2 { //......other member function float Dot( const Vector2& V ) const float LengthSquared() const; //…..other member function } inline float Vector2::Dot( const Vector2& V ) const { using namespace DirectX; XMVECTOR v1 = XMLoadFloat2( this ); XMVECTOR v2 = XMLoadFloat2( &V ); XMVECTOR X = XMVector2Dot( v1, v2 ); return XMVectorGetX( X ); }
这样的实现对于Float4来说也许有意义，但对于Float2来说就太笨重了，把2个Float2复制到mmx寄存器相加以后再保存到普通内存位置也许比直接用非SIMD指令相加还慢！此外对于SIMD计算来说，应该尽量减少load和unload，尽量把数据保存在寄存器中，比如在计算前把数据load为XMVECTOR，执行完一系列计算，最后再保存到普通位置，而不是每执行一次计算，就load/store一次
case 1: Load to XMVECTOR perform calc 1 perform calc 1 .. Perform calc n Store to Float4 case 2 Load to XMVECTOR Perform calc 1 Store to Float4 Load to XMVECTOR Perform calc 2 Store to Float4 …
两种不同写法，如果编译器没有特别优化的情况下，效率相差会很明显。因此，好的数学库还要有正确的使用方法，才会得到最好的性能。

FlameMath
FlameMath保留了SimpleMath的接口，但改进了一部分性能问题，替换了部分函数的实现，对于简单类型和轻量级计算，直接用普通指令，对于matrix等复杂计算，再使用SIMD。
inline float Float2::Dot( const Float2& V ) const { return (x * V.x + y * V.y); }
但是，FlameMath仍然不能避免不同计算间反复load/store的问题。因此，最佳方案应该是使用Float3,Float4等类型保存数据，对于轻量级简单计算，直接用FloatX的成员函数进行，对于需要连续进行的复杂计算，则应该把数据load为XMVECTOR等类型，直接用DXM函数计算，最后再store到FloatX中。FloatMath中的FloatX对应DXM和SimpleMath中的标量数据类型，Vector4和Matrix4x4则相当于XMVECTOR 和XMMATRIX。所有DXM中的函数以SimdMath类静态函数的方式提供。
Simpe Usage: Float2 v1; Float2 v2; Float2 result = v1 + v2; //done Advance usage Float2 f1; Float2 f2; Vector4 v1 = SimdMath.LoadFloat2(f1); Vector4 v2 = SimdMath.LoadFloat2(f2); Vector4 v3 = SimdMath. Vector2Normalize (v1); Vector4 v4 = SimdMath. Vector2Normalize (v2); Vector4 v5 = SimdMath. Vector2AngleBetweenNormals(v3,v4); Float result; SimdMath. StoreFloat(&result,v5); //done
ps:FlameMath所有代码都未经测试，使用时只需要包含FlameMath.h即可:)
https://files.cnblogs.com/clayman/FlameMath.rar
查看全文

相关阅读:
spring 源码解析一（bean定义）
IOC 容器中添加组件的方式
 spring 后置处理器
 .NetCore3.1 配置Kestrel端口的几种方式及优先级
 CESIUM空间中AB两点A绕B点的地面法向量旋转任意角度后新的A点坐标(A’)
Cesium坐标转换：根据两个坐标点（坐标点a、坐标点b）的经纬度，计算a点和b点的角度
 任意一个点A(x,y)围绕任意一个点B(a,b)旋转任意角度后的坐标值
 已知地球上的2点坐标，A和B，求A，B线上任意点位置。
centos6下mysql5.7.13制作rpm包
 sql 删除狐立帐户

原文地址：https://www.cnblogs.com/clayman/p/3053196.html