浮点峰值计算
定义:计算单位时间内,乘法和加法的最大总吞吐量,单位是GFLOPS或者TFLOPS。
如1:Sandy Bridge架构的理论浮点峰值就等于(8Mul + 8Add)* 核心频率 * 核心数:i7 2600k 是 (8+8)3.44=217.6 GFLOPS
如2:Haswell架构的理论峰值就等于2(port) * 8(AVX2) * 2(mul+add) * 频率 * 核心数
reference:https://zhuanlan.zhihu.com/p/28226956
[1] Intel® 64 and IA-32 Architectures Software Developer’s Manual
[2] Intel® 64 and IA-32 Architectures Optimization Reference Manual