科学计算显卡的几个主要性能指标:
1、运算能力:FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算;
2、计算性能:
3、显存大小:显存大小也决定了实验中能够使用的样本数量和模型复杂度。
4. cuda 核心数量
1、CUDA compute capability对比(computer capability 并不代表显卡的计算能力,主版本号说明GPU的架构,副版本号相当于更新的版本)
GTX Titan x :5.2
GTX 980 :5.2
Tesla P100 :
Tesla K80 :3.7
Tesla K40 :3.5
K4200 : 3.0
2、计算性能(TFLOPS) 比较
单精度single 双精度double
GTX Titan x : 7 0.2
GTX 980 : 4.6 0.15
Tesla P100 : 10.6 5.3
Tesla K80 : 8.73 2.91
Tesla K40 : 4.29 1.43
K4200 : 2.0
单精度能够保证小数点后6到7位计算准确(2^23),双精度则是14到15位(2^52)
3、显存大小
GTX Titan x :12Gb
GTX 980 :4Gb
Tesla P100 : 16G
Tesla K80 :24Gb
Tesla K40 :12Gb
K4200 :4Gb
4. cuda 核心数量
GTX Titan x
GTX 980
Tesla P100 : 3584
Tesla K80 : 4992
Tesla K40 : 2880
K4200
5、价格比较(网上商城京东淘宝报价)
GTX Titan x :8000+-
GTX 980 :6000+-
Tesla P100 : 45000++
Tesla K80 :33000+-
Tesla K40 :25000+-
K4200 :6000+-
1、GTX 系列显卡优缺点:
优点:单精度计算能力强大,显存最大12Gb,性价比高
缺点:双精度计算能力弱,没有计算纠错ECC 内存,对于超高精度计算不利
2、Tesla 或 quadro显卡优缺点:
优点:双精度计算能力最强,拥有ECC内存增强计算准确率,
缺点:单精度计算能力差,价格较高
总结:单从性能上选择,Tesla K80是最强大的,但也最贵;综合性价比来考虑 GTX Titan X 最好。