测试平台为我的acer 5572ANWXCi笔记本,Core Duo T2250、945、1.5G DDR2、geforce 7300go 64bit 128M。
GPU | CPU | GPU* | CPU* | |
Joky.tif | 1.809444 | 28.306510 | 36.927075 | 12.229953 |
HDTV.tif | 7.248393 | 179.199637 | 465.021794 | 173.764878 |
单位为毫秒millisecond,加“*”表示回读GPU数据到内存。Joky.tif大小为300x400,120000 pixels。HDTV.tif大小为1920x1080,2073600 pixels。
测试结果表明,如果不回读,那么可以放心大胆的使用GPU计算。但是如果回读,那么速度将急剧下降。总线是一个原因,但估计更深层次的是GPU的工作机制以及设计。但是可以肯定的是,如果使用RM开发基于多核心的CPU比如CELL BE处理器的计算程序,那么带来的好处是及其明显的,避免了硬件编码优化工作,节省了人力物力,最重要的是可以获得相当不错的性能。
测试代码如下,其中CPU部分没有优化,但是打开了VC71的SSE2开关。














































































