zoukankan      html  css  js  c++  java
  • RGB2GRAY 各种算法速度比较,整形乘法比查表法快!

    1.  查表法,外循环用 这种格式 : 
    //for(int j = 0; j != h; ++j)// for(int i = 0; i!=w;++i)//、

    		for(int j = 0; j != h; ++j)
    			for(int i = 0; i!=w;++i)
    		{
    			int r,g,b,y,r1,g1,b1,y1;
    			r = D[in[of3]];//查表 //这里给第一个ALU执行
    			g = E[in[of3+1]];
    			b = F[in[of3+2]];
    			y = r + g + b;
    			out[of] = y;
    			of3 +=3;
    			of+=1;
    		}


    耗时: 1000ms



    2. 查表法, 外循环用这种格式 :  for(int i = 0; i != img_size; ++i)

    		for(int i = 0; i != img_size; ++i)
    		{
    			int r,g,b,y,r1,g1,b1,y1;
    			r = D[in[of3+2]];//查表 //这里给第一个ALU执行
    			g = E[in[of3+1]];
    			b = F[in[of3]];
    			y = r + g + b;
    			out[i] = y;
    			of3 +=3;
    		}

    耗时 700ms


    3.  整形乘法, 1ALU

    		for(int i = 0; i != img_size; ++i)
    		{
    			int r,g,b,y,r1,g1,b1,y1;
    			r = 1224 * in[of3+2];
    			g = 2404 * in[of3+1];
    			b = 467 * in[of3];
    			y = r + g + b;
    			y = y >> 12; //这里去掉了除法运算
    			out[i] = y;
    			of3 +=3;
    		}


    耗时: 550ms


    4. 整形乘法 : 2ALU

    		for(int i = 0; i != img_size; i+=2) //一次并行处理2个数据
    		{
    
    			int r,g,b,y,r1,g1,b1,y1;
    
    			r = 1224 * in[of6+2];
    			g = 2404 * in[of6+1];
    			b = 467 * in[of6];
    			y = r + g + b;
    			y = y >> 12;
    			out[i] = y;
    
    			r1 = 1224 * in[of6+5];
    			g1 = 2404 * in[of6+4];
    			b1 = 467 * in[of6+3];
    			y = r1 + g1 + b1;
    			y = y >> 12;
    			out[i + 1] = y;
    			of6 += 6;
    			//of  += 1;
    		}
    耗时:450ms


    5. 根据实验,发现bgr2y 函数是否加inline 对耗时无明显影响, 为了保险,还是应该加上inline。



    思考:

    1. 2ALU算法比1ALU算法快10%~25%

    2.整形乘法法比查表法快 18%,至于为什么会比查表法快,是因为现在的CPU使用的都是硬件乘法器,比操作内存要快!!


  • 相关阅读:
    快速幂 快速乘法
    扩展欧几里得学习笔记
    求逆序数数目(树状数组+离散化)
    隐式图的遍历
    随机数生成
    推倒重来
    动态规划初步
    子集生成
    东大oj1155 等凹函数
    P1278 单词游戏
  • 原文地址:https://www.cnblogs.com/luoyinjie/p/7219310.html
Copyright © 2011-2022 走看看