zoukankan      html  css  js  c++  java
  • __builtin_expect -- 分支预测优化

    1.引言

    __builtin_expect说明

    这个指令是gcc(version >= 2.96)引入的,作用是允许程序员将最有可能执行的分支告诉编译器,让编译器告诉CPU提前加载该分支下的指令。

    写法为:__builtin_expect(EXP, N),表示的意思是:EXP == N的概率很大

    一般的使用方法是将_builtin_expect指令封装为likely和unlikely宏。这两个宏的写法如下

    #define likely(x)       __builtin_expect(!!(x), 1) //x很可能为真
    #define unlikely(x)   __builtin_expect(!!(x), 0) //x很可能为假

    首先我们要明确:

    if (likely(x))      //等价于if(x)
    if (unlikely(x))  //等价于if(x)
    
    __builtin_expect() 是 GCC (version >= 2.96)提供给程序员使用的,目的是将“分支转移”的信息提供给编译器,这样编译器可以对代码进行优化,以减少指令跳转带来的性能下降。
    __builtin_expect((x),1)表示 x 的值为真的可能性更大;
    __builtin_expect((x),0)表示 x 的值为假的可能性更大。
    也就是说,使用likely(),执行 if 后面的语句的机会更大,使用 unlikely(),执行 else 后面的语句的机会更大。通过这种方式,编译器在编译过程中,会将可能性更大的代码紧跟着起面的代码,从而减少指令跳转带来的性能上的下降。

    int x, y;
     if(unlikely(x > 0))
        y = 1; 
    else 
        y = -1;
    上面的代码中 gcc 编译的指令会预先读取 y = -1 这条指令,这适合 x 的值大于 0 的概率比较小的情况。如果 x 的值在大部分情况下是大于 0 的,就应该用 likely(x > 0),这样编译出的指令是预先读取 y = 1 这条指令了。这样系统在运行时就会减少重新取指了。
     我们可以直接给出测试程序
     1 #include <stdio.h>
     2 #define likely(x)    __builtin_expect(!!(x), 1)
     3 #define unlikely(x)  __builtin_expect(!!(x), 0)
     4 
     5 int main(void) {
     6     int x = -1, y;
     7     if (likely(x > 0)) {
     8         y = 1;
     9         printf("x > 0
    ");
    10     } else {
    11         y = -1; 
    12         printf("x <= 0
    ");
    13     }   
    14     printf("y = %d
    ", y); 
    15     return 0;
    16 }

    ydq@ubuntu:20201017$ vi 4.test.c
    ydq@ubuntu:20201017$ g++ 4.test.c
    ydq@ubuntu:20201017$ ./a.out
    x <= 0
    y = -1

    到了这里,也许你会觉得有点奇怪,为啥我明明可以直接用法if(x > 0)去进行判断,为啥还要那么大花力气去定义likely用去调__builtin_expect函数呢?这里其实涉及到CPU和高速缓存如何去处理指令的知识了,这里我们简单介绍一下(其实具体我也不是很清楚,只能讲解一下我自己大概的理解~v~),对于我们编写的C语言程序,编译器需要把C程序转化为机器指令,这样才能够让CPU处理这些指令,并执行我们C程序最终的功能,这里多核CPU是有并行能力去处理这部分代码的,我们知道CPU的频率远高于高速缓存的频率,所以两者对指令的处理能力不不同步的,为了不让CPU停下来休息,我们要求高速缓存要提前加载机器指令,而分支语句会让CPU的并行处理能力大打折扣,因为高速缓存无法预测分支语句的条件,从而提前去加载具体条件下的分支语句指令,故编译器为我们实现__builtin_expect函数,让我们人为的提前高速编译器,那个分支条件为真,让高速缓存有能力“预测”自己要提前加载那个分支语句的指令,这样就可以充分利用CPU的并行能力了。下面我们给出我们实际的运用。
     1 #include <stdio.h>
     2 #include <stdbool.h>
     3 
     4 int IsPalindrome(int x) {
     5     if (__builtin_expect(!!(x < 0), 0)) { //这里用条件__builtin_expect(!!(x < 0)),去替代if (x < 0),让我们提前告诉CPU和缓存传入的x大概率不小于0,让缓存可以提前加载第9行的代码翻译过来的指令
     6         return false;
     7     }   
     8 
     9     int y = 0, z = x;
    10     while (x) {
    11         y = y * 10 + x % 10; 
    12         x /= 10; 
    13     }   
    14     return z == y;
    15 }
    16 
    17 int main(void) {
    18     int n;
    19     while (scanf("%d", &n) != EOF) {
    20         if (IsPalindrome(n)) {
    21             printf("%d is palindrome
    ", n); 
    22         } else {
    23             printf("%d is not palindrome
    ", n); 
    24         }
    25     }   
    26     return 0;
    27 }

    所以以上代码可以让我们上述判断回文整数的程序执行速度更快,效率更高。

    部分内容的作者和出处来自如下:
    作者:大明白
    链接:https://www.jianshu.com/p/2684613a300f
    来源:简书



     

  • 相关阅读:
    基于struts2和hibernate的登录和注册功能——完整实例
    (转载)Hibernate的事务管理
    (转载)hibernate缓存
    Hibernate映射解析——七种映射关系
    Hibernate核心组件详解
    Struts2国际化——完整实例代码
    Struts2的手工自定义验证--完整实例代码
    Struts2内置校验器——完整实例代码
    Struts2自定义拦截器——完整实例代码
    Struts2工作原理及流程
  • 原文地址:https://www.cnblogs.com/ydqblogs/p/13832051.html
Copyright © 2011-2022 走看看