昨天看到王垠的一篇旧文,自称找到了一个编译器的Bug。
内容是这样的,考虑如下代码:
void foo(int *p) { int x = *p; if (p == NULL) ... puts("Hello!"); }
王垠说,编译器会把它优化成这样(我猜多半是-O3)
void foo(int *p) { puts("Hello!"); }
并指出:这样不对啊!if里面的错误处理都被去掉了!
实际上编译器是对的。
int x = *p;
这一句里面,如果p非法,那就产生一个未定义行为(UB,Undefined Behaviour)。
UB是什么意思呢?未定义就是未定义!你的电脑爆炸都有可能!
所以,编译器把你后面的语句优化掉,不也是【未定义】吗?
解释完了,下面来说一下编译器的优化逻辑。
void foo(int *p)
{
int x = *p;
if (p == NULL)
...
puts("Hello!");
}
首先,编译器看到人写了第一句
int x = *p;
所以编译器假定:p指向合法
既然p合法,所以就把if (p == NULL)优化掉,因为这个不可能发生
然后代码变成了
void foo(int *p) { int x = *p; puts("Hello!"); }
接着,编译器注意到x没有用到,所以把这一行也优化掉,然后就变成了如上这样子。
void foo(int *p)
{
puts("Hello!");
}
这能怪编译器吗?
举一个极端的例子,我们写宏的时候会用 do ... while (0),自然是希望编译器把这个判断while (0)给优化掉的。
但是,如果人运行时用指针把code段的这个0修改掉了呢?呵呵,那编译器不就优化错了!