zoukankan      html  css  js  c++  java
  • 浅析C语言的非局部跳转:setjmp和longjmp

    作者:李恩华  写于2012.4.22日凌晨西甲国家德比之前

    C语言中有一个goto语句,其可以结合标号实现函数内部的任意跳转(通常情况下,很多人都建议不要使用goto语句,因为采用goto语句后,代码维护工作量加大)。另外,C语言标准中还提供一种非局部跳转“no-local goto",其通过标准库<setjmp.h>中的两个标准函数setjmplongjmp来实现。

    C标准库<setjmp.h>

    下面是KR的《C程序设计语言(第2 . 新版)》第232页给出的关于标准库<setjmp.h>的说明。

    8 非局部跳转<setjmp.h>
    
    头文件<setjmp.h>中的说明提供了一种避免通常的函数调用和返回顺序的途径,特别的,它允许立即从一个多层嵌套的函数调用中返回。
    
    8.1 setjmp
    
    #include <setjmp.h>
    int setjmp(jmp_buf env);
    
    setjmp()宏把当前状态信息保存到env中,供以后longjmp()恢复状态信息时使用。如果是直接调用setjmp(),那么返回值为0;如果是由于调用longjmp()而调用setjmp(),那么返回值非0。setjmp()只能在某些特定情况下调用,如在if语句、 switch语句及循环语句的条件测试部分以及一些简单的关系表达式中。
    
    8.2 longjmp
    
    #include <setjmp.h>
    void longjmp(jmp_buf env, int val);
    
    longjmp()用于恢复由最近一次调用setjmp()时保存到env的状态信息。当它执行完时,程序就象setjmp()刚刚执行完并返回非0值val那样继续执行。包含setjmp()宏调用的函数一定不能已经终止。所有可访问的对象的值都与调用longjmp()时相同,唯一的例外是,那些调用setjmp()宏的函数中的非volatile自动变量如果在调用setjmp()后有了改变,那么就变成未定义的。

    jmp_bufsetjmp.h中定义的一个结构类型,其用于保存系统状态信息。宏函数setjmp会将其所在的程序点的系统状态信息保存到某个jmp_buf的结构变量env中,而调用函数longjmp会将宏函数setjmp保存在变量env中的系统状态信息进行恢复,于是系统就会跳转到setjmp()宏调用所在的程序点继续进行。这样setjmp/longjmp就实现了非局部跳转的功能。

    一个简单的例子:

    下面我们来看一个简单的例子。

     1 #include <stdio.h>
     2 #include <setjmp.h>
     3 
     4 jmp_buf jump_buffer;
     5 
     6 void func(void)
     7 {
     8          printf("Before calling longjmp\n");
     9          longjmp(jump_buffer, 1);
    10          printf("After calling longjmp\n");
    11 }
    12 void func1(void)
    13 {
    14          printf("Before calling func\n");
    15          func();
    16          printf("After calling func\n");
    17 }
    18 int main()
    19 {
    20          if (setjmp(jump_buffer) == 0){
    21                    printf("first calling set_jmp\n");
    22                    func1();
    23          }else {
    24                    printf("second calling set_jmp\n");
    25          }
    26          return 0;
    27 }

    代码的运行结果如下

    lienhua34@lienhua34-laptop:~/program/test$ ./test
    first calling set_jmp
    Before calling func
    Before calling longjmp
    second calling set_jmp 

    通过上面这个简单例子的运行结果可以看出。main函数运行的setjmp()宏调用,将当前程序点的系统状态信息保存到全局变量jump_buffer中,然后返回结果0。于是,代码打印出字符串"first calling set_jmp",然后调用函数func1()。在函数func1中,先打印字符串"Before calling func",然后去调用函数func()。现在程序控制流转到func函数中,函数func先打印字符串“Before calling longjmp",然后调用函数longjmp这时候关键点到了!!!longjmp函数将main函数中setjmp()宏调用设置在全局变量jump_buffer中的系统状态信息恢复到系统的相应寄存器中,导致程序的控制流跳转到了main函数中setjmp()宏调用所在的程序点,此时相当于第二次进行setjmp()宏调用,并且此时的setjmp()宏调用的返回不再是0,而是传递给函数调用longjmp()的第二个参数1。于是程序控制流转到main函数中if语句的else部分执行,打印字符串“second calling set_jmp“。最后,执行main函数中的语句“reture 0;”返回,程序运行结束退出。

     

    从上面的运行过程,我们可以看出在longjmp()函数调用处的程序点嵌套在三层函数调用中:main, func1func,但是longjmp()函数调用导致程序控制流跳过函数调用funcfunc1,直接回到main函数中setjmp()宏调用所在的程序点,然后执行main函数中后续的语句,从而忽略了函数func1func中后续的语句部分。这就是非局部跳转。

    非局部跳转的实现机制

    C语言的运行控制模型,是一个基于栈结构的指令执行序列,表现出来就是call/return: call调用一个函数,然后return从一个函数返回。在这种运行控制模型中,每个函数调用都会对应着一个栈帧,其中保存了这个函数的参数、返回值地址、局部变量以及控制信息等内容。当调用一个函数时,系统会创建一个对应的栈帧压入栈中,而从一个函数返回时,则系统会将该函数对应的栈帧从栈顶退出。正常的函数跳转就是这样从栈顶一个一个栈帧逐级地返回。

     

    另外,系统内部有一些寄存器记录着当前系统的状态信息,其中包括当前栈顶位置、位于栈顶的栈帧位置以及其他一些系统信息(例如代码段,数据段等等)。这些寄存器指示了当前程序运行点的系统状态,可以称为程序点。在宏函数setjmp中就是将这些系统寄存器的内容保存到jmp_buf类型变量env中,然后在函数longjmp中将函数setjmp保存在变量env中的系统状态信息恢复,此时系统寄存器中指示的栈顶的栈帧就是调用宏函数setjmp时的栈顶的栈帧。于是,相当控制流跳过了中间的若干个函数调用对应的栈帧,到达setjmp所在那个函数的栈帧。这就是非局部跳转的实现机制,其不同于上面所说的call/return跳转机制。

     

    正是因为这种实现机制,在上面的标准库说明中提到:“包含setjmp()宏调用的函数一定不能终止”。如果该函数终止的话,该函数对应的栈帧也已经从系统栈中退出,于是setjmp()宏调用保存在env中的内容在longjmp函数恢复时,就不再是setjmp()宏调用所在程序点。此时,调用函数longjmp()就会出现不可预测的错误。 

    非局部跳转的运用

    非局部跳转通常被用于实现将程序控制流转移到错误处理模块中;或者是通过这种非正常的函数返回机制,返回到之前调用的函数中。

     

    最近,在我的毕业设计,我也采用了这种非局部跳转方式来实现错误处理机制。我的毕业设计是用C语言实现一个简单的scheme解析器,在该求值器对某个表达式的求值过程中可能遇到某个错误,导致这个表达式无效。此时,需要跳转到求值器的主循环开头,重新读取表达式,然后求值。于是,我的主循环框架就设计为:

    while (1){
         if (setjmp(jump_buffer) == 0){
             /*读取表达式
                求值表达式
                打印表达式的值
            */
         }else {
             /* 进行错误处理,初始化求值环境 */
        }
    }

    其中,jump_buffer是一个jmp_buf类型的全局变量。循环开始时,if语句的条件判断中,setjmp保存程序点信息到全局变量jump_buffer中,此时setjmp()宏调用返回值为0,然后开始读取、求值表达式。当表达式求值遇到错误时,通过执行函数调用

    longjmp(jump_buffer, 1);

    就可以跳转到主循环的setjmp()宏调用所在程序点,而此时setjmp()宏调用的返回值为1,于是进入else部分进行错误处理,初始化求值环境。

     

    上面只是我这两天为了实现我的毕业设计,而进行学习得到的一些知识。如有错误的地方,请各位看官指正,谢谢!

  • 相关阅读:
    序列化和反序列化&持久化
    基于qiankun微前端的部署方案
    【MySQL】Explain执行计划 type类型说明
    【ElasticSearch】index read-only
    【MybatisPlus】Wrappers条件构造器构造or条件查询
    【布隆过滤器】基于Resisson的实现的布隆过滤器
    Nacos源码分析(三): 心跳设计
    Nacos源码分析(二):服务端和客户端实例注册
    Nacos源码分析(一): Nacos源码环境搭建
    【linux】如何在linux中查找文件、进程
  • 原文地址:https://www.cnblogs.com/lienhua34/p/2464859.html
Copyright © 2011-2022 走看看