zoukankan      html  css  js  c++  java
  • C/C++ 可变参数函数的原理和应用

    标准 C 库 <stdarg.h>

      它接受一个格式字符串,并且后面跟随任意指定的参数,根据实际需要而确定入参的个数。

      实际上它的实现要依赖于一个标准 C 库 <stdarg.h>,standard argument(标准参数) 的意思。下面先稍为介绍一下 <stdarg.h>,或者在 C++ 中的 <cstdarg> 的功效:

       这实际上是一组初始化和调用可变参数的宏,下面先介绍一下可变参数表的调用形式以及原理:
       首先是参数的内存存放格式:参数存放在内存的堆栈段中,在执行函数的时候,从最后一个开始入栈。因此栈底高地址,栈顶低地址,举个例子如下:
       void func(int x, float y, char z);
       那么,调用函数的时候,实参 char z 先进栈,然后是 float y,最后是 int x,因此在内存中变量的存放次序是 x->y->z,因此,从理论上说,我们只要探测到任意一个变量的地址,并且知道其他变量的类型,通过指针移位运算,则总可以顺藤摸瓜找到其他的输入变量。
       然后是可变入参表格式,省略的参数用 ... 代替,但必须注意:
       1. 只能有一个 ... 并且它必须是最后一个参数;
       2. 不要只用一个 ... 作为所有的参数,因为从后面可以知道,这样你无法确定入参表的地址。
       举个例子,声明函数如下:
       void func(int x, int y, ...);
       然后调用:func(3, 5, 'c', 2.1f, 6);
       于是在调用参数的时候,编译器则不会检查实际输入的是什么参数,只管把所有参数按照上面描述的方法,变成实参堆放在内存中,在本例中,内存中依次存放 x=3, y=5, 'c', 2.1f, 6
       但是有一个需要注意的地方,这些东西只是紧挨着堆放在内存中,于是想要正确调用这些参数,必须知道他们确切的类型,并且我们也关心这个参数表实际的长度,然而不幸的是,这些我们无从得知。因此,这个解决办法决不是高明的,从某种程度上说,这甚至是一个严重的漏洞。因此,C++ 很不提倡去使用它。
       不过缺点归缺点,万不得已的时候我们还是得用,但是我们对里面输入变量的时候,应该对入参的类型有一个清醒的认识,否则这样的操作是很危险的。
       
    下面是 <stdarg.h> 对上面这一个思路的实现,里面重要的几个宏定义如下:
       typedef char* va_list; 
       void va_start ( va_list ap, prev_param );   /*初始化参数指针ap,将函数参数A右边第一个参数的地址赋给ap。 A必须是一个参数的指针,所以此种类型函数至少要有一个普通的参数。*/
       type va_arg ( va_list ap, type );  /* 获得ap指向参数的值,并使ap指向下一个参数,type用来指明下一个参数类型。*/
       void va_end ( va_list ap );
     

      其中,va_list 是一个字符指针,可以理解为指向当前参数的一个指针,取参必须通过这个指针进行。

     

    使用<stdarg.h>步骤

    <Step 1>

      在调用参数表之前,应该定义一个 va_list 类型的变量,以供后用(下面假设这个 va_list 类型变量被定义为ap);

    <Step 2>

      然后应该对 ap 进行初始化,让它指向可变参数表里面的第一个参数,这是通过 va_start 来实现的,第一个参数是 ap 本身,第二个参数是在变参表前面紧挨着的一个变量;

    <Step 3>

      然后是获取参数,调用 va_arg,它的第一个参数是 ap,第二个参数是要获取的参数的指定类型,然后返回这个指定类型的值,并且把 ap 的位置指向变参表的下一个变量位置;

    <Step 4>

      获取所有的参数之后,我们有必要将这个 ap 指针关掉,以免发生危险,方法是调用 va_end,他是输入的参数 ap 置为 NULL,应该养成获取完参数表之后关闭指针的习惯。

     

    例子

    #include <stdarg.h>
    #include <iostream>
    using namespace std;
    int max(int n, ...)
    { //定参 n 表示后面变参数量,定界用,输入时切勿搞错
    va_list ap; // 定义一个 va_list 指针来访问参数表
    va_start(ap, n); // 初始化 ap,让它指向第一个变参
    int maximum = -0x7FFFFFFF; // 这是一个最小的整数
    int temp;
    for(int i = 0; i < n; i++) {
    temp = va_arg(ap, int); // 获取一个 int 型参数,并且 ap 指向下一个参数
    if(maximum < temp) maximum = temp;
    }
    va_end(ap); // 善后工作,关闭 ap
    return maximum ;
    }
    // 在主函数中测试 max 函数的行为(C++ 格式)
    int main() {
    cout << max(3, 10, 20, 30) << endl;
    cout << max(6, 20, 40, 10, 50, 30, 40) << endl;
    }

    存在不足

    基本用法阐述至此,可以看到,这个方法存在两处极严重的漏洞:

    其一,

      输入参数的类型随意性,使得参数很容易以一个不正确的类型获取一个值(譬如输入一个float,却以int型去获取他),这样做会出现莫名其妙的运行结果;

    其二,

      变参表的大小并不能在编译时获取,这样就存在一个访问越界的可能性,导致后果严重的 RUNTIME ERROR。

     

    <stdarg.h> 的内部实现形式

    C语言通过几个宏实现变参的寻址。下面是linux2.18内核源码里这几个宏的定义,相信符合C89,C99标准的C语言基本都是这样定义的。

       typedef char *va_list;

    /*
       Storage alignment properties -- 堆栈按机器字对齐
    */
    #define _AUPBND            (sizeof (acpi_native_uint) - 1)
    #define _ADNBND            (sizeof (acpi_native_uint) - 1)

    /*
       Variable argument list macro definitions -- 变参函数内部实现需要用到的宏
    */
    #define _bnd(X, bnd)          (((sizeof (X)) + (bnd)) & (~(bnd)))
    #define va_arg(ap, T)        (*(T *)(((ap) += (_bnd (T, _AUPBND))) - (_bnd (T,_ADNBND))))
    #define va_end(ap)          (void) 0
    #define va_start(ap, A)        (void) ((ap) = (((char *) &(A)) + (_bnd (A,_AUPBND))))

       下面以x86 32位机为例分析这几个宏的用途
       要理解这几个宏需要对C语言如何传递参数有一定了解。与PASCAL相反,与stdcall 相同,C语言传递参数时是用push指令从右到左将参数逐个压栈,因此C语言里通过栈指针来访问参数。虽然X86的push一次可以压2,4或8个字节入栈,C语言在压参数入栈时仍然是机器字的size为最小单位的,也就是说参数的地址都是字对齐的,这就是_bnd(X,bnd)存在的原因。另外补充一点常识,不管是汇编还是C,编译出的X86函数一般在进入函数体后立即执行 
       push ebp
       mov ebp, esp
       这两条指令。首先把ebp入栈,然后将当前栈指针赋给ebp,以后访问栈里的参数都使用ebp作为基指针。
      
       一一解释这几个宏的作用。
       _bnd(X,bnd) ,计算类型为X的参数在栈中占据的字节数,当然是字对齐后的字节数了。acpi_native_unit是一个机器字,32位机的定义是:typedef u32 acpi_native_uint;
       显然,_AUPBND ,_ADNBND 的值是 4-1 == 3 == 0x00000003 ,按位取反( ~(bnd))就是0xfffffffc 。 
    因此,_bnd(X,bnd) 宏在32位机下就是 
       ( (sizeof(X) + 3)&0xfffffffc )
    很明显,其作用是--倘若sizeof(X)不是4的整数倍,去余加4。

       _bnd(sizeof(char),3) == 4 
       _bnd(sizeof(struct size7struct),3) == 8

     

    摘自百度百科,以及另外一边博文- -。

    有空自己再写多个例子。

  • 相关阅读:
    正则表达式
    正则表达式-量词
    正则表达式-字符组
    6月学习总结
    利用Magick和gs实现pdf到jpg的转换
    NGS Antenna Calibrations
    VS2017运行旧版本下的C程序工程
    C#.NET SQLite自适应32位/64位系统
    RAID1环境下外挂第三块硬盘
    修复 Fontconfig Error
  • 原文地址:https://www.cnblogs.com/guotao/p/2608872.html
Copyright © 2011-2022 走看看