柔性数组
1、允许结构中包含一个大小可变的数组,sizeof返回的这种结构大小不包括柔性数组的内存。
2、包含柔性数组成员的结构要使用malloc()函数进行内存的动态分配。分配的内存大于结构体的大小。
3、柔性数组的定义
typedef strcut type
{
int i;
int a[];
}type_a;
4、type_a *p=(type_a *)malloc(sizeof(type_a)+100*sizeof(int));
5、p->a[n]直接访问数组。
6、free释放内存
struct结构中的最后一个元素允许是未知大小的数组,但是柔性数组前面必须有一个其他成员。包含柔性数组成员的结构用malloc()函数进行内存的动态分配,并且分配的内存应该大于结构的大小。
sizeof(type)只有4.
type *p= (type*)malloc(sizeof(type)+100*sizeof(int));
p->a[n] 方便的访问数组。
在讲述柔性数组成员之前,首先要介绍一下不完整类型(incomplete type)。不完整类型是这样一种类型,它缺乏足够的信息例如长度去描述一个完整的对象。
6.2.5 Types
incomplete types (types that describe objects but lack information needed to determine their sizes).
C与C++关于不完整类型的语义是一样的。
基本上没有什么书介绍过不完整类型,很多人初次遇到这个概念时脑袋会一片空白。事实上我们在实际的工程设计中经常使用不完整类型,只不过不知道有这么个概念而已。前向声明就是一种常用的不完整类型:
class base;
struct test;
base和test只给出了声明,没有给出定义。不完整类型必须通过某种方式补充完整,才能使用它们进行实例化,否则只能用于定义指针或引用,因为此时实例化的是指针或引用本身,不是base或test对象。
一个未知长度的数组也属于不完整类型:
extern int a[];
extern不能去掉,因为数组的长度未知,不能作为定义出现。不完整类型的数组可以通过几种方式补充完整才能使用,大括号形式的初始化就是其中一种方式:
int a[] = { 10, 20 };
柔性数组成员(flexible array member)也叫伸缩性数组成员,它的出现反映了C程序员对精炼代码的极致追求。这种代码结构产生于对动态结构体的需求。在日常的编程中,有时候需要在结构体中存放一个长度动态的字符串,一般的做法,是在结构体中定义一个指针成员,这个指针成员指向该字符串所在的动态内存空间,例如:
struct test
{
int a;
double b;
char *p;
};
p指向字符串。这种方法造成字符串与结构体是分离的,不利于操作,如果把字符串跟结构体直接连在一起,不是更好吗?于是,可以把代码修改为这样:
char a[] = “hello world”;
struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );
strcpy( PntTest + 1, a );
这样一来,( char* )( PntTest + 1 )就是字符串“hello world”的地址了。这时候p成了多余的东西,可以去掉。但是,又产生了另外一个问题:老是使用( char* )( PntTest + 1 )不方便。如果能够找出一种方法,既能直接引用该字符串,又不占用结构体的空间,就完美了,符合这种条件的代码结构应该是一个非对象的符号地址,在结构体的尾部放置一个0长度的数组是一个绝妙的解决方案。不过,C/C++标准规定不能定义长度为0的数组,因此,有些编译器就把0长度的数组成员作为自己的非标准扩展,例如:
struct test
{
int a;
double b;
char c[0];
};
c就叫柔性数组成员,如果把PntTest指向的动态分配内存看作一个整体,c就是一个长度可以动态变化的结构体成员,柔性一词来源于此。c的长度为0,因此它不占用test的空间,同时PntTest->c就是“hello world”的首地址,不需要再使用( char* )( PntTest + 1 )这么丑陋的语法了。
鉴于这种代码结构所产生的重要作用,C99甚至把它收入了标准中:
6.7.2.1 Structure and union specifiers
As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.
C99使用不完整类型实现柔性数组成员,标准形式是这样的:
struct test
{
int a;
double b;
char c[];
};
c同样不占用test的空间,只作为一个符号地址存在,而且必须是结构体的最后一个成员。柔性数组成员不仅可以用于字符数组,还可以是元素为其它类型的数组,例如:
struct test
{
int a;
double b;
float c[];
};
应当尽量使用标准形式,在非C99的场合,可以使用指针方法。有些人使用char a[1],这是非常不可取的,把这样的a用作柔性数组成员会发生越界行为,虽然C/C++标准并没有规定编译器应当检查越界,但也没有规定不能检查越界,为了一个小小的指针空间而牺牲移植性,是不值得的。
简化版应用场景:有一串不同类型,不同大小的数据需要传输,某通信协议支持x byte的数据包长度,将这一串数据封装成不大于x byte的数据包依次传输,如何设计数据包的封装和解析?
设计数据包:为了方便对端解析,设计数据包有头部和数据两段,头部用结构体的元素表示,需要什么信息则添加一个元素定义,数据段用柔性数组,是为了保证头部和数据段得内存保持连续,如下所示:
[html] view plaincopyprint?
typedef struct node_s {
int type; /* 头部,可根据实际情况添加元素 */
int len; /* 头部,标识数据段已使用的长度 */
char value[0]; /* 数据段,柔性数组 */
} node_t;
所以,柔性数组实现扩展长度的结构体一句话概括就是:在结构体的最后加上一个长度为零的char数组。
用sizeof(node_t)可以发现,柔性数组是不占内存空间的。
如何添加一段数据到数据包呢?
1,初始化:
[cpp] view plaincopyprint?
#define MAX_INFO_SIZE (x - sizeof(node_t))
[cpp] view plaincopyprint?
node_t *nodeinfo;
char *mark;
node_info = (node_t *)malloc(sizeof(node_t) + MAX_INFO_SIZE);
if (node_info == NULL) {
mem_error();
}
[cpp] view plaincopyprint?
memset(node_info, 0, sizeof(node_t) + MAX_INFO_SIZE);
node_info->type = your_type;
node_info->len = 0;
mark = &node_info->value;
即是:申请一段内存,初始化,将数据段的标志位mark指向value地址,还没有添加数据,所以len为0;
2,添加数据
[cpp] view plaincopyprint?
for (data = x; data < y; data = next(x)) { <span style="white-space:pre"> </span>/* 遍历那串数据,简化版 */
len = get_data_len(data);
if (node_info->len + len <= MAX_INFO_SIZE) {
memcpy(mark, data, len);
mark += len;
node_info->len += len;
} else {
send(node_info); <span style="white-space:pre"> </span>/* 调用某协议发送出数据,简化版 */
memset(node_info, 0, sizeof(node_t) + MAX_INFO_SIZE);
node_info->type = your_type;
node_info->len = 0;
mark = &node_info->value;
memcpy(mark, data, len);
mark += len;
node_info->len += len;
}
}
send(node_info); <span style="white-space:pre"> </span>/* 发送最后一个数据包 */
添加数据的操作即是:将数据拷贝到数据段,记录添加的长度,移动标记位以便下次添加。如果数据达到数据包最大值,发送掉这个包,然后继续添加操作。
这样,每个不大于x byte的数据包都填充好了data数据,并且利用通信机制发送到了另一个地方。
那“另一个地方”接收到了这个不大于x byte的数据包,如何从数据包里解析出data数据来呢?
3,解析数据
假设某台机器得到了这个数据包,要查看数据包里每个data的内容,如何解析?
[cpp] view plaincopyprint?
node_t *node_info;
char *buf;
int len;
node_t *node_info;
get_info(node_info); /* 让node_info得到了那个不大于x byte的数据包,简化版 */
for (buf = node_info->value; buf < node_info->value + node_info->len; buf += len) {
data = (data_t *)buf; /* 从数据包里取到了一个data */
op(data); /* 查看数据包,简化版 */
len = get_data_len(data);
}
以上,利用柔性数组构造一个数据包,并进行封包,发包,解包的操作就完成了!
在实际生产应用中,要对数据包的头部扩展,其他的每一个操作都不会像例子的伪代码那样简单,但原理是一样的。
如果没有用过柔性数组的童鞋,可以思考一下:
为什么最后一个原始是0元素的数组而不是指针呢?假如不是C99怎么办?
c99之 柔性数组成员
时间:2012-09-07 13:18来源:Internet 作者:Internet 点击:次
在讲述柔性数组成员之前,首先要介绍一下不完整类型(incomplete type)。不完整类型是这样一种类型,它缺乏足够的信息例如长度去描述一个完整的对象。 6.2.5 Types inco
在讲述柔性数组成员之前,首先要介绍一下不完整类型(incomplete type)。不完整类型是这样一种类型,它缺乏足够的信息例如长度去描述一个完整的对象。
6.2.5 Types
incomplete types (types that describe objects but lack information needed to determine their sizes).
C与C++关于不完整类型的语义是一样的。
前向声明就是一种常用的不完整类型:
class base;
struct test;
base和test只给出了声明,没有给出定义。不完整类型必须通过某种方式补充完整,才能使用它们进行实例化,否则只能用于定义指针或引用,因为此时实例化的是指针或引用本身,不是base或test对象。
一个未知长度的数组也属于不完整类型:
extern int a[];
extern不能去掉,因为数组的长度未知,不能作为定义出现。不完整类型的数组可以通过几种方式补充完整才能使用,大括号形式的初始化就是其中一种方式:
int a[] = { 10, 20 };
柔性数组成员(flexible array member)也叫伸缩性数组成员,它的出现反映了C程序员对精炼代码的极致追求。这种代码结构产生于对动态结构体的需求。在日常的编程中,有时候需要在结构体中存放一个长度动态的字符串,一般的做法,是在结构体中定义一个指针成员,这个指针成员指向该字符串所在的动态内存空间,例如:
struct test
{
int a;
double b;
char *p;
};
p指向字符串。这种方法造成字符串与结构体是分离的,不利于操作,如果把字符串跟结构体直接连在一起,不是更好吗?于是,可以把代码修改为这样:
char a[] = “hello world”;
struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );
strcpy( PntTest + 1, a );
这样一来,( char* )( PntTest + 1 )就是字符串“hello world”的地址了(已经忽略p)。这时候p成了多余的东西,可以去掉。但是,又产生了另外一个问题:老是使用( char* )( PntTest + 1 )不方便。如果能够找出一种方法,既能直接引用该字符串,又不占用结构体的空间,就完美了,符合这种条件的代码结构应该是一个非对象的符号地址,在结构体的尾部放置一个0长度的数组是一个绝妙的解决方案。不过,C/C++标准规定不能定义长度为0的数组,因此,有些编译器就把0长度的数组成员作为自己的非标准扩展,例如:
struct test
{
int a;
double b;
char c[0];
};
c就叫柔性数组成员,如果把PntTest指向的动态分配内存看作一个整体,c就是一个长度可以动态变化的结构体成员,柔性一词来源于此。c的长度为0,因此它不占用test的空间,同时PntTest->c就是“hello world”的首地址,不需要再使用( char* )( PntTest + 1 )这么丑陋的语法了。
鉴于这种代码结构所产生的重要作用,C99甚至把它收入了标准中:
6.7.2.1 Structure and union specifiers
As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.
C99使用不完整类型实现柔性数组成员,标准形式是这样的:
struct test
{
int a;
double b;
char c[];
};
c同样不占用test的空间,只作为一个符号地址存在,而且必须是结构体的最后一个成员。柔性数组成员不仅可以用于字符数组,还可以是元素为其它类型的数组,例如:
struct test
{
int a;
double b;
float c[];
};
应当尽量使用标准形式,在非C99的场合,可以使用指针方法。有些人使用char a[1],这是非常不可取的,把这样的a用作柔性数组成员会发生越界行为,虽然C/C++标准并没有规定编译器应当检查越界,但也没有规定不能检查越界,为了一个小小的指针空间而牺牲移植性,是不值得的。
柔性数组到底如何使用呢?看下面例子:
typedef struct st_type
{
int i;
int a[0];
}type_a;
有些编译器会报错无法编译可以改成:
typedef struct st_type
{
int i;
int a[];
}type_a;
这样我们就可以定义一个可变长的结构体,用 sizeof(type_a)得到的只有 4,就是
sizeof(i)=sizeof(int)。那个 0 个元素的数组没有占用空间,而后我们可以进行变长操作了。通
过如下表达式给结构体分配内存:
type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));这样我们为结构体指针 p 分配了一块内存。用 p->item[n]就能简单地访问可变长元素。
但是这时候我们再用 sizeof(*p)测试结构体的大小,发现仍然为 4。是不是很诡异?我们
不是给这个数组分配了空间么?
别急,先回忆一下我们前面讲过的“模子” 。在定义这个结构体的时候,模子的大小就
已经确定不包含柔性数组的内存大小。柔性数组只是编外人员,不占结构体的编制。只是说
在使用柔性数组时需要把它当作结构体的一个成员,仅此而已。再说白点,柔性数组其实与
结构体没什么关系,只是“挂羊头卖狗肉”而已,算不得结构体的正式成员。
需要说明的是:C89不支持这种东西,C99把它作为一种特例加入了标准。但是,C99
所支持的是 incomplete type,而不是 zero array,形同 int item[0];这种形式是非法的,C99支持的形式是形同 int item[];只不过有些编译器把 int item[0];作为非标准扩展来支持,而且在C99发布之前已经有了这种非标准扩展了,C99发布之后,有些编译器把两者合而为一了。当然,上面既然用 malloc函数分配了内存,肯定就需要用 free函数来释放内存:
free(p);
经过上面的讲解,相信你已经掌握了这个看起来似乎很神秘的东西。不过实在要是没
掌握也无所谓,这个东西实在很少用。
【柔性数组结构成员
C99中,结构中的最后一个元素允许是未知大小的数组,这就叫做柔性数组成员,但结构中的柔性数组成员前面必须至少一个其他成员。柔性数组成员允许结构中包含一个大小可变的数组。sizeof返回的这种结构大小不包括柔性数组的内存。包含柔性数组成员的结构用malloc ()函数进行内存的动态分配,并且分配的内存应该大于结构的大小,以适应柔性数组的预期大小。】
C语言版:
type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));
C++语言版:
type_a *p = (type_a*)new char[sizeof(type_a)+100*sizeof(int)];
而释放同样简单:
C语言版:
free(p);
C++语言版:
delete []p;