C语言标准定义的32个关键字 关键字 意 义 auto 声明自动变量,缺省时编译器一般默认为auto int 声明整型变量 double 声明双精度变量 long 声明长整型变量 char 声明字符型变量 float 声明浮点型变量 short 声明短整型变量 signed 声明有符号类型变量 unsigned 声明无符号类型变量 struct 声明结构体变量 union 声明联合数据类型 enum 声明枚举类型 static 声明静态变量 switch 用于开关语句 case 开关语句分支 default 开关语句中的“其他”分支 break 跳出当前循环 register 声明寄存器变量 const 声明只读变量 volatile 说明变量在程序执行中可被隐含地改变 typedef 用以给数据类型取别名(当然还有其他作用) extern 声明变量是在其他文件正声明(也可以看做是引用变量) return 子程序返回语句(可以带参数,也可不带参数) void 声明函数无返回值或无参数,声明空类型指针 continue 结束当前循环,开始下一轮循环 do 循环语句的循环体 while 循环语句的循环条件 if 条件语句 else 条件语句否定分支(与 if 连用) for 一种循环语句(可意会不可言传) goto 无条件跳转语句 sizeof 计算对象所占内存空间大小 下面的篇幅就一一讲解这些关键字。但在讲解之前先明确两个概念: 什么是定义?什么是声明?它们有何区别? 举个例子: A)int i; B)extern int i;(关于extern,后面解释) 哪个是定义?哪个是声明?或者都是定义或者都是声明?我所教过的学生几乎没有一人能回答上这个问题。这个十分重要的概念在大学里从来没有被提起过! 什么是定义:所谓的定义就是(编译器)创建一个对象,为这个对象分配一块内存并给它取上一个名字,这个名字就是我们经常所说的变量名或对象名。但注意,这个名字一旦和这块内存匹配起来(可以想象是这个名字嫁给了这块空间,没有要彩礼啊。^_^),它们就同生共死,终生不离不弃。并且这块内存的位置也不能被改变。一个变量或对象在一定的区域内(比如函数内,全局等)只能被定义一次,如果定义多次,编译器会提示你重复定义同一个变量或对象。 什么是声明:有两重含义,如下: 第一重含义:告诉编译器,这个名字已经匹配到一块内存上了(伊人已嫁,吾将何去何从?何以解忧,唯有稀粥),下面的代码用到变量或对象是在别的地方定义的。声明可以出现多次。 第二重含义:告诉编译器,我这个名字我先预定了,别的地方再也不能用它来作为变量名或对象名。比如你在图书馆自习室的某个座位上放了一本书,表明这个座位已经有人预订,别人再也不允许使用这个座位。其实这个时候你本人并没有坐在这个座位上。这种声明最典型的例子就是函数参数的声明,例如: void fun(int i,char c); 好,这样一解释,我们可以很清楚的判断:A)是定义;B)是声明。 那他们的区别也很清晰了。记住,定义声明最重要的区别:定义创建了对象并为这个对象分配了内存,声明没有分配内存(一个抱伊人,一个喝稀粥。^_^)。 1.1,最宽恒大量的关键字----auto auto:它很宽恒大量的,你就当它不存在吧。编译器在默认的缺省情况下,所有变量都是auto的。 1.2,最快的关键字---- register register:这个关键字请求编译器尽可能的将变量存在CPU内部寄存器中而不是通过内存寻址访问以提高效率。注意是尽可能,不是绝对。你想想,一个CPU的寄存器也就那么几个或几十个,你要是定义了很多很多register变量,它累死也可能不能全部把这些变量放入寄存器吧,轮也可能轮不到你。 1.2.1,皇帝身边的小太监----寄存器 不知道什么是寄存器?那见过太监没有?没有?其实我也没有。没见过不要紧,见过就麻烦大了。^_^,大家都看过古装戏,那些皇帝们要阅读奏章的时候,大臣总是先将奏章交给皇帝旁边的小太监,小太监呢再交给皇帝同志处理。这个小太监只是个中转站,并无别的功能。 好,那我们再联想到我们的CPU。CPU不就是我们的皇帝同志么?大臣就相当于我们的内存,数据从他这拿出来。那小太监就是我们的寄存器了(这里先不考虑CPU的高速缓存区)。数据从内存里拿出来先放到寄存器,然后CPU再从寄存器里读取数据来处理,处理完后同样把数据通过寄存器存放到内存里,CPU不直接和内存打交道。这里要说明的一点是:小太监是主动的从大臣手里接过奏章,然后主动的交给皇帝同志,但寄存器没这么自觉,它从不主动干什么事。一个皇帝可能有好些小太监,那么一个CPU也可以有很多寄存器,不同型号的CPU拥有寄存器的数量不一样。 为啥要这么麻烦啊?速度!就是因为速度。寄存器其实就是一块一块小的存储空间,只不过其存取速度要比内存快得多。进水楼台先得月嘛,它离CPU很近,CPU一伸手就拿到数据了,比在那么大的一块内存里去寻找某个地址上的数据是不是快多了?那有人问既然它速度那么快,那我们的内存硬盘都改成寄存器得了呗。我要说的是:你真有钱!1.2.2,使用register修饰符的注意点 虽然寄存器的速度非常快,但是使用register修饰符也有些限制的:register变量必须是能被CPU寄存器所接受的类型。意味着register变量必须是一个单个的值,并且其长度应小于或等于整型的长度。而且register变量可能不存放在内存中,所以不能用取址运算符“&”来获取register变量的地址。 1.3,最名不符实的关键字----static 不要误以为关键字static很安静,其实它一点也不安静。这个关键字在C语言里主要有两个作用,C++对它进行了扩展。 1.3.1,修饰变量 第一个作用:修饰变量。变量又分为局部和全局变量,但它们都存在内存的静态区。 静态全局变量,作用域仅限于变量被定义的文件中,其他文件即使用extern声明也没法使用他。准确地说作用域是从定义之处开始,到文件结尾处结束,在定义之处前面的那些代码行也不能使用它。想要使用就得在前面再加extern***。恶心吧?要想不恶心,很简单,直接在文件顶端定义不就得了。 静态局部变量,在函数体里面定义的,就只能在这个函数里用了,同一个文档中的其他函数也用不了。由于被static修饰的变量总是存在内存的静态区,所以即使这个函数运行结束,这个静态变量的值还是不会被销毁,函数下次使用时仍然能用到这个值。 static int j; void fun1(void) { static int i=0; i++; } void fun2(void) { j=0; j++; } int main() { for(k=0;k<10;k++) { fun1(); fun2(); } return0; } i和j的值分别是什么,为什么? 1.3.2,修饰函数 第二个作用:修饰函数。函数前加static使得函数成为静态函数。但此处“static”的含义不是指存储方式,而是指对函数的作用域仅局限于本文件(所以又称内部函数)。使用内部函数的好处是:不同的人编写不同的函数时,不用担心自己定义的函数,是否会与其它文件中的函数同名。 关键字static有着不寻常的历史。起初,在C中引入关键字static是为了表示退出一个块后仍然存在的局部变量。随后,static 在C中有了第二种含义:用来表示不能被其它文件访问的全局变量和函数。为了避免引入新的关键字,所以仍使用static关键字来表示这第二种含义。 当然,C++里对static赋予了第三个作用,这里先不讨论,有兴趣的可以找相关资料研究。 1.4,基本数据类型----short、int、long、char、float、double 短整型short C语言包含的数据类型如下图所示: 整 整型int 型 长整型long 数值类型 单精度型float 基本类型 浮点型 字符类型char 双精度型double 数组 C 结构体struct 数 构造类型 据 共用体union 类 枚举类型enum 型 指针类型 空类型void 1.4.1,数据类型与“模子” short、int、long、char、float、double这六个关键字代表C语言里的六种基本数据类型。怎么去理解它们呢?举个例子:见过藕煤球的那个东西吧?(没见过?煤球总见过吧)。那个东西叫藕煤器,拿着它在和好的煤堆里这么一咔,一个煤球出来了。半径12cm,12个孔。不同型号的藕煤器咔出来的煤球大小不一样,孔数也不一样。这个藕煤器其实就是个模子。 现在我们联想一下,short、int、long、char、float、double这六个东东是不是很像不同类型的藕煤器啊?拿着它们在内存上咔咔咔,不同大小的内存就分配好了,当然别忘了给它们取个好听的名字。在32位的系统上short咔出来的内存大小是2个byte;int咔出来的内存大小是4个byte;long咔出来的内存大小是4个byte;float咔出来的内存大小是4个byte;double咔出来的内存大小是8个byte;char咔出来的内存大小是1个byte。(注意这里指一般情况,可能不同的平台还会有所不同,具体平台可以用sizeof关键字测试一下) 很简单吧?咔咔咔很爽吧?是很简单,也确实很爽,但问题就是你咔出来这么多内存块,你总不能给他取名字叫做x1,x2,x3,x4,x5…或者长江1号,长江2号…吧。它们长得这么像(不是你家的老大,老二,老三…),过一阵子你就会忘了到底哪个名字和哪个内存块匹配了(到底谁嫁给谁了啊?^_^)。所以呢,给他们取一个好的名字绝对重要。下面我们就来研究研究取什么样的名字好。 1.4.2,变量的命名规则 一般规则: 【规则1-1】命名应当直观且可以拼读,可望文知意,便于记忆和阅读。 标识符最好采用英文单词或其组合,不允许使用拼音。程序中的英文单词一般不要太复杂,用词应当准确。 【规则1-2】命名的长度应当符合“min-length&&max-information”原则。 C 是一种简洁的语言, 命名也应该是简洁的。例如变量名MaxVal 就比 MaxValueUntilOverflow好用。标识符的长度一般不要过长,较长的单词可通过去掉“元音”形成缩写。 另外,英文词尽量不缩写,特别是非常用专业名词,如果有缩写,在同一系统中对同一单词必须使用相同的表示法,并且注明其意思。 【规则1-3】当标识符由多个词组成时,每个词的第一个字母大写,其余全部小写。比如: int CurrentVal; 这样的名字看起来比较清晰,远比一长串字符好得多。 【规则1-4】尽量避免名字中出现数字编号,如Value1,Value2等,除非逻辑上的确需要编号。比如驱动开发时为管脚命名,非编号名字反而不好。 初学者总是喜欢用带编号的变量名或函数名,这样子看上去很简单方便,但其实是一颗颗定时炸弹。这个习惯初学者一定要改过来。 【规则1-5】对在多个文件之间共同使用的全局变量或函数要加范围限定符(建议使用模块名(缩写)作为范围限定符)。(GUI_ ,etc) 标识符的命名规则: 【规则1-6】标识符名分为两部分:规范标识符前缀(后缀)+ 含义标识 。非全局变量可以不用使用范围限定符前缀。 【规则1-7】作用域前缀命名规则。 No. 标识符类型 作用域前缀1 GlobalVariable g 2 FileStaticVariable(native) n 3 FunctionStaticVariable f 4 AutoVariable a 5 GlobalFunction g 6 StaticFunction n 【规则1-8】数据类型前缀命名规则。 No. Prefix Suffix DataType Example Remark1 bt bit BitbtVariable; 2 b boolean booleanbVariable; 3 c char charcVariable; 4 i int intiVariable; 5 s short[int] short[int]sVariable; 6 l long[int] long[int]lVariable; 7 u unsigned[int] unsigned[int]uiVariable; 8 d double doubledVariable; 9 f float floatfVariable; 10 p pointer void*vpVariable; 指针前缀11 v void voidvVariable; 13 st enum enumAstVariable; 14 st struct structAstVariable; 15 st union unionAstVariable; 16 fp function void(*fpGetModeFuncList_a[])(void) point 17 _a arrayof charcVariable_a[TABLE_MAX]; 当自定义 结构数据 typedef structSM_EventOpt 类型时使 { 用_st后 _st typedef unsignedchar 缀;18 enum/struct/u 当自定义 _pst nion unsignedint 结构数据 char 类型为指 }SM_EventOpt_st,*SM_EventOpt_pst; 针类型时 使用_pst 后缀; 【规则1-9】含义标识命名规则,变量命名使用名词性词组,函数命名使用动词性词组。例如: No 变量名 目标词 动词(的过去分词) 状语 目的地 含义1 DataGotFromSD Data Got From SD 从SD中取 得的数据2 DataDeletedFromSD Data Deleted From SD 从SD中删 除的数据变量含义标识符构成:目标词 + 动词(的过去分词)+[状语]+[目的地]; N 变量名 动词(一般现时) 目标词 状语 目的地 含义o 1 GetDataFromSD Get Data From SD 从SD中取 得数据2 DeleteDataFromSD Delete Data From SD 从SD中删 除数据函数含义标识符构成:动词(一般现时)+目标词+[状语]+[目的地]; 【规则1-10】程序中不得出现仅靠大小写区分的相似的标识符。 例如:intx,X; 变量x 与X 容易混淆 voidfoo(intx); 函数foo与FOO 容易混淆 voidFOO(floatx); 这里还有一个要特别注意的就是1(数字1)和l(小写字母l)之间,0(数字0)和o(小写字母o)之间的区别。这两对真是很难区分的,我曾经的一个同事就被这个问题折腾了一次。 【规则1-11】一个函数名禁止被用于其它之处。 例如: #include "c_standards.h" void foo(intp_1) { intx=p_1; } void static_p(void) { int foo=1u; } 【规则1-12】所有宏定义、枚举常数、只读变量全用大写字母命名,用下划线分割单词。例如: const int MAX_LENGTH=100;//这不是常量,而是一个只读变量,具体请往后看#defineFILE_PATH“/usr/tmp” 【规则1-13】考虑到习惯性问题,局部变量中可采用通用的命名方式,仅限于n、i、j等作为循环变量使用。 一定不要写出如下这样的代码: int p; char i; int c; char*a; 一般来说习惯上用n,m,i,j,k等表示int类型的变量;c,ch等表示字符类型变量;a等表示数组;p等表示指针。当然这仅仅是一般习惯,除了i,j,k等可以用来表示循环变量外,别的字符变量名尽量不要使用。 【规则1-14】定义变量的同时千万千万别忘了初始化。定义变量时编译器并不一定清空了这块内存,它的值可能是无效的数据。 这个问题在内存管理那章有非常详细的讨论,请参看。 【规则1-15】不同类型数据之间的运算要注意精度扩展问题,一般低精度数据将向高精度数据扩展。 1.5,最冤枉的关键字----sizeof 1.5.1,常年被人误认为函数 sizeof是关键字不是函数,其实就算不知道它是否为32个关键字之一时,我们也可以借助编译器确定它的身份。看下面的例子: int i=0; A),sizeof(int);B),sizeof(i); C),sizeof int; D),sizeof i; 毫无疑问,32位系统下A),B)的值为4。那C)的呢?D)的呢? 在32位系统下,通过VisualC++6.0或任意一编译器调试,我们发现D)的结果也为4。咦?sizeof后面的括号呢?没有括号居然也行,那想想,函数名后面没有括号行吗?由此轻易得出sizeof绝非函数。 好,再看C)。编译器怎么怎么提示出错呢?不是说sizeof是个关键字,其后面的括号可以没有么?那你想想sizeof int表示什么啊?int前面加一个关键字?类型扩展?明显不正确,我们可以在int前加unsigned,const等关键字但不能加sizeof。好,记住:sizeof在计算变量所占空间大小时,括号可以省略,而计算类型(模子)大小时不能省略。一般情况下,咱也别偷这个懒,乖乖的写上括号,继续装作一个“函数”,做一个“披着函数皮的关键字”。做我的关键字,让人家认为是函数去吧。 1.5.2,sizeof(int)*p表示什么意思? sizeof(int)*p表示什么意思? 留几个问题(讲解指针与数组时会详细讲解),32位系统下: int*p=NULL; sizeof(p)的值是多少? sizeof(*p)呢? inta[100]; sizeof(a) 的值是多少? sizeof(a[100])呢?//请尤其注意本例。 sizeof(&a)呢? sizeof(&a[0])呢? int b[100]; void fun(int b[100]) { sizeof(b);//sizeof(b) 的值是多少? } 1.4,signed、unsigned关键字 我们知道计算机底层只认识0、1.任何数据到了底层都会变计算转换成0、1.那负数怎么存储呢?肯定这个“-”号是无法存入内存的,怎么办?很好办,做个标记。把基本数据类型的最高位腾出来,用来存符号,同时约定如下:最高位如果是1,表明这个数是负数,其值为除最高位以外的剩余位的值添上这个“-”号;如果最高位是0,表明这个数是正数,其值为除最高位以外的剩余位的值。 这样的话,一个32位的signed int类型整数其值表示法范围为:-231~231-1;8位的char类型数其值表示的范围为-27~27-1。一个32位的unsigned int类型整数其值表示法范围为:0~ 232-1;8位的char类型数其值表示的范围为0~28-1。同样我们的signed关键字也很宽恒大量,你也可以完全当它不存在,编译器缺省默认情况下数据为signed 类型的。 上面的解释很容易理解,下面就考虑一下这个问题: intmain() { chara[1000]; inti; for(i=0;i<1000;i++) { a[i]=-1-i; } printf("%d",strlen(a)); return0; } 此题看上去真的很简单,但是却鲜有人答对。答案是255。别惊讶,我们先分析分析。 for循环内,当i的值为0时,a[0]的值为-1。关键就是-1在内存里面如何存储。 我们知道在计算机系统中,数值一律用补码来表示(存储)。主要原因是使用补码,可以将符号位和其它位统一处理;同时,减法也可按加法来处理。另外,两个用补码表示的数相加时,如果最高位(符号位)有进位,则进位被舍弃。正数的补码与其原码一致;负数的补码:符号位为1,其余位为该数绝对值的原码按位取反,然后整个数加1。 按照负数补码的规则,可以知道-1的补码为0xff,-2的补码为0xfe……当i的值为127时,a[127]的值为-128,而-128是char类型数据能表示的最小的负数。当i继续增加,a[128]的值肯定不能是-129。因为这时候发生了溢出,-129需要9位才能存储下来,而char类型数据只有8位,所以最高位被丢弃。剩下的8位是原来9位补码的低8位的值,即0x7f。当i继续增加到255的时候,-256的补码的低8位为0。然后当i增加到256时,-257的补码的低8位全为1,即低八位的补码为0xff,如此又开始一轮新的循环…… 按照上面的分析,a[0]到a[254]里面的值都不为0,而a[255]的值为0。strlen函数是计算字符串长度的,并不包含字符串最后的‘0’。而判断一个字符串是否结束的标志就是看是否遇到‘0’。如果遇到‘0’,则认为本字符串结束。 分析到这里,strlen(a)的值为255应该完全能理解了。这个问题的关键就是要明白char类型默认情况下是有符号的,其表示的值的范围为[-128,127],超出这个范围的值会产生溢出。另外还要清楚的就是负数的补码怎么表示。弄明白了这两点,这个问题其实就很简单了。留三个问题: 1),按照我们上面的解释,那-0和+0在内存里面分别怎么存储? 2),inti=-20; unsigned j=10; i+j的值为多少?为什么? 3), 下面的代码有什么问题? unsignedi; for(i=9;i>=0;i--) { printf("%u ",i); } 1.6,if、else组合 if语句很简单吧。嗯,的确很简单。那我们就简单的看下面几个简单的问题: 1.6.1,bool变量与“零值”进行比较 bool变量与“零值”进行比较的if语句怎么写? bool bTestFlag=FALSE;//想想为什么一般初始化为FALSE比较好? A),if(bTestFlag==0); if(bTestFlag==1); B),if(bTestFlag==TRUE); if(bTestFlag==FLASE); C),if(bTestFlag); if(!bTestFlag); 哪一组或是那些组正确呢?我们来分析分析: A)写法:bTestFlag是什么?整型变量?如果要不是这个名字遵照了前面的命名规范,肯怕很容易让人误会成整型变量。所以这种写法不好。 B)写法:FLASE的值大家都知道,在编译器里被定义为0;但TRUE的值呢?都是1吗?很不幸,不都是1。VisualC++定义为1,而它的同胞兄弟VisualBasic就把TRUE定义为-1.那很显然,这种写法也不好。 大家都知道if语句是靠其后面的括号里的表达式的值来进行分支跳转的。表达式如果为真,则执行if语句后面紧跟的代码;否则不执行。那显然,本组的写法很好,既不会引起误会,也不会由于TRUE或FLASE的不同定义值而出错。记住:以后写代码就得这样写。 1.6.2, float变量与“零值”进行比较 float变量与“零值”进行比较的if语句怎么写? floatfTestVal=0.0; A),if(fTestVal==0.0); if(fTestVal!=0.0); B),if((fTestVal>=-EPSINON)&& (fTestVal <=EPSINON));//EPSINON为定义好的精度。 哪一组或是那些组正确呢?我们来分析分析: float和double类型的数据都是有精度限制的,这样直接拿来与0.0比,能正确吗?明显不能,看例子: 的值四舍五入精确到小数点后10位为:3.1415926536,你拿它减去0.00000000001然后再四舍五入得到的结果是多少?你能说前后两个值一样吗? EPSINON为定义好的精度,如果一个数落在[0.0-EPSINON,0.0+EPSINON] 这个闭区间内,我们认为在某个精度内它的值与零值相等;否则不相等。扩展一下,把0.0替换为你想比较的任何一个浮点数,那我们就可以比较任意两个浮点数的大小了,当然是在某个精度内。 同样的也不要在很大的浮点数和很小的浮点数之间进行运算,比如: 10000000000.00+0.00000000001 这样计算后的结果可能会让你大吃一惊。 1.6.3,指针变量与“零值”进行比较 指针变量与“零值”进行比较的if语句怎么写? int*p=NULL;//定义指针一定要同时初始化,指针与数组那章会详细讲解。 A),if(p==0); if(p!=0); B),if(p); if(!p); C),if(NULL==p); if(NULL!=p); 哪一组或是那些组正确呢?我们来分析分析: A)写法:p是整型变量?容易引起误会,不好。尽管NULL的值和0一样,但意义不同。 B)写法:p是bool型变量?容易引起误会,不好。 C)写法:这个写法才是正确的,但样子比较古怪。为什么要这么写呢?是怕漏写一个“=”号:if(p=NULL),这个表达式编译器当然会认为是正确的,但却不是你要表达的意思。所以,非常推荐这种写法。 1.6.4,else到底与哪个if配对呢? else常常与if语句配对,但要注意书写规范,看下面例子: if(0==x) if(0==y) error(); else{ //program code } 这个else到底与谁匹配呢?让人迷糊,尤其是初学者。还好,C语言有这样的规定:else始终与同一括号内最近的未匹配的if语句结合。虽然老手可以区分出来,但这样的代码谁都会头疼的,任何时候都别偷这种懒。关于程序中的分界符‘{’和‘}’,建议如下:【建议1-16】程序中的分界符‘{’和‘}’对齐风格如下: 注意下表中代码的缩进一般为4个字符,但不要使用Tab键,因为不同的编辑器Tab键定义的空格数量不一样,别的编辑器打开Tab键缩进的代码可能会一片混乱。 提倡的的风格 不提倡的风格 voidFunction(intx) voidFunction(intx){ { //programcode //programcode } } if(condition) if(condition){ { //programcode //programcode }else{ } //programcode else } { 或: //programcode if(condition) } //programcode else //programcode 或: if(width<height)dosomething(); for(initialization;condition;update) for(initialization;condition;update){ { //programcode //programcode } } while(condition) while(condition){ { //programcode //programcode } } do do{ { //programcode //programcode }while(condition); } while(condition); 1.6.5,if语句后面的分号 关于if-else语句还有一个容易出错的地方就是与空语句的连用。看下面的例子: if(NULL!=p); fun(); 这里的fun()函数并不是在NULL!=p的时候被调用,而是任何时候都会被调用。问题就出在if语句后面的分号上。在C语言中,分号预示着一条语句的结尾,但是并不是每条C语言语句都需要分号作为结束标志。if语句的后面并不需要分号,但如果你不小心写了个分号,编译器并不会提示出错。因为编译器会把这个分号解析成一条空语句。也就是上面的代码实际等效于: if(NULL!=p) { ; } fun(); 这是初学者很容易犯的错误,往往不小心多写了个分号,导致结果与预想的相差很远。所以建议在真正需要用空语句时写成这样: NULL; 而不是单用一个分号。这就好比汇编语言里面的空指令,比如ARM指令中的NOP指令。这样做可以明显的区分真正必须的空语句和不小心多写的分号。 1.6.6,使用if语句的其他注意事项 【规则1-17】先处理正常情况,再处理异常情况。 在编写代码是,要使得正常情况的执行代码清晰,确认那些不常发生的异常情况处理代码不会遮掩正常的执行路径。这样对于代码的可读性和性能都很重要。因为,if语句总是需要做判断,而正常情况一般比异常情况发生的概率更大(否则就应该把异常正常调过来了),如果把执行概率更大的代码放到后面,也就意味着if语句将进行多次无谓的比较。另外,非常重要的一点是,把正常情况的处理放在if后面,而不要放在else后面。当然这也符合把正常情况的处理放在前面的要求。 【规则1-18】确保if和else子句没有弄反。 这一点初学者也容易弄错,往往把本应该放在if语句后面的代码和本应该放在else语句后面的代码弄反了。
1.7,switch、case组合 既然有了if、else组合为什么还需要switch、case组合呢? 1.7.1,不要拿青龙偃月刀去削苹果 那你既然有了菜刀为什么还需要水果刀呢?你总不能扛着云长的青龙偃月刀(又名冷艳锯)去削苹果吧。如果你真能做到,关二爷也会佩服你的。^_^。 if、else一般表示两个分支或是嵌套表示少量的分支,但如果分支很多的话……还是用switch、case组合吧。其基本格式为: switch(variable) { caseValue1: //program code break; caseValue2: //program code break; caseValue3: //program code break; … default: break; } 很简单,但有两个规则: 【规则1-19】每个case 语句的结尾绝对不要忘了加break,否则将导致多个分支重叠(除非有意使多个分支重叠)。 【规则1-20】最后必须使用default 分支。即使程序真的不需要default处理,也应该保留语句: default: break; 这样做并非画蛇添足,可以避免让人误以为你忘了default处理。 1.7.2,case关键字后面的值有什么要求吗? 好,再问问:真的就这么简单吗?看看下面的问题: Value1 的值为0.1行吗?-0.1呢?-1呢?0.1+0.9呢? 1+2呢?3/2呢?‘A’呢?“A”呢?变量i(假设i已经被初始化)呢?NULL呢?等等。这些情形希望你亲自上机调试一下,看看到底哪些行,哪些不行。 记住:case 后面只能是整型或字符型的常量或常量表达式(想想字符型数据在内存里是怎么存的)。 1.7.3,case语句的排列顺序 似乎从来没有人考虑过这个问题,也有很多人认为case语句的顺序无所谓。但事实却不是如此。如果case语句很少,你也许可以忽略这点,但是如果case语句非常多,那就不得不好好考虑这个问题了。比如你写的是某个驱动程序,也许会经常遇到几十个case语句的情况。一般来说,我们可以遵循下面的规则: 【规则1-21】按字母或数字顺序排列各条case语句。 如果所有的case语句没有明显的重要性差别,那就按A-B-C或1-2-3等顺序排列case语句。这样做的话,你可以很容易的找到某条case语句。比如: switch(variable) { case A: //program code break; case B: //program code break; case C: //program code break; … default: break; } 【规则1-22】把正常情况放在前面,而把异常情况放在后面。 如果有多个正常情况和异常情况,把正常情况放在前面,并做好注释;把异常情况放在后面,同样要做注释。比如: switch(variable) { /////////////////////////////////////////////////////////////////////////////////// //正常情况开始 case A: //program code break; case B: //program code break; //正常情况结束 ////////////////////////////////////////////////////////////////////////////////////// //异常情况开始 case -1: //program code break; //异常情况结束 ////////////////////////////////////////////////////////////////////////////////////// … default: break; } 【规则1-23】按执行频率排列case语句 把最常执行的情况放在前面,而把最不常执行的情况放在后面。最常执行的代码可能也是调试的时候要单步执行的最多的代码。如果放在后面的话,找起来可能会比较困难,而放在前面的话,可以很快的找到。 1.7.4,使用case语句的其他注意事项 【规则1-24】简化每种情况对应的操作。 使得与每种情况相关的代码尽可能的精炼。case语句后面的代码越精炼,case语句的结果就会越清晰。你想想,如果case语句后面的代码整个屏幕都放不下,这样的代码谁也难看得很清晰吧。如果某个case语句确实需要这么多的代码来执行某个操作,那可以把这些操作写成一个或几个子程序,然后在case语句后面调用这些子程序就ok了。一般来说case语句后面的代码尽量不要超过20行。 【规则1-25】不要为了使用case语句而刻意制造一个变量。 case语句应该用于处理简单的,容易分类的数据。如果你的数据并不简单,那可能使用if-elseif的组合更好一些。为了使用case而刻意构造出来的变量很容易把人搞糊涂,应该避免这种变量。比如: charaction=a[0]; switch(action) { case‘c’: fun1(); break; case‘d’: … break; default: break; } 这里控制case语句的变量是action。而action的值是取字符数组a的一个字符。但是这种方式可能带来一些隐含的错误。一般而言,当你为了使用case语句而刻意去造出一个变量时,真正的数据可能不会按照你所希望的方式映射到case语句里。在这个例子中,如果用户输入字符数组a里面存的是“const”这个字符串,那么case语句会匹配到第一个case上,并调用fun1()函数。然而如果这个数组里存的是别的以字符c开头的任何字符串(比如:“col”,“can”),case分支同样会匹配到第一个case上。但是这也许并不是你想要的结果,这个隐含的错误往往使人抓狂。如果这样的话还不如使用if-elseif组合。比如: if(0==strcmp(“const”,a)) { fun1(); } elseif { … } 【规则1-26】把default子句只用于检查真正的默认情况。 有时候,你只剩下了最后一种情况需要处理,于是就决定把这种情况用default子句来处理。这样也许会让你偷懒少敲几个字符,但是这却很不明智。这样将失去case语句的标号所提供的自说明功能,而且也丧失了使用default子句处理错误情况的能力。所以,奉劝你不要偷懒,老老实实的把每一种情况都用case语句来完成,而把真正的默认情况的处理交给default子句。 1.8,do、while、for关键字 C语言中循环语句有三种:while循环、do-while循环、for循环。 while循环:先判断while后面括号里的值,如果为真则执行其后面的代码;否则不执行。while(1)表示死循环。死循环有没有用呢?看下面例子: 比如你开发一个系统要日夜不停的运行,但是只有操作员输入某个特定的字符‘#’才可以停下来。 while(1) { if(‘#’==GetInputChar()) { break; } } 1.8.1,break与continue的区别 break关键字很重要,表示终止本层循环。现在这个例子只有一层循环,当代码执行到break时,循环便终止。 如果把break换成continue会是什么样子呢?continue表示终止本次(本轮)循环。当代码执行到continue时,本轮循环终止,进入下一轮循环。 while(1)也有写成while(true)或者while(1==1) 或者while((bool)1)等形式的,效果一样。 do-while循环:先执行do后面的代码,然后再判断while后面括号里的值,如果为真,循环开始;否则,循环不开始。其用法与while循环没有区别,但相对较少用。 for循环:for循环可以很容易的控制循环次数,多用于事先知道循环次数的情况下。 留一个问题:在switchcase 语句中能否使用continue关键字?为什么? 1.8.2,循环语句的注意点 【建议1-27】在多重循环中,如果有可能,应当将最长的循环放在最内层,最短的循环放在最外层,以减少CPU跨切循环层的次数。 例如: 长循环在最内层,效率高 长循环在最外层,效率低 for(col=0;col<5;col++) for(row=0;row<100;row++) { { for(row=0;row<100;row++) for(col=0;col<5;col++) { { sum=sum+a[row][col]; sum=sum+a[row][col]; } } } } 【建议1-28】建议for语句的循环控制变量的取值采用“半开半闭区间”写法。半开半闭区间写法和闭区间写法虽然功能是相同,但相比之下,半开半闭区间写法写法更加直观。 半开半闭区间写法 闭区间写法 for(n=0;n<10;n++) for(n=0;n<=9;n++) { { ⋯ ⋯ } } 【规则1-29】不能在for循环体内修改循环变量,防止循环失控。 for(n=0;n<10;n++) { … n=8;//不可,很可能违背了你的原意 … } 【规则1-30】循环要尽可能的短,要使代码清晰,一目了然。 如果你写的一个循环的代码超过一显示屏,那会让读代码的人发狂的。解决的办法由两个:第一,重新设计这个循环,确认是否这些操作都必须放在这个循环里;第二,将这些代码改写成一个子函数,循环中只调用这个子函数即可。一般来说循环内的代码不要超过20行。 【规则1-31】把循环嵌套控制在3层以内。 国外有研究数据表明,当循环嵌套超过3层,程序员对循环的理解能力会极大的降低。如果你的循环嵌套超过3层,建议你重新设计循环或是将循环内的代码改写成一个字函数。 1.9,goto关键字 一般来说,编码的水平与goto语句使用的次数成反比。有的人主张慎用但不禁用goto语句,但我主张禁用。关于goto语句的更多讨论可以参看SteveMcConnell的名著《CodeComplete.SecondEdition》。 【规则1-32】禁用goto语句。 自从提倡结构化设计以来,goto就成了有争议的语句。首先,由于goto 语句可以灵活跳转,如果不加限制,它的确会破坏结构化设计风格;其次,goto 语句经常带来错误或隐患。它可能跳过了变量的初始化、重要的计算等语句,例如: structstudent*p=NULL; … gotostate; p=(structstudent*)malloc(…);//被goto跳过,没有初始化 ⋯ state: //使用p指向的内存里的值的代码 ⋯ 如果编译器不能发觉此类错误,每用一次goto 语句都可能留下隐患。 1.10,void关键字 void有什么好讲的呢?如果你认为没有,那就没有;但如果你认为有,那就真的有。有点像“色即是空,空即是色”。 1.10.1,void a? void的字面意思是“空类型”,void*则为“空类型指针”,void*可以指向任何类型的数据。void几乎只有“注释”和限制程序的作用,因为从来没有人会定义一个void变量,看看下面的例子: voida; VisualC++6.0上,这行语句编译时会出错,提示“illegaluseoftype'void'”。不过,即使voida的编译不会出错,它也没有任何实际意义。 void真正发挥的作用在于: (1) 对函数返回的限定; (2) 对函数参数的限定。 众所周知,如果指针p1和p2的类型相同,那么我们可以直接在p1和p2间互相赋值;如果p1和p2指向不同的数据类型,则必须使用强制类型转换运算符把赋值运算符右边的指针类型转换为左边指针的类型。 例如: float *p1; int *p2; p1=p2; 其中p1=p2语句会编译出错,提示“'=':cannotconvertfrom'int*'to'float*'”,必须改为: p1=(float*)p2; 而void*则不同,任何类型的指针都可以直接赋值给它,无需进行强制类型转换: void *p1; int *p2; p1=p2; 但这并不意味着,void*也可以无需强制类型转换地赋给其它类型的指针。因为“空类型”可以包容“有类型”,而“有类型”则不能包容“空类型”。比如,我们可以说“男人和女人都是人”,但不能说“人是男人”或者“人是女人”。下面的语句编译出错: void *p1; int *p2; p2=p1; 提示“'=':cannotconvertfrom'void*'to'int*'”。 1.10.2,void修饰函数返回值和参数 【规则1-33】如果函数没有返回值,那么应声明为void类型 在C语言中,凡不加返回值类型限定的函数,就会被编译器作为返回整型值处理。但是许多程序员却误以为其为void类型。例如: add(inta,intb) { return a+b; } intmain(intargc,char*argv[])//甚至很多人以为main函数无返回值 //或是为void型的 { printf("2+3=%d",add(2,3)); } 程序运行的结果为输出: 2+3=5 这说明不加返回值说明的函数的确为int函数。 因此,为了避免混乱,我们在编写C程序时,对于任何函数都必须一个不漏地指定其类型。如果函数没有返回值,一定要声明为void类型。这既是程序良好可读性的需要,也是编程规范性的要求。另外,加上void类型声明后,也可以发挥代码的“自注释”作用。所谓的代码的“自注释”即代码能自己注释自己。 【规则1-34】如果函数无参数,那么应声明其参数为void 在C++语言中声明一个这样的函数: intfunction(void) { return1; } 则进行下面的调用是不合法的:function(2); 因为在C++中,函数参数为void的意思是这个函数不接受任何参数。 但是在TurboC2.0中编译: #include"stdio.h" fun() { return1; } main() { printf("%d",fun(2)); getchar(); } 编译正确且输出1,这说明,在C语言中,可以给无参数的函数传送任意类型的参数,但是在C++编译器中编译同样的代码则会出错。在C++中,不能向无参数的函数传送任何参数,出错提示“'fun':functiondoesnottake1parameters”。 所以,无论在C还是C++中,若函数不接受任何参数,一定要指明参数为void。1.10.3,void指针 【规则1-35】千万小心又小心使用void指针类型。 按照ANSI(AmericanNationalStandardsInstitute)标准,不能对void指针进行算法操作,即下列操作都是不合法的: void*pvoid; pvoid++;//ANSI:错误 pvoid+=1;//ANSI:错误 ANSI标准之所以这样认定,是因为它坚持:进行算法操作的指针必须是确定知道其指向数据类型大小的。也就是说必须知道内存目的地址的确切值。 例如: int*pint; pint++;//ANSI:正确 但是大名鼎鼎的GNU(GNU'sNotUnix的递归缩写)则不这么认定,它指定void*的算法操作与char*一致。因此下列语句在GNU编译器中皆正确: pvoid++;//GNU:正确 pvoid+=1;//GNU:正确 在实际的程序设计中,为符合ANSI标准,并提高程序的可移植性,我们可以这样编写实现同样功能的代码: void*pvoid; (char*)pvoid++;//ANSI:正确;GNU:正确 (char*)pvoid+=1;//ANSI:错误;GNU:正确 GNU和ANSI还有一些区别,总体而言,GNU较ANSI更“开放”,提供了对更多语法的支持。但是我们在真实设计时,还是应该尽可能地符合ANSI标准。 【规则1-36】如果函数的参数可以是任意类型指针,那么应声明其参数为void*。 典型的如内存操作函数memcpy和memset的函数原型分别为: void*memcpy(void*dest,constvoid*src,size_tlen); void*memset(void*buffer,intc,size_tnum); 这样,任何类型的指针都可以传入memcpy和memset中,这也真实地体现了内存操作函数的意义,因为它操作的对象仅仅是一片内存,而不论这片内存是什么类型。如果memcpy和memset的参数类型不是void*,而是char*,那才叫真的奇怪了!这样的memcpy和memset明显不是一个“纯粹的,脱离低级趣味的”函数! 下面的代码执行正确: 例子:memset接受任意类型指针 intIntArray_a[100]; memset(IntArray_a,0,100*sizeof(int));//将IntArray_a清0 例子:memcpy接受任意类型指针 intdestIntArray_a[100],srcintarray_a[100]; //将srcintarray_a拷贝给destIntArray_a memcpy(destIntArray_a,srcintarray_a,100*sizeof(int)); 有趣的是,memcpy和memset函数返回的也是void*类型,标准库函数的编写者都不是一般人。 1.10.4,void不能代表一个真实的变量 【规则1-37】void不能代表一个真实的变量。 因为定义变量时必须分配内存空间,定义void类型变量,编译器到底分配多大的内存呢。 下面代码都企图让void代表一个真实的变量,因此都是错误的代码: voida;//错误 function(voida);//错误 void体现了一种抽象,这个世界上的变量都是“有类型”的,譬如一个人不是男人就是女人(人妖不算)。 void的出现只是为了一种抽象的需要,如果你正确地理解了面向对象中“抽象基类”的概念,也很容易理解void数据类型。正如不能给抽象基类定义一个实例,我们也不能定义一个void(让我们类比的称void为“抽象数据类型”)变量。 void简单吧?到底是“色”还是“空”呢? 1.10,return关键字 return用来终止一个函数并返回其后面跟着的值。 return(Val);//此括号可以省略。但一般不省略,尤其在返回一个表达式的值时。 return可以返回些什么东西呢?看下面例子: char*Func(void) { charstr[30]; … returnstr; } str属于局部变量,位于栈内存中,在Func 结束的时候被释放,所以返回str 将导致错误。【规则1-38】return语句不可返回指向“栈内存”的“指针”,因为该内存在函数体结束时被自动销毁。 1.11,const关键字也许该被替换为readolny const是constant的缩写,是恒定不变的意思,也翻译为常量、常数等。很不幸,正是因为这一点,很多人都认为被const修饰的值是常量。这是不精确的,精确的说应该是只读的变量,其值在编译时不能被使用,因为编译器在编译时不知道其存储的内容。或许当初这个关键字应该被替换为readonly。那么这个关键字有什么用处和意义呢? const 推出的初始目的,正是为了取代预编译指令,消除它的缺点,同时继承它的优点。我们看看它与define宏的区别。(很多人误以为define是关键字,在这里我提醒你再回到本章前面看看32个关键字里是否有define)。 1.11.1,const修饰的只读变量 定义const只读变量,具有不可变性。 例如: constintMax=100; intArray[Max]; 这里请在VisualC++6.0里分别创建.c文件和.cpp文件测试一下。你会发现在.c文件中,编译器会提示出错,而在.cpp文件中则顺利运行。为什么呢?我们知道定义一个数组必须指定其元素的个数。这也从侧面证实在C语言中,const修饰的Max仍然是变量,只不过是只读属性罢了;而在C++里,扩展了const的含义,这里就不讨论了。 注意:const修饰的只读变量必须在定义的同时初始化,想想为什么? 留一个问题:case语句后面是否可以是const修饰的只读变量呢?请动手测试一下。1.11.2,节省空间,避免不必要的内存分配,同时提高效率 编译器通常不为普通const只读变量分配存储空间,而是将它们保存在符号表中,这使得它成为一个编译期间的值,没有了存储与读内存的操作,使得它的效率也很高。例如: #defineM3 //宏常量 constintN=5; //此时并未将N放入内存中 ...... inti=N; //此时为N分配内存,以后不再分配! intI=M; //预编译期间进行宏替换,分配内存 intj=N; //没有内存分配 intJ=M; //再进行宏替换,又一次分配内存! const定义的只读变量从汇编的角度来看,只是给出了对应的内存地址,而不是象#define一样给出的是立即数,所以,const定义的只读变量在程序运行过程中只有一份拷贝(因为它是全局的只读变量,存放在静态区),而#define定义的宏常量在内存中有若干个拷贝。#define宏是在预编译阶段进行替换,而const修饰的只读变量是在编译的时候确定其值。#define宏没有类型,而const修饰的只读变量具有特定的类型。 1.11.3,修饰一般变量 一般常量是指简单类型的只读变量。这种只读变量在定义时,修饰符const可以用在类型说明符前,也可以用在类型说明符后。例如: int const i=2; 或 const int i=2; 1.11.4,修饰数组 定义或说明一个只读数组可采用如下格式: intconsta[5]={1,2,3,4,5};或 constinta[5]={1,2,3,4,5}; 1.11.5,修饰指针 constint*p; //p可变,p指向的对象不可变 intconst*p; //p可变,p指向的对象不可变 int*constp; //p不可变,p指向的对象可变 constint*constp;//指针p和p指向的对象都不可变 在平时的授课中发现学生很难记住这几种情况。这里给出一个记忆和理解的方法: 先忽略类型名(编译器解析的时候也是忽略类型名),我们看const离哪个近。“近水楼台先得月”,离谁近就修饰谁。 constint*p; //const修饰*p,p是指针,*p是指针指向的对象,不可变 intconst*p; //const修饰*p,p是指针,*p是指针指向的对象,不可变 int*constp; //const修饰p,p不可变,p指向的对象可变 constint*constp;//前一个const修饰*p,后一个const修饰p,指针p和p指向的对象 都不可变 1.11.6,修饰函数的参数 const修饰符也可以修饰函数的参数,当不希望这个参数值被函数体内意外改变时使 用。例如: voidFun(constinti); 告诉编译器i在函数体中的不能改变,从而防止了使用者的一些无意的或错误的修改。1.11.7,修饰函数的返回值 const修饰符也可以修饰函数的返回值,返回值不可被改变。例如: constintFun(void); 在另一连接文件中引用const只读变量: externconstinti; //正确的声明 externconstintj=10;//错误!只读变量的值不能改变。 注意这里是声明不是定义,关于声明和定义的区别,请看本章开始处。 讲了这么多讲完了吗?远没有。在C++里,对const做了进一步的扩展,还有很多知识未能讲完。有兴趣的话,不妨查找相关资料研究研究。 1.12,最易变的关键字----volatile volatile是易变的、不稳定的意思。很多人根本就没见过这个关键字,不知道它的存在。也有很多程序员知道它的存在,但从来没用过它。我对它有种“杨家有女初长成,养在深闺人未识” 的感觉。 volatile关键字和const一样是一种类型修饰符,用它修饰的变量表示可以被某些编译器未知的因素更改,比如操作系统、硬件或者其它线程等。遇到这个关键字声明的变量,编译器对访问该变量的代码就不再进行优化,从而可以提供对特殊地址的稳定访问。先看看下面的例子: inti=10; intj=i;//(1)语句 intk=i;//(2)语句 这时候编译器对代码进行优化,因为在(1)、(2)两条语句中,i没有被用作左值。这时候编译器认为i的值没有发生改变,所以在(1)语句时从内存中取出i的值赋给j之后,这个值并没有被丢掉,而是在(2)语句时继续用这个值给k赋值。编译器不会生成出汇编代码重新从内存里取i的值,这样提高了效率。但要注意:(1)、(2)语句之间i没有被用作左值才行。 再看另一个例子: volatile inti=10; intj=i;//(3)语句 intk=i;//(4)语句 volatile关键字告诉编译器 i是随时可能发生变化的,每次使用它的时候必须从内存中取出i的值,因而编译器生成的汇编代码会重新从i的地址处读取数据放在k中。 这样看来,如果i是一个寄存器变量或者表示一个端口数据或者是多个线程的共享数据,就容易出错,所以说volatile可以保证对特殊地址的稳定访问。 但是注意:在VC++6.0中,一般Debug模式没有进行代码优化,所以这个关键字的作用有可能看不出来。你可以同时生成Debug版和Release版的程序做个测试。 留一个问题:constvolatileinti=10;这行代码有没有问题?如果没有,那i到底是什么属性? 1.13,最会带帽子的关键字----extern extern,外面的、外来的意思。那它有什么作用呢?举个例子:假设你在大街上看到一个黑皮肤绿眼睛红头发的美女(外星人?)或者帅哥。你的第一反应就是这人不是国产的。extern就相当于他们的这些区别于中国人的特性。extern可以置于变量或者函数前,以标示变量或者函数的定义在别的文件中,下面的代码用到的这些变量或函数是外来的,不是本文件定义的,提示编译器遇到此变量和函数时在其他模块中寻找其定义。就好比在本文件中给这些外来的变量或函数带了顶帽子,告诉本文件中所有代码,这些家伙不是土著。那你想想extern修饰的变量或函数是定义还是声明? 看列子: A.c文件中定义: B.c文件中用extern修饰: inti=10; externinti;//写成i=10;行吗? voidfun(void) externvoidfun(void);//两个void可否省略? { //code } C.h文件中定义: D.c文件中用extern修饰: int j =1; externdoublej;//这样行吗?为什么? int k =2; j=3.0;//这样行吗?为什么? 至于extern“C”的用法,一般认为属于C++的范畴,这里就先不讨论。当然关于extern的讨论还远没有结束,在指针与数组那一章,你还会和它亲密接触的。 留个问题: return; 这个语句有问题吗?如果没有问题,那返回的是什么?
1.14,struct关键字 struct是个神奇的关键字,它将一些相关联的数据打包成一个整体,方便使用。 在网络协议、通信控制、嵌入式系统、驱动开发等地方,我们经常要传送的不是简单的字节流(char型数组),而是多种数据组合起来的一个整体,其表现形式是一个结构体。经验不足的开发人员往往将所有需要传送的内容依顺序保存在char型数组中,通过指针偏移的方法传送网络报文等信息。这样做编程复杂,易出错,而且一旦控制方式及通信协议有所变化,程序就要进行非常细致的修改,非常容易出错。这个时候只需要一个结构体就能搞定。平时我们要求函数的参数尽量不多于4个,如果函数的参数多于4个使用起来非常容易出错(包括每个参数的意义和顺序都容易弄错),效率也会降低(与具体CPU有关,ARM芯片对于超过4个参数的处理就有讲究,具体请参考相关资料)。这个时候,可以用结构体压缩参数个数。 1.14.1,空结构体多大? 结构体所占的内存大小是其成员所占内存之和(关于结构体的内存对齐,请参考预处理那章)。这点很容易理解,但是下面的这种情况呢? structstudent { }stu; sizeof(stu)的值是多少呢?在VisualC++6.0上测试一下。 很遗憾,不是0,而是1。为什么呢?你想想,如果我们把structstudent看成一个模子的话,你能造出一个没有任何容积的模子吗?显然不行。编译器也是如此认为。编译器认为任何一种数据类型都有其大小,用它来定义一个变量能够分配确定大小的空间。既然如此,编译器就理所当然的认为任何一个结构体都是有大小的,哪怕这个结构体为空。那万一结构体真的为空,它的大小为什么值比较合适呢?假设结构体内只有一个char型的数据成员,那其大小为1byte(这里先不考虑内存对齐的情况).也就是说非空结构体类型数据最少需要占一个字节的空间,而空结构体类型数据总不能比最小的非空结构体类型数据所占的空间大吧。这就麻烦了,空结构体的大小既不能为0,也不能大于1,怎么办?定义为0.5个byte?但是内存地址的最小单位是1个byte,0.5个byte怎么处理?解决这个问题的最好办法就是折中,编译器理所当然的认为你构造一个结构体数据类型是用来打包一些数据成员的,而最小的数据成员需要1个byte,编译器为每个结构体类型数据至少预留1个byte的空间。所以,空结构体的大小就定位1个byte。 1.14.2,柔性数组 也许你从来没有听说过柔性数组(flexiblearray)这个概念,但是它确实是存在的。 C99中,结构中的最后一个元素允许是未知大小的数组,这就叫做柔性数组成员,但结构中的柔性数组成员前面必须至少一个其他成员。柔性数组成员允许结构中包含一个大小可变的数组。sizeof返回的这种结构大小不包括柔性数组的内存。包含柔性数组成员的结构用malloc()函数进行内存的动态分配,并且分配的内存应该大于结构的大小,以适应柔性数组的预期大小。 柔性数组到底如何使用呢?看下面例子: typedefstructst_type { inti; inta[0]; }type_a; 有些编译器会报错无法编译可以改成: typedefstructst_type { inti; inta[]; }type_a; 这样我们就可以定义一个可变长的结构体,用sizeof(type_a)得到的只有4,就是sizeof(i)=sizeof(int)。那个0个元素的数组没有占用空间,而后我们可以进行变长操作了。通过如下表达式给结构体分配内存: type_a*p=(type_a*)malloc(sizeof(type_a)+100*sizeof(int)); 这样我们为结构体指针p分配了一块内存。用p->item[n]就能简单地访问可变长元素。但是这时候我们再用sizeof(*p)测试结构体的大小,发现仍然为4。是不是很诡异?我们不是给这个数组分配了空间么? 别急,先回忆一下我们前面讲过的“模子”。在定义这个结构体的时候,模子的大小就已经确定不包含柔性数组的内存大小。柔性数组只是编外人员,不占结构体的编制。只是说在使用柔性数组时需要把它当作结构体的一个成员,仅此而已。再说白点,柔性数组其实与结构体没什么关系,只是“挂羊头卖狗肉”而已,算不得结构体的正式成员。 需要说明的是:C89不支持这种东西,C99把它作为一种特例加入了标准。但是,C99所支持的是incompletetype,而不是zeroarray,形同intitem[0];这种形式是非法的,C99支持的形式是形同intitem[];只不过有些编译器把intitem[0];作为非标准扩展来支持,而且在C99发布之前已经有了这种非标准扩展了,C99发布之后,有些编译器把两者合而为一了。 当然,上面既然用malloc函数分配了内存,肯定就需要用free函数来释放内存: free(p); 经过上面的讲解,相信你已经掌握了这个看起来似乎很神秘的东西。不过实在要是没掌握也无所谓,这个东西实在很少用。 1.14.3,struct与class的区别 在C++里struct关键字与class关键字一般可以通用,只有一个很小的区别。struct的成员默认情况下属性是public的,而class成员却是private的。很多人觉得不好记,其实很容易。你平时用结构体时用public修饰它的成员了吗?既然struct关键字与class关键字可以通用,你也不要认为结构体内不能放函数了。 当然,关于结构体的讨论远没有结束,在指针与数组那一章,你还会要和它打交道的。 1.15,union关键字 union关键字的用法与struct的用法非常类似。 union维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union中所有的数据成员共用一个空间,同一时间只能储存其中一个数据成员,所有的数据成员具有相同的起始地址。例子如下: unionStateMachine { charcharacter; intnumber; char*str; doubleexp; }; 一个union只配置一个足够大的空间以来容纳最大长度的数据成员,以上例而言,最大长度是double型态,所以StateMachine的空间大小就是double数据类型的大小。 在C++里,union的成员默认属性页为public。union主要用来压缩空间。如果一些数据不可能在同一时间同时被用到,则可以使用union。 1.15.1,大小端模式对union类型数据的影响 下面再看一个例子: union { inti; char a[2]; }*p,u; p=&u; p->a[0]=0x39; p->a[1]=0x38; p.i的值应该为多少呢? 这里需要考虑存储模式:大端模式和小端模式。 大端模式(Big_endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中。 小端模式(Little_endian):字数据的高字节存储在高地址中,而字数据的低字节则存放在低地址中。 union型数据所占的空间等于其最大的成员所占的空间。对union型的成员的存取都是相对于该联合体基地址的偏移量为0处开始,也就是联合体的访问不论对哪个变量的存取都是从union的首地址位置开始。如此一解释,上面的问题是否已经有了答案呢? 1.15.2,如何用程序确认当前系统的存储模式? 上述问题似乎还比较简单,那来个有技术含量的:请写一个C函数,若处理器是Big_endian的,则返回0;若是Little_endian的,则返回1。 先分析一下,按照上面关于大小端模式的定义,假设int类型变量i被初始化为1。 以大端模式存储,其内存布局如下图: 以小端模式存储,其内存布局如下图: 变量i占4个字节,但只有一个字节的值为1,另外三个字节的值都为0。如果取出低地址上的值为0,毫无疑问,这是大端模式;如果取出低地址上的值为1,毫无疑问,这是小端模式。既然如此,我们完全可以利用union类型数据的特点:所有成员的起始地址一致。到现在,应该知道怎么写了吧?参考答案如下: intcheckSystem() { unioncheck { inti; charch; }c; c.i=1; return(c.ch==1); } 现在你可以用这个函数来测试你当前系统的存储模式了。当然你也可以不用函数而直接去查看内存来确定当前系统的存储模式。如下图: 图中0x01的值存在低地址上,说明当前系统为小端模式。 不过要说明的一点是,某些系统可能同时支持这两种存储模式,你可以用硬件跳线或在编译器的选项中设置其存储模式。 留个问题: 在x86系统下,输出的值为多少? #include <stdio.h> intmain() { inta[5]={1,2,3,4,5}; int*ptr1=(int*)(&a+1); int*ptr2=(int*)((int)a+1); printf("%x,%x",ptr1[-1],*ptr2); return0; } 1.16,enum关键字 很多初学者对枚举(enum)感到迷惑,或者认为没什么用,其实枚举(enum)是个很有用的数据类型。 1.16.1, 枚举类型的使用方法 一般的定义方式如下: enumenum_type_name { ENUM_CONST_1, ENUM_CONST_2, ... ENUM_CONST_n }enum_variable_name; 注意:enum_type_name是自定义的一种数据数据类型名,而enum_variable_name为enum_type_name类型的一个变量,也就是我们平时常说的枚举变量。实际上enum_type_name类型是对一个变量取值范围的限定,而花括号内是它的取值范围,即enum_type_name类型的变量 enum_variable_name只能取值为花括号内的任何一个值,如果赋给该类型变量的值不在列表中,则会报错或者警告。ENUM_CONST_1、ENUM_CONST_2、...、 ENUM_CONST_n,这些成员都是常量,也就是我们平时所说的枚举常量(常量一般用大写)。enum变量类型还可以给其中的常量符号赋值,如果不赋值则会从被赋初值的那个常量开始依次加1,如果都没有赋值,它们的值从0开始依次递增1。如分别用一个常数表示不同颜色: enumColor { GREEN=1, RED, BLUE, GREEN_RED=10, GREEN_BLUE }ColorVal; 其中各常量名代表的数值分别为: GREEN=1 RED=2 BLUE=3 GREEN_RED=10 GREEN_BLUE=11 1.16.2,枚举与#define宏的区别 下面再看看枚举与#define宏的区别: 1),#define宏常量是在预编译阶段进行简单替换。枚举常量则是在编译的时候确定其值。2),一般在编译器里,可以调试枚举常量,但是不能调试宏常量。 3),枚举可以一次定义大量相关的常量,而#define宏一次只能定义一个。 留两个问题: A),枚举能做到事,#define宏能不能都做到?如果能,那为什么还需要枚举?B),sizeof(ColorVal)的值为多少?为什么? 1.17,伟大的缝纫师----typedef关键字 1.17.1,关于马甲的笑话 有这样一个笑话:一个猎人在河边抓捕一条蛇,蛇逃进了水里。过一会,一个乌龟爬到岸边。猎人一把抓住这个乌龟,大声的说道:小样,别你为你穿了个马甲我就不认识你了! typedef关键字是个伟大的缝纫师,擅长做马甲,任何东西穿上这个马甲就立马变样。它可以把狼变成一头羊,也能把羊变成一头狼。甚至还可以把长着翅膀的鸟人变成天使,同样也能把美丽的天使变成鸟人。所以,你千万不要得罪它,一定要掌握它的脾气,不然哪天我把你当鸟人,你可别怪我。^_^。 1.17.2,历史的误会----也许应该是typerename 很多人认为typedef是定义新的数据类型,这可能与这个关键字有关。本来嘛,type是数据类型的意思;def(ine)是定义的意思,合起来就是定义数据类型啦。不过很遗憾,这种理解是不正确的。也许这个关键字该被替换为“typerename”或是别的词。 typedef的真正意思是给一个已经存在的数据类型(注意:是类型不是变量)取一个别名,而非定义一个新的数据类型。比如:华美绝伦的芍药,就有个别名---“将离”。中国古代男女交往,往往以芍药相赠,表达惜别之情,送芍药就意味着即将分离。所以文人墨客就给芍药取了个意味深长的别名-----“将离”。这个新的名字就表达了那种依依不舍的惜别之情…这样新的名字与原来的名字相比,就更能表达出想要表达的意思。 在实际项目中,为了方便,可能很多数据类型(尤其是结构体之类的自定义数据类型)需要我们重新取一个适用实际情况的别名。这时候typedef就可以帮助我们。例如: typedef struct student { //code }Stu_st,*Stu_pst; //命名规则请参考本章前面部分 A),struct student stu1;和Stu_st stu1;没有区别。 B),struct student * stu2;和Stu_pst stu2;和Stu_st * stu2;没有区别。 这个地方很多初学者迷惑,B)的两个定义为什么相等呢?其实很好理解。我们把“struct student{/*code*/}” 看成一个整体,typedef就是给“struct student{/*code*/}”取了个别名叫“Stu_st”;同时给“structstudent{/*code*/}* ”取了个别名叫“Stu_pst”。只不过这两个名字同时取而已,好比你给你家小狗取了个别名叫“大黄”,同时你妹妹给小狗带了小帽子,然后给它取了个别名叫“小可爱”。^_^。 好,下面再把typedef 与const放在一起看看: C),const Stu_pst stu3; D),Stu_pst const stu4; 大多数初学者认为C)里const修饰的是stu3指向的对象;D)里const修饰的是stu4这个指针。很遗憾,C)里const修饰的并不是stu3指向的对象。那const这时候到底修饰的是什么呢?我们在讲解const int i 的时候说过const放在类型名“int”前后都行;而const int *p与int *const p则完全不一样。也就是说,我们看const修饰谁都时候完全可以将数据类型名视而不见,当它不存在。反过来再看“const Stu_pst stu3”,Stu_pst是“struct student{/*code*/}*”的别名, “struct student{/*code*/}*”是一个整体。对于编译器来说,只认为Stu_pst是一个类型名,所以在解析的时候很自然的把“Stu_pst”这个数据类型名忽略掉。现在知道const到底修饰的是什么了吧?^_^。 1.17.3,typedef与#define的区别 噢,上帝!这真要命!别急,要命的还在后面呢。看如下例子: E), #define INT32 int unsigned INT32 i=10; F),typedef int int32; unsigned int32 j=10; 其中F)编译出错,为什么呢?E)不会出错,这很好理解,因为在预编译的时候INT32被替换为int,而unsigned int i=10;语句是正确的。但是,很可惜,用typedef取的别名不支持这种类型扩展。另外,想想typedef static int int32行不行?为什么? 下面再看一个与#define宏有关的例子: G),#define PCHAR char* PCHAR p3,p4; H),typedef char* pchar; pcharp1,p2; 两组代码编译都没有问题,但是,这里的p4却不是指针,仅仅是一个char类型的字符。这种错误很容易被忽略,所以用#define的时候要慎之又慎。关于#define当然还有很多话题需要讨论,请看预处理那一章。当然关于typedef的讨论也还没有结束,在指针与数组那一章,我们还要继续讨论。 1.17.4,#define a int[10]与typedef int a[10]; 留两个问题: 1),#defineaint[10] A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 2),typedef int a[10]; A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 3),#define a int*[10] A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 4),typedef int* a[10]; A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 5),#define *a int[10] A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 6),typedefint (*a)[10]; A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 7),#define *a *int[10] A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 8),typedefint* (*a)[10]; A),a[10] a[10]; B),a[10] a; C),int a[10]; D),int a; E),a b[10]; F),a b; G),a* b[10]; H),a* b; 请判断这里面哪些定义正确,哪些定义不正确。另外,int[10]和a[10]到底该怎么用?