zoukankan      html  css  js  c++  java
  • strcmp函数实现及分析

    最近看C,看到strcmp函数,对它的实现原型不很清楚,于是到网上搜。网上算法一大堆,看了很多代码后自己做了一下总结


     strcmp函数是C/C++中基本的函数,它对两个字符串进行比较,然后返回比较结果,函数形式如下:
    int strcmp(const char* str1, const char* str2);
    其中str1和str2可以是字符串常量或者字符串变量,返回值为整形。返回结果如下规定:
    ① str1小于str2,返回负值或者-1(VC返回-1);                   
    ② str1等于str2,返回0;
    ③ str1大于str2,返回正值或者1(VC返回1);

    strcmp函数实际上是对字符的ASCII码进行比较,实现原理如下:首先比较两个串的第一个字符,若不相等,则停止比较并得出两个ASCII码大小比较的结果;如果相等就接着 比较第二个字符然后第三个字符等等。无论两个字符串是什么样,strcmp函数最多比较到其中一个字符串遇到结束符'/0'为止,就能得出结果。strcmp算法的可以有多种,不过我觉的可以把这么多算法分为两种,一种是利用减法运算判断结果,另一种是利用比较运算(==)得出结果。

    减法运算的实现的代码如下:

    1. int strcmp(const char* str1, const char* str2)  
    2. {  
    3.     int ret = 0;  
    4.     while(!(ret=*(unsigned char*)str1-*(unsigned char*)str2) && *str1)  
    5.     {  
    6.         str1++;  
    7.         str2++  
    8.     }  
    9.   
    10.   
    11.     if (ret < 0)  
    12.     {  
    13.         return -1;  
    14.     }  
    15.     else if (ret > 0)  
    16.     {  
    17.         return 1;  
    18.     }  
    19.     return 0;  
    20. }  
    这个函数要注意一下几点
    ①使用*(unsigned char*)str1而不是用*str1。这是因为传入的参数为有符号数,有符号字符值的范围是-128~127,无符号字符值的范围是0~255,而字符串的ASCII没有负值,若不转化为无符号数这回在减法实现时出现错误。
    例如 str1的值为1,str2的值为255。
    作为无符号数计算时ret = -254,结果为负值,正确
    作为有符号数计算时ret = 2,结果为正值,错误

    ②While循环中ret=*(unsigned char*)str1-*(unsigned char*)str2) && *str1,最后与上str1也可以换成str2,因为前面已经做了相减,无论哪个先为‘’都会退出。因为最后与上str1是为了判断str1是否结束,即是否为‘’。

    ③这个函数没有判断参数为NULL时的情况,所以当传入NULL时程序会崩溃。网上看别人说商业化代码都会在调用strcmp前先判断是否为NULL,所以可以不用判断NULL;我在VC6上测试string.h中的strcmp(NULL,NULL),程序也会崩溃。这里可以根据实际情况来决定。

    若要判断NULL按下面方法更改代码,可以在这个函数最前面加入断言

    assert((NULL != str1) && (NULL != str2))
    但要注意断言assert 是仅在Debug 版本起作用的宏,是在Debug时做的无害测试。若想在Release 版也可
    以判断NULL,那我们必须用别的代码来判断。

    可以在程序前面加入if判断
    if ((NULL != str1) && (NULL != str2))
    {
    return 0;
    }
    我用CFree 5测试sting.h中的strcmp(NULL,NULL),程序返回值为0(strcmp(NULL,str1)崩溃),这里我们可以返回其他的值如 -2。
    我们也可以在函数前面加入while判断
    while ((NULL != str1) && (NULL != str2))
    {
    //strcmp实现代码
    }
    return 0;
    利用while就可以把每个字符都进行判断。

    利用比较运算(==)算法如下
    1. int strcmp(const char* str1, const char* str2)  
    2. {  
    3.     while ((*str1) && (*str1 == *str2))  
    4.     {  
    5.         str1++;  
    6.         str2++;  
    7.     }  
    8.   
    9.   
    10.     if (*(unsigned char*)str1 > *(unsigned char*)str2)  
    11.     {  
    12.         return 1;  
    13.     }  
    14.     else if (*(unsigned char*)str1 < *(unsigned char*)str2)  
    15.     {  
    16.         return -1;  
    17.     }  
    18.     else  
    19.     {  
    20.         return 0;  
    21.     }    
    22. }  
    函数注意点和上面一样,有一点要注意不要为了简洁而写成下面
    1. int strcmp(const char *str1,const char *str2)  
    2. {  
    3.     while ((*str1) && (*str1++ == *str2++)) //这里++会引起错误  
    4.     {  
    5.     NULL;  
    6.     }  
    7.   
    8.   
    9.     if (*(unsigned char*)str1 > *(unsigned char*)str2)  
    10.     {  
    11.         return 1;  
    12.     }  
    13.     else if (*(unsigned char*)str1 < *(unsigned char*)str2)  
    14.     {  
    15.         return -1;  
    16.     }  
    17.     else  
    18.     {  
    19.         return 0;  
    20.     }   
    21. }  

    当str1为abcd,st2为abfd时,由于判断到第三个字符时while推出,而str指针又加了1,str都指向第四个字符输出结果为0,显然这是错误的。

    这个函数也可以用for来实现
    1. int strcmp(const char *str1, const char *str2)  
    2. {  
    3.     for ( ; *str1 == *str2; str1++, str2++)  
    4.     {     
    5.         if (*str1 == '')  
    6.         return 0;  
    7.     }  
    8.       
    9.     if (*(unsigned char*)str1 > *(unsigned char*)str2)  
    10.     {  
    11.         return 1;  
    12.     }  
    13.     else if (*(unsigned char*)str1 < *(unsigned char*)str2)  
    14.     {  
    15.         return -1;  
    16.     }  
    17.     //如果只返回正负的话可以用 return *(unsigned char*)str1 - *(unsigned char*)str2;  
    18. }  
    转载链接:http://blog.csdn.net/wgenek/article/details/7257435
  • 相关阅读:
    Bom入门
    Dom入门
    JavaScript对象
    Ultra-QuickSort——[归并排序、分治求逆序对]
    UVA 11212 Editing a Book [迭代加深搜索IDA*]
    Anagram——[枚举全排列]
    Black Box--[优先队列 、最大堆最小堆的应用]
    Argus--[优先队列]
    UVa1601
    UVa 10603 Fill [暴力枚举、路径搜索]
  • 原文地址:https://www.cnblogs.com/webmen/p/5739738.html
Copyright © 2011-2022 走看看