zoukankan      html  css  js  c++  java
  • strtok和strtok_r(转载)

     strtok将字符串分隔成标记。对strtok的第一次调用与后继的调用不同。第一次调用的时候,将要解析的字符串地址作为第一个参数s1,传递进去。在后继的解析同一个字符串的调用中,用NULL作为第一个参数。
        对strtok的每个后继调用都返回下一个标记的起始,并在返回的标记末尾插入一个''。当strtok函数到达s1的末尾时,就返回NULL。
        strtok没有为标记分配新的空间,而是就地对s1进行了标记,理解这一点是很重要的。因此,如果需要在调用该函数后访问原来的s1,就必须传递字符串的一个拷贝。
        这两个参数使用的限定符restrict要求:这个函数中s1引用的任何对象都不能被s2访问。也就是说,被解析的字符串的末端不能用来包含定界符。

        但是,strtok不是一个线程安全的函数。因为根据其定义,它必须使用内部静态变量来记录字符串中下一个需要解析的标记的当前位置。但是,由于指示这个位置的变量只有一个,那么,在同一个程序中出现多个解析不同字符串的strtok调用时,各自的字符串的解析就会互相干扰。

    原型:char *strtok(char *s, char *delim);

    功能:分解字符串为一组字符串。s为要分解的字符串,delim为分隔符字符串。

    说明:首次调用时,s指向要分解的字符串,之后再次调用要把s设成NULL。
            strtok在s中查找包含在delim中的字符并用NULL('/0')来替换,直到找遍整个字符串。

    返回值:从s开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。
               所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。

    举例:

        #include <string.h>
        #include
    <stdio.h>


       
    int main(void
    )
    {
           
    char input[16] ="abc,d"
    ;
           
    char*
    p;

      
    /*
    strtok places a NULL terminator
            in front of the token, if found
    */

            p
    = strtok(input, ","
    );
           
    if (p)      printf("%s "
    , p);

       
    /*
    A second call to strtok using a NULL
            as the first parameter returns a pointer
            to the character following the token  
    */

            p
    = strtok(NULL, ","
    );
           
    if (p)      printf("%s "
    , p);

            return0;
       }

          函数第一次调用需设置两个参数。第一次分割的结果,返回串中第一个 ',' 之前的字符串,也就是上面的程序第一次输出abc。

          第二次调用该函数strtok(NULL,"."),第一个参数设置为NULL。结果返回分割依据后面的字串,即第二次输出d。

    带有_r的函数主要来自于UNIX下面。所有的带有_r和不带_r的函数的区别的是:带_r的函数是线程安全的,r的意思是reentrant,可重入的。

    1. strtok介绍
    众所周知,strtok可以根据用户所提供的分割符(同时分隔符也可以为复数比如“,。”)
    将一段字符串分割直到遇到"/0".

    比如,分隔符=“,” 字符串=“Fred,John,Ann”
    通过strtok 就可以把3个字符串 “Fred”     “John”      “Ann”提取出来。
    上面的C代码为

    QUOTE:
    int in=0;
    char buffer[]="Fred,John,Ann"
    char *p[3];
    char *buf = buffer;
    while((p[in]=strtok(buf,","))!=NULL) {
                     in++;
                     buf=NULL; }

    如上代码,第一次执行strtok需要以目标字符串的地址为第一参数(buf=buffer),之后strtok需要以NULL为第一参数 (buf=NULL)。指针列p[],则储存了分割后的结果,p[0]="John",p[1]="John",p[2]="Ann",而buf就变成    Fred/0John/0Ann/0。

    2. strtok的弱点
    让我们更改一下我们的计划:我们有一段字符串 "Fred male 25,John male 62,Anna female 16" 我们希望把这个字符串整理输入到一个struct,

    QUOTE:
    struct person {
         char [25] name ;
         char [6] sex;
         char [4] age;
    }

    要做到这个,其中一个方法就是先提取一段被“,”分割的字符串,然后再将其以“ ”(空格)分割。
    比如: 截取 "Fred male 25" 然后分割成 "Fred" "male" "25"
    以下我写了个小程序去表现这个过程:

    QUOTE:
    #include<stdio.h>
    #include<string.h>
    #define INFO_MAX_SZ 255
    int main()
    {
       int in=0;
       char buffer[INFO_MAX_SZ]="Fred male 25,John male 62,Anna female 16";
       char *p[20];
       char *buf=buffer;

       while((p[in]=strtok(buf,","))!=NULL) {
                 buf=p[in];
                 while((p[in]=strtok(buf," "))!=NULL) {
                           in++;
                           buf=NULL;
                        }
                     p[in++]="***"; //表现分割
                     buf=NULL; }

       printf("Here we have %d strings/n",i);
       for (int j=0; j<in; j++)
             printf(">%s</n",p[j]);
       return 0;
    }

    这个程序输出为:
    Here we have 4 strings
    >Fred<
    >male<
    >25<
    >***<
    这只是一小段的数据,并不是我们需要的。但这是为什么呢? 这是因为strtok使用一个static(静态)指针来操作数据,让我来分析一下以上代码的运行过程:

    红色为strtok的内置指针指向的位置蓝色为strtok对字符串的修改

    1. "Fred male 25,John male 62,Anna female 16" //外循环

    2. "Fred male 25/0John male 62,Anna female 16" //进入内循环

    3.    "Fred/0male 25/0John male 62,Anna female 16"

    4.    "Fred/0male/025/0John male 62,Anna female 16"

    5 "Fred/0male/025/0John male 62,Anna female 16" //内循环遇到"/0"回到外循环

    6   "Fred/0male/025/0John male 62,Anna female 16" //外循环遇到"/0"运行结束。

    3. 使用strtok_r
    在这种情况我们应该使用strtok_r, strtok reentrant.
    char *strtok_r(char *s, const char *delim, char **ptrptr);

    相对strtok我们需要为strtok提供一个指针来操作,而不是像strtok使用配套的指针。
    代码:

    QUOTE:
    #include<stdio.h>
    #include<string.h>
    #define INFO_MAX_SZ 255
    int main()
    {
       int in=0;
       char buffer[INFO_MAX_SZ]="Fred male 25,John male 62,Anna female 16";
       char *p[20];
       char *buf=buffer;

       char *outer_ptr=NULL;
       char *inner_ptr=NULL;

       while((p[in]=strtok_r(buf,",",&outer_ptr))!=NULL) {
                 buf=p[in];
                 while((p[in]=strtok_r(buf," ",&inner_ptr))!=NULL) {
                           in++;
                           buf=NULL;
                        }
                     p[in++]="***";
                     buf=NULL; }

       printf("Here we have %d strings/n",i);
       for (int j=0; jn<i; j++)
             printf(">%s</n",p[j]);
       return 0;
    }

    这一次的输出为:
    Here we have 12 strings
    >Fred<
    >male<
    >25<
    >***<
    >John<
    >male<
    >62<
    >***<
    >Anna<
    >female<
    >16<
    >***<


    让我来分析一下以上代码的运行过程:

    红色为strtok_r的outer_ptr指向的位置
    紫色为strtok_r的inner_ptr指向的位置
    蓝色为strtok对字符串的修改

    1. "Fred male 25,John male 62,Anna female 16" //外循环

    2. "Fred male 25/0John male 62,Anna female 16"//进入内循环

    3.   "Fred/0male 25/0John male 62,Anna female 16"

    4   "Fred/0male/025/0John male 62,Anna female 16"

    5 "Fred/0male/025/0John male 62,Anna female 16" //内循环遇到"/0"回到外循环

    6   "Fred/0male/025/0John male 62/0Anna female 16"//进入内循环

  • 相关阅读:
    使用一行Python代码从图像读取文本
    FastAI 简介
    OpenCV-Python 轮廓:更多属性 | 二十四
    Numpy和OpenCV中的图像几何变换
    从云计算到边缘计算
    OpenCV-Python 轮廓属性 | 二十三
    c# GetType()和typeof()的区别
    C# 子类父类方法同名,三种处理方式
    C# string 与 String的区别
    decimal
  • 原文地址:https://www.cnblogs.com/jade-L/p/3201454.html
Copyright © 2011-2022 走看看