strtok
strtok这个函数我们再熟悉不过了,因为我们要经常要和字符打交道,不可避免的要分割字符串连接字符串。那么我今天看一下分割字符串。
strtok
函数原型char* strtok(char *str,const char *delimiters);
来分析一下这个分割字符串函数,这个函数是在传入的字符数组里进行调整,它并没有生成新的字符数组。
第一个参数可以是字符数组或者NULL,第一次切割传要切割的字符,第二次要在原来字符数组上继续切割就传NULL;
第二个参数传入的是切割符,这个参数看起来简单其实是比第一个还复杂,它传入的是一个字符串,而不是一个字符。
我们知道切割符是一个字符这个很好理解,但是传入一个字符串那函数是怎么进行切割的呢?
my_strtok函数的实现
#include <stdio.h> #include <string.h> char *my_strtok(char *buff, char* delimit) { static char *p = NULL; //定义一个静态的字符指针 p if(buff == NULL && (buff = p) == NULL) //这个if语句特别重要,解决第一个参数传入的问题 { //第一个参数是buff不为NULL,if第一条buff == NULL就为非 return NULL; //不执行后面的赋值语句和判断语句, //如果为空就把buff 赋值成 p } char *t = buff; //这个是遍历buff字符串用的 char *s = NULL; //这个是遍历delimit分割符用的 while(*t != '\0' ) //第一层遍历buff { s = delimit; //把分割符号的地址赋给s while( *s != '\0') //遍历分割符里面的元素 { if(*s == *t) //如果分割符里面的字符命中了 { p = t+1; //把t+1的地址赋给静态指针 if( t == buff) //如果刚开始就命中了分割符 { buff = p; //buff 等于t+1 //把刚刚在buff中发现的命中分割符给置成\0 break; //跳出这层循环,因为现在一块都没切出来,不break,会被下面的语句return出去 } *t = '\0'; return buff; } s++; } t++; } if(buff != NULL) { return buff; p = NULL; } return NULL; }
strtok的使用(联系下面的函数自己理解下)
我们举个例子,
我们要分割一个 char buff[128] = "ab,cd,ef,ghj";
以 “,”为分割符
strtok(buff,",");
第一个形参是buff
第二个是形参是char *delimit
char *tmp 遍历buff数组的指针
char *s 保存着分割符delinitstatic char *p 记录每次分割后的第一位字符
第一次分割。第一个参数我们传入buff,也就是数组的首地址,从a开始分割。遍历buff指针char *p命中分割符后,静态的指针指向这个分割符后面一个字符,并把‘,’置成‘\0’,返回压入的第一个形参地址。
这个时候的buff[128] 变成 "ab\0cd,efghj;
第二次分割时候。我们如果第一个参数接着传入buff,那么就搞笑了。因为我们第一次把第一个‘,’字符置\0。
显然遍历buff指针还跑一遍发现找不到分割符,碰到/0结束了。
所以我们非第一次切割的,记住传入的是NULL,这个是用来区分是不是第一次分割同一个字符串的。我们如果传入的是NULL,那么就是从函数static char*p继续。
这么来说要想分割出ab cd ef ghj 这四个字符串
char *Arg[5] = {0}; //定义一个指针数组每个格子保存分界符的下一位 char *p = strtok(buff,","); //第一次切割所以传进去的是数组首地址 int i = 0; while(p!=NULL) { Arg[i++] = p; //利用一个指针数组保存每次切割后的第一位字符 p = strtok(NULL,","); //非第一次切割传递一个NULL即可 }
这样就保存了,每个分割好的字符的首地址了。
而且分割符都被换成\0,
buff[128] = "ab\0cd\0ef\0ghj
Arg 分别保存了 a c e g四个字符的地址指针
当输出时候,就可以输出分割好的字符串
使用strtok注意事项
1)对同一个字符数组切割,第一个形参使用时候记得非第一次次分割,传的是NULL。
2)还有就是它会对源字符串修改,如果源字符串还要继续使用的话,先利用strcpy一个零时字符数组,在实现字符分割。
3)压入第一个形参是传字符数组,不能传const char *类型,这样是字符串常量不能进行修改。
4)我们传入的第二个形参是字符串,不是字符,意味着是“ ” ,是双引号,不是单引号‘ ’哪怕只有一个字符5)在使用线程中,使用strtok是不安全的,因为他们共享全局变量,strtok的内部静态指针会被所有线程共享,所以才
引出了我们strtok_r这个函数,我们下面会去讲解下。strtok_r
我们既然已经实现了分割字符串函数strtok,还要引出这个strtok_r呢?
其实strtok 这个函数是有缺陷的,我们通过一个例子来演示一下
执行结果
我们简单的分析一下把
就是strtok里面那个static 静态的全局指针 p,是所有线程共享的,那么就会出现覆盖的问题,这里是主线程先执行,第一次切割的是buff,然后p记录了下次切割的第一位字符,然而线程fun里的开始切割buff1了,切割后,把主线程在p记录的地址覆盖了。于是出现了主线程帮fun这个线程一起切割buff1的情况。
那么就出现了线程不安全的问题。于是引出了strtok_r函数这个是多了个参数。char **m,第三个参数传入的是指针的地址
每个线程的栈是私有的,所以呢就可以在栈上定义个char *m = NULL ,去代替了static char* p。把共有的变成了私有的。这就是strtok 和 strtok_r 的区别。
相关阅读
多数企业都已熟悉国内以微博为主的社会化媒体营销,而面向海外营销将同样的策略移植到 Facebook 可行吗?企业在 Facebook 上发布消息
电话机器人在简单重复的业务场景,例如短期活动的快速通知、海量外呼筛选客户、用户服务回访等,为各大企业创造了“降本增效&rd
有工作流使用经验的朋友请进来,最近在做一个工作流方面的项目;
这两天刚忙完一个项目,趁着这几天任务轻松,抽空总结上一个项目所遇到的一些问题,都是很简单的基本操作,先列个大纲吧: 一、地图的基本
setInterval()这个方法可按照指定的周期(以毫秒计)来调用函数或计算表达式。 setInterval(x(),y); x()代表你调用的方法, y是每隔多长时间