盘点分析C语言中少见却强大的字符串函数
正片开始
字符串函数
首先神魔是字符串函数?
指的是编程语言中用来进行字符串处理的函数,如C,pascal,Visual以及LotusScript中进行字符串拷贝,计算长度,字符查找等的函数。 功能:把src所指由NUL结束的字符串复制到dest所指的 数组 中。 返回指向dest结尾处字符 (NUL)的 指针 。
像之前我写到过的 strcpy,strcat,strcmp 这些函数都属于长度不受限的字符串函数,由此就有下面两种分类
1.长度不受限的字符串函数
2.长度受限的字符串函数
长度不受限就是以‘ \0 ’为函数结束标准的判定,当对象没给定 ’ \0 '时,就跑不出结果或者报错;相反则为长度受限。我再整理一下,好做个对比:
strcpy
字符串拷贝,把指向的字符串复制到目标字符串,声明为
char *strcpy(char *dest, const char *src)
strcat
字符串连续,把指向的字符串追加到目标字符串的结尾(无间隔),声明为:
char *strcat(char *dest, const char *src)
strcmp
把所指向的字符串和目标字符串进行比较, 返回值大小决定二者的相对大小,声明如下:
int strcmp(const char *str1, const char *str2)
以上三种是函数的长度受限,我们可以变 strncpy,strncat 和 strncmp,就是长度不受限函数了,相比多了一个 n ,这个 n 是指函数作用范围最多在前 n 个字节,比如 strncmp 中的n 就是要比较的最大字符数,就相当于一个限制机制了。
这里主要补充几个比较实用的吧:
strstr
其实顾名思义,翻译过来就是“字符串字符串”,其实作用就是在一个字符串里面找我的目标字符串,不包含终止符 ‘\0’,返回值是该函数在 目标字符串中第一次出现该字符串的位置。声明为:
char *strstr(const char *haystack, const char *needle)
举个栗子:
int main() { char a[] = "overwatch"; char b[] = "wa"; char* c = strstr(a, b); if (c != NULL) { printf("found it: %s\n", c); } else { printf("there was nothing\n"); } return 0; }
我们用最常规的代码也可以模拟出 strstr 的功能,库函数的实现方法也是类似
#include<assert.h> char* strstr1(const char* a, const char* b) { assert(a && b); const char* c = NULL; const char* d = NULL; const char* str = a; if (*b == '\0') { return (char*)a; //处理查找语句为空语句 } while (*str) { c = str; d = b; while (*c && *d && (*c == *d))//防止相同元素为'\0' 循环继续导致越界访问 { *c++; *d++; } if (*d == '\0') { return (char*)str; } str++;//多次查找,匹配错误会回到起点++再重新查找 } return NULL; }
要注意的是,该函数规定当查找对象字符串为空 (\0) 时,会返回目标字符串的地址。
KMP算法
说到了 strstr ,引申一下KMP算法,也就是字符串查找算法,称之为 Knuth-Morria-Pratt 算法。该算法相对于暴力算法有比较大的改进,主要是消除了主串指针的回溯,从而使算法效率有了某种程度的提高。KMP算法比我们的 strstr 效率要高,我们日后再细细讲解
strtok
我们可以称之为字符串刀,作用就是分割字符串,strtok() 函数的声明如下:
char *strtok(char *str, const char *delim)
str 为一组字符串,delim 为分隔符,也可以是个集合,分割结果变成第一个子字符串。
因为结果被修改所以 strtok 对象一般为临时拷贝的可修改内容。举个栗子:
int main() { char a[] = "overwatch"; char b[20] = { 0 }; char* ret = NULL; strcpy(b, a); //进行临时拷贝方便切割 char* p = "w";//指针类型维护分隔符 ret = strtok(b, p); printf("%s\n", ret); return 0; }
若要进一步分割,我们需要空指针进行维护,什么意思?
分割完一次,结尾就会变成 ‘ \0 ’,此时的 strtok 记忆能力已经记住了 ‘ \0 ’的位置,这个记忆功能我们大致都能猜出是一个静态变量,static 修饰一个局部变量时就可以做到这点,就是我们只需要传入一个 null ,就可以自动进行分割,以此类推:
strtok(b, p); ret = strtok(NULL,"t");
strerror
咱在使用库函数时,总会有调用失败的时候,这时候都会有一个错误码被设置,这个错码都会放进 errno 这个全局错误码里面,我们看到的错误信息可能是一个莫名其妙的数字,而 strerror 就是将错误码翻译成错误信息,并返回一个指向错误消息字符串的指针。strerror 生成的错误字符串取决于开发平台和编译器。
char *strerror(int errnum)
比如:
int main() { printf("%s\n", strerror(10)); printf("%s\n", strerror(20)); printf("%s\n", strerror(30)); return 0; }
结果分别是:无子进程,非目录元素,只读文件系统
但其实 strerror 并不是小题大做拿来查询错误的,是在文本上输入输出时方便我们得知打开写入打开失败的原因的,当我们尝试打开一个不存在的文件时就会报错: No such file or directory
#include <errno.h> int main () { FILE *fp; fp = fopen("file.txt","search"); if( fp == NULL ) { printf("Error: %s\n", strerror(errno)); } return(0); }
因为我们要调用C语言给出的全局变量 errno,所以记得要引 <errno.h> 头文件。
上一篇:C语言数学公式来实现土味表白
栏 目:C代码
本文标题:盘点分析C语言中少见却强大的字符串函数
本文地址:http://www.codeinn.net/misctech/212106.html