当前位置:主页 > 软件编程 > C代码 >

盘点分析C语言中少见却强大的字符串函数

时间:2022-08-28 09:29:37 | 栏目:C代码 | 点击:

正片开始

字符串函数

首先神魔是字符串函数?

指的是编程语言中用来进行字符串处理的函数,如C,pascal,Visual以及LotusScript中进行字符串拷贝,计算长度,字符查找等的函数。 功能:把src所指由NUL结束的字符串复制到dest所指的 数组 中。 返回指向dest结尾处字符 (NUL)的 指针 。

像之前我写到过的 strcpy,strcat,strcmp 这些函数都属于长度不受限的字符串函数,由此就有下面两种分类

1.长度不受限的字符串函数

2.长度受限的字符串函数

长度不受限就是以‘ \0 ’为函数结束标准的判定,当对象没给定 ’ \0 '时,就跑不出结果或者报错;相反则为长度受限。我再整理一下,好做个对比:

strcpy

字符串拷贝,把指向的字符串复制到目标字符串,声明为

char *strcpy(char *dest, const char *src)

strcat

字符串连续,把指向的字符串追加到目标字符串的结尾(无间隔),声明为:

char *strcat(char *dest, const char *src)

strcmp

把所指向的字符串和目标字符串进行比较, 返回值大小决定二者的相对大小,声明如下:

int strcmp(const char *str1, const char *str2)

以上三种是函数的长度受限,我们可以变 strncpy,strncat 和 strncmp,就是长度不受限函数了,相比多了一个 n ,这个 n 是指函数作用范围最多在前 n 个字节,比如 strncmp 中的n 就是要比较的最大字符数,就相当于一个限制机制了。

这里主要补充几个比较实用的吧:

strstr

其实顾名思义,翻译过来就是“字符串字符串”,其实作用就是在一个字符串里面找我的目标字符串,不包含终止符 ‘\0’,返回值是该函数在 目标字符串中第一次出现该字符串的位置。声明为:

char *strstr(const char *haystack, const char *needle)

举个栗子:

int main()
{
	char a[] = "overwatch";
	char b[] = "wa";
	char* c = strstr(a, b);
	if (c != NULL)
	{
		printf("found it: %s\n", c);
	}
	else
	{
		printf("there was nothing\n");
	}
	return 0;
}

在这里插入图片描述

我们用最常规的代码也可以模拟出 strstr 的功能,库函数的实现方法也是类似

#include<assert.h>
char* strstr1(const char* a, const char* b)
{
	assert(a && b);
	const char* c = NULL;
	const char* d = NULL;
	const char* str = a;
	if (*b == '\0')
	{
		return (char*)a; //处理查找语句为空语句
	}
	while (*str)
	{
		c = str;
		d = b;
		while (*c && *d && (*c == *d))//防止相同元素为'\0' 循环继续导致越界访问
		{
			*c++;
			*d++;
		}
		if (*d == '\0')
		{
			return (char*)str;
		}
		str++;//多次查找,匹配错误会回到起点++再重新查找
	}
	return NULL;
}

在这里插入图片描述

要注意的是,该函数规定当查找对象字符串为空 (\0) 时,会返回目标字符串的地址。

KMP算法

说到了 strstr ,引申一下KMP算法,也就是字符串查找算法,称之为 Knuth-Morria-Pratt 算法。该算法相对于暴力算法有比较大的改进,主要是消除了主串指针的回溯,从而使算法效率有了某种程度的提高。KMP算法比我们的 strstr 效率要高,我们日后再细细讲解

strtok

我们可以称之为字符串刀,作用就是分割字符串,strtok() 函数的声明如下:

char *strtok(char *str, const char *delim)

str 为一组字符串,delim 为分隔符,也可以是个集合,分割结果变成第一个子字符串。

因为结果被修改所以 strtok 对象一般为临时拷贝的可修改内容。举个栗子:

int main()
{
	char a[] = "overwatch";
	char b[20] = { 0 };
	char* ret = NULL;
	strcpy(b, a); //进行临时拷贝方便切割
	char* p = "w";//指针类型维护分隔符
	ret = strtok(b, p);
	printf("%s\n", ret);
	return 0;
}

在这里插入图片描述

若要进一步分割,我们需要空指针进行维护,什么意思?
分割完一次,结尾就会变成 ‘ \0 ’,此时的 strtok 记忆能力已经记住了 ‘ \0 ’的位置,这个记忆功能我们大致都能猜出是一个静态变量,static 修饰一个局部变量时就可以做到这点,就是我们只需要传入一个 null ,就可以自动进行分割,以此类推:

	strtok(b, p);
	ret = strtok(NULL,"t");

在这里插入图片描述

strerror

咱在使用库函数时,总会有调用失败的时候,这时候都会有一个错误码被设置,这个错码都会放进 errno 这个全局错误码里面,我们看到的错误信息可能是一个莫名其妙的数字,而 strerror 就是将错误码翻译成错误信息,并返回一个指向错误消息字符串的指针。strerror 生成的错误字符串取决于开发平台和编译器。

char *strerror(int errnum)

比如:

int main()
{
	printf("%s\n", strerror(10));
	printf("%s\n", strerror(20));
	printf("%s\n", strerror(30));
	return 0;
}

在这里插入图片描述

结果分别是:无子进程,非目录元素,只读文件系统

但其实 strerror 并不是小题大做拿来查询错误的,是在文本上输入输出时方便我们得知打开写入打开失败的原因的,当我们尝试打开一个不存在的文件时就会报错: No such file or directory

#include <errno.h>
int main ()
{
   FILE *fp;  fp = fopen("file.txt","search");
   if( fp == NULL ) 
   {
      printf("Error: %s\n", strerror(errno));
   }  
  return(0);
}

因为我们要调用C语言给出的全局变量 errno,所以记得要引 <errno.h> 头文件。

您可能感兴趣的文章:

相关文章