C语言中字符和字符串处理（ANSI字符和Unicode字符）

我们知道，C语言用char数据类型表示一个8位的ANSI字符，默认在代码中声明一个字符串时，C编译器会把字符串中的字符转换成由8位char数据类型构成的一个数组：

 
 // An 8-bit character
 
 char c = 'A';
 
 // An array of 99 8-bit character and 8-bit terminating zero
 
 char szBuffer[100] = "A String";

Microsoft的C/C++编译器定义了一个内建的数据类型wchar_t，它表示一个16位的Unicode（UTF-16）字符。编译器只有指定了/Zc:wchar_t编译器开关时，才会定义这个参数类型。

声明Unicode字符和字符串的方法如下：

复制代码代码如下:

 
 // A 16-bit character
 
 wchar_t c= L'A';
 
 // An array up to 99 16-bit characters and a 16-bit terminating zero
 
 wchar_t szBuffer[100] = L"A String";

字符串之前的大写字母L通知编译器该字符串应该编译一个Unicode字符串。

另外，在编写代码的时候，可以使用ANSI或Unicode字符/字符串使其能通过编译。WinNT.h定义了以下类型和宏：

复制代码代码如下:

 
 #ifdef UNICODE
 
 typedef WCHAR TCHAR, *PTCHAR, PTSTR;
 
 typedef CONST WCHAR *PCTSTR;
 
 #define __TEXT(quote) L##quote
 
 #else
 
 typedef CHAR TCHAR, *PTCHAR, PTSTR;
 
 typedef CONST CHAR *PCTSTR;
 
 #define __TEXT(quote) quote
 
 #endif
 
 #define TEXT(quote) __TEXT(quote)

利用这些类型和宏来写代码，无论使用ANSI还是Unicode字符，都能通过编译，如下所示：

复制代码代码如下:

 
 // If UNICODE define, a 16-bit character; else an 8-bit character
 
 TCHAR c = TEXT('A');
 
 // If UNICODE define, an array of 16-bit character; else 8-bit character
 
 TCHAR szBuffer[100] = TEXT("A String");

以上所述就是本文的全部Neri了，希望大家能够喜欢。

频道导航

C语言中字符和字符串处理（ANSI字符和Unicode字符）

您可能感兴趣的文章: