字符串的长度通常是指字符串中包含字符的数目,但有的时候人们需要的是字符串所占字节的数目。常见的获取字符串长度的方法包括如下几种。
1.使用sizeof获取字符串长度
sizeof的含义很明确,它用以获取字符数组的字节数(当然包括结束符\0)。对于ANSI字符串和UNICODE字符串,形式如下:
- sizeof(cs)/sizeof(char)
- sizeof(ws)/sizeof(wchar_t)
可以采用类似的方式,获取到其字符的数目。如果遇到MBCS,如"中文ABC",很显然,这种办法就无法奏效了,因为sizeof()并不知道哪个char是半个字符。
2.使用strlen()获取字符串长度
strlen()及wcslen()是标准C++定义的函数,它们分别获取ASCII字符串及宽字符串的长度,如:
- size_t strlen( const char *string );
- size_t wcslen( const wchar_t *string );
strlen()与wcslen()采取\0作为字符串的结束符,并返回不包括\0在内的字符数目。
3.使用CString::GetLength()获取字符串长度
CStringT继承于CSimpleStringT类,该类具有函数:
- int GetLength( ) const throw( );
GetLength()返回字符而非字节的数目。比如:CStringW中,"中文ABC"的GetLength()会返回5,而非10。那么对于MBCS呢?同样,它也只能将一个字节当做一个字符,CStringA表示的"中文ABC"的GetLength()则会返回7。
4.使用std::string::size()获取字符串长度
basic_string同样具有获取大小的函数:
- size_type length( ) const;
- size_type size( ) const;
length()和size()的功能完全一样,它们仅仅返回字符而非字节的个数。如果遇到MCBS,它的表现和CStringA::GetLength()一样。
5.使用_bstr_t::length()获取字符串长度
_bstr_t类的length()方法也许是获取字符数目的最佳方案,严格意义来讲,_bstr_t还称不上一个完善的字符串类,它主要提供了对BSTR类型的封装,基本上没几个字符串操作的函数。不过,_bstr_t 提供了length()函数:
- unsigned int length ( ) const throw( );
该函数返回字符的数目。值得称道的是,对于MBCS字符串,它会返回真正的字符数目。
现在动手
编写如下程序,体验获取字符串长度的各种方法。
【程序 4-8】各种获取字符串长度的方法
- 01 #include "stdafx.h"
- 02 #include "string"
- 03 #include "comutil.h"
- 04 #pragma comment( lib, "comsuppw.lib" )
- 05
- 06 using namespace std;
- 07
- 08 int main()
- 09 {
- 10 char s1[] = "中文ABC";
- 11 wchar_t s2[] = L"中文ABC";
- 12
- 13 //使用sizeof获取字符串长度
- 14 printf("sizeof s1: %d\r\n", sizeof(s1));
- 15 printf("sizeof s2: %d\r\n", sizeof(s2));
- 16
- 17 //使用strlen获取字符串长度
- 18 printf("strlen(s1): %d\r\n", strlen(s1));
- 19 printf("wcslen(s2): %d\r\n", wcslen(s2));
- 20
- 21 //使用CString::GetLength()获取字符串长度
- 22 CStringA sa = s1;
- 23 CStringW sw = s2;
- 24
- 25 printf("sa.GetLength(): %d\r\n", sa.GetLength());
- 26 printf("sw.GetLength(): %d\r\n", sw.GetLength());
- 27
- 28 //使用string::size()获取字符串长度
- 29 string ss1 = s1;
- 30 wstring ss2 = s2;
- 31
- 32 printf("ss1.size(): %d\r\n", ss1.size());
- 33 printf("ss2.size(): %d\r\n", ss2.size());
- 34
- 35 //使用_bstr_t::length()获取字符串长度
- 36 _bstr_t bs1(s1);
- 37 _bstr_t bs2(s2);
- 38
- 39 printf("bs1.length(): %d\r\n", bs1.length());
- 40 printf("bs2.length(): %d\r\n", bs2.length());
- 41
- 42 return 0;
- 43 }
输出结果:
sizeof s1: 8
sizeof s2: 12
strlen(s1): 7
wcslen(s2): 5
sa.GetLength(): 7
sw.GetLength(): 5
ss1.size(): 7
ss2.size(): 5
bs1.length(): 5
bs2.length(): 5