PHP 中如何正确统计中文字数?这个是困扰我很久的问题,php 中有很多函数可以计算字符串的长度,比如下面的例子,分别使用了 strlen
,mb_strlen
,mb_strwidth
这个三个函数去测试统计字符串的长度,看看把中文算成几个字节:
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
从上面的测试,我们可以看出:strlen
把中文字符算成 3 个字节,mb_strlen
不管中文还是英文,都算 1 个字节,而 mb_strwidth
则把中文算成 2 个字节,所以 mb_strwidth
才是我们想要的:中文 2 个字节,英文 1 个字节。
同样截取字符串也建议使用 mb_strimwidth
,也是按照 中文 2 个字节,英文 1 个字节 方式计算之后的,并且如果字数超过截取的要求,这个函数还可以在最后面自动添加‘…’。
- 1
- 1
注意,最后添加‘utf-8’
编码参数,可以避免中文截取乱码的问题。