zoukankan html css js c++ java

PHP 统计中文字符串的长度

中文网站一般会选择两种编码：gbk/gb2312或是utf-8。 gbk编码下每个中文字符所占字节为2，例：

$zhStr = ‘您好，中国！’;
echo strlen($zhStr); // 输出：12

UTF-8编码下每个中文字符占3个字节。

$zhStr = ‘您好，中国！’;
echo strlen($zhStr); // 输出：18

那么如何计算这组中文字符串的长度呢？有人可能会说gbk下获取中文字符串长度除以2，utf-8编码下除以3不就行了吗？但是您要考虑字符串并不老实，99%的情况会以中英混合的情况出现。
这是WordPress中的一段代码，主要思想就是先用正则将字符串分解为个体单元，然后再计算单元的个数即字符串的长度，代码如下（只能处理utf-8编码下的字符串）：

$zhStr = ‘您好，中国！’;
$str = ‘Hello,中国！’;
// 计算中文字符串长度
function utf8_strlen($string = null) {
// 将字符串分解为单元
preg_match_all(“/./us”, $string, $match);
// 返回单元个数
return count($match[0]);
}
echo utf8_strlen($zhStr); // 输出：6
echo utf8_strlen($str); // 输出：9

下面我封装了一个函数准确计算中文字符串的长度：

function count_strlen($string = null)
{
    $fileType = mb_detect_encoding($string , array('UTF-8','GBK','LATIN1','BIG5')) ; //判断字符串中文编码的类型

    $length = iconv_strlen($string,$fileType);//根据字符编码计算字符串长度

    return $length;
}

$str = "中文45汶";
$len = count_strlen($str);
echo $len; //输出5

查看全文

相关阅读:
【0726 | Day 2】编程语言分类/主流编程语言介绍/网络的瓶颈效应
 【0725 | Day 1】计算机编程/计算机组成原理/计算机操作系统
 windows下vue-cli及webpack 构建网站(一)环境安装
 HBuilder 做移动端app流程
 vuejs 学习旅程之 vue-resource
vuejs 学习旅程一
 身心合一
 td 内容自动换行 table表格td设置宽度后文字太多自动换行
 PhpStorm 2017汉化补丁 2017.1 免费中文版
 PHPStorm2017.1.3永久激活方法之本地破解激活

原文地址：https://www.cnblogs.com/zhongJaywang/p/5459953.html