zoukankan      html  css  js  c++  java
  • (转载)PHP如何获取中文字符串长度 utf8_strlen()

    http://www.phplamp.org/2010/06/php-zh-cn-char-utf8-string-length/
     

    PHP如何获取中文字符串长度 utf8_strlen()

    发表于:2010年06月15日 17时  作者:dx_andy

    PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:

    PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

    $enStr = ‘Hello,China!’;
    echo strlen($enStr); // 输出:12

    而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

    gbk编码下每个中文字符所占字节为2,例:

    $zhStr = ‘您好,中国!’;
    echo strlen($zhStr); // 输出:12

    utf-8编码下每个中文字符所占字节为3,例:

    $zhStr = ‘您好,中国!’;
    echo strlen($zhStr); // 输出:18

    那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

    这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

    $zhStr = ‘您好,中国!’;
    $str = ‘Hello,中国!’;

    // 计算中文字符串长度
    function utf8_strlen($string = null) {
    // 将字符串分解为单元
    preg_match_all(“/./us”, $string, $match);
    // 返回单元个数
    return count($match[0]);
    }

    echo utf8_strlen($zhStr); // 输出:6
    echo utf8_strlen($str); // 输出:9

  • 相关阅读:
    python使用thrift访问操作hbase
    js打开新页面
    设计模式
    c# dotfuscator 混淆后无法使用
    SQL server清空数据库日志脚本
    SQlserver 行转列
    SQLServer 脚本测试
    C# HttpWebRequest与HttpWebResponse详解
    反射
    SQl server master
  • 原文地址:https://www.cnblogs.com/showker/p/2106994.html
Copyright © 2011-2022 走看看