zoukankan      html  css  js  c++  java
  • php解决中文截取乱码问题

      针对截取字符串出现中文乱码问题,网上有很多介绍,也有很多函数,但笔者看着网上的函数,总感觉有点别扭,

      所以自己动手写了一个防止截取字符串时出现中文乱码的函数。

      实现的原理还是比较简单,主要是利用ASCII编码和中文编码的二进制范围不一致而把它们区分开来,然后,通过substr()截取字符串的函数实现的。

      下面给出我写的代码,注意:我这里只针对utf-8编码,其他编码,看官可以自己手动改一下函数,以便支持其他的编码。

    <?php
    header('content-type:text/html;charset=utf-8;');
    $str = '利要a-符e:r ttnx节小-子s区。vh;peh。例t来个oe体字n代gb节看t通c eu是的soS至什tna过码 t;Ie看C实e/,字le A来具8y么a)n=于ndg是r于 0tmt现码 e0ssf8单下s(uo别e的以ieh过aatx和t接要u几这看 nsw Ihrr用字 mgtts上就eg cAei的nwo码e跳h,t编';
    /*
    *在某篇文章中截取一段字符串,多余的用省略号...表示,并且防止中文乱码
    *$param1 string要截取的字符串 $str  注意:这里是utf-8编码
    *$param2 int截取字符串的长度 $len  
    *返回值 成功返回所要截取的字符串,失败为空
    */
    function str($str='',$len=0){
        //检查参数
        if(!is_string($str) || !is_int($len)){
            return '';
        }
        $length = strlen($str);
        if($length <= 0 ){
            return '';
        }
        if($len>=$length){
            return $str;
        }
        //初始化,统计字符串的个数,
        $count = 0;
        for($i=0;$i<$length;$i++){
            //达到个数跳出循环,$i即为要截取的长度
            if($count == $len){
                break;
            }
            $count++;
            //ord函数是获取字符串的ASCII编码,大于等于十六进制0x80的字符串即为中文字符串
            if(ord($str{$i}) >= 0x80){
                $i +=2;//中文编码的字符串的长度再加2
            }
        }
        //如果要截取的个数超过了字符串的总个数,那么我们返回全部字符串,不带省略号
        if($len > $count){
            return $str;
        }else{
            return substr($str,0,$i).'...';
        }
    }

      以上代码的实现就是利用单字节字符的ASCII码小于0x80。至于要跳过几个字节,这要看具体是什么编码。

      有什么错误,还望指出。

  • 相关阅读:
    安装Django、Nginx和uWSGI
    创建Orcale数据库链接访问外部数据库
    ER图,以及转化成关系模式
    eclipse中的Java项目导出成为一个可以直接双击运行的jar文件
    电脑添加新的字体
    JDBC 的编程步骤
    转转基础服务性能压测实战
    公司起诉CTO拖延研发进度,索赔90万
    详解MQ消息队列及四大主流MQ的优缺点
    晒一波程序员的杯子,逼格超级高
  • 原文地址:https://www.cnblogs.com/loveyoume/p/6081930.html
Copyright © 2011-2022 走看看