zoukankan      html  css  js  c++  java
  • php 中文unicode 互转

    /**
     * $str 原始中文字符串
     * $encoding 原始字符串的编码,默认GBK
     * $prefix 编码后的前缀,默认"&#"
     * $postfix 编码后的后缀,默认";"
     */
    function unicode_encode($str, $encoding = 'GBK', $prefix = '&#', $postfix = ';') {
        $str = iconv($encoding, 'UCS-2', $str);
        $arrstr = str_split($str, 2);
        $unistr = '';
        for($i = 0, $len = count($arrstr); $i < $len; $i++) {
            $dec = hexdec(bin2hex($arrstr[$i]));
            $unistr .= $prefix . $dec . $postfix;
        } 
        return $unistr;
    } 
     
    /**
     * $str Unicode编码后的字符串
     * $decoding 原始字符串的编码,默认GBK
     * $prefix 编码字符串的前缀,默认"&#"
     * $postfix 编码字符串的后缀,默认";"
     */
    function unicode_decode($unistr, $encoding = 'GBK', $prefix = '&#', $postfix = ';') {
        $arruni = explode($prefix, $unistr);
        $unistr = '';
        for($i = 1, $len = count($arruni); $i < $len; $i++) {
            if (strlen($postfix) > 0) {
                $arruni[$i] = substr($arruni[$i], 0, strlen($arruni[$i]) - strlen($postfix));
            } 
            $temp = intval($arruni[$i]);
            $unistr .= ($temp < 256) ? chr(0) . chr($temp) : chr($temp / 256) . chr($temp % 256);
        } 
        return iconv('UCS-2', $encoding, $unistr);
    }
    
    //GBK字符串测试
    $str = '<b>哈哈</b>';
    echo $str.'<br />';
     
    $unistr = unicode_encode($str);
    echo $unistr.'<br />'; // <b>哈哈</b>
     
    $str2 = unicode_decode($unistr);
    echo $str2.'<br />'; //<b>哈哈</b>
     
    //UTF-8字符串测试
    $utf8_str = iconv('GBK', 'UTF-8', $str);
    echo $utf8_str.'<br />'; // <b>鍝堝搱</b> 注:UTF在GBK下显示的乱码!可切换浏览器的编码测试
     
    $utf8_unistr = unicode_encode($utf8_str, 'UTF-8');
    echo $utf8_unistr.'<br />'; // <b>哈哈</b>
     
    $utf8_str2 = unicode_decode($utf8_unistr, 'UTF-8');
    echo $utf8_str2.'<br />'; // <b>鍝堝搱</b>
     
    //其它后缀、前缀测试
    $prefix_unistr = unicode_encode($str, 'GBK', "\u", '');
    echo $prefix_unistr.'<br />'; // u60u98u62u21704u21704u60u47u98u62
     
    $profix_unistr2 = unicode_decode($prefix_unistr, 'GBK', "\u", '');
    echo $profix_unistr2.'<br />'; //<b>哈哈</b>
    
  • 相关阅读:
    再学 GDI+[91]: TGPImage(11) 转灰度图像
    再学 GDI+[90]: TGPImage(10) 获取图像的调色板信息
    给 Memo 排序的函数
    再学 GDI+[97]: TGPImage(17) 获取 GDI+ 所支持的可编码、可解码的图像格式
    再学 GDI+[94]: TGPImage(14) 增减图像的红、绿、蓝三色的成分
    上周热点回顾(10.2611.1)
    博客园上海俱乐部Windows 7社区发布活动的奖品
    顶吧!顶出今日头条
    博客园电子期刊2009年10月刊发布啦
    对于近期社区问题的一点想法
  • 原文地址:https://www.cnblogs.com/lvchenfeng/p/5203294.html
Copyright © 2011-2022 走看看