zoukankan      html  css  js  c++  java
  • PHP中对汉字进行UNICODE编码和解码的实现

    PHP中对汉字进行UNICODE编码和解码的实现

    在前面的文章中我用.NET实现了UNICODE的解码,使用JAVA实现了UNICODE的编码,在JAVA中的实现最简单,在.NET中的实现也比较容易。而现在,使用PHP语言也同样遇到这个问题,对UNICODE编码的内容进行处理,于是又得用PHP写一个UNICODE的编码和解码程序。这次彻底点,把编码和解码的程序都一起写出来,分享给大家。至于UNICODE编码的原理和作用,在前面的文章中已经介绍过。
    C#中将UNICODE编码后的字符转换为汉字
    保护JAVA源文件,将ASC2编码的字符串转换为UNICODE编码

    UNICODE编码在PHP中使用UCS-2编码,之前还真是没有发现,一直还以为是UTF-8就行了。贴出代码:


    //将内容进行UNICODE编码,编码后的内容格式:YOKA\u738b (原始:YOKA王)
    function unicode_encode($name)
    {
        $name = iconv('UTF-8', 'UCS-2', $name);
        $len = strlen($name);
        $str = '';
        for ($i = 0; $i < $len - 1; $i = $i + 2)
        {
            $c = $name[$i];
            $c2 = $name[$i + 1];
            if (ord($c) > 0)
            {    // 两个字节的文字
                $str .= '\u'.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);
            }
            else
            {
                $str .= $c2;
            }
        }
        return $str;
    }

    // 将UNICODE编码后的内容进行解码,编码后的内容格式:YOKA\u738b (原始:YOKA王)
    function unicode_decode($name)
    {
        // 转换编码,将Unicode编码转换成可以浏览的utf-8编码
        $pattern = '/([\w]+)|(\\\u([\w]{4}))/i';
        preg_match_all($pattern, $name, $matches);
        if (!empty($matches))
        {
            $name = '';
            for ($j = 0; $j < count($matches[0]); $j++)
            {
                $str = $matches[0][$j];
                if (strpos($str, '\\u') === 0)
                {
                    $code = base_convert(substr($str, 2, 2), 16, 10);
                    $code2 = base_convert(substr($str, 4), 16, 10);
                    $c = chr($code).chr($code2);
                    $c = iconv('UCS-2', 'UTF-8', $c);
                    $name .= $c;
                }
                else
                {
                    $name .= $str;
                }
            }
        }
        return $name;
    }
  • 相关阅读:
    crawler碎碎念4 关于python requests、Beautiful Soup库、SQLlite的基本操作
    另类爬取表格数据
    如何选择kmeans中的k值——肘部法则–Elbow Method和轮廓系数–Silhouette Coefficient
    欧几里得距离
    数据导入+欧式距离计算+互信息计算
    轮廓系数
    肘部法则
    利用键值对进行排序的操作
    NMI计算
    彻底搞懂 C# 的 async/await
  • 原文地址:https://www.cnblogs.com/blogsme/p/2873616.html
Copyright © 2011-2022 走看看