zoukankan      html  css  js  c++  java
  • php检测文件编码方法[非完美]

    关于文件编码的检测,百度一下一大把都是,但是确实没有能用的、
    很多人建议 mb_detect_encoding 检测,可是不知为何我这不成功,什么都没输出、
    看到有人写了个增强版,用 BOM 判断的,我果断就无视了,这东西完全不靠谱、
    最终根据PHP手册里 mb_detect_encoding 函数下方的例子,自己写了一个检测函数,
    还包括自动检测编码并按指点编码读取文件的函数、
    源码献上,不喜勿喷。
    网上的方法我试过没用才写的,说不定环境不一样导致的。
    所以万一没用,也别喷我,我只是共享想思路而已、、

    <?php
    /**
     * 检测文件编码
     * @param string $file 文件路径
     * @return string|null 返回 编码名 或 null
     */
    function detect_encoding($file) {
        $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
        $str = file_get_contents($file);
        foreach ($list as $item) {
            $tmp = mb_convert_encoding($str, $item, $item);
            if (md5($tmp) == md5($str)) {
                return $item;
            }
        }
        return null;
    }
    
    /**
     * 自动解析编码读入文件
     * @param string $file 文件路径
     * @param string $charset 读取编码
     * @return string 返回读取内容
     */
    function auto_read($file, $charset='UTF-8') {
        $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
        $str = file_get_contents($file);
        foreach ($list as $item) {
            $tmp = mb_convert_encoding($str, $item, $item);
            if (md5($tmp) == md5($str)) {
                return mb_convert_encoding($str, $charset, $item);
            }
        }
        return "";
    }
  • 相关阅读:
    POJ 2991(线段树)
    UVa_1592
    紫书 -- 大整数类
    在结构体中添加成员函数/C++
    双向队列
    用埃氏筛法生成质数表
    poj 3687(拓扑排序)
    它们其实都是“图”-- 最小生成树
    最小生成树(MST, Minimum Spanning Tree)
    他们其实都是“图”--最短路
  • 原文地址:https://www.cnblogs.com/52cik/p/php-detect-encoding.html
Copyright © 2011-2022 走看看