zoukankan      html  css  js  c++  java
  • php fwrite写入文件bom头导致的乱码问题解决

    最近导出文件遇到fwrite导出乱码,而且中英文都乱码,很费解。折腾了一番之后终于找到问题所在了,mark下。

    UTF-8 BOM 又叫 UTF-8 签名,其实 UTF-8 的 BOM 对 UFT-8 没有作用,是为了支援 UTF-16,UTF-32 才加上的 BOM ,BOM 签名的意思就是告诉弱编辑器(记事本)当前文件采用何种编码,方便编辑器识别。

    PHP 在设计之初,没有考虑到 BOM 头的问题,因此很容易因为 BOM 头引发诡异的问题,比如编码转换失败,样式错乱等等问题,而且此问题相当隐蔽,很难确定发生问题的文件(试想在没有工具的情况下从上万的工程文件中找到哪个文件带有 BOM 头)。

    BOM 头是隐藏字符,非编辑字符,就像普通空文件一样,当我们写 <?php 的时候其实之前已经加了 BOM 头,如下(file.php):

    {BOM头}<?php

    .....
    当 file.php 被其他文件包含时,由于 BOM 头在 php 标签外,会当作输出内容输出到浏览器,然后引发问题。

    少年,珍爱生命,远离 BOM 。

    php fwrite输出也遇到了这个问题,判断是否有bom,如果没有加手动加上bom字符串,如果有直接输出,问题解决。

    代码如下:

     1 function checkBOM($filename)
     2 {
     3     if (!file_exists($filename)) {
     4         return FALSE;
     5     }
     6     $contents   = file_get_contents($filename);
     7     $charset[1] = substr($contents, 0, 1);
     8     $charset[2] = substr($contents, 1, 1);
     9     $charset[3] = substr($contents, 2, 1);
    10     if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
    11         return TRUE;
    12     }
    13     return FALSE;
    14 }
    15 
    16 $msg = "你好
    ";
    17 //如果默认编码不是utf8,先用函数utf8_encode将所需写入的数据变成UTF编码格式。
    18 //$msg = utf8_encode($msg);
    19 //$msg = iconv('gbk', 'utf-8', $msg);
    20 
    21 $fileName = 'test';
    22 $filePath = './test.txt';
    23 $checkBom = checkBOM($filePath);
    24 // 有bom的情况下"xEFxBBxBF"第一次写入这段字符不可缺少
    25 if ($checkBom == FALSE) {
    26     $msg = "xEFxBBxBF" . $msg;
    27 }
    28 $fp = @fopen($filePath, 'a');
    29 @fwrite($fp, $msg);
    30 @fclose($fp);

    function checkBOM($filename)
    {
    if (!file_exists($filename)) {
    return FALSE;
    }
    $contents = file_get_contents($filename);
    $charset[1] = substr($contents, 0, 1);
    $charset[2] = substr($contents, 1, 1);
    $charset[3] = substr($contents, 2, 1);
    if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
    return TRUE;
    }
    return FALSE;
    }

    $msg = "你好 ";
    //如果默认编码不是utf8,先用函数utf8_encode将所需写入的数据变成UTF编码格式。
    //$msg = utf8_encode($msg);
    //$msg = iconv('gbk', 'utf-8', $msg);

    $fileName = 'test';
    $filePath = './test.txt';
    $checkBom = checkBOM($filePath);
    // 有bom的情况下"xEFxBBxBF"第一次写入这段字符不可缺少
    if ($checkBom == FALSE) {
    $msg = "xEFxBBxBF" . $msg;
    }
    $fp = @fopen($filePath, 'a');
    @fwrite($fp, $msg);
    @fclose($fp);


    不知道有没有更好的办法,欢迎交流。

  • 相关阅读:
    电赛小结
    markdown小结
    一元运算符重载
    二维数组作为函数参数传递剖析(转载)
    C语言内存(转载)
    Effective C++ chapter1:Accustiming Yourself to C++
    C++ 模板
    const
    命令行参数
    AStar算法
  • 原文地址:https://www.cnblogs.com/zqifa/p/php-26.html
Copyright © 2011-2022 走看看