zoukankan      html  css  js  c++  java
  • Python写UTF8文件,UE、记事本打开依然乱码的问题

    Python写UTF8文件,UE、记事本打开依然乱码的问题

    现象:使用codecs打开文件,写入UTF-8文本,正常无错误。用vim打开正常,但记事本、UE等打开乱码。

    原因:一般写文本时,默认是没有BOM头的,即编辑器不知道这个文本文件是神马编码,只能智能detect,这个detect有的弱有的强,比如UE、记事本就挂了,认为是ASCII格式的,于是就乱码了。

    解决方法:如果为了编辑器打开正常,可以加入BOM编码。但一定要慎重,一旦加入后,头部会增加2~3个字节,如果程序再读取,显然会出错。这个如果使用UE编辑过PHP代码抓过狂的都应该懂得,NOBOM哦亲~

    # 四号程序员 http://www.coder4.com
    1
    2
    3
    4
    fp_out = codecs.open(fn_out, "w", "utf-8")
    fp_out.write(codecs.BOM_UTF8.decode("utf-8"))
    ....
    fp_out.close()

    注意上述codecs.BOM_UTF是个常量,Python中预定义的还有:

    # 四号程序员 http://www.coder4.com
    01
    02
    03
    04
    05
    06
    07
    08
    09
    10
    codecs.BOM
    codecs.BOM_BE
    codecs.BOM_LE
    codecs.BOM_UTF8
    codecs.BOM_UTF16
    codecs.BOM_UTF16_BE
    codecs.BOM_UTF16_LE
    codecs.BOM_UTF32
    codecs.BOM_UTF32_BE
    codecs.BOM_UTF32_LE
  • 相关阅读:
    返回数组指针的函数形式
    zoj 2676 网络流+01分数规划
    2013 南京理工大学邀请赛B题
    poj 2553 强连通分支与缩点
    poj 2186 强连通分支 和 spfa
    poj 3352 边连通分量
    poj 3177 边连通分量
    poj 2942 点的双连通分量
    poj 2492 并查集
    poj 1523 求割点
  • 原文地址:https://www.cnblogs.com/DjangoBlog/p/3670774.html
Copyright © 2011-2022 走看看