zoukankan      html  css  js  c++  java
  • 【改】utf-8 的去掉BOM的方法

    最近在测试中发现,linux系统中导出的文件,有记事本打开另存为或者保存后,再次导入进linux系统,发现失败了,对比文件内容,没发现区别,打开二进制文件对比发现,文件头部多了三个字符:EF BB BF。

    通过网络查找答案知,windows记事本等采用utf8 BOM格式,而Linux下采用UTF-8无BOM格式,上述三个字符即BOM。

    去掉BOM方法:

    1. # cat INFILE | sed 's/xefxbbxbf//g' > OUTFILE    ;     sed -i 's/^xEFxBBxBF//g' test.txt  //直接修改

    2. # awk '{if(NR==1)sub(/^xefxbbxbf/,"");print}' INFILE > OUTFILE

    3.# tail --bytes=+4 INFILE > OUTFILE  ##没有判断标示

  • 相关阅读:
    STS 配置tomcat以后,无法访问
    docker
    Java
    STS
    Java
    docker
    sql产生随机时间
    sql产生随机数
    Android 代码自动提示功能
    Activity的跳转与传值
  • 原文地址:https://www.cnblogs.com/eleclsc/p/10969739.html
Copyright © 2011-2022 走看看