UTF-8和UTF—8Bom的区别(转)UTF-8和UTF—8Bom的区别(转)

zoukankan html css js c++ java

UTF-8和UTF—8Bom的区别(转)UTF-8和UTF—8Bom的区别(转)

UTF-8和UTF—8Bom的区别(转)

在我们通常使用的windows系统中，我发现了一个有趣的现象。我新建一个空的文本文档，点击文件-另存为-编码选择UTF-8，然后保存。此时这个文件明明是空的，却占了3字节大小。原因在于：此时保存的编码方式自动会变为UTF-8 BOM

因为Unicode可以采用16位或者32位编码，所以计算机在处理时需要知道其字节顺序，BOM就是用来标识字节流的字节顺序的，但字节顺序这个概念对UTF-8来说是没有意义的，所以BOM对UTF-8同样没有意义。但Unicode标准却BOM在UTF-8编码格式中存在。其存在位置在文件开头，以三个字节0xEF, 0xBB, 0xBF表示。

UTF-8编码不推荐使用无意义的BOM，但许多Windows程序却在保存UTF-8编码的文件时将其存为带BOM的格式（即在文件开头加上0xEFBBBF三个字节），这么干的就包括Windows记事本。

因此，在编辑UTF-8的文件时，建议不要使用记事本等进行编辑，虽然保存后的文件仍然是UTF-8，但却已经不再是保存前的UTF-8了，这在使用这些文件的时候可能就会因为编码而出现问题，就像我文章开头所描述的那样。

去掉UTF-8编码文件BOM的方法：用Notepad++的Encoding菜单中的Encoding in UTF-8 without BOM即可。或者用任何16进制编辑器将文件前三个字节去掉。再或者更简单的：用VIM设置UTF-8编码的BOM标记。

查看全文

相关阅读:
sql server中的 SET NOCOUNT ON 的含义
 SQL Server 中的嵌套事务与@@TranCount（转）
数据库中的主键与外键的关系，通俗易懂
 模板制作
 DELPHI中MDI子窗口的关闭和打开
 Entity Framework 基础
 WPF使用HierarchicalDataTemplate绑定Dictionary生成TreeView
WPF新手之如何将数据绑定到TreeView
WPF数据验证（5）―― 错误模板
 WPF DataGrid 获取选中一行或者多行

原文地址：https://www.cnblogs.com/dwx-bzdcxy/p/15019453.html