Windows平台下存储Unicode格式的文件时,会在文件头插入2到3字节的文件头。这个文件头就是BOM(Byte Order Marks).
这个文件头在Unicode中,无对应符号。所以不必担心与其他编码格式互转时,造成错误。
BOM与编码之间的对应关系如下:
Byte order mark Description
EF BB BF UTF-8
FF FE UTF-16, little endian
FE FF UTF-16, big endian
以上对《Using Byte Order Marks》翻译后的摘录