windows记事本保存格式
ANSI(American National Standards Institute ) 美国国家标准学会
ANSI
和美国国家标准学会无关,也不是字符编码。在Windows系统不同语言环境下表示不同编码。Windows 里的「ANSI」其实是 Windows code pages,这个模式根据当前 locale(区域设置/语言环境) 选定具体的编码,比如简体中文 locale 下是 GBK。
UNICODE BIG ENDIAN
带BOM的 UNICODE大端序UTF-16。大端序:数据的高位字节存放在地址的低端、低位字节存放在地址高端,即顺序存储。
UNICODE
带有 BOM(byte-order mark) 的小端序 UTF-16。BOM用于文本编辑器识别编码。
UTF-8
带 BOM 的 UTF-8。
注:Unicode是字符集(character set)、UTF-8、UTF-16、UTF-32是Unicode的编码(encoding)。目前不带 BOM 的 UTF-8兼容性最佳
常用Unicode编码的BOM
UTF-8: EF BB BF UTF-16 big endian: FE FF UTF-16 little endian: FF FE UTF-32 big endian: 00 00 FE FF UTF-32 little endian: FF FE 00 00
Using different language formats in Notepad、谈谈Unicode编码、字符编码笔记:ASCII,Unicode 和 UTF-8、ANSI是什么编码?、Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?、Unicode码趣味科普、大端序与小端序、关于BOM