-
UTF-8:EF BB BF
-
UTF-16 Big-Endian 字节顺序:FE FF
-
UTF-16 Little-Endian 字节顺序:FF FE
-
UTF-32 Big-Endian 字节顺序:00 00 FE FF
-
UTF-32 Little-Endian 字节顺序:FF FE 00 00
其中,UTF-8的字节顺序标记分别是EF BB BF转换成十进制以后是239 298 191 .
当我们通过自己编写的程序读取文件中的数据时候,如果编码不正确,就会导致读取错误。
例如:现在有一个文件,编码类型为UTF-8n(这种编码也属于UTF-8编码,但是文件中不包含字节顺序标记)。如果我们使用C#提供的StreamReader类进行读取,指定的编码为Encoding.Unicode的时候,会错误的读取该数据。但是如果该文件的编码类型为UTF-8则不会读取发生错误,因为我们指定的编码是可以识别UTF-8编码的。如果想正确的读取UTF-8n文件,我们只需要将StreamReader的编码指定为Encoding.UTF-8就可以了。
但是有时候我们需要制作一些数据来进行测试。需要将UTF-8数据转换成UTF-8n或者是将UTF-8n 转换成UTF-8类型。
下边的简单代码演示如何进行转换:






























































































































































