先看例子:
public class Test { public static void main(String[] args) { char han = '永'; System.out.println((short)han); //输出27704 //以十六进制输出 System.out.format("%x", (short)han);//输出6c38 System.out.println(); char han2 = 0x6c38; System.out.println(han2);//输出永 } }
JVM编码:
JVM内部统一用Unicode,编码只发生在JVM和OS文件系统交界的地方。
所有的IO基本上可以分为面向字符和面向字节
面向字符是指不管你采用什么编码机制,我保存‘永’这个字符时,读出来还是‘永’字
面向字节的话就要保证系统中文件的二进制内容和JVM内部的二进制内容一致,不能变换0和1的位置,这种方式很适合读入视频文件和音频文件
JAVA中的Reader和Writer使用默认的编码机制,而且不能任意更改,比如使用中文版的windows,那么Reader和Writer默认使用的是GBK 的编码方式,
如果读取一个UTF-8编码的文件,那么就会乱码。如果使用到GBK编码以外的文件,就必须采用编码转换:一个字符与字节的转换,那就是InputStreamReader和OutputStreamWriter了。这两个类是字节流和字符流的适配器。