JVM-java字符编码

zoukankan html css js c++ java

JVM-java字符编码
在JVM内部，所有的字符都是用Unicode编码的。而对于JVM所在操作系统的文件系统，可能有不同的编码类型。
由于JVM和OS文件系统所使用的编码方式不同，JVM在与操作系统进行数据交互的时候，就会进行编码转换。因此可以说，所有的乱码问题一定是JVM和OS文件系统进行数据交互时候出了问题。
Java代码

import java.io.*;

public class Demo{

    public static void main(String [] args) throws Exception {

        File file=new File("D:\test.txt");//mark1

        FileInputStream fis=new FileInputStream(file);

        InputStreamReader isr=new InputStreamReader(fis,"GB2312");//mark2



        File toFile=new File("D:\toTest.txt");

        FileOutputStream fos=new FileOutputStream(toFile);

        OutputStreamWriter osr=new OutputStreamWriter(fos);



        int content=-1;

        while((content=isr.read())!=-1){

            osr.write(content);

        }



        isr.close();osr.close();

        fis.close();fos.close();

        System.out.println(System.getProperty("file.encoding"));//笔者的系统默认编码是UTF-8



    }

}
对于上面的代码，功能是将test.txt文件的内容读取出来，复制一份到toTest.txt中。
首先JVM需要将数据从OS文件系统读取到JVM内部，这个时候，JVM需要进行编码转换，目标编码当然是Unicode，原编码是啥？当不在mark2行的代码中指定的话，JVM会默认源编码是系统默认类型（在例子中就是UTF-8），上面的代码中我们指定了原编码方式是GB2312（因为GB2312是test.txt文件的编码类型）。因此，如果我们不指定编码格式为GB2312的话，这个过程读入的数据就已经乱码了。

接着我们来看输出，当数据从JVM输出到OS文件系统的时候，也会进行编码转换，此时源编码是Unicode，目的编码是？如果不指定的话，JVM会指定为系统默认编码，这里是UTF-8。

从上面的过程，我们就可以理解Java程序中的乱码了。解决乱码也很简单，就是在JVM和OS文件系统进行数据交互的时候，一定要指定好编码方式。
查看全文

相关阅读:
Spring源码分析（五）获取Document
Spring源码分析（四）容器的基础XmlBeanFactory
Spring源码分析（三）容器核心类
 Spring源码分析（二）容器基本用法
 day23 框架之基础加强
 Java web项目综合练习（Estore）
第16 天 JavaWEB过滤器和监听器技术
 第17天笔记文件上传下载
 Javaweb 第15天 web练习和分页技术
 【剑指offer】数组中的逆序对，C++实现

原文地址：https://www.cnblogs.com/yaowen/p/6292849.html