zoukankan      html  css  js  c++  java
  • JVM-java字符编码

    在JVM内部,所有的字符都是用Unicode编码的。而对于JVM所在操作系统的文件系统,可能有不同的编码类型。 
    由于JVM和OS文件系统所使用的编码方式不同,JVM在与操作系统进行数据交互的时候,就会进行编码转换。因此可以说,所有的乱码问题一定是JVM和OS文件系统进行数据交互时候出了问题。 

    Java代码  收藏代码
    1. import java.io.*;  
    2. public class Demo{  
    3.     public static void main(String [] args) throws Exception {  
    4.         File file=new File("D:\test.txt");//mark1  
    5.         FileInputStream fis=new FileInputStream(file);  
    6.         InputStreamReader isr=new InputStreamReader(fis,"GB2312");//mark2  
    7.           
    8.         File toFile=new File("D:\toTest.txt");  
    9.         FileOutputStream fos=new FileOutputStream(toFile);  
    10.         OutputStreamWriter osr=new OutputStreamWriter(fos);  
    11.           
    12.         int content=-1;  
    13.         while((content=isr.read())!=-1){  
    14.             osr.write(content);  
    15.         }  
    16.           
    17.         isr.close();osr.close();  
    18.         fis.close();fos.close();  
    19.         System.out.println(System.getProperty("file.encoding"));//笔者的系统默认编码是UTF-8  
    20.           
    21.     }  
    22. }  



    对于上面的代码,功能是将test.txt文件的内容读取出来,复制一份到toTest.txt中。 
    首先JVM需要将数据从OS文件系统读取到JVM内部,这个时候,JVM需要进行编码转换,目标编码当然是Unicode,原编码是啥?当不在mark2行的代码中指定的话,JVM会默认源编码是系统默认类型(在例子中就是UTF-8),上面的代码中我们指定了原编码方式是GB2312(因为GB2312是test.txt文件的编码类型)。因此,如果我们不指定编码格式为GB2312的话,这个过程读入的数据就已经乱码了。 

    接着我们来看输出,当数据从JVM输出到OS文件系统的时候,也会进行编码转换,此时源编码是Unicode,目的编码是?如果不指定的话,JVM会指定为系统默认编码,这里是UTF-8。 

    从上面的过程,我们就可以理解Java程序中的乱码了。解决乱码也很简单,就是在JVM和OS文件系统进行数据交互的时候,一定要指定好编码方式。

  • 相关阅读:
    ThinkPHP之APP_DEBUG给我带来的问题
    yii框架部署
    论文翻译之--- 软件设计师怎样使用标记来帮助提醒和重新查找
    初始html5,遇到的第一个问题
    几种进入mysql的方法
    百度经验---一些生活常见问题的解决
    myeclipse背景色设置遇到的问题
    linux学习(二)-----Linux 的目录结构、远程登录、vi和vim
    linux学习(一)-----vm、centos安装
    springboot核心技术(四)-----Docker、数据访问、自定义starter
  • 原文地址:https://www.cnblogs.com/yaowen/p/6292849.html
Copyright © 2011-2022 走看看