zoukankan      html  css  js  c++  java
  • 一.UTF8字符集csv文件在oracle下乱码问题处理

      1.问题描述

      在excel中生成了一个UTF-8编码格式的csv文件准备导入数据库,在notpad++下打开显示正常,编码集为UTF-8,通过pl/sql dev导入oracle是出现乱码,此时初步推断oracle字符集与本地操作不同导致的乱码

      2.处理过程

      2.1 查看ORACLE字符编码集

      select userenv('language') from dual;

      此时oracle返回其字符编码为:SIMPLIFIED CHINESE_CHINA.ZHS16GBK

      2.2 添加操作系统对象字符编码系统变量

      在win10中添加如下系统变量

      变量名:NLS_LANG

      变量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK

      2.3 更改文件字符集

      2.3.1 excle

      从excle导出的csv文件只能直接导出为utf-8格式,暂未发现有其他方法可以直接导出其他字符编码类型的csv文件

      2.3.2 notpad++

      在notpad++中直接通过编码->转换为GB2312(notpad++没有gbk,gbk是GB2312的超集),结果文件出现乱码,此方法不可行;

      在notpad++中新建一个空文件,将其字符编码集变为gb2312,再将原来csv文件的内容复制过来,发现没有出现乱码,且字符编码集设置成功

      2.3.3 sublime

      使用sublime 安装ConvertToUTF8 插件可以实现编码集转换

      安装过程:ctr+shift+p打开完成搜索框,输入install package 打开可安装插件列表界面,在此界面输入ConvertToUTF8 可直接安装该插件

      使用方法:打开UTF编码集的csv文件,点击file->relaod with encoding,在其中选择目标字符编码,这里我们选中gbk,点击之后,文件已转化为gbk编码,再保存即可

      2.3.4 java编写工具类

      1 public void codeChange() throws IOException {

      2 String sourceCharset = "utf8"; // 源文件编码

      3 String targetCharset = "gbk"; // 目标文件编码

      4 String newFileName=path.substring(0,path.lastIndexOf("."))+"_"+1+".csv";

      5 File file =new File(path);//源文件

      6 FileInputStream fileInputStream=new FileInputStream(file);

      7 InputStreamReader inputStreamReader=new InputStreamReader(fileInputStream,sourceCharset);

      8 BufferedReader bufferedReader=new BufferedReader(inputStreamReader);

      9 File targetFile =new File(newFileName);//目标文件

      10 BufferedWriter bufferedWriter=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(targetFile),targetCharset));

      11 String line=null;

      12 while((line=bufferedReader.readLine())!=null){

      13 bufferedWriter.write(line);

      14 bufferedWriter.newLine();

      15 bufferedWriter.flush();

      16 }

      17 bufferedWriter.close();

      18 bufferedReader.close();

      19 }

      复制代码

      2.4 注意事项

      2.4.1 在利用notpad++或sublime更改字符集时,最好先对文件进行备份,因为 编码转化可能是不可逆过程

      2.4.2 一般遇到字符编码不统一,修改一方即可,这里我们选择修改操作系统的是因为避免对其他文件造成影响,也可以选择修改oracle的字符编码集,但是对数据库中其他数据会造成影响(编辑:雷林鹏 来源:网络)

  • 相关阅读:
    Spring-web初始化流程简图
    记一次升级Tomcat
    Spring-Task思维导图
    2019的第一个工作日
    RocketMQ专题2:三种常用生产消费方式(顺序、广播、定时)以及顺序消费源码探究
    RocketMQ专题1:入门
    博客搬家到云栖社区
    ActiveMQ专题2: 持久化
    ActiveMQ专题1: 入门实例
    linux下怎么卸载自带的JDK和安装想要的JDK
  • 原文地址:https://www.cnblogs.com/pengpeng1208/p/9466384.html
Copyright © 2011-2022 走看看