zoukankan      html  css  js  c++  java
  • hive表数据导出到csv乱码原因及解决方案

    转载自http://blog.csdn.net/lgdlxc/article/details/42126225

    Hive表中的数据使用hive - e"select * from table">aa.csv导出到csv文件的时候在window中用Excel打开查看的时候是乱码,而且格式也不对。

    原因有下面两个:

    1.乱码的原因是用excel打开csv时格式默认为gbk,但是从hive中导出来的是utf8的

    2.格式不对的原因是csv文件的列分隔符是逗号或者 ,而hive中默认使用01

    解决办法:

    使用hive中的concat_ws函数将所有列连接起来组成一列。

    concat_ws('分隔符',列1,列2,……),语句如下

    hive -e " select concat_ws(',',cat1,cat2,dd_name) as onecl from dd_prod">testaa.csv

    然后再使用iconv -f UTF-8 -c  -t GBK testaa.csv > testbb.csv转换编码。得到的testbb.csv没有乱码格式也对。

  • 相关阅读:
    javascript实现动态侧边栏
    javascript实现图片滚动
    C语言-----野指针
    守护进程daemon.c
    UDP网络程序设计
    TCP网络程序设计
    网络编程模型
    fork和vfork
    网络协议分析
    多线程同步
  • 原文地址:https://www.cnblogs.com/coskaka/p/7449354.html
Copyright © 2011-2022 走看看