zoukankan      html  css  js  c++  java
  • HIVE-默认分隔符的(linux系统的特殊字符)查看,输入和修改

    这段时间做hive的时候,用到了系统默认分隔符。通常下面2中情况我们需要需要用到分隔符

    1,制作table的输入文件,有时候我们需要输入一些特殊的分隔符

    2,把hive表格导出到本地时,系统默认的分隔符是^A,这个是特殊字符,直接cat或者vim是看不到的

    分隔符在HIVE中的用途

    分隔符

    描述

    对于文本文件来说,每行都是一条记录,因此换行符可以分隔记录

    ^A(Ctrl+A)

    用于分隔字段(列)。在CREATE TABLE语句中可以使用八进制编码01表示

    ^B(Ctrl+B)

    用于分隔ARRAY或者STRUCT中的元素,或用于MAP中键-值对之间的分隔。在CREATE TABLE语句中可以使用八进制编码02表示

    ^C(Ctrl+C)

    用于MAP中键和值之间的分隔。在CREATE TABLE语句中可以使用八进制编码03表示

    Hive 中没有定义专门的数据格式,数据格式可以由用户指定,用户定义数据格式需要指定三个属性:列分隔符(通常为空格、” ”、”x001″)、行分隔符(” ”)以及读取文件数据的方法。由于在加载数据的过程中,不需要从用户数据格式到 Hive 定义的数据格式的转换,因此,Hive 在加载的过程中不会对数据本身进行任何修改,而只是将数据内容复制或者移动到相应的 HDFS 目录中。

    我们可以在create表格的时候,选择如下,表格加载input的文件的时候就会按照下面格式匹配

    row format delimited 
    fields terminated by '01' 
    collection items terminated by '02' 
    map keys terminated by '03'
    lines terminated by '
    ' 
    stored as textfile; 

     如何查看和修改分割符,特殊符号

    1查看隐藏字符的方法

    1.1,cat -A filename

    1.2,vim filename后 命令模式下输入

      set list显示特殊符号

      set nolist 取消显示特殊符号

    2修改隐藏字符的方法

    首先按照1.2打开显示特殊符号。进入INSERT模式

    ctrl + V 可以输入 ^符号
    ctrl + a 可以输入A---'01'
    ctrl + b 可以输入A---'02'
    ctrl + c 可以输入A---'03'

     注意:虽然键盘上你能找到^和A但直接输入时不行的,必须按照上面的方法输入。

    第一行是特殊符号颜色蓝色,第二行直接输入不是特殊符号。

    特殊号直接cat是不可以看见的,但是第二行是可见的,所以不是特殊符号。

    具体可以参考

    http://www.cnblogs.com/kouryoushine/articles/7805593.html

  • 相关阅读:
    telnet命令测试端口连接是否正常, telnet不是内部或外部命令的方案
    Linux常用命令
    nginx的反向代理的优势,特点于原理(一)
    linux操作系统中的常用命令以及快捷键(一)
    Centos网卡名称命名
    Centos第一次使用配置IP地址
    Linux环境下交叉编译器安装及运行
    jupyter更换路径
    python3实现在二叉树中找出和为某一值的所有路径
    使用 SQL 服务器时,"评估期已过期"错误消息
  • 原文地址:https://www.cnblogs.com/kouryoushine/p/7805597.html
Copyright © 2011-2022 走看看