zoukankan      html  css  js  c++  java
  • 数据工程师:必备的 Hive 安装&交互方式技能

    Hive 安装

    hive 的下载地址为:
    https://archive.apache.org/dist/hive/

    图片

    从图中可以看出,hive 有许多可下载的安装版本,这里我使用 hive-2.3.0 的版本为大家演示。

    step1:下载、上传并解压安装包

    进入目标机器将下载的安装包上传至服务器的 /your_directory 路径下,进行解压,命令如下所示

    cd /your_directory
    tar -zxvf apache-hive-2.3.0-bin.tar.gz -C  /your_directory

    step2:安装 Mysql 用于存储 Hive 元数据

    开始在 Linux 下安装 Mysql 数据库,按照以下顺序步骤执行:

    a. 查看是否已安装 Mysql
    yum list installed mysql*
    如果检测出已安装 Mysql 则可以先卸载掉, 然后再进行安装;

    b. 安装 Mysql 客户端
    yum -y install mysql

    c. 安装 Mysql 服务器端
    yum -y install mysql_server

    d. 安装 Mysql 开发库
    yum -y install mysql-devel

    e. 配置 Mysql 配置文件
    设置 utf-8 编码
    vim /etc/my.cnf , 在 my.cnf 文件中添加 default-character-set=utf8;

    f. 启动 Mysql 数据库
    service mysqld start;

    g. 创建 root 密码
    mysqladmin -u root password 123456

    h. 进入 Mysql 数据库
    mysql -hlocalhost -P3306 -uroot -p123456


    i. 进入 Mysql 客户端进行授权

    grant all privileges on . to 'root'@‘%’ identified by 'test_001' with grant option;
     
    flush privileges;

    step3:修改 hive 的配置文件

    修改 hive-env.sh 文件

    cd /your_directory/apache-hive-2.3.0-bin/conf
    cp hive-env.sh.template hive-env.sh
    HADOOP_HOME=/your_directory/hadoop-2.7.5
    export HIVE_CONF_DIR=/your_directory/apache-hive-2.3.0-bin/conf

    修改 hive-site.xml 文件

     

    从图中可以看出该 xml 文件里设置了 Mysql (存储 hive 元数据信息的数据库) 的连接URL,驱动名称,数据库用户名,密码等关键信息。

    step4:添加 Mysql 的连接驱动包

    Hive 使用 Mysql 作为元数据存储,需要连接 Mysql 数据库,所以将 mysql-connector-java-5.1.38.jar 这个 jar 包上传到 /your_directory/apache-hive-2.3.0-bin/lib这个目录下, 然后启动 Hive。Hive的安装部署就结束了。

    step5:配置 Hive 的环境变量

    在服务器执行以下命令配置 hive 的环境变量

    sudo vim /etc/profile
    export HIVE_HOME=/your_directory/apache-hive-2.3.0-bin
    export PATH=:$HIVE_HOME/bin:$PATH

    请记住配置完 hive 的环境变量后,需要使用以下命令使其生效

    source /etc/profile

     

    Hive 的交互方式

    第1种:bin/hive进入hive客户端

    # 进入到hive的安装目录
    cd /your_directory/apache-hive-2.3.0-bin/
    # 输入以下命令则可以进入hive客户端页面
    bin/hive

    hive 客户端页面如下图所示

     创建一个数据库

    # 如果数据库名为:mytest的不存在,则创建一个名为 mytest 的数据库,如果存在也不会报错,只是不会创建 mytest 这个名字的数据库;
    create database if not exists mytest;

    第2种:使用 sql 语句或者 sql 脚本进行交互

    不进入 hive 的客户端直接执行 hive 的 hql 语句

    (1). hive -e 的方式

    cd /your_directory/apache-hive-2.3.0-bin
    bin/hive -e'create database if not exists mytest;'

    (2). hive -f 的方式

    cd /your_directory
    
    vim test_hive.sql

    test_hive.sql内容如下:

    create database if not exists mytest;
    use mytest;
     
    create table t_student(id int, name string);

    #通过hive -f来执行sql脚本
    bin/hive -f /your_directory/test_hive.sql

    以上交互方式创建的 mytest 数据库的元数据信息存储在上述安装的元数据库 mysql 库表中。

    欢迎关注【无量测试之道】公众号,回复【领取资源】

    Python+Unittest框架API自动化、

    Python+Unittest框架API自动化、

    Python+Pytest框架API自动化、

    Python+Pandas+Pyecharts大数据分析、

    Python+Selenium框架Web的UI自动化、

    Python+Appium框架APP的UI自动化、

    Python编程学习资源干货、

    资源和代码 免费送啦~
    文章下方有公众号二维码,可直接微信扫一扫关注即可。

    备注:我的个人公众号已正式开通,致力于IT互联网技术的分享。

    包含:数据分析、大数据、机器学习、测试开发、API接口自动化、测试运维、UI自动化、性能测试、代码检测、编程技术等。

    微信搜索公众号:“无量测试之道”,或扫描下方二维码:

    添加关注,让我们一起共同成长!

  • 相关阅读:
    RUST实践.md
    redis.md
    opencvrust.md
    aws rds can't connect to mysql server on 'xx'
    Foundation ActionScript 3.0 With Flash CS3 And Flex
    Foundation Flash Applications for Mobile Devices
    Flash Mobile Developing Android and iOS Applications
    Flash Game Development by Example
    Actionscript 3.0 迁移指南
    在SWT中非UI线程控制界面
  • 原文地址:https://www.cnblogs.com/Wu13241454771/p/15619606.html
Copyright © 2011-2022 走看看