zoukankan      html  css  js  c++  java
  • Cloudera manager的服务安装以及spark升级到2.2

    一、Cloudera manager的服务安装

    包含2个:

    1、 是软件包的分发、安装

    此种方式安装的时候。Cloudera manager会在激活这个步骤验证软件的版本和当前cdh的兼容性。如果不符合会提示,并且不能激活。

    (1)、包的在线安装

       

    上一步中配置会打开这个界面进行:下载地址的配置。

    点击分配步骤之后,.parcel的软件包在每台机器上就已经复制了,并且是解压好的安装包。

    (2)、通过自己下载.parcel,上传到软件包目录

         此种方式安装的时候。Cloudera manager在激活这个步骤验证软件的版本和当前cdh的兼容性。

         (2.1).上传parcel包到Cloudera manager主节点所在机器的/opt/cloudera/parcel-repo

         (2.2).一般包含一下三个文件,如果没有.parcel.sha文件就自己创建一个。里面的码就是manifest.json文件里面组件的hash的值。

               

                  

           

            文件下载、上传到指定目录之后,后面的操作和在线下载的方式是一样的。检查新Parcel、分配、激活。

            如果一个软件包就是比较简单的(只要求有对应jar,没有分配组件等复杂管理)、或者软件包比较新cloudera manager没有提供对应的添加服务的界面选项。应该到这里就结束了。

    2、 是服务管理的界面:主要是添加服务、选择角色所在的机器、管理服务的运行、配置等。

    服务管理界面这块cloudera manager上我没有发现自动分发、配置的功能。都是手动同步配置和软件到各个机器上的。

    Web服务管理包的路径在  /opt/cloudera/csd/

        详细的步骤请参见下文的spark服务管理界面的安装。

    =========================================

    此步骤不确定是否必要。

    二、scala环境的安装

    安装scala

    1、下载

    https://downloads.lightbend.com/scala/2.12.4/scala-2.12.4.tgz

    2、解压

    tar -xvf scala-2.12.4.tgz

    3、添加到环境

    vim /etc/profile

    #set scala

    export SCALA_HOME=/usr/scala-2.12.4

    export PATH=$PATH:$SCALA_HOME/bin

    复制到其他机器

    scp -r /usr/scala-2.12.4/ root@192.168.180.224:/usr/scala-2.12.4/

    生效环境

    source /etc/profile

    =========================================

    三、spark2.2软件包的安装

    spark2的安装地址

    下载地址

    http://archive.cloudera.com/spark2

    这里需要说明一下。Cloudera manager里面组件的安装提供了cloudera2和cloudera1这2中版本的软件包。

    根据下面这个网页的说:其实就是hive关联软件导致的cdh版本的要求。总体看来cloudera2版本的软件包兼容更广泛。

    1版本的可能有的cdh版本需要升级才能兼容要安装的软件包

    https://www.cloudera.com/documentation/spark2/latest/topics/spark2_requirements.html

    最终选择了下面这个地址的spark版本,通过在线下载的方式进行了安装。

    http://archive.cloudera.com/spark2/parcels/2.2.0.cloudera2/

    =========================================

    四、spark2.2web服务关联的安装

    由于担心版本冲突,我先卸载了cloudera manager自带的spark1.6版本。

    重新安装spark2.2版本的软件包和对应的web服务管理功能。

    下载添加web服务的组件

    地址

    http://archive.cloudera.com/spark2/csd/

    要下载的文件

    SPARK2_ON_YARN-2.2.0.cloudera2.jar

    SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha

    如果是SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha1请重命名一下,把后缀名.sha1改成sha.

    ---------------------------------------

    /opt/cloudera/

    以下操作在每个节点执行:

    把上面的2个文件上传到/opt/cloudera/csd/目录

    授权(变更所属组和拥有者)

    cd /opt/cloudera/csd/

    chgrp cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar

    chgrp cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha

    chown cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar

    chown cloudera-scm SPARK2_ON_YARN-2.2.0.cloudera2.jar.sha

    重启

    /opt/cm-5.11.1/etc/init.d/cloudera-scm-agent restart

    /opt/cm-5.11.1/etc/init.d/cloudera-scm-server restart

    重启之后,就应该能在添加服务里面看到spark2了

        

    如果重启之后还看不到看到spark2这个服务。请查验.parcel包是否和web管理服务包的版本对应的上。

             

    =========================================

    五、测试代码是否有效

    /opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/lib/spark2/examples/jars/

    ./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn-client examples/jars/spark-examples_2.11-2.2.0.cloudera2.jar 

    cloudera manager自己安装的spark2目录

    cd /opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/bin/

    spark2-submit --class org.apache.spark.examples.SparkPi --master yarn-client /opt/cloudera/parcels/SPARK2-2.2.0.cloudera2-1.cdh5.12.0.p0.232957/lib/spark2/examples/jars/spark-examples_2.11-2.2.0.cloudera2.jar

    运行会报错,需要在运行的机器上都安装getway,并且刷新客户端配置。Spark可能需要它来获取hadoop的配置信息。

  • 相关阅读:
    20175126《Java程序设计》第七周学习总结
    20175126《Java程序设计》第六周学习总结
    软工实践个人总结
    第06组 Beta版本演示
    第06组 Beta冲刺(4/5)
    第06组 Beta冲刺(5/5)
    第06组 Beta冲刺(3/5)
    第06组 Beta冲刺(2/5)
    第6组 Beta冲刺(1/5)
    第06组 Alpha事后诸葛亮
  • 原文地址:https://www.cnblogs.com/double-kill/p/8413508.html
Copyright © 2011-2022 走看看