zoukankan      html  css  js  c++  java
  • azkaban组件的安装与使用

    Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban定义了一种KV文件格式来建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。

    它有如下功能特点:

    ²  Web用户界面

    ²  方便上传工作流

    ²  方便设置任务之间的关系

    ²  调度工作流

    ²  认证/授权(权限的工作)

    ²  能够杀死并重新启动工作流

    ²  模块化和可插拔的插件机制

    ²  项目工作区

    ²  工作流和任务的日志记录和审计

    一、准备工作

    Azkaban Web服务器

    azkaban-web-server-2.5.0.tar.gz

    Azkaban执行服务器 

    azkaban-executor-server-2.5.0.tar.gz

    MySQL

    目前azkaban只支持 mysql,需安装mysql服务器,本文档中默认已安装好mysql服务器,并建立了 root用户,密码 123456.

    下载地址:http://azkaban.github.io/downloads.html

    二、安装

    将安装文件上传到集群,最好上传到安装 hive、sqoop的机器上,方便命令的执行

    在当前用户目录下新建 azkabantools目录,用于存放源安装文件.新建azkaban目录,用于存放azkaban运行程序

    azkaban web服务器安装

    解压azkaban-web-server-2.5.0.tar.gz
    
    命令: tar –zxvf azkaban-web-server-2.5.0.tar.gz
    
    将解压后的azkaban-web-server-2.5.0 移动到 azkaban目录中,并重新命名 webserver
    
    命令: mv azkaban-web-server-2.5.0 ../azkaban
    
            cd ../azkaban
    
            mv azkaban-web-server-2.5.0  server

    azkaban 执行服器安装

    解压azkaban-executor-server-2.5.0.tar.gz
    
    命令:tar –zxvf azkaban-executor-server-2.5.0.tar.gz
    
    将解压后的azkaban-executor-server-2.5.0 移动到 azkaban目录中,并重新命名 executor
    
    命令:mv azkaban-executor-server-2.5.0  ../azkaban
    
    cd ../azkaban
    
    mv azkaban-executor-server-2.5.0  executor

    azkaban脚本导入

    解压: azkaban-sql-script-2.5.0.tar.gz
    
    命令:tar –zxvf azkaban-sql-script-2.5.0.tar.gz
    
    将解压后的mysql 脚本,导入到mysql中:
    
    进入mysql
    
    mysql> create database azkaban;
    
    mysql> use azkaban;
    
    Database changed
    
    mysql> source /home/hadoop/azkaban-2.5.0/create-all-sql-2.5.0.sql;//默认在本机上安装了mysql,linux的mysql安装可参考我的上一篇文档

    创建SSL配置

    参考地址: http://docs.codehaus.org/display/JETTY/How+to+configure+SSL

    命令: 

    keytool -keystore keystore -alias jetty -genkey -keyalg RSA

    运行此命令后,会提示输入当前生成 keystor的密码及相应信息,输入的密码请劳记,信息如下:

    输入keystore密码:(自定义) 

    再次输入新密码:(与上边一致)

    您的名字与姓氏是什么?

      [Unknown]: (回车,下同)

    您的组织单位名称是什么?

      [Unknown]: 

    您的组织名称是什么?

      [Unknown]: 

    您所在的城市或区域名称是什么?

      [Unknown]: 

    您所在的州或省份名称是什么?

      [Unknown]: 

    该单位的两字母国家代码是什么

      [Unknown]:  CN

    CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=CN 正确吗?

      [否]:  y

    输入<jetty>的主密码

            (如果和 keystore 密码相同,按回车): (回车)

    再次输入新密码:

    完成上述工作后,将在当前目录生成 keystore 证书文件,将keystore 考贝到 azkaban web服务器根目录中.如:

    cp keystore azkaban/server

    配置文件

    注:先配置好服务器节点上的时区

    1、先生成时区配置文件Asia/Shanghai,用交互式命令 tzselect 即可(注意在root权限下进行,最好将集群中所有机器同一时间)

    2、拷贝该时区文件,覆盖系统本地时区配置

    cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime 

    修改时间方法:
    先输入date查看时间
    将所有机器切换至root权限,或直接:
    sudo date -s ‘2019-03-18 15.01.11’
    最后将时间写入硬件时间:
    hwclock -w

    三、配置

    azkaban web服务器配置

    进入azkaban web服务器安装目录 conf目录,修改azkaban.properties文件,命令

    vi azkaban.properties

    对以下标红的字段作主要修改:

    #Azkaban Personalization Settings
    azkaban.name=Test                           #服务器UI名称,用于服务器上方显示的名字
    azkaban.label=My Local Azkaban                               #描述
    azkaban.color=#FF3601                                                 #UI颜色
    azkaban.default.servlet.path=/index                         #
    web.resource.dir=web/                                                 #默认根web目录
    default.timezone.id=Asia/Shanghai                           #默认时区,已改为亚洲/上海 默认为美国
     
    #Azkaban UserManager class
    user.manager.class=azkaban.user.XmlUserManager   #用户权限管理默认类
    user.manager.xml.file=conf/azkaban-users.xml              #用户配置,具体配置参加下文
     
    #Loader for projects
    executor.global.properties=conf/global.properties    # global配置文件所在位置
    azkaban.project.dir=projects                                                #
     
    database.type=mysql                                                              #数据库类型
    mysql.port=3306                                                                       #端口号
    mysql.host=min1                                                     #数据库连接IP
    mysql.database=azkaban                                                       #数据库实例名
    mysql.user=root                                                                 #数据库用户名
    mysql.password=123456                                                      #数据库密码
    mysql.numconnections=100                                                  #最大连接数
     
    # Velocity dev mode
    velocity.dev.mode=false
    # Jetty服务器属性.
    jetty.maxThreads=25                                                               #最大线程数
    jetty.ssl.port=8443                                                                   #Jetty SSL端口
    jetty.port=8081                                                                         #Jetty端口
    jetty.keystore=keystore                                                          #SSL文件名
    jetty.password=123456                                                             #SSL文件密码
    jetty.keypassword=123456                                                      #Jetty主密码 与 keystore文件相同
    jetty.truststore=keystore                                                                #SSL文件名
    jetty.trustpassword=123456                                                   # SSL文件密码
     
    # 执行服务器属性
    executor.port=12321                                                               #执行服务器端口
     
    # 邮件设置
    mail.sender=xxxxxxxx@163.com                                       #发送邮箱
    mail.host=smtp.163.com                                                       #发送邮箱smtp地址
    mail.user=xxxxxxxx                                       #发送邮件时显示的名称
    mail.password=**********                                                 #邮箱密码
    job.failure.email=xxxxxxxx@163.com                              #任务失败时发送邮件的地址
    job.success.email=xxxxxxxx@163.com                            #任务成功时发送邮件的地址
    lockdown.create.projects=false                                           #
    cache.directory=cache                                                            #缓存目录

    azkaban 执行服务器executor配置

    进入执行服务器安装目录conf,修改azkaban.properties

    vi azkaban.properties

    对以下标红的字段作主要修改:

    #Azkaban
    default.timezone.id=Asia/Shanghai                                              #时区
     
    # Azkaban JobTypes 插件配置
    azkaban.jobtype.plugin.dir=plugins/jobtypes                   #jobtype 插件所在位置
     
    #Loader for projects
    executor.global.properties=conf/global.properties
    azkaban.project.dir=projects
     
    #数据库设置
    database.type=mysql                                                                       #数据库类型(目前只支持mysql)
    mysql.port=3306                                                                                #数据库端口号
    mysql.host=min1                                                        #数据库IP地址
    mysql.database=azkaban                                                                #数据库实例名
    mysql.user=root                                                                       #数据库用户名
    mysql.password=123456                                 #数据库密码
    mysql.numconnections=100                                                           #最大连接数
     
    # 执行服务器配置
    executor.maxThreads=50                                                                #最大线程数
    executor.port=12321                                                               #端口号(如修改,请与web服务中一致)
    executor.flow.threads=30                                                                #线程数

    用户配置

    进入azkaban web服务器conf目录,修改azkaban-users.xml

    vi azkaban-users.xml 

    增加 管理员用户

    <azkaban-users>
            <user username="azkaban" password="azkaban" roles="admin" groups="azkaban" />
            <user username="metrics" password="metrics" roles="metrics"/>
            <user username="admin" password="admin" roles="admin,metrics" />//新加的一行,为azkaban在web页面的登录用户名与密码
            <role name="admin" permissions="ADMIN" />
            <role name="metrics" permissions="METRICS"/>
    </azkaban-users>

    四、启动

    web服务器

    在azkaban web服务器目录下执行启动命令(cd /azkaban/server)

    bin/azkaban-web-start.sh

    注:在web服务器根目录运行

    或者启动到后台

    nohup  bin/azkaban-web-start.sh  1>/tmp/azstd.out  2>/tmp/azerr.out &

    执行服务器

    在执行服务器目录下执行启动命令(cd /azkaban/execustor)

    bin/azkaban-executor-start.sh

    注:只能要执行服务器根目录运行

    启动完成后,在浏览器(建议使用谷歌浏览器)中输入https://min1(服务器IP或主机名):8443 ,即可访问azkaban服务了.在登录中输入刚才新的户用名及密码(admin,admin),点击 login.

    五、实战举例

    Azkaba内置的任务类型支持command、java

    1、创建job描述文件

    #command.job
    
    type=command                                                    
    
    command=echo 'hello'

    2、将job资源文件打包成zip文件

    zip command.job

    3、通过azkaban的web管理平台创建project并上传job压缩包

    首先创建project

    上传zip包

     

    4、启动执行该job

  • 相关阅读:
    客户端rsyslog配置文件详解
    logstash插件配置-codec插件说明json和multiline
    Linux流量监控工具
    单线程 Redis 为什么这么快,看看这篇就知道了
    RabbitMQ Network Partitions 处理策略
    inux 下配置网卡的别名即网卡子IP的配置 转
    Prometheus的监控解决方案(含监控kubernetes)
    Prometheus+Grafana监控Kubernetes
    python输入一维数组(输入以空格为间隔的一行)
    用gdb来理解:值传递/指针传递/引用传递
  • 原文地址:https://www.cnblogs.com/fjlcoding/p/azkaban.html
Copyright © 2011-2022 走看看