zoukankan      html  css  js  c++  java
  • Hadoop DistributedCache使用案例

    背景

    公司数据处理具有两个计算框架,单机框架和MR框架。眼下我已经抽象出一套API interface, 供业务计算开发者使用。

    并分别在两个计算框架下实现了API的运行调度。应用开发者有时间须要通过上传override的配置文件。来调整业务计算參数。单机框架易于实现。但在MR框架里,须要解决override的配置文件的分发问题。

    实现

    1. 通过命令行传入配置文件路径;

    2. MR job client端读入本地配置文件,并增加DistributedCache。并把命令行參数不加改动,附加到MR child JVM启动參数数组中。

    3. MR child JVM启动后检查启动參数, 发现有配置文件,且配置文件不存在。则将配置文件路径替换为DistributedCache相应的本地路径。

    4. child JVM job读入替换后的配置文件,并应用到mr job中。实现计算參数的改动。


    參考

    http://dongxicheng.org/mapreduce-nextgen/hadoop-distributedcache-details/


  • 相关阅读:
    swift -- 静态变量static
    swift -- 单例+ lazy懒加载 + 第三方库
    swift -- 代理delegate
    swift -- 闭包
    swift -- 构造/析构函数
    swift -- 继承
    swift -- as / 扩展
    swift -- 类中的方法
    swift -- 类和结构体
    C 扩展库
  • 原文地址:https://www.cnblogs.com/liguangsunls/p/6823333.html
Copyright © 2011-2022 走看看