zoukankan      html  css  js  c++  java
  • mapReducer程序编写过程

    /*
        第一步    split    有系统自动切分
        第二步    map        撰写map类extemds Maper 复写Map方法;
        第三步    shuffle        
                    Partion        分区,将不同信息区分的分发到不同的Reducer中
                    Sort        排序,按照key的不同标准判断顺序
                    Group        分组,按照不同的key值判断相同的标准分组到一起
        第四步    Reducer        处理分组数据。输出信息。        

        自定义key值    implements writableComparable<>
        编写Map类
        重写Partion    extends    HashPartitioner<MyKey, DoubleWritable>
                        两个参数分别是自定义key的类型,和值得类型。
                        重写getPartion方法,(要求短小)
        重写sort方法    extends    writableCompare方法,
                    //使用父类构造方法加载并创建自定义key类。
                    public MySort(){
                        super(MyKey.class,true);
                    }
                    //重写compare方法,自定义比较标准。(需要将WritableComparable转化为指定类)
                    public int compare(WritableComparable a, WritableComparable b)
        重写分组方法    extends    writableCompare方法,
                    //使用父类构造方法加载并创建自定义key类。
                    public MySort(){
                        super(MyKey.class,true);
                    }
                    //重写compare方法,自定义比较标准。(需要将WritableComparable转化为指定类)
                    public int compare(WritableComparable a, WritableComparable b)
        编写Reduce类,extends Reducer<MyKey, DoubleWritable, Text, NullWritable>
                    重写 Reducer方法。输出。
        编写Job类        设置配置参数,创建Job类型,设置相关类。            
        
        
    */

  • 相关阅读:
    Oracle 11g R2性能优化 SQL TRACE
    Oracle 11g R2创建数据库之手工建库方式
    Oracle 11g R2创建数据库之DBCA静默方式
    CentOS 7静默安装Oracle 11g R2数据库软件
    如何在Windows上使用Git创建一个可执行脚本?
    我们为什么推荐在Json中使用string表示Number属性值?
    [麻雀虽小,五脏俱全] 之网站重写之路
    2020年必须掌握的硬核技能k8s
    [半翻] 设计面向DDD的微服务
    Quartz.net在集群环境下的 部署任务的姿势
  • 原文地址:https://www.cnblogs.com/Xmingzi/p/5774703.html
Copyright © 2011-2022 走看看