zoukankan      html  css  js  c++  java
  • mapreduce程序来实现分类

    文件的内容例如以下所看到的:

    5

    45

    8

    876

    6

    45

    要求最后的输出格式:

    1    5

    2    6

    3    8

    4    45

    5    45

    5    876

    首先,这个题目是须要对文件的内容进行排序操作。我们都知道在mapper阶段是会对key进行排序的,我们就利用这个出发,把输入一行的数据转换成int,再把该int做mapper的key输出,而value的输出随便,我们这里输出1;然后在reduce阶段我们把mapper的key做为reduce的value输出,而key仅仅需定义一个全局的静态变量,每次输出自增就可以。

    package cn.lmj.mapreduce;


    import java.io.IOException;
    import java.util.Iterator;


    import org.apache.hadoop.fs.Path;
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.mapred.FileInputFormat;
    import org.apache.hadoop.mapred.FileOutputFormat;
    import org.apache.hadoop.mapred.JobClient;
    import org.apache.hadoop.mapred.JobConf;
    import org.apache.hadoop.mapred.MapReduceBase;
    import org.apache.hadoop.mapred.Mapper;
    import org.apache.hadoop.mapred.OutputCollector;
    import org.apache.hadoop.mapred.Reducer;
    import org.apache.hadoop.mapred.Reporter;
    import org.apache.hadoop.mapred.TextInputFormat;
    import org.apache.hadoop.mapred.TextOutputFormat;


    public class Sort
    {
    public static class SortMapper extends MapReduceBase implements
    Mapper<Object, Text, IntWritable, IntWritable>
    {
    @Override
    public void map(Object key, Text value,
    OutputCollector<IntWritable, IntWritable> output,
    Reporter reporter) throws IOException
    {
    String line = value.toString();
    int i = Integer.parseInt(line.toString());
    output.collect(new IntWritable(i), new IntWritable(1));
    }
    }


    public static class SortReducer extends MapReduceBase implements
    Reducer<IntWritable, IntWritable, IntWritable, IntWritable>
    {

    //必须是全局的静态变量,由于reduce的实例在开发中可能会有非常多个,必须让多个对象共享同一个变量
    private static IntWritable linenum = new IntWritable(1);


    @Override
    public void reduce(IntWritable key, Iterator<IntWritable> values,
    OutputCollector<IntWritable, IntWritable> output,
    Reporter reporter) throws IOException
    {
    while (values.hasNext())
    {
    values.next();
    output.collect(linenum, key);

    //每次输出让linenum加1
    linenum = new IntWritable(linenum.get() + 1);
    }
    }
    }


    public static void main(String[] args) throws Exception
    {
    JobConf conf = new JobConf(Sort.class);
    conf.setJobName("cccccc");


    conf.setOutputKeyClass(IntWritable.class);
    conf.setOutputValueClass(IntWritable.class);


    conf.setMapperClass(SortMapper.class);

    //注意,这个题目不能够设置Combiner对mapper之后的数据进行预先合拼
    conf.setReducerClass(SortReducer.class);


    conf.setInputFormat(TextInputFormat.class);
    conf.setOutputFormat(TextOutputFormat.class);


    FileInputFormat.setInputPaths(conf, new Path("/zuoye/file1/"));
    FileOutputFormat.setOutputPath(conf, new Path("/zuoye/file1/output"));


    JobClient.runJob(conf);
    }
    }

  • 相关阅读:
    摄影技巧:如何拍好夜景?这些拍摄要点值得借鉴
    单反摄影:快门优先怎么用?
    摄影基础知识:什么是光圈优先?
    【震惊】、【无耻】、【嚣张】浙江谷誉科技旗下爱卡之家,黑商圈钱跑路,强行黑吃,用户损失累计数亿
    爱卡之家是不是骗人的,爱卡之家跑路了吗?
    浙江谷誉网络的爱卡之家怎么样,是不是真实的,靠不靠谱?
    爱卡之家app怎么样?爱卡之家油卡套餐可信吗?爱卡之家是不是骗人的,靠不靠谱?
    爱卡之家充值不到账 爱卡之家疑似跑路 爱卡之家客服联系不上
    android TypedValue.applyDimension()的作用
    Android 在xml中配置 float 和 integer 值
  • 原文地址:https://www.cnblogs.com/hrhguanli/p/4556881.html
Copyright © 2011-2022 走看看