zoukankan      html  css  js  c++  java
  • java实现spark常用算子之filter



    import org.apache.spark.SparkConf;
    import org.apache.spark.api.java.JavaRDD;
    import org.apache.spark.api.java.JavaSparkContext;
    import org.apache.spark.api.java.function.Function;
    import org.apache.spark.api.java.function.VoidFunction;

    import java.util.Arrays;
    import java.util.List;

    /**
    * filter 算子使用
    * 通过函数筛选出需要的数据元素,返回true表示保留,返回false表示抛弃
    */
    public class FilterOperator {
    public static void main(String[] args){
    SparkConf conf = new SparkConf().setMaster("local").setAppName("filter");
    JavaSparkContext sc = new JavaSparkContext(conf);
    List<Integer> names = Arrays.asList(12,56,5,14,44);
    JavaRDD<Integer> nameRdd = sc.parallelize(names);
    JavaRDD<Integer> result = nameRdd.filter(new Function<Integer, Boolean>() {
    @Override
    public Boolean call(Integer integer) throws Exception {
    if(integer<10) {
    return false;
    }
    return true;
    }
    });

    result.foreach(new VoidFunction<Integer>() {
    @Override
    public void call(Integer integer) throws Exception {
    System.err.println("filter算子:"+integer);
    }
    });

    }
    }


    微信扫描下图二维码加入博主知识星球,获取更多大数据、人工智能、算法等免费学习资料哦!

  • 相关阅读:
    算法图解之散列表
    算法图解之快速排序
    算法图解之分而治之
    __setitem__,__getitem,__delitem__的作用
    算法图解之递归
    Python开发不可不知的虚拟环境
    静态属性property的本质和应用
    SQLmap详解
    windows提权备忘录
    linux提权备忘录
  • 原文地址:https://www.cnblogs.com/guokai870510826/p/11598808.html
Copyright © 2011-2022 走看看