zoukankan      html  css  js  c++  java
  • Java8 Stream新特性详解及实战

    Java8 Stream新特性详解及实战

    背景介绍

    在阅读Spring Boot源代码时,发现Java 8的新特性已经被广泛使用,如果再不学习Java8的新特性并灵活应用,你可能真的要out了。为此,针对Java8的新特性,会更新一系列的文章,欢迎大家持续关注。

    首先,我们来看一下Spring Boot源代码ConfigFileApplicationListener类中的一段代码:

    private List<Profile> getOtherActiveProfiles(Set<Profile> activatedViaProperty) {
    	return Arrays.stream(this.environment.getActiveProfiles()).map(Profile::new)
    			.filter((profile) -> !activatedViaProperty.contains(profile))
    			.collect(Collectors.toList());
    }
    

    这段代码怎么?够简洁明快吧,如果不使用Java8的新特性,想象一下得多少行代码才能实现?但如果没掌握或不了解Java8的新特性,这段代码读起来是不是很酸爽?

    Java 8的API中新增了一个处理集合的抽象概念:Stream,中文称作“流”。它可以指定你希望对集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。使用起来就像使用SQL语句来对数据库执行查询操作一样。可以让你如行云流水一般写出简单、高效、干劲的代码。

    什么是Stream

    Stream 中文称为 “流”,通过将集合转换为这么一种叫做 “流” 的元素序列(注意是抽象概念),通过声明性方式,能够对集合中的每个元素进行一系列并行或串行的流水线操作。通俗来说就是你只用告诉“流”你需要什么,便在出口处等待结果接口。

    上图为Steam操作的基本流程,在后面的学习过程中可反复与具体的代码进行对照,加深学习印象。

    Stream相关概念

    Stream操作的过程中涉及到一些相关概念,先了解一下,方便后面统一称谓。

    • 元素:特定类型的对象,比如List里面放置的对象,会形成一个队列。Stream不会存储元素,只是按需计算。
    • 数据源:流的来源,对照上图中的集合,数组,I/O channel, 产生器generator等。
    • 聚合操作:类似SQL语句的各种过滤操作,对照上图中的filter、sorted、map等。
    • Pipelining:中文词义“流水线”,中间操作会返回流本身,跟我们之前所说的流式(fluent)编程一个概念,这样可对操作进行优化,比如延迟执行(laziness)和短路(short-circuiting)。
    • 内部迭代:传统遍历方式是通过Iterator或For-Each来完成,这是外部迭代。而Stream通过访问者模式(Visitor)实现了内部迭代。

    需要注意的是在整个操作的过程中,聚合操作部分可以执行多次操作,但每次操作并不是像传统的集合遍历对集合里面的元素进行转换,而是将操作函数放入一个操作集合中,只有到最后一步(比如for-each打印)时才会一次性执行。

    而流和迭代器类似,只能迭代一次。比如,当调用完collect方法之后,流便不能再使用了。

    stream操作方法分类

    中间聚合操作:map (mapToInt, flatMap 等)、 filter、 distinct、 sorted、 peek、 skip、 parallel、 sequential、 unordered。

    最终输出操作:forEach、 forEachOrdered、 toArray、 reduce、 collect、 min、 max、 count、iterator。

    短路操作:anyMatch、 allMatch、 noneMatch、 findFirst、 findAny、 limit。

    生成流

    在 Java 8 中, 生成流有多种方法:Stream接口的静态工厂方法、集合提供的生成方法和其他特殊的生成方法。

    of方法

    Stream接口的静态工厂方法主要通过重载的of方法:

    public static<T> Stream<T> of(T... values);
    
    public static<T> Stream<T> of(T t)
    

    of方法,其生成的Stream是有限长度的,Stream的长度为其内的元素个数。使用示例代码:

    Stream<String> stringStream = Stream.of("公众号");
    Stream<String> stringsStream = Stream.of("关注","公众号", "程序新视界");
    

    generator方法

    与of方法对应的generator方法生成的是无限长度的Stream,其元素是由Supplier接口提供的。

    public static<T> Stream<T> generate(Supplier<T> s)
    

    使用generate方法生成的Stream通常用于随机数和常量,或者需要前后元素间维持着某种状态信息的场景。把 Supplier 实例传递给 Stream.generate() 生成的 Stream,默认是串行(相对 parallel 而言)但无序的(相对 ordered 而言)。

    示例代码如下:

    Stream<Double> generateDouble = Stream.generate(Math::random);
    
    Stream<String> generateString = Stream.generate(new Supplier<String>() {
    	@Override
    	public String get() {
    		return "公众号:程序新视界";
    	}
    });
    

    其实上面两种写法的效果是一样的,只不过第一种采用了Lambda表达式,简化了代码。

    iterate方法

    iterate方法生成的也是无限长度的Stream,是通过函数f迭代对给指定的元素种子而产生无限连续有序Stream,其中包含的元素可以认为是:seed,f(seed),f(f(seed))无限循环。示例代码如下:

    Stream.iterate(1,i -> i +1).limit(10).forEach(System.out::println);
    

    打印结果为1,2,3,4,5,6,7,8,9,10。

    上面的方法可以认为种子(seed)为1,f(seed)为在1的基础上“+1”,依次循环下去,直到达到limit的限制,最后生成对应的Stream。

    empty方法

    empty方法生成一个空的Stream,不包含任何元素。

    Collection接口和数组的默认方法

    Collection接口和数组中都提供了默认的生成Stream的方法。直接看源代码:

    // Collection中
    default Stream<E> stream() {
        return StreamSupport.stream(spliterator(), false);
    }
    // 并行流操作
    default Stream<E> parallelStream() {
        return StreamSupport.stream(spliterator(), true);
    }
    
    // Arrays中
    public static <T> Stream<T> stream(T[] array) {
        return stream(array, 0, array.length);
    }
    
    public static <T> Stream<T> stream(T[] array, int startInclusive, int endExclusive) {
        return StreamSupport.stream(spliterator(array, startInclusive, endExclusive), false);
    }
    

    示例代码:

    List<String> list = new ArrayList<>();
    list.add("欢迎关注");
    list.add("微信公众号");
    list.add("程序新视界");
    list.stream().forEach(System.out::println);
    
    int[] nums = new int[]{1, 2, 3, 4, 5};
    Arrays.stream(nums).forEach(System.out::println);
    

    其他生成方法

    关于其他生成方法就不详细举例了,比如:Random.ints()、BitSet.stream()、JarFile.stream()、Pattern.splitAsStream(java.lang.CharSequence)、Files.lines(java.nio.file
    .Path)等。

    操作方法使用

    关于操作方法就不进行详细的讲解,更多的以示例的形式展示如何使用。

    concat方法

    合并两个Stream。如果输入Stream有序,则新Stream有序;如果其中一个Stream为并行,则新Stream为并行;如果关闭新Stream,原Stream都将执行关闭。

    Stream.concat(Stream.of("欢迎","关注"),Stream.of("程序新视界")).forEach(System.out::println);
    

    distinct

    Stream中元素去重。

    Stream.of(1,1,1).distinct().forEach(System.out::println);
    

    打印结果为1。

    filter

    根据指定条件进行筛选过滤,留下满足条件的元素。

    Stream.of(1, 2, 3, 4, 5).filter(i -> i >= 3).forEach(System.out::println);
    

    打印结果为3,4,5。

    map

    将Stream中的元素进行映射转换,比如将“a”转为“A”,期间生产了新的Stream。同时为了提升效率,官方也提供了封装好的方法:mapToDouble,mapToInt,mapToLong。

    Stream.of("a","b","c").map(item -> item.toUpperCase()).forEach(System.out::println);
    Stream.of("a","b","c").map(String::toUpperCase).forEach(System.out::println);
    

    打印结果为A,B,C。

    flatMap

    将流中的每一个元素映射为一个流,再把每一个流连接成为一个流。期间原有的Stream的元素会被逐一替换。官方提供了三种原始类型的变种方法:flatMapToInt,flatMapToLong和flatMapToDouble。

    Stream.of(1, 2, 3).flatMap(i -> Stream.of(i * 10)).forEach(System.out::println);
    

    打印结果为10,20,30。

    peek

    生成一个相同的Stream,并提供一个消费函数,当新Stream中的元素被消费(执行操作)时,该消费函数会在此之前先执行。

    Stream.of(1, 2).peek(i -> System.out.println("peekCall:" + i)).forEach(System.out::println);
    

    打印结果依次为:peekCall:1,1,peekCall:2,2。

    ship

    跳过前N个元素,取剩余元素,如果没有则为空Stream。

    Stream.of(1, 2, 3).skip(2).forEach(System.out::println);
    

    打印结果为3。

    sorted

    对Stream元素进行排序,可采用默认的sorted()方法进行排序,也可通过sorted(Comparator)方法自定义比较器来进行排序,前者默认调用equals方法来进行比较,

    Stream.of(1, 3, 2).sorted().forEach(System.out::println);
    

    打印结果:1,2,3。

    limit

    限制返回前N个元素,与SQL中的limit相似。

    Stream.of(1, 2, 3).limit(2).forEach(System.out::println);
    

    打印结果为:1,2。

    collect

    收集方法,实现了很多归约操作,比如将流转换成集合和聚合元素等。

    Stream.of(1, 2, 3).collect(Collectors.toList());
    Stream.of(1, 2, 3).collect(Collectors.toSet());
    

    除了以上的集合转换,还有类似joining字符串拼接的方法,具体可查看Collectors中的实现。

    count

    返回Stream中元素个数。

    Stream.of(1, 2, 3).count();
    

    forEach

    遍历Stream中所有元素。示例参考以上设计到的。

    forEachOrder

    遍历Stream中所有元素,如果Stream设置了顺序,则按照顺序执行(Stream是无序的),默认为元素的插入顺序。

    max

    根据指定的比较器(Comparator),返回Stream中最大元素的Optional对象,Optional中的value便是最大值。

    Optional可以代表一个值或不存在,主要是为了规避返回值为null,而抛出NullPointerException的问题,也是由Java8引入的。但当调用其get()方法时,如果当前值不存在则会抛出异常。

    Optional<Integer> max = Stream.of(1, 2, 3).max(Comparator.comparingInt(o -> o));
    System.out.println("max:" + max.get());
    

    打印结果:max:3。

    min

    与max操作相同,功能相反,取最小值。

    Optional<Integer> min = Stream.of(1, 2, 3).min(Comparator.comparingInt(o -> o));
    System.out.println("min:" + min.get());
    

    打印结果:min:1。

    reduce

    reduce可实现根据指定的规则从Stream中生成一个值,比如之前提到的count,max和min方法是因为常用而被纳入标准库中。实际上,这些方法都是reduce的操作。

    Stream.of(1, 2, 3).reduce(Integer::sum);
    Stream.of(1, 2, 3).reduce(0, (a, b) -> a + b);
    

    以上两个方法都是对结果进行求和,不同的是第一个方法调用的是reduce的reduce((T, T) -> T)方法,而第二个调用的是reduce(T, (T, T) -> T)。其中第二个方法的第一个参数0,表示从第0个值开始操作。

    allMatch

    判断Stream中的所有元素是否满足指定条件。全部满足返回true,否则返回false。

    boolean result = Stream.of(1, 2, 3).allMatch(i  -> i > 0);
    System.out.println(result);
    

    返回结果:true。

    anyMatch

    判断Stream中的元素至少有一个满足指定条件。如果至少有一个满足则返回true,否则返回false。

    boolean anyResult = Stream.of(1, 2, 3).anyMatch(i  -> i > 2);
    System.out.println(anyResult);
    

    返回结果:true。

    findAny

    获得其中一个元素(使用stream()时找到的是第一个元素;使用parallelStream()并行时找到的是其中一个元素)。如果Stream为空,则返回一个为空的Optional。

    Optional<String> any = Stream.of("A", "B", "C").findAny();
    System.out.println(any.get());
    

    返回结果:A。

    findFirst

    获得第一个元素。如果Stream为空,则返回一个为空的Optional。

    Optional<String> first = Stream.of("A", "B", "C").findFirst();
    System.out.println(first.get());
    

    返回结果:A。

    noneMatch

    判断Stream中是否所有元素都不满足指定条件。都不满足则返回true,否则false。

    boolean noneMatch = Stream.of(1, 2, 3).noneMatch(i  -> i > 5);
    System.out.println(noneMatch);
    

    返回结果:true。

    统计

    通过summaryStatistics方法可获得Stream的一些统计信息。

    IntSummaryStatistics summaryStatistics = Stream.of(1, 2, 3).mapToInt((i) -> i).summaryStatistics();
    System.out.println("max:" + summaryStatistics.getMax());
    System.out.println("min:" + summaryStatistics.getMin());
    System.out.println("sum:" + summaryStatistics.getSum());
    System.out.println("average:" + summaryStatistics.getAverage());
    

    这里用到了流与数值流直接的转换mapToInt,类似的方法还有mapToDouble、mapToLong。对应获得的数值流还提供了一些额外的方法,就像上面获取不同统计信息的方法一样。

    鸟瞰Stream

    最后,我们再来看一下Stream的主要接口类关系图。

    其中,BaseStream定义了Stream的基本接口,Stream中定义了map、filter、flatMap等常用操作。IntStream、LongStream、DoubleStream是针对基本类型提供了便捷和特化操作。以上接口构建了Java8中流体系的根基。AbstractPipeline是流水线(Pipeline)的核心抽象类,用于构建和管理流水线。

    另外,关于Stream的效率问题网上也有很多资料提到,下一篇文章,我们将重点说说Stream的性能问题,关注公众号“程序新视界”,敬请期待。

    原文链接:《Java8 Stream新特性详解及实战

  • 相关阅读:
    3.16
    3.8
    3.7
    3.6
    3.5
    3.3
    3.2
    《机器学习十讲》学习报告一
    机器学习-集成算法
    机器学习-基于核的算法
  • 原文地址:https://www.cnblogs.com/secbro/p/11641184.html
Copyright © 2011-2022 走看看