zoukankan      html  css  js  c++  java
  • [五]java函数式编程归约reduce概念原理 stream reduce方法详解 reduce三个参数的reduce方法如何使用

    reduce-归约


    看下词典翻译:
    image_5b7bb842_2b7a
    好的命名是自解释的
    reduce的方法取得就是其中归纳的含义
    java8 流相关的操作中,我们把它理解 "累加器",之所以加引号是因为他并不仅仅是加法
    他的运算可以是一个Lambda 表达式
    所以更准确的说 reduce 是一个迭代运算器
    Stream包的文档中其实已经说的很明白了
    但是就是因为不是很理解所以看的云里雾里
    其中说到:
    一个reduce操作(也称为折叠)接受一系列的输入元素,并通过重复应用操作将它们组合成一个简单的结果
     
    参照reduce方法文档给出的示例

    T result = identity;

    for (T element : this stream)

    result = accumulator.apply(result, element)

    return result;

     

    累计运算的概念


    以下面的这个方法为例解析
    image_5b7bb842_61a1
    BinaryOperator 是BiFunction 的三参数特殊化形式,两个入参和返回结果都是类型T
     
    计算1,2,3,4,5 的和,并且初始值为3  
    也就是计算3+1+2+3+4+5 
    1.使用Stream 两个参数的reduce方法进行归约运算
    2.使用for循环迭代调用BinaryOperator 的apply进行运算
    image_5b7bb842_27a8
    其实两种方式背后的思维方式是一样的
    那就是   
    结果重新作为一个参数,不断地参与到运算之中,直到最后结束
     
    理解reduce的含义重点就在于理解"累   加   器" 的概念
    image_5b7bb842_5f93
     
    只要能够理解了累计运算的概念
    就可以完全理解Stream 中reduce方法
    他就是一个不断累计运算的过程
    image_5b7bb842_f7c
     
     
    Stream的一个参数和两个参数的方法的基本逻辑都是如此
    差别仅仅在于一个参数的是result  R = T1 ,然后再继续与剩下的元素参与运算
     
     

    三个参数的reduce


        <U> U reduce(U identity,
                     BiFunction<U, ? super T, U> accumulator,
                     BinaryOperator<U> combiner);
     
    image_5b7bb842_57b2
     
    它的形式类似于
    image_5b7bb842_1a72
    与两个参数的reduce不同的地方在于类型
    双参数的返回类型为T  Stream类型为T
    三参数的返回类型为U  Stream类型为T   有了更大的发挥空间  T可能为U 也可能不是U 
     
    很显然,三参数的reduce 方法的思维方式同双参数的并无二致
    所以问题来了,那还要第三个参数做什么?
    其实第三个参数用于在并行计算下 合并各个线程的计算结果
     
    并行流运行时:内部使用了fork-join框架
    image_5b7bb842_567a
    多线程时,多个线程同时参与运算
    多个线程执行任务,必然会产生多个结果
    那么如何将他们进行正确的合并
    这就是第三个参数的作用
     
     
    大致处理流程
    image_5b7bb842_523b
    从流程上看的 结果R是一直参与运算的!!
    我们之前也有一个例子
    两种情况下的结果是不一样的!!!!
    image_5b7bb842_595b
     
    image_5b7bb842_7701
    结果不同  是因为  ((((5+1)+2)+3)+4)+5   和   (5+1)+ (5+2)+ (5+3)+ (5+4)+ (5+5)  运算结果不相同 
    那么这个方法不是有问题么?
     
    其实不然,有问题的是我们的写法
    文档中进行了明确的说明要求
    image_5b7bb842_5e68
     
    翻译下:
    第一点:identity 的值对于合并运算combiner来说必须是一个恒等式,也就是说对于任意的u,  combiner(identity,u)  和u是相同的
    这句话看起来怪怪的,对于任意的u 经过合并运算 竟然还是u,那还要这个干嘛??
    从我们上面的并行处理流程可以看得出来,这个result 的初始identity 对于每一个分支都是参与运算的!
     
    这也是为什么要求:
    任意的u,  combiner(identity,u)  和u是相同的
    的原因
    我们之所以会错,就是因为没有达到要求  
    我们的combiner为   (a,b)->a+b;
    那么如果分为两个分支进行运算,我们的初始值identity就参与了两次运算  也就是说多加了两个identity的值!!
    怎么样才能保证u = combiner(identity,u)  
    除非identity=0  这才是对于  (a,b)->a+b  来说能够保障u = combiner(identity,u)    
    否则,你就不要用(a,b)->a+b  这个combiner
    我们把Identity换成0之后
    image_5b7bb842_1ad8
    image_5b7bb842_328c
     
    结果就不再有问题了
     
    第二点
    combiner 必须和accumulator要兼容
    对于任意的u 和 t
    image_5b7bb842_5598
    这到底是什么意思呢?
     
    场景
    假设说4个元素 1,2,3,4  需要运算
    此时假设已经 1,2,3 三组数据已经运算结束,马上要同第四组运算 
    如果是并行,我们假定1,2,3 在一个分支   4单独在另一分支
     
    并行时
    U为已经计算好的1,2,3后的结果     接下来要与另一组的4 合并
    T4则是identity与T参与运算
    上面的图就是
    combiner.apply(u, accumulator.apply(identity, t))
     
    image_5b7bb842_7a6c
     
    非并行运算
    u 直接与下一个元素进行结合运算

    image_5b7bb842_3cb9
     
    显然这只是并行和非并行两种不同的处理运算方式,他们应该是相同的
    也就是
    image_5b7bb842_1362
     
     
  • 相关阅读:
    C语言I博客作业04
    C语言I博客作业02
    The First Assignment
    蒟蒻的长链剖分学习笔记(例题:HOTEL加强版、重建计划)
    分治FFT模板
    [Ynoi2016]掉进兔子洞 题解
    蒟蒻首开博客园博客QwQ
    bzoj4320 homework 题解
    [ZJOI2016]小星星(容斥+dp)
    【scoi2009】围豆豆(最短路模型)
  • 原文地址:https://www.cnblogs.com/noteless/p/9511407.html
Copyright © 2011-2022 走看看