zoukankan      html  css  js  c++  java
  • Java线程(十一):Fork/Join-Java并行计算框架

    并行计算在处处都有大数据的今天已经不是一个新奇的词汇了。如今已经有单机多核甚至多机集群并行计算。注意,这里说的是并行,而不是并发。严格的将,并行是指系统内有多个任务同一时候运行,而并发是指系统内有多个任务同一时候存在,不同的任务按时间分片的方式切换运行,因为切换的时间非常短。给人的感觉好像是在同一时候运行。
    Java在JDK7之后增加了并行计算的框架Fork/Join,能够解决我们系统中大数据计算的性能问题。Fork/Join採用的是分治法,Fork是将一个大任务拆分成若干个子任务。子任务分别去计算,而Join是获取到子任务的计算结果,然后合并。这个是递归的过程。子任务被分配到不同的核上运行时,效率最高。伪代码例如以下:

    Result solve(Problem problem) {
        if (problem is small)
            directly solve problem
        else {
            split problem into independent parts
            fork new subtasks to solve each part
            join all subtasks
            compose result from subresults
        }
    }

    Fork/Join框架的核心类是ForkJoinPool,它能够接收一个ForkJoinTask,并得到计算结果。ForkJoinTask有两个子类。RecursiveTask(有返回值)和RecursiveAction(无返回结果),我们自定义任务时。仅仅需选择这两个类继承就可以。

    类图例如以下:
    这里写图片描写叙述这里写图片描写叙述
    以下来看一个实例:计算一个超大数组全部元素的和。代码例如以下:

    import java.util.Arrays;
    import java.util.Random;
    import java.util.concurrent.ExecutionException;
    import java.util.concurrent.ForkJoinPool;
    import java.util.concurrent.RecursiveTask;
    
    /**
     * @author: shuang.gao  Date: 2015/7/14 Time: 8:16
     */
    public class SumTask extends RecursiveTask<Integer> {
    
        private static final long serialVersionUID = -6196480027075657316L;
    
        private static final int THRESHOLD = 500000;
    
        private long[] array;
    
        private int low;
    
        private int high;
    
        public SumTask(long[] array, int low, int high) {
            this.array = array;
            this.low = low;
            this.high = high;
        }
    
        @Override
        protected Integer compute() {
            int sum = 0;
            if (high - low <= THRESHOLD) {
                // 小于阈值则直接计算
                for (int i = low; i < high; i++) {
                    sum += array[i];
                }
            } else {
                // 1. 一个大任务切割成两个子任务
                int mid = (low + high) >>> 1;
                SumTask left = new SumTask(array, low, mid);
                SumTask right = new SumTask(array, mid + 1, high);
    
                // 2. 分别计算
                left.fork();
                right.fork();
    
                // 3. 合并结果
                sum = left.join() + right.join();
            }
            return sum;
        }
    
        public static void main(String[] args) throws ExecutionException, InterruptedException {
            long[] array = genArray(1000000);
    
            System.out.println(Arrays.toString(array));
    
            // 1. 创建任务
            SumTask sumTask = new SumTask(array, 0, array.length - 1);
    
            long begin = System.currentTimeMillis();
    
            // 2. 创建线程池
            ForkJoinPool forkJoinPool = new ForkJoinPool();
    
            // 3. 提交任务到线程池
            forkJoinPool.submit(sumTask);
    
            // 4. 获取结果
            Integer result = sumTask.get();
    
            long end = System.currentTimeMillis();
    
            System.out.println(String.format("结果 %s 耗时 %sms", result, end - begin));
        }
    
        private static long[] genArray(int size) {
            long[] array = new long[size];
            for (int i = 0; i < size; i++) {
                array[i] = new Random().nextLong();
            }
            return array;
        }
    }
    

    我们通过调整阈值(THRESHOLD)。能够发现耗时是不一样的。实际应用中。假设须要切割的任务大小是固定的,能够经过測试,得到最佳阈值;假设大小不是固定的。就须要设计一个可伸缩的算法,来动态计算出阈值。

    假设子任务非常多,效率并不一定会高。
    未完待续。。


    參考资料

    http://gee.cs.oswego.edu/dl/papers/fj.pdf
    https://docs.oracle.com/javase/tutorial/essential/concurrency/forkjoin.html
    https://www.ibm.com/developerworks/cn/java/j-lo-forkjoin/
    http://www.ibm.com/developerworks/cn/java/j-jtp11137.html

    本文来自:高爽|Coder。原文地址:http://blog.csdn.net/ghsau/article/details/46287769,转载请注明。

  • 相关阅读:
    84最佳买卖股票时机含冷冻期(309)
    83 不同路径 II(63)
    82同路径(62)
    模块与包
    名称空间与作用域
    函数的参数
    函数对象
    函数继续学习中
    python学习day3-上午
    第一个完成程序:通过文件实现注册登录
  • 原文地址:https://www.cnblogs.com/gavanwanggw/p/7381782.html
Copyright © 2011-2022 走看看