zoukankan      html  css  js  c++  java
  • 并行排序

    排序是一项非常常用的操作,你的应用程序在运行时,可能无时无刻不在进行排序操作。排序的算法有很多,但是对于大部分的算法都是串行执行的。当排序的元素很多时,若使用并行算法代替串行,显然可以更加有效的利用CPU,提高排序效率。但将串行算法修改为并行算法并非易事,甚至会极大的增加原有算法的复杂度。下面介绍几种相对简单的算法。

    奇偶交换排序:分离数据相关性

      在介绍奇偶交换排序前,首先来看一下冒泡排序。在这里,我们将数组从小到大排序:

     1 public static int[] bubbleSort(int[] arr){
     2         for (int i = 0;i < arr.length - 1;i++){
     3             for (int j = 0;j < arr.length - 1 - i;j++){
     4                 if (j+1 == arr.length-i){
     5                     break;
     6                 }
     7                 if (arr[j] > arr[j+1]){
     8                     int temp = arr[j];
     9                     arr[j] = arr[j+1];
    10                     arr[j+1] = temp;
    11                 }
    12             }
    13         }
    14         return arr;
    15     }

      在冒泡排序的交换过程中,由于每次交换的两个元素存在数据冲突,也就是对于每个元素,它既可能与前面的元素交换,也可能与后面的元素交换,因此很难直接改造成并行算法。如果能够解开这种数据的相关性,就可以比较容易的使用并行算法来实现类似的排序。奇偶交换排序就是基于这种思想的对于奇偶交换来说,它将排序过程分为两个阶段,奇交换和偶交换。对于奇交换来说,它总是比较奇数索引以及相邻的后续元素;偶交换总是比较偶数索引和其相邻的后续元素,并且奇交换和偶交换会成对出现,这样才能保证比较和交换涉及到数组中的每一个元素。

     从上图可以看出,由于将整个比较交换独立分割为奇阶段和偶阶段。这就使得在每一个阶段内,所有的比较和交换都是没有数据相关性的。因此,每一次比较和交换都可以独立执行,也就可以并行化了。

    下面是奇偶交换的串行实现:

     1 public static int[] oddEvevSort(int[] arr){
     2         int exchFlag = 1,start = 0;
     3         while (exchFlag == 1 || start == 1){
     4             exchFlag = 0;
     5             for (int i = start;i < arr.length - 1;i += 2){
     6                 if (arr[i] > arr[i+1]){
     7                     int temp = arr[i];
     8                     arr[i] = arr[i+1];
     9                     arr[i+1] = temp;
    10                     exchFlag = 1;
    11                 }
    12             }
    13             if (start == 0){
    14                 start = 1;
    15             }else {
    16                 start = 0;
    17             }
    18         }
    19         return arr;
    20     }

    上述代码中,exchFlag用来记录当前迭代是否发生了数据交换,而start变量用来表示是奇交换还是偶交换。初始时,start为0,表示进行偶交换,每次迭代结束后,切换start状态。如果上一次发生了数据交换,或者当前进行的是奇交换,循环就不会停止,直到程序不再发生交换,并且当前进行的是偶交换为止(表示奇偶交换已经成对出现)。

    下面是奇偶交换的并行排序:

     1 public class CurrentOddEven {
     2     static int[] arr = {23,3,23,4,5,5,6,6,6453,678,68,9,9,79878,97,897897,98,78};
     3     static int exchFlag = 1;
     4     static synchronized void setExchFlag(int v){
     5         exchFlag = v;
     6     }
     7 
     8     static synchronized int getExchFlag(){
     9         return exchFlag;
    10     }
    11     public static class OddEvenSortTask implements Runnable{
    12         int i;
    13         CountDownLatch latch;
    14 
    15         public OddEvenSortTask(int i,CountDownLatch latch){
    16             this.i = i;
    17             this.latch = latch;
    18         }
    19 
    20         @Override
    21         public void run() {
    22             if (arr[i] > arr[i+1]){
    23                 int temp = arr[i];
    24                 arr[i] = arr[i+1];
    25                 arr[i+1] = temp;
    26                 setExchFlag(1);
    27             }
    28             latch.countDown();
    29         }
    30     }
    31 
    32     public static void main(String[] args) throws InterruptedException {
    33         int start = 0;
    34         ExecutorService es = Executors.newCachedThreadPool();
    35         while (getExchFlag() == 1 || start == 1){
    36             setExchFlag(0);
    37             //偶数的数组长度,当start=1时,只有length/2-1 个线程
    38             CountDownLatch latch = new CountDownLatch(arr.length/2-(arr.length%2 == 0?start:0));
    39             for (int i = start;i < arr.length - 1;i += 2){
    40                 es.submit(new OddEvenSortTask(i,latch));
    41             }
    42             //等待所有线程结束
    43             latch.await();
    44             if (start == 0){
    45                 start = 1;
    46             }else {
    47                 start = 0;
    48             }
    49         }
    50         for (int temp:arr){
    51             System.out.println(temp);
    52         }
    53         es.shutdown();
    54     }
    55 }

     上述代码第11行,定义了奇偶排序的任务类。该任务的主要工作是进行数据的比较和交换(第22~26行)。并行排序的主体在main方法中,使用了countDownLatch来记录线程数量,对于每一次的迭代,使用单独的线程对每一次元素比较和交换操作,在下一次的迭代开始之前,必须等上一次的迭代必须完成。

     希尔排序:改进的插入排序

    插入排序也是一种很常见的排序算法。它的基本思想:一个未排序的数组(当然也可以是链表)可以分为两个部分,前半部分是已经排序的,后半部分是未排序的。在进行排序时,只需要在未排序的部分中选择一个元素,将其插入前面有序的数组中即可。最终,未排序的部分会越来越少,直到为0,那么排序就完成了。初始时,可以假设已排序部分就是第一个元素。

    插入排序串行排序如下:

     1 public static int[] insertSort(int[] arr){
     2         int length = arr.length;
     3         int i,j,key;
     4         for (i = 1;i < length;i++){
     5             //key为要准备插入的元素
     6             key = arr[i];
     7             j = i - 1;
     8             while (j >= 0 && arr[j] > key){
     9                 arr[j+1] = arr[j];
    10                 j--;
    11             }
    12             //找到合适的位置插入key
    13             arr[j+1] = key;
    14         }
    15         return arr;
    16     }

    上述代码第6行,提取准备插入的元素(也就是未排序序列中的第一个元素)。接着,在已排序的序列中找到这个元素的插入位置(第8~10行),并进行插入(第13行)即可。

    简单的插入排序是很难进行并行化的。因为这一次的数据插入依赖于上一次得到的有序序列,因此多个步骤之间无法并行。为此,我们可以对插入排序进行扩展,就是希尔排序。

    希尔排序将整个数组根据间隔h分割为若干个数组。子数组相互穿插在一起,每一次排序时,分别对每一个子数组进行排序。如下图所示(借大神的图侵删):

    从上图可以看出,每一组排序完成后,可以递减h的值,进行下轮更精细的排序,知道h=1,此时,等价于一次插入排序。

    希尔排序的一个主要优点是,即使最小的一个元素在数组的末尾,由于每次元素的移动都以h为间隔进行,因此数组末尾的小元素可以在很少的交换次数下,就被置换到最接近元素最终位置的地方。

    下面是希尔排序的串行实现:

     1 public static int[] shellSort(int[] arr){
     2         //计算出最大的h值
     3         int h = 1;
     4         while (h <= arr.length/3){
     5             h = h*3 + 1;
     6         }
     7         while (h > 0){
     8             for (int i = h;i < arr.length;i++){
     9                 if (arr[i] < arr[i - h]){
    10                     int temp = arr[i];
    11                     int j = i - h;
    12                     while (j >= 0 && arr[j] > temp){
    13                         arr[j + h] = arr[j];
    14                         j -= h;
    15                     }
    16                     arr[j + h] = temp;
    17                 }
    18             }
    19             //计算出下一个h值
    20             h = (h - 1)/3;
    21         }
    22         return arr;
    23     }

    上述代码的4~6行,计算出一个合适的h值,接着进行正式的希尔排序。第8行代码的for循环进行间隔为h的插入排序,每次排序结束后,递减h的值(第20行),直到h=1,退化为插入排序。

    由于希尔排序每次都针对不同的子数组进行排序,各个子数组之间是完全独立的,因此,是可以改写为并行程序的:

     1 public class CurrentShellSort {
     2     static int[] a = {2,3,1,45,53,3,55,4,65,765,7,7,89687,6,89,69,4354,89,99};
     3     static ExecutorService pool = Executors.newCachedThreadPool();
     4 
     5     public static class ShellSortTask implements Runnable {
     6 
     7         int x = 0;
     8         int h = 0;
     9         CountDownLatch l;
    10 
    11         public ShellSortTask(int x, int h, CountDownLatch latch) {
    12             this.x = x;
    13             this.h = h;
    14             this.l = latch;
    15         }
    16 
    17         public void run() {
    18             int i, j, key;
    19             for (i = x + h; i < a.length; i = i + h) {
    20                 if (a[i] < a[i - h]) {
    21                     j = i - h;
    22                     key = a[i];
    23                     while (j >= 0 && a[j] > key) {
    24                         a[j + h] = a[j];
    25                         j -= h;
    26                     }
    27                     a[j + h] = key;
    28                 }
    29             }
    30             l.countDown();
    31         }
    32     }
    33 
    34     public static void pShellSort(int[] arr) throws InterruptedException {
    35         // 计算出最大的n值
    36         int h = 1;
    37         CountDownLatch lathc = null;
    38         while (h <= arr.length / 3) {
    39             h = h * 3 + 1;
    40         }
    41         while (h > 0) {
    42             System.out.println("h=" + h);
    43             lathc = new CountDownLatch(h);
    44             for (int x = 0; x < h; x++) {
    45                 pool.submit(new ShellSortTask(x, h, lathc));
    46             }
    47             lathc.await();
    48             System.out.println(Arrays.toString(arr));
    49             // 计算下一个h值
    50             h = (h - 1) / 3;
    51         }
    52         pool.shutdown();
    53     }
    54     //测试
    55     public static void main(String[] args) throws InterruptedException {
    56         pShellSort(a);
    57     }
    58 }

     输出结果:

    h=13
    [2, 3, 1, 45, 53, 3, 55, 4, 65, 765, 7, 7, 89687, 6, 89, 69, 4354, 89, 99]
    h=4
    [2, 3, 1, 4, 53, 3, 7, 7, 65, 6, 55, 45, 4354, 89, 89, 69, 89687, 765, 99]
    h=1
    [1, 2, 3, 3, 4, 6, 7, 7, 45, 53, 55, 65, 69, 89, 89, 99, 765, 4354, 89687]

    参考:《Java高并发程序设计》 葛一鸣 郭超 编著:

    作者:Joe
    努力了的才叫梦想,不努力的就是空想,努力并且坚持下去,毕竟这是我相信的力量
  • 相关阅读:
    Javascript的调试利器:Firebug使用详解
    ASP.NET URL Rewriter 技术
    asp读取xml
    怎样提高WebService性能大数据量网络传输处理
    .net实现URL重写
    VS2005中,创建新网站ASP.NET,没有解决方案
    asp.net架构之请求处理过程:HttpModule,HttpHandler
    在应用程序级别之外使用注册为 allowDefinition='MachineToApplication' 的节是错误的
    正则表达式基础知识
    asp.net用url重写URLReWriter实现任意二级域名
  • 原文地址:https://www.cnblogs.com/Joe-Go/p/9828848.html
Copyright © 2011-2022 走看看