zoukankan      html  css  js  c++  java
  • 【每日算法】交换排序算法之快速排序

    恩,重头戏开始了,快速排序是各种笔试面试最爱考的排序算法之一,且排序思想在很多算法题里面被广泛使用。是需要重点掌握的排序算法。

    1)算法简介

    快速排序是由东尼·霍尔所发展的一种排序算法。其基本思想是基本思想是,通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。

    2)算法描述和分析

    快速排序使用分治法来把一个串(list)分为两个子串行(sub-lists)。

    步骤为:
    1、从数列中挑出一个元素,称为 "基准"(pivot),
    2、重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作。
    3、递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

    递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,但是这个算法总会退出,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。

    算法伪代码描述:

    function quicksort(q)
        var list less, pivotList, greater
        if length(q) ≤ 1 {
            return q
        } else {
            select a pivot value pivot from q
            for each x in q except the pivot element
                if x < pivot then add x to less
                if x ≥ pivot then add x to greater
                add pivot to pivotList
            return concatenate(quicksort(less), pivotList, quicksort(greater))
        }
    

    在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n^2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。

    最差时间复杂度: O(n^2)
    最优时间复杂度: O(n log n)
    平均时间复杂度: O(n log n)
    最差空间复杂度: 根据实现的方式不同而不同

    3)算法图解、flash演示、视频演示

    图解:
    快速排序会递归地进行很多轮,其中每一轮称之为快排的partition算法,即上述算法描述中的第2步,非常重要,且在各种笔试面试中用到该思想的算法题层出不穷,下图为第一轮的partition算法的一个示例。

    快速排序

    Flash:
    可一步步参见http://ds.fzu.edu.cn/fine/resources/FlashContent.asp?id=86中的快排过程
    视频 舞动的排序算法
    http://v.youku.com/v_show/id_XMzMyODk4NTQ4.html

    4)算法代码

        事实上,这个地方需要提一下的是,快排有很多种版本。例如,我们“基准数”的选择方法不同就有不同的版本,但重要的是快排的思想,我们熟练掌握一种版本,在最后的笔试面试中也够用了,我这里罗列几种最有名的版本C代码。
    

    1、版本一
    我们选取数组的第一个元素作为主元,每一轮都是和第一个元素比较大小,通过交换,分成大于和小于它的前后两部分,再递归处理。

    代码如下

    /************************************************** 
      函数功能:对数组快速排序                        
      函数参数:指向整型数组arr的首指针arr;           
                整型变量left和right左右边界的下标    
      函数返回值:空                                   
    /**************************************************/  
    void QuickSort(int *arr, int left, int right)  
    {  
      int i,j;  
      if(left<right)  
      {  
        i=left;j=right;  
        arr[0]=arr[i]; //准备以本次最左边的元素值为标准进行划分,先保存其值  
        do  
        {  
          while(arr[j]>arr[0] && i<j)   
            j--;        //从右向左找第1个小于标准值的位置j  
          if(i<j)                               //找到了,位置为j  
          {   
            arr[i] = arr[j];  
            i++;  
          }           //将第j个元素置于左端并重置i  
          while(arr[i]<arr[0] && i<j)  
            i++;      //从左向右找第1个大于标准值的位置i  
          if(i<j)                       //找到了,位置为i  
          {   
            arr[j] = arr[i];  
            j--;  
          }           //将第i个元素置于右端并重置j  
        }while(i!=j);  
        arr[i] = arr[0];         //将标准值放入它的最终位置,本次划分结束  
        quicksort(arr, left, i-1);     //对标准值左半部递归调用本函数  
        quicksort(arr, i+1, right);    //对标准值右半部递归调用本函数  
      }  
    }  
    

    2、版本二
    随机选基准数的快排

    //使用引用,完成两数交换  
    void Swap(int& a , int& b)  
    {  
     int temp = a;  
     a = b;  
     b = temp;  
    }  
    //取区间内随机数的函数  
    int Rand(int low, int high)  
    {  
     int size = hgh - low + 1;  
     return  low + rand()%size;   
    }  
        //快排的partition算法,这里的基准数是随机选取的  
    int RandPartition(int* data, int low , int high)  
    {      
     swap(data[rand(low,high)], data[low]);//  
     int key = data[low];  
     int i = low;  
       
     for(int j=low+1; j<=high; j++)  
     {  
      if(data[j]<=key)  
      {  
       i = i+1;  
       swap(data[i], data[j]);  
      }              
     }   
     swap(data[i],data[low]);  
     return i;  
    }  
    //递归完成快速排序  
    void QuickSort(int* data, int low, int high)  
    {  
     if(low<high)  
     {  
      int k = RandPartition(data,low,high);  
      QuickSort(data,low,k-1);  
      QuickSort(data,k+1,high);  
     }  
    }  
    

    5)考察点,重点和频度分析

    完全考察快排算法本身的题目,多出现在选择填空,基本是关于时间空间复杂度的讨论,最好最坏的情形交换次数等等。倒是快排的partition算法需要特别注意!频度极高地被使用在各种算法大题中!详见下小节列举的面试小题。

    6)笔试面试例题

    这里要重点强调的是快排的partition算法,博主当年面试的时候就遇到过数道用该思路的算法题,举几道如下:

    例题1、最小的k个数,输入n个整数,找出其中最下的k个数,例如输入4、5、1、6、2、7、3、8、1、2,输出最下的4个数,则输出1、1、2、2。

    当然,博主也知道这题可以建大小为k的大顶堆,然后用堆的方法解决。

    但是这个题目可也以仿照快速排序,运用partition函数进行求解,不过我们完整的快速排序分割后要递归地对前后两段继续进行分割,而这里我们需要做的是判定分割的位置,然后再确定对前段还是后段进行分割,所以只对单侧分割即可。代码如下:

    void GetLeastNumbers_by_partition(int* input, int n, int* output, int k)  
    {  
        if(input == NULL || output == NULL || k > n || n <= 0 || k <= 0)  
            return;  
        int start = 0;  
        int end = n - 1;  
        int index = Partition(input, n, start, end);  
        while(index != k - 1)  
        {  
            if(index > k - 1)  
            {  
                end = index - 1;  
                index = Partition(input, n, start, end);  
            }  
            else  
            {  
                start = index + 1;  
                index = Partition(input, n, start, end);  
            }  
        }  
        for(int i = 0; i < k; ++i)  
            output[i] = input[i];  
    }  
    

    例题2、判断数组中出现超过一半的数字

    当然,这道题很多人都见过,而且最通用的一种解法是数对对消的思路。这里只是再给大家提供一种思路,快排partition的方法在很多地方都能使用,比如这题。我们也可以选择合适的判定条件进行递归。代码如下:

    bool g_bInputInvalid = false;  
    bool CheckInvalidArray(int* numbers, int length)  
    {  
        g_bInputInvalid = false;  
        if(numbers == NULL && length <= 0)  
            g_bInputInvalid = true;  
        return g_bInputInvalid;  
    }  
    bool CheckMoreThanHalf(int* numbers, int length, int number)  
    {  
        int times = 0;  
        for(int i = 0; i < length; ++i)  
        {  
            if(numbers[i] == number)  
                times++;  
        }  
        bool isMoreThanHalf = true;  
        if(times * 2 <= length)  
        {  
            g_bInputInvalid = true;  
            isMoreThanHalf = false;  
        }  
        return isMoreThanHalf;  
    }  
    int MoreThanHalfNum_Solution1(int* numbers, int length)  
    {  
        if(CheckInvalidArray(numbers, length))  
            return 0;  
        int middle = length >> 1;  
        int start = 0;  
        int end = length - 1;  
        int index = Partition(numbers, length, start, end);  
        while(index != middle)  
        {  
            if(index > middle)  
            {  
                end = index - 1;  
                index = Partition(numbers, length, start, end);  
            }  
            else  
            {  
                start = index + 1;  
                index = Partition(numbers, length, start, end);  
            }  
        }  
        int result = numbers[middle];  
        if(!CheckMoreThanHalf(numbers, length, result))  
            result = 0;  
        return result;  
    }  
    

    例题3、有一个由大小写组成的字符串,现在需要对他进行修改,将其中的所有小写字母排在大写字母的前面(不要求保持原顺序)
    这题可能大家都能想到的方法是:设置首尾两个指针,首指针向后移动寻找大写字母,尾指针向前移动需找小写字母,找到后都停下,交换。之后继续移动,直至相遇。这种方法在这里我就不做讨论写代码了。

    但是这题也可以采用类似快排的partition。这里使用从左往后扫描的方式。字符串在调整的过程中可以分成两个部分:已排好的小写字母部分、待调整的剩余部分。用两个指针i和j,其中i指向待调整的剩余部分的第一个元素,用j指针遍历待调整的部分。当j指向一个小写字母时,交换i和j所指的元素。向前移动i、j,直到字符串末尾。代码如下:

    #include <iostream>  
    using namespace std;  
    
    void Proc( char *str ) {  
        int i = 0;  
        int j = 0;  
        //移动指针i, 使其指向第一个大写字母  
        while( str[i] != '' && str[i] >= 'a' && str[i] <= 'z' ) i++;  
        if( str[i] != '' ) {  
            //指针j遍历未处理的部分,找到第一个小写字母  
            for( j=i; str[j] != ''; j++ ) {  
                if( str[j] >= 'a' && str[j] <= 'z' ) {  
                    char tmp = str[i];  
                    str[i] = str[j];  
                    str[j] = tmp;  
                    i++;  
                }  
            }  
        }  
    }  
    
    int main() {  
        char data[] = "SONGjianGoodBest";  
        Proc( data );  
        return 0;  
    }  
    
    
  • 相关阅读:
    django之创建第3个项目:编写第一个模板文件
    django之创建第2个项目
    django之创建第1个项目并查看网页效果
    python 第三库卸载办法
    django之环境变量配置
    数据库中的函数研究
    数据库中的 Date 函数研究
    数据库查询语句研究
    tablib.Dataset()操作exl类型数据之“类方法”研究
    tablib把数据导出为Excel、JSON、CSV等格式的Py库(写入数据并导出exl)
  • 原文地址:https://www.cnblogs.com/shih/p/6660096.html
Copyright © 2011-2022 走看看