看了一道笔试题,说有100W个数据,范围在0~65535之间,要求用最少的空间和最快的速度进行排序。
刚开始的思路是,65535就是2^16,那首先要把数据类型定义为short。其次,要用最少的空间,那最好还是不用递归,那不用快排。不递归,速度又快,那肯定是堆排序了。O(n)的空间+O(nlogn)的时间。
后来看了网上的人对于这题的评点,原来统计排序才是这一条件下的最优解。
统计排序,又叫桶排序。它的原理非常简单。在知道数据大小范围的条件下,定义一个等于数据大小范围的数组。数组初始化为0,然后直接用数据作为数组下标统计数据个数,最后把统计数据从头到尾输出(升序),或者从尾到头输出(降序)即可。时间复杂度为O(N)。
因此,当题目有以下特点时,考虑统计排序:1、数据范围确定 2、数据范围小于数据个数
考虑题目条件,2^16 < 100W=2^20 < 2^32 (unsigned int范围),因此定义一个长为65535的数组做统计。
unsigned short value; unsigned int array[65536]; memset(array, 0, sizeof(array)); while (get_value(&value)) { ++array[value]; }
有的题目可能没有明确给出数据的范围,但其实已经隐含给出了。例如:给出一个包含数字与字母的字符串,要求字母位置不变,对数字排序。题目隐含了数字的大小是0~9,因此使用统计排序做就非常简单了。
void sortstr( char *str){ cout<<str<<endl; int count[10]={0}; int j=0; while(str[j]!='