基数排序是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序也不是只能使用于整数。
基数排序的主要思路是:将所有待比较数值(必须是正整数)统一为同样的数位长度,数位较短的数前面补零。 然后,从最低位开始,依次进行一次稳定排序。这样从最低位排序一直到最高位排序完成以后,数列就变成一个有序序列。
先看一下示例:
比如这样一个数列排序: 342 58 576 356, 以下描述演示了具体的排序过程(红色字体表示正在排序的数位)
第一次排序(个位):
3 4 2
5 7 6
3 5 6
0 5 8
第二次排序(十位):
3 4 2
3 5 6
0 5 8
5 7 6
第三次排序(百位):
0 5 8
3 4 2
3 5 6
5 7 6
结果: 58 342 356 576
稳定排序的意义
稳定排序的意思是指, 待排序相同元素之间的相对前后关系, 在各次排序中不会改变。比如实例中具有十位数字5的两个数字58和356, 在十位排序之前356在58之前,在十位排序之后, 356依然在58之前。
稳定排序能保证, 上一次的排序成果被保留, 十位数的排序过程能保留个位数的排序成果,百位数的排序过程能保留十位数的排序成果。
这个算法的难度在于分离数位,将分离出的数位代表原元素的代表,用作计数排序。但是分离数位不能脱离原来的数字, 计数排序的结果, 还是要移动原元素。
注意,上述示例采用的是最低位优先。基数排序的方式可以采用最低位优先LSD(Least sgnificant digital)法或最高位优先MSD(Most sgnificant digital)法,LSD的排序方式由键值的最右边开始,而MSD则相反,由键值的最左边开始。LSD的基数排序适用于位数小的数列,如果位数多的话,使用MSD的效率会比较好,MSD的方式恰与LSD相反,是由高位数为基底开始进行分配,其他则都相同。
#include<iostream> #include<vector> using namespace std; void countSort(vector<int>& vec,int exp) {//计数排序 vector<int> range(10,0); int length=vec.size(); vector<int> tmpVec(length,0); for(int i=0;i<length;++i) { range[(vec[i]/exp)%10]++; } for(int i=1;i<range.size();++i) { range[i]+=range[i-1];//统计本应该出现的位置 } for(int i=length-1;i>=0;--i) { tmpVec[range[(vec[i]/exp)%10]-1]=vec[i]; range[(vec[i]/exp)%10]--; } vec=tmpVec; } void radixSort(vector<int>& vec) { int length=vec.size(); int max=-1; for(int i=0;i<length;++i) {//提取出最大值 if(vec[i]>max) max=vec[i]; } //提取每一位并进行比较,位数不足的高位补0 for(int exp=1;max/exp>0;exp*=10) countSort(vec,exp); } int main() { int a[10]={53,3,542,748,14,214,154,63,616,589}; vector<int> vec(a,a+10); radixSort(vec); for(int i=0;i<vec.size();++i) { cout<<vec[i]<<" "; } cout<<endl; return 0; }