静态查找是数据集合稳定不需要添加删除元素的查找包括:
- 顺序查找
- 折半查找
- Fibonacci
- 分块查找
静态查找可以用线性表结构组织数据,这样可以使用顺序查找算法,再对关键字进行排序就可以使用折半查找或斐波那契查找等算法提高查找效率,平均查找长度:折半查找最小,分块次之,顺序查找最大。顺序查找对有序无序表均适用,折半查找适用于有序表,分块查找要求表中元素是块与块之间的记录按关键字有序
动态查找是数据集合需要添加删除元素的查找包括:
1. 二叉排序树
2. 平衡二叉树
3. 散列表
顺序查找适合于存储结构为顺序存储或链接存储的线性表。
元素必须是有序的,如果是无序的则要先进行排序操作。
二分查找即折半查找,属于有序查找算法。用给定值value与中间结点mid的关键字比较,若相等则查找成功;若不相等,再根据value与该中间结点关键字的比较结果确定下一步查找的子表
将数组的查找过程绘制成一棵二叉树排序树,如果查找的关键字不是中间记录的话,折半查找等于是把静态有序查找表分成了两棵子树,即查找结果只需要找其中的一半数据记录即可,等于工作量少了一半,然后继续折半查找,效率高。
时间复杂度为O(log2n);
折半计算mid的公式
mid = (low+high)/2;
if(a[mid]==value)
return mid;
if(a[mid]>value)
high = mid-1;
if(a[mid]<value)
low = mid+1;
改进二分查找算法,将查找点的选择改进为自适应选择,差值查找也属于有序查找。
对于表长较大,而关键字分布又比较均匀的查找表来说,插值查找算法的平均性能比折半查找要好的多。反之,数组中如果分布非常不均匀,那么插值查找未必是很合适的选择。
折半计算mid的公式,等式变换后得到: mid = (low+high)/2 = low + (high-low)/2
mid等于最低下标low加上最高下标high与low的差的一半。将这个 1/2 进行改进,通过类比,改进为下面的计算方案:
mid = low + ((key - a[low])/(a[high] - a[low]))(high - low)这样就可以大大提高查找的效率。
改进二分查找算法,通过运用黄金比例选择查找点进行查找,同样地,斐波那契查找也属于一种有序查找算法。
斐波那契查找的时间复杂也为O(logn),但就平均性能来说,斐波那契查找要优于折半查找。可惜如果是最坏情况,比如这里key=l,那么始终都处于左侧长半区在查找,则查找效率要低于折半查找。
复杂度也为O(log2n)
分块查找的平均查找长度ASL是折半查找的平均查找长度加顺序查找块内平均查找长度
如果查找的数据集是有序线性表,并且是顺序存储的,查找可以用折半、插值、斐波那契等查找算法来实现,可惜,因为有序,在插入和删除操作上,就需要耗费大量的时间
若查找表无序,则插入删除可无需移动大量记录,但于查找不利。有没有一种即可以使得插入和删除效率不错,又可以比较高效率地实现查找的算法呢?
二叉排序树(Binary Sort Tree),又称为二叉查找树。它或者是一棵空树,或者是具有下列性质的二叉树。
若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值;
若它的右子树不空 ,则右子树上所有结点的值均大于它的根结点的值;
它的左、右子树也分别为二叉排序树。
平衡二叉树(AVL树)
平衡二叉树,是一种二叉排序树,其中每一个节点的左子树和右子树的高度差至多等于1。
从平衡二叉的英文名字(AVL树),你也可以体会到,它是一种高度平衡的二叉排序树。
高度平衡意思是说,要么它是一棵空树,要么它的左子树和右子树都是平衡二叉树,且左子树和右子树的深度之差的绝对值不超过1。
多路查找树
我们之前谈的树,都是一个结点可以有多个孩子,但是它自身只存储一个元素。二叉树限制更多,结点最多只能有两个孩子。
一个结点只能存储一个元素,在元素非常多的时候,就使得要么树的度非常大(结点拥有子树的个数的最大值),要么树的高度非常大,甚至两者都必须足够大才行。这就使得内存存取外存次数非常多,这显然成了时间效率上的瓶颈,这迫使我们要打破每一个结点只存储一个元素的限制
,为此引入了多路查找树的概念。
多路查找树,其每一个结点的孩子数可以多于两个,且每一个结点处可以存储多个元素。由于它是查找树,所有元素之间存在某种特定的排序关系。
在这里,每一个结点可以存储多少个元素,以及它的孩子数的多少是非常关键的。它的4种特殊形式 : 2-3 树、2-3-4 树、B 树和B+树。