zoukankan      html  css  js  c++  java
  • 数据结构(六)查找---有序表查找(三种查找方式:折半,插值,斐波拉契查找)

    前提

    有序表查找要求我们的数据是有序的,是排序好的,我们只需要进行查找即可

    我们下面将介绍折半查找(二分查找),插值查找,斐波那契查找

    一:折半查找

    (一)定义

    二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。

    (二)查找过程

    首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;
    否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。
    重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。

    (三)代码实现

    int Binary_Search(int *a, int n, int key)
    {
        int low, high, mid;
        low = 0;
        high = n - 1;
        while (low<=high)
        {
            mid = (low + high) / 2;
            if (a[mid] < key)
                low = mid + 1;
            else if (a[mid]>key)
                high = mid - 1;
            else
                return mid;
        }
        return -1;
    }
    
    int main()
    {
        int a[10] = { 1, 6, 12, 21, 30, 31, 32, 42, 49, 52 };
        int index;
        index=Binary_Search(a, 10, 49);
        if (index != -1)
            printf("find key in %d
    ", index);
        else
            printf("not find key
    ");
        system("pause");
        return 0;
    }

    (四)性能分析

    其时间复杂度是O(logn),不过由于折半查找的前提是需要有序表顺序存储,对于静态查找表,一次排序后不再变化,这样的算法是比较好的。但是对于需要频繁插入或删除操作的数据集来说,维护有序的排序会带来不小的工作量,不建议使用。

    二:插值查找(按比例查找法)

    (一)算法分析:

    对于前面的折半查找,为啥一定要折一般,而不是1/4或者其他?
    比如:我们查字典Apple,我们会先从中间查找,还是有一定目的的向前找。
    或者在0
    -1000个数之间有200个元素从小到大均匀分布排序,我们若是需要查找到15,我们会去中间查找500,还是直接去前面开始查找。 以上都说明我们上面的折半查找可以再进行改进

    首先我们对折半公式进行改写:

     

    折半查找这种查找方式,不是自适应的(也就是说是傻瓜式的),其前面的查找系数(比例参数)始终是1/2

    通过类比,我们可以将查找的点改进为如下:

    也就是将上述的比例参数1/2改进为自适应的,根据关键字在整个有序表中所处的位置,让mid值的变化更靠近关键字key,这样也就间接地减少了比较次数。

    (二)基本思想:

    基于二分查找算法,将查找点的选择改进为自适应选择,可以提高查找效率。当然,插值查找也属于有序查找。

    (三)代码实现:

    int Insert_Search(int *a, int n, int key)
    {
        int low, high, mid;
        low = 0;
        high = n - 1;
        while (low <= high)
        {
            mid = low + (key - a[low]) / (a[high] - a[low])*(high - low);
            if (a[mid] < key)
                low = mid + 1;
            else if (a[mid]>key)
                high = mid - 1;
            else
                return mid;
        }
        return -1;
    }
    实现方法和折半一样,只是修改了mid

    (四)性能分析:

    而插值查找则比较灵活,并不是简单的从中间进行的,它是根据我们需要查询的值的渐进进行搜索的.
    
    插值查找的不同点在于每一次并不是从中间切分,而是根据离所求值的距离进行搜索的.
    对于表长较大,而关键字分布又比较均匀的查找表来说,插值查找算法的平均性能比折半查找要好的多。反之,数组中如果分布非常不均匀,那么插值查找未必是很合适的选择。
    时间复杂度:平均情况O(loglog(n)),最坏O(log(n))

    三:斐波那契查找(仅使用加法减法实现二分查找)

    除了插值查找之外,我们再介绍一种有序查找,可以对折半进行优化,那就是斐波那契查找,利用了黄金分割原理来实现的
    斐波那契查找与折半查找很相似,他是根据斐波那契序列的特点对有序表进行分割的。他要求开始表中记录的个数为某个斐波那契数小1,即n=F(k)-1;

    (一)斐波那契数列

    越向后,每两个数之间相除越接近黄金比例

    (二)斐波拉契查找实现

    1.首先我们要创建一个斐波拉契数列

    2.获取我们的数组大小n(我们不考虑0下标,因为我们的斐波那契数列从0开始,无法构成黄金比例),在斐波拉契数列中的位置

    例如上面的查找数组大小为n=10,F[6]<n<F[7],所以得出其位置为k=7

    3.因为我们的k=7,F[7]=13,而a数组最大为10,我们需要对其按照F[7]=13补齐数组,使其长度为F[7]-1=12,将a[11]=a[10],a[12]=a[10]

    4.开始正式查找,按照上图mid=low+F[k-1]-1;

     

    (三)思考:n=F(k)-1, 表中记录的个数为某个斐波那契数小1。这是为什么呢?

     推文:斐波那契查找原理详解与实现

    是为了格式上的统一,以方便递归或者循环程序的编写。
    表中的数据是F(k)-1个,使用mid值进行分割又用掉一个,那么剩下F(k)-2个。
    正好分给两个子序列,每个子序列的个数分别是F(k-1)-1与F(k-2)-1个,格式上与之前是统一的。
    不然的话,每个子序列的元素个数有可能是F(k-1),F(k-1)-1,F(k-2),F(k-2)-1个,写程序会非常麻烦。

    (四)算法实现

    void Fibonacci(int **Fb, int n)
    {
        int f1, f2,ft;
        int count=3;
        f1 = 1; f2 = 1;
    
        while (f2<n)
        {
            ft = f1 + f2;
            f1 = f2;
            f2 = ft;
            count++;
        }
        (*Fb) = (int *)malloc(count*sizeof(int));
        (*Fb)[0] = 0;
        (*Fb)[1] = 1;
        for (f1 = 2; f1 <= count - 1; f1++)
            (*Fb)[f1] = (*Fb)[f1 - 1] + (*Fb)[f1 - 2];
    }
    创建斐波那契数列
    int Fibonacci_Search(int *a, int n, int key)
    {
        int low, high, mid, i, j,k;
        int *Fb,*temp;
        //根据实际情况来初始化
        low = 1;
        high = n;
    
        Fibonacci(&Fb, n);
        k = 0;
    
        while (n > Fb[k])    //计算n位于斐波那契数列位置
            k++;
    
        temp = (int *)malloc((Fb[k] - 1 + 1)*sizeof(int));//后面加1是因为还有个下标0空间
        memcpy(temp, a, n*sizeof(n + 1));
    
        for (i = n + 1; i <= Fb[k] - 1; i++)    //我们要查找的是数组1到F[k]-1,而实际数组长要包括一个下标0空间
            temp[i] = a[n];
    
        while (low<=high)
        {
            mid = low + Fb[k - 1] - 1;
            if (key == temp[mid])
            {
                //分情况,是前半段,正常输出,后半段判断是不是在我们补充的数组里面,这时我们返回原数组最后一个下标
                if (mid <= n)
                    return mid;
                else
                    return n;
            }
            else if (key>temp[mid])
            {
                low = mid + 1;
                k = k - 2;
            }
            else
            {
                high = mid - 1;
                k = k - 1;
            }
        }
        return 0;    //0是未找到,0下标使无意义的
    }
    int main()
    {
        int a[11] = { 0,1,16,24,35,47,59,62,73,88,99};
        int index;
        index = Fibonacci_Search(a, 10, 73);
        if (index != -1)
            printf("find key in %d
    ", index);
        else
            printf("not find key
    ");
        system("pause");
        return 0;
    }

     (五)性能分析

    其时间复杂度也是O(logn),就平均性能来说,斐波那契查找由于折半查找。但是若是最坏情况,比如key=1,始终处于左侧长半区查找,则效率低于折半查找。

    四:总结

  • 相关阅读:
    一些平行模块化软件架构的坑
    qsub|pasta|
    open 管道用法|Getopt::Long
    Estimating Gene Frequencies| method of maximum likelihood|point estimate
    定义变量|dirname|basename|printf
    Linkage Disequilibrium|D‘|r2
    linkage disequilibrium|linkage equilibrium
    Sex linkage
    Different Gene Frequencies in the Two Sexes
    Overlapping generations model
  • 原文地址:https://www.cnblogs.com/ssyfj/p/9499162.html
Copyright © 2011-2022 走看看