zoukankan      html  css  js  c++  java
  • 查找-集中查找方式的Pyhon实现

    顺序查找

    二分查找:在一个已经 完全排序(或者部分排序)的数组中 查找数字或者统计数字的出现次数-

     就是每次缩小一般的范围进行查找或者统计 最后的循环结束的条件就是end-first=1,即二者相邻,若有其中之一为要找的值,则对了,若果都没有就没有了

    我的想法是

    1 先判断 首、尾 是不是要找的

     1.1是 就最好啦

     1.2 不是 看中间值是不是 

       1.2.1 是就最好啦

       1.2.2不是 比大小 确定下一次要查找的范围 然后在这个范围内在进行重复上述步骤

    插值查找:(二分查找升级版)

    哈希查找

    二叉排序树查找

    2. 插值查找

    二分查找法虽然已经很不错了,但还有可以优化的地方。
    有的时候,对半过滤还不够狠,要是每次都排除十分之九的数据岂不是更好?选择这个值就是关键问题,插值的意义就是:以更快的速度进行缩减。

    插值的核心就是使用公式:
    value = (key - list[low])/(list[high] - list[low])

    用这个value来代替二分查找中的1/2。
    上面的代码可以直接使用,只需要改一句。

    # 插值查找算法
    # 时间复杂度O(log(n))
    
    def binary_search(lis, key):
        low = 0
        high = len(lis) - 1
        time = 0
        while low < high:
            time += 1
            # 计算mid值是插值算法的核心代码
            mid = low + int((high - low) * (key - lis[low])/(lis[high] - lis[low]))
            print("mid=%s, low=%s, high=%s" % (mid, low, high))
            if key < lis[mid]:
                high = mid - 1
            elif key > lis[mid]:
                low = mid + 1
            else:
                # 打印查找的次数
                print("times: %s" % time)
                return mid
        print("times: %s" % time)
        return False
    
    if __name__ == '__main__':
        LIST = [1, 5, 7, 8, 22, 54, 99, 123, 200, 222, 444]
        result = binary_search(LIST, 444)
        print(result)

    插值算法的总体时间复杂度仍然属于O(log(n))级别的。其优点是,对于表内数据量较大,且关键字分布比较均匀的查找表,使用插值算法的平均性能比二分查找要好得多。反之,对于分布极端不均匀的数据,则不适合使用插值算法。

     

     

    八、散列表(哈希表)

     

    散列表:所有的元素之间没有任何关系。元素的存储位置,是利用元素的关键字通过某个函数直接计算出来的。这个一一对应的关系函数称为散列函数或Hash函数。
    采用散列技术将记录存储在一块连续的存储空间中,称为散列表或哈希表(Hash Table)。关键字对应的存储位置,称为散列地址。

    散列表是一种面向查找的存储结构。它最适合求解的问题是查找与给定值相等的记录。但是对于某个关键字能对应很多记录的情况就不适用,比如查找所有的“男”性。也不适合范围查找,比如查找年龄20~30之间的人。排序、最大、最小等也不合适。

    因此,散列表通常用于关键字不重复的数据结构。比如python的字典数据类型。

    优点:最主要的优点是能在O(1)时间内查找某一元素,查找效率最高!但缺点树需要额外的空间,


    附件列表

  • 相关阅读:
    *p++与(*p)++与*(p++)------自增运算符常见误区
    二维数组(解引用、指针数组、数组的指针)——C语言
    二叉树、前序遍历、中序遍历、后序遍历
    C语言参数传递(值传递、地址传递)+二级指针
    文件操作(FILE)与常用文件操作函数——C语言
    结构体(结构体嵌套、结构体指针、结构体参数传递)
    链表(单向链表的建立、删除、插入、打印)
    博文与文档发布玩法:Github + MWeb + 语雀 + Cnbolgs
    [笔记] Git 冲突处理
    [笔记] C# 如何获取文件的 MIME Type
  • 原文地址:https://www.cnblogs.com/zzxx-myblog/p/6421425.html
Copyright © 2011-2022 走看看