一、查找
查找:在一些数据元素中,通过一定的方法找出与给定关键字相同的数据元素的过程。
列表查找(线性表查找):从列表中查找指定元素。
- 输入:列表、待查找元素
- 输出:元素下标(未找到元素时一般返回None或-1)
python中内置列表查找函数:index()。
二、顺序查找(Linear Search)
顺序查找:也叫线性查找,从列表第一个元素开始,顺序进行搜索,直到找到元素或搜索到列表最后一个元素为止。
1、代码示例
def linear_search(li, val):
"""
顺序查找
:param li: 输入的列表
:param val: 输入的待查找的值
:return:
"""
for ind, v in enumerate(li): # index和值
if v == val:
return ind # 返回元素下标index
else:
# 循环完毕仍没找到
return None
2、时间复杂度分析
在这里n就是列表的长度,且并没有循环减半的过程,有一个与n相关的循环,因此时间复杂度是:O(n)。
三、二分查找(Binary Search)
二分查找:又叫做折半查找,从有序列表的初始候选区li[0:n]开始,通过对待查找的值与候选区中间值的比较,可以使候选区减少一半。
1、二分查找示例
(1)从列表中查找元素3:

(2)用left和right两个变量来维护候选区
初始的时候left=0,right=n-1

通过(left+right)/2求出中间元素5与3进行比较:

由于5比3大,候选区修改为mid的左边,right=mid-1,完成候选区修改:

计算出新的mid:(0+3)/2=1找到新的mid:

2比3小说明在mid的右边,需要移动left更新候选区,left=mid+1:

再次通过(2+3)/2=2找到mid的索引值:

mid的值与要找的元素3一致,说明找到了,输出mid的下标。left如果大于right则候选区已经没有值了,说明找不到匹配的值。
2、二分查找代码
def binary_search(li, val):
"""
二分查找
:param li: 输入的列表
:param val: 输入的待查找的值
:return:
"""
left = 0
right = len(li) - 1
while left <= right: # 说明候选区有值
mid = (left + right) // 2 # 因为是下标, 因此要整除2
if li[mid] == val:
# 找到待查找的值返回index
return mid
elif li[mid] > val:
# 待查找的值在mid左侧
right = mid - 1 # 更新候选区
else: # li[mid] < val
# 待查找的值在mid右侧
left = mid + 1 # 更新候选区
else:
# 没有找到
return None
li = [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(binary_search(li, 3)) # 输出:2(index值)
3、时间复杂度分析
由于二分查找是循环减半的,因此它的复杂度是:O(logn)。
可以得出:二分查找的效率比线性查找高。
测试验证:
cal_time.py:
import time
def cal_time(func):
def wrapper(*args, **kwargs):
t1 = time.time()
result = func(*args, **kwargs)
t2 = time.time()
print("%s running time: %s secs." % (func.__name__, t2 - t1))
return result
return wrapper
给二分查找和线性查找都对同一问题测试查看输出的值:
from cal_time import *
@cal_time
def linear_search(li, val):
"""
顺序查找
:param li: 输入的列表
:param val: 输入的待查找的值
:return:
"""
for ind, v in enumerate(li): # index和值
if v == val:
return ind # 返回元素下标index
else:
# 循环完毕仍没找到
return None
@cal_time
def binary_search(li, val):
"""
二分查找
:param li: 输入的列表
:param val: 输入的待查找的值
:return:
"""
left = 0
right = len(li) - 1
while left <= right: # 说明候选区有值
mid = (left + right) // 2 # 因为是下标, 因此要整除2
if li[mid] == val:
# 找到待查找的值返回index
return mid
elif li[mid] > val:
# 待查找的值在mid左侧
right = mid - 1 # 更新候选区
else: # li[mid] < val
# 待查找的值在mid右侧
left = mid + 1 # 更新候选区
else:
# 没有找到
return None
li = list(range(1000000))
# print(binary_search(li, 3)) # 输出:2(index值)
linear_search(li, 3800)
binary_search(li, 3800)
"""
linear_search running time: 0.0004601478576660156 secs.
binary_search running time: 2.193450927734375e-05 secs.
"""
由此可见二分查找的巨大优势。
四、总结
python中内置列表查找函数index()一定是顺序查找,因为二分查找要求列表必须是有序列表,但是Python的列表不一定是有序的,因此这个内置的查找函数一定是顺序查找。
因此在考虑选择顺序查找或者二分查找时,如果是有序的肯定是使用二分查找,如果是无序的则需要考虑是否要先进行排序。
排序的时间会非常长,如果查找就此一次那选用顺序查找,如果未来查找的次数会非常多,那可以先排序,未来再查找时速度就非常快了。