zoukankan      html  css  js  c++  java
  • 算法图解


    1. 二分法:一组n个数字(有序排列)找到一个准确的数字,用二分法最多只要找log2n次。

    def binary_search(list, item):
                low = 0
                high = len(list) - 1
                while low <= high:
                    mid = round((low + high) / 2)
                    guess = list[:mid]
                    if guess == mid:
                    return mid
                    if mid > item:
                        high = mid-1
                        continue
                    else:
                        low = mid + 1
                        continue
                return None
            my_list = [1,3,6,9,12,16,17,21,29,32]
            print(binary_search(my_list, 3))


    2. 选择排序:
    在内存中,数组空间不够时,内存必须重新分配新的足够的空间给数组;但是列表不需要全部重新分配,只要分配多余的空间给新来的元素,并用随机的内存地址串在一起。
    但是要读取列表时,不能直接读取后面的元素,必须先访问元素1,然后元素2,直到最后一个元素。数组可以随意访问。
    选择排序或者叫冒泡排序:

    def findSmallest(arr):
                    smallest = arr[0]
                    smallest_index=0
                    for i in range(1,len(arr)): #随机找到列表中的数
                        if arr[i]< smallest:    #比较大小
                        smallest_index=i
                    return smallest_index
                def selectionSort(arr):
                    newArr=[]
                    for i in range(len(arr)):
                        smallest=findSmallest(arr)
                        newArr.append(arr.pop(smallest)) #在每个最小的数之后添加一个比较大的数,好排序
                return newArr
                print(selectionSort([1,5,15,4,3,8,6,9,10]))

    3. 递归:
    递归函数是调用自己。

    4. 快速排序:

    def quicksort(array):
                    if len(array) <2:
                        return array
                    else: 
                        pivot = array[0]
                        less=[i for i in array[1:] if i <= pivot] #由所有小于基准值的元素组成的子数组
                        greater=[i for i in array[1:] if i>pivot]
                        return quicksort(less)+[pivot]+quicksort(greater)
                print quicksort([1,4,2,3])

    5. 散列表(字典):
    6. 广度优先搜索:
    先在一度关系中搜索,没有结果之后再从二度关系中搜索。
    队列是先进先出的,栈是后进先出的

    from collections import deque
                search_queue = deque()    #创建一个队列
                search_queue+=graph["you"]    #将你的另据都加入到这个搜索队列中:
                def person_is_seller(name):
                    return name[-1] == 'm'    #判断这个人是否为想要的结果的函数。
                while search_queue:    #只要队列不为空
                    person=search_queue.popleft()    #就取出其中第一人
                    if person_is_seller(person):    #检查这个人是否是想要的
                        print (person+"is a xxx")
                        return True
                    else:
                        search_queue+=graph[person]    #不是想要找的对象,将这个朋友加入到搜索队列
                return False    #如果到了这里,说明队列赵总没有想要的结果,队列已为空。
            
    广度优先搜索代码:
                def search(name):
                    search_queue=deque()
                    search_queue+=graph[name]
                    searched=[]    #这个数组用于记录检查过的人
                    while search_queue:
                        person=search_queue.popleft()
                        if not person in searched:
                            if person_is_seller(person):
                                print person+'is a xxxx'
                                return True
                            else:
                                search_queue+=graph[person]
                                searched.append(person)
                    retuen False

    7. 狄克斯特拉算法:
    使用广度优先搜索,将得到数量最少的路径,但不一定是最快最方便的路径。
    狄克斯特拉算法,相当于在广度优先算法的基础上加了权重。
    关键理念: 找到最便宜的节点,并确保没有到该节点更便宜的路径。 如果有负权边,就不能试用此算法。

    def find_lowest_cost_node(costs):
                    lowest_cost=float('inf')
                    lowest_cost_node= None
                    for node in costs: 
                        cost=costs[node]
                        if cost< lowest_cost & node not in processed:    #如果当前节点未处理,且成本更低
                            lowest_cost=cost
                            lowest_cost_node=node
                    return lowest_cost_node
                    
                node=find_lowest_cost_node(costs):    #在未处理的节点找到开销最小的点
                while node is not None:        #这个循环在所有节点被处理过后结束
                    cost =costs[node]
                    neighbors = graph[node]
                    for n in neighbors.keys():        #遍历当前节点的所有邻居
                        new_cost=cost+nighbors[n]
                        if costs[n] > new_cost:        #如果经过当前节点离邻居更近
                            costs[n] = new_cost        #就更新改邻居的开销
                            parents[n]=node        #同事将该邻居的父节点设置为当前节点
                    processed.append(node)        
                    node=find_lowest_cost_node(costs)     #找出接下来要处理的节点,并循环

    8. 贪婪算法:
    每一步都采取最优的做法,最终得到的就是全局最优解。

    9. 动态规划:
    先解决子问题,再解决主问题。

    10. K最近邻算法:
    给一个对象分类,看离它最近的三个对象是什么类型,就是3最近邻算法。
    可以用在推荐系统中,在每位用户注册时就让他们指出自己喜欢的对象和喜欢的程度。 用户给使用过的对象评分,哪一类的评分最高,就推荐哪一类的对象。
    要挑选适当的指标,考虑回归性。

    11. 二叉查找树

    12. 反向索引: 一个散列表,将单词映射到包含它的页面。

    13. 傅里叶变换:

    14. 并行算法: 提高算法速度,让他们能够在多个内核中并行地执行。

    15. MapReduce: 分布式算法, 用hadoop执行。 基于映射(map)函数和归并(reduce)函数。
    归并函数是将一个数组转换成一个元素。

    16. 布隆过滤器和HyperLogLog:
    布隆过滤器是一种概率性数据结构,HyperLogLog是类似于布隆过滤器的算法, 这两者都不是准确的结果,但是是大概率的结果。

    17. SHA算法: 安全散列算法: 用来判断两个文件是否相同
    SHA是一个散列函数, 它生成一个散列值(一个较短的字符串),用于促成索引。,用散列值判断文件是否相同,检查密码。

    18. Diffie-Hellman秘钥交换: 公钥和私钥。

    19. 线性规划:
    用于在给定约束条件下最大限度地改善指定的指标。

  • 相关阅读:
    PHP 高精度计算
    PHPWord使用方法
    羽毛球
    大数据(2)
    大数据(1)
    Centos 7 启动错误:XFS_WANT_CORRUPTED_GOTO 修复
    selenium 自动化工具
    python 开发技巧(0)-- 各个系统的python安装
    Yii简单使用阿里云短信教程!
    VMware虚拟机 Ubuntu 实用技巧 (2)桥接模式连接网络与网卡的配置
  • 原文地址:https://www.cnblogs.com/spencersun/p/9549334.html
Copyright © 2011-2022 走看看