zoukankan      html  css  js  c++  java
  • Python学习---Python的异步IO[all]

    image

    1.1.1. 前期环境准备和基础知识

    安装:

    pip3 install aiohttp
    

    image

    pip3 install grequests

    image

    pip3 install wheel

    image

    pip3 install scrapy

    image

    注意:

        windows上scrapy依赖 https://sourceforge.net/projects/pywin32/files/

    安装Twisted

    a. http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted,

    b. 下载:Twisted-17.1.0-cp35-cp35m-win_amd64.whl

    image

    c. 进入文件所在目录

    d. pip3 install Twisted-17.1.0-cp35-cp35m-win_amd64.whl

    image

     

    实现IO操作的方式

     

    为什么需要异步请求呢?

         如果是正常的请求,一个请求结束后才能开启下一个请求[串行请求],如果期间有一个请求一次,则后面的请求都会终止。

         如果是类似多线程的异步请求,则由多个线程同时开启多个请求,一个请求的异常不会影响其他

    实现IO操作有3种方式:

    同步  【串行操作】
    多进程【更消耗资源,有操作系统调用】 --> 更适合计算密集型操作因为需要并发操作,消耗CPU
           线程是计算机工作的最小单元
    多线程【有CPU进行调用,节省资源】    --> 更适合多IO操作,因为发送请求后不消耗CPU资源
           进程中至少有一个线程,默认都有一个主线程且共享进程的内部资源
    多协程 --> 一个进程内一个线程完成多个任务【可以同时接收多个请求,然后在一个一个的处理请求】
           如果遇到阻塞则执行下一个请求,如果阻塞的请求收到回复后执行刚才阻塞的那个请求【回调实现】,效率比多线程还高.

    注:线程里面有GIL【global Interpreter lock】,Python里面有个GIL锁[该锁保障同时间1个进程内只允许1个线程操作],不允许CPU操作多个线程,不允许CPU调用资源[也就是限制了CPU,即限制了多线程]。但是线程可以进行IO操作,多个线程可以同时进行多个IO操作[URL 请求等,因为CPU的只需要发送一下即可,发送后不消耗cpu资源],

    利用多线程实现IO的异步操作:

    import requests
    from concurrent.futures.thread import ThreadPoolExecutor
    pool = ThreadPoolExecutor(5) # 创建线程池,也可以理解为多线程了这里
    url_list = [
        'https://www.baidu.com/',
        'https://www.taobao.com/',
        'https://www.google.com/search',
        'https://hao.360.cn/',
    ]
    def async_url(url):
        try:
            response = requests.get(url)
            print('正常请求:', '【', url, '】', response.content)
        except Exception as e:
            print('异常请求:', e)
    for url in url_list:
        print('请求开始:', url)
        pool.submit(async_url, url)
    pool.shutdown()   # 关闭线程

    后台显示结果:

    image

    利用多进程实现IO的异步操作:

    [其他同上]
    from concurrent.futures.process import ProcessPoolExecutor
    import requests
    pool = ProcessPoolExecutor(5) # 创建进程池,也可以理解为多线程了这里
    pool.submit(async_url, url)   # async_url是个方法,url是传递过去参数
    pool.shutdown()   # 关闭进程

    异步IO_1---asyncio模块(no-http)

    Python学习---IO的异步[asyncio模块(no-http)]

    异步IO_2---gevent+Grequests

    Python学习---IO的异步[gevent+Grequests模块]

    异步IO_3---twisted模块

    Python学习---IO的异步[twisted模块]

    异步IO_4---tornado模块

    Python学习---IO的异步[tornado模块]

    自定义异步IO

  • 相关阅读:
    Codeforces 1009F Dominant Indices
    UOJ #35 后缀排序 哈希做法
    bzoj 3670 [Noi2014]动物园
    动态规划 笔记

    常用模块和面向对象 类
    常用模块
    包的使用和常用模块
    日志
    复习列表,模块
  • 原文地址:https://www.cnblogs.com/ftl1012/p/9424733.html
Copyright © 2011-2022 走看看