zoukankan html css js c++ java

协程下的爬虫

from urllib import request
import gevent, time
from gevent import monkey  //在没有加上此句和下一句时，运行速度理论上是一样的，因为gevent检测不到I/O端口
monkey.patch_all()

def f(url):
    print('GET:%s'%url)
    resp = request.urlopen(url)
    data = resp.read()
    print('%d bytes received from %s' % (len(data),url))
#用循环的方式爬虫，也就时串行
urls = ['https://www.python.org/','https://www.yahoo.com/']
start_time = time.time()
for url in urls:
    f(url)
print('The asynchronous total time is {time}'.format(time = time.time() - start_time))
#用协程方式爬虫
async_time = time.time()
gevent.joinall([gevent.spawn(f,'https://www.python.org/'),
                gevent.spawn(f,'https://www.yahoo.com/'),
                ])
print('The total time is {time}'.format(time = time.time() - async_time))

运行的结果如下：

GET:https://www.python.org/
48835 bytes received from https://www.python.org/
GET:https://www.yahoo.com/
498399 bytes received from https://www.yahoo.com/
The total time is 12.665598630905151
GET:https://www.python.org/
GET:https://www.yahoo.com/
48835 bytes received from https://www.python.org/
498546 bytes received from https://www.yahoo.com/
The asynchronous total time is 5.80000114440918

查看全文

相关阅读:
bootstrap模态框手动开启关闭与设置点击外部不关闭
 mybatis的增删改查返回值小析（六）
mac安装python本版管理工具pyenv
taro 编译建议修改：使用循环的 index 变量作为 key 是一种反优化
 taro-多个input同一个事件处理
 python初探（01D） line 2 SyntaxError: Non-ASCII character 'xe8' 报错
 taro父、子组件通信
 taro---image引入图片
 webpack(五)---模块热替换
 webpack(四)---开发系列

原文地址：https://www.cnblogs.com/zhouzhe-blog/p/9425305.html