zoukankan      html  css  js  c++  java
  • 爬虫 异步数据写入框架 (adbapi)

    数据库pymysql的commit()和execute()在提交数据时,都是同步提交至数据库,由于scrapy框架数据的解析和异步多线程的,所以scrapy的数据解析速度,要远高于数据的写入数据库的速度。如果数据写入过慢,会造成数据库写入的阻塞,影响数据库写入的效率。
    通过多线程异步的形式对数据进行写入,可以提高数据的写入速度。


    使用twisted异步IO框架,实现数据的异步写入。
    from twisted.enterprise import adbapi
    
    
    # 初始化数据库连接池(线程池)
    # 参数一:mysql的驱动
    # 参数二:连接mysql的配置信息
    dbpool = adbapi.ConnectionPool('pymysql', **params)
    参数1:在异步任务中要执行的函数insert_db;
    参数2:给该函数insert_db传递的参数
    query = self.dbpool.runInteraction(self.insert_db, item)
    def insert_db(self, cursor, item):
          insert_sql = "INSERT INTO bole(title, date_time, tags, content, zan_num, keep_num, comment_num, img_src, img_path) VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s)"
            cursor.execute(insert_sql, (item['title'], item['date_time'], item['tags'], item['content'], item['zan_num'], item['keep_num'], item['comment_num'], item['img_src'], item['img_path']))
    
           在execute()之后,不需要再进行commit(),连接池内部会进行提交的操作。


     
  • 相关阅读:
    Jquery想说爱你不容易
    关于css
    sass相关实例
    web前端学习之HTML
    web前端学习
    软件工程来换网前端设计
    关于前端开发的相关资料及例子
    四则运算
    自我介绍
    关于读完《软件工程》之后不解的问题
  • 原文地址:https://www.cnblogs.com/eunuch/p/9308520.html
Copyright © 2011-2022 走看看