zoukankan      html  css  js  c++  java
  • python3 两种方法将数据存入mysql数据库

    方法一:(数据量小的时候推荐使用这种)

    第一步:pip install mysqlclient

    这里我没有报错 也许你可能会报错Read timed out   此时不要慌,这是因为你的网络问题,你使用豆瓣源再次下载:pip install  -i https://pypi.douban.com/simple/ mysqlclient

    注意:以下针对linux用户(乌班图):可能这时你会报错安装失败,解决方法:

    安装命令:sudo apt-get install libmysqlclient-dev

    linux用户(centOs):

    安装命令:sudo yum install python-devel mysql-devel

     1,在pipeline.py中写入如下代码:

    import MySQLdb
    #采用同步的机制写入mysql
    class MysqlPipeline(object):
    def __init__(self):
    self.conn = MySQLdb.connect('localhost','root','root','article_spider',charset='utf8',use_unicode=True)
    self.cursor = self.conn.cursor()
    def process_item(self,item,spider):
    insert_sql = """ insert into article(title,create_date,url,fav_nums) VALUES(%s,%s,%s,%s)"""
    self.cursor.execute(insert_sql,(item['title'],item['create_date'],item['url'],item['fav_nums']))
    self.conn.commit()

    2,在settings.py中写入如下代码:

    ITEM_PIPELINES = {
        'ArticleSpider.pipelines.MysqlPipeline':1,
    }

    以上是一种插入数据库的方法,下面还有一种:mysql插入的异步方法

    **********************************************************************华丽的分割线 ******************************************************************************

    方法二:(数据量大的时候推荐使用这种,异步插入关系型数据库)

    1,首先在settings.py中配置

    MYSQL_HOST = 'localhost'
    MYSQL_DBNAME ='article_spider'
    MYSQL_USER = 'root'
    MYSQL_PASSWORD = 'root'
    

    2,在pipelines.py中贴入代码:

    from twisted.enterprise import adbapi
    import MySQLdb
    import MySQLdb.cursors
    #mysql插入的异步化,twisted 提供的异步api
    class MysqlTwistedPipline(object):
        def __init__(self,dbpool):
            self.dbpool = dbpool
        @classmethod#方法是固定的,会被spider调用的
        def from_settings(cls,settings):
            dbparms = dict(
                host = settings['MYSQL_HOST'],
                db = settings['MYSQL_DBNAME'],
                user = settings['MYSQL_USER'],
                passwd = settings['MYSQL_PASSWORD'],
                charset = 'utf8',
                cursorclass =  MySQLdb.cursors.DictCursor,
                use_unicode = True
            )
            #**dbparms代表可变化的参数
            dbpool = adbapi.ConnectionPool("MySQLdb",**dbparms)
            return cls(dbpool)
        def process_item(self,item,spider):
            #使用twisted将mysql插入变成异步执行
            query = self.dbpool.runInteraction(self.do_insert,item)
            query.addErrback(self.handle_error,item,spider)
        #c处理异步插入的异常
        def handle_error(self,failure,item,spider):
            print(failure)
        def do_insert(self,cursor,item):
            #执行具体的插入
            insert_sql = """ insert into article(title,create_date,url,fav_nums) VALUES(%s,%s,%s,%s)"""
            cursor.execute(insert_sql,(item['title'],item['create_date'],item['url'],item['fav_nums']))
    

      致辞插入数据库的方法完成。喜欢的记得点个赞哦。。。谢谢谢谢~~

  • 相关阅读:
    重新想象 Windows 8 Store Apps (32) 加密解密: 非对称算法, 数据转换的辅助类
    《C#编程极限》目录
    《软件设计精要与模式》完稿(原名《软件设计之道》)
    《软件设计之道》正式更名为《软件设计精要与模式》
    《软件设计精要与模式》各篇之篇首语
    Visual Studio 2005单元测试中关于外部文件的问题解决
    Web Service Software Factory
    Windows下IIS+PHP 5.2的安装与配置
    规划你的C#程序——《C#编程极限》第一章
    《软件设计精要与模式》前言
  • 原文地址:https://www.cnblogs.com/fh-fendou/p/7576414.html
Copyright © 2011-2022 走看看