zoukankan      html  css  js  c++  java
  • python3 两种方法将数据存入mysql数据库

    方法一:(数据量小的时候推荐使用这种)

    第一步:pip install mysqlclient

    这里我没有报错 也许你可能会报错Read timed out   此时不要慌,这是因为你的网络问题,你使用豆瓣源再次下载:pip install  -i https://pypi.douban.com/simple/ mysqlclient

    注意:以下针对linux用户(乌班图):可能这时你会报错安装失败,解决方法:

    安装命令:sudo apt-get install libmysqlclient-dev

    linux用户(centOs):

    安装命令:sudo yum install python-devel mysql-devel

     1,在pipeline.py中写入如下代码:

    import MySQLdb
    #采用同步的机制写入mysql
    class MysqlPipeline(object):
    def __init__(self):
    self.conn = MySQLdb.connect('localhost','root','root','article_spider',charset='utf8',use_unicode=True)
    self.cursor = self.conn.cursor()
    def process_item(self,item,spider):
    insert_sql = """ insert into article(title,create_date,url,fav_nums) VALUES(%s,%s,%s,%s)"""
    self.cursor.execute(insert_sql,(item['title'],item['create_date'],item['url'],item['fav_nums']))
    self.conn.commit()

    2,在settings.py中写入如下代码:

    ITEM_PIPELINES = {
        'ArticleSpider.pipelines.MysqlPipeline':1,
    }

    以上是一种插入数据库的方法,下面还有一种:mysql插入的异步方法

    **********************************************************************华丽的分割线 ******************************************************************************

    方法二:(数据量大的时候推荐使用这种,异步插入关系型数据库)

    1,首先在settings.py中配置

    MYSQL_HOST = 'localhost'
    MYSQL_DBNAME ='article_spider'
    MYSQL_USER = 'root'
    MYSQL_PASSWORD = 'root'
    

    2,在pipelines.py中贴入代码:

    from twisted.enterprise import adbapi
    import MySQLdb
    import MySQLdb.cursors
    #mysql插入的异步化,twisted 提供的异步api
    class MysqlTwistedPipline(object):
        def __init__(self,dbpool):
            self.dbpool = dbpool
        @classmethod#方法是固定的,会被spider调用的
        def from_settings(cls,settings):
            dbparms = dict(
                host = settings['MYSQL_HOST'],
                db = settings['MYSQL_DBNAME'],
                user = settings['MYSQL_USER'],
                passwd = settings['MYSQL_PASSWORD'],
                charset = 'utf8',
                cursorclass =  MySQLdb.cursors.DictCursor,
                use_unicode = True
            )
            #**dbparms代表可变化的参数
            dbpool = adbapi.ConnectionPool("MySQLdb",**dbparms)
            return cls(dbpool)
        def process_item(self,item,spider):
            #使用twisted将mysql插入变成异步执行
            query = self.dbpool.runInteraction(self.do_insert,item)
            query.addErrback(self.handle_error,item,spider)
        #c处理异步插入的异常
        def handle_error(self,failure,item,spider):
            print(failure)
        def do_insert(self,cursor,item):
            #执行具体的插入
            insert_sql = """ insert into article(title,create_date,url,fav_nums) VALUES(%s,%s,%s,%s)"""
            cursor.execute(insert_sql,(item['title'],item['create_date'],item['url'],item['fav_nums']))
    

      致辞插入数据库的方法完成。喜欢的记得点个赞哦。。。谢谢谢谢~~

  • 相关阅读:
    常用SQL语句
    一个很准的心理测试
    视图,存储实现行列转换
    『原创』+『转载』配置模拟器网络环境(访问局域网)Step by Step!
    『原创』老范的XML文档编辑程序——不是一般的山寨!(原创附程序)
    『原创』+『参考』基于PPC的图像对比程序——使用直方图度量
    『原创』.Net CF下ListView的数据绑定
    『原创』+『参考』使用C#在PPC的Today界面上的任务栏加入应用程序图标
    关于RDA远程访问数据库的一个例子(亲手完成,不容易啊)
    『原创』+『参考』亲手实验:使用C#在PPC中播放声音
  • 原文地址:https://www.cnblogs.com/fh-fendou/p/7576414.html
Copyright © 2011-2022 走看看