zoukankan html css js c++ java

scrapy将爬取的数据存入MySQL数据库

items.py

import scrapy


class InsistItem(scrapy.Item):

    positionname=scrapy.Field()
    type=scrapy.Field()
    place=scrapy.Field()
    mian=scrapy.Field()
    time=scrapy.Field()

pipelines.py

import json
import scrapy
import pymysql
from scrapy.pipelines.images import ImagesPipeline
class InsistPipeline(object):
    def __init__(self):
        self.db=pymysql.connect(host='localhost',user='dsuser',passwd='badpassword',db='dsdb',charset='utf8',port=3306)
        self.cur=self.db.cursor()
    def process_item(self, item, spider):
        sql='INSERT INTO job(name,type,place,mian,time) VALUES(%s,%s,%s,%s,%s) '
        self.cur.execute(sql,(item['positionname'],item['type'],item['place'],item['mian'],item['time']))
        self.db.commit()
        return item
      
    def close_spider(self, spider):
        self.cur.close()
        self.db.close()

insisits.py
#爬虫程序
import scrapy
from insist.items import InsistItem
import json
class InsistsSpider(scrapy.Spider):
    name = 'insists'
    allowed_domains = ['careers.tencent.com']
    #start_urls =['https://careers.tencent.com/search.html?index=']
    baseURL='https://careers.tencent.com/tencentcareer/api/post/Query?pageSize=10&pageIndex='
    offset=1
    start_urls=[baseURL+str(offset)]

    def parse(self, response):
        contents = json.loads(response.text)
        jobs = contents['Data']['Posts']
        item = InsistItem()
        for job in jobs:
            item['positionname'] = job['RecruitPostName']
            item['type'] = job['BGName']
            item['place'] = job['LocationName']
            item['mian'] = job['CategoryName']
            item['time'] = job['LastUpdateTime']
            yield item#返回后继续执行数据
        if self.offset<=5:
              self.offset+=1
              url=self.baseURL+str(self.offset)
              yield scrapy.Request(url,callback=self.parse)

查看全文

相关阅读:
关于xcode 9.0数组问题的遇到的坑
 PHP将emoji表情进行过滤
 iOS 11更新后以及iPhone X推出后工程中遇到的问题及适配
 在IOS11中position:fixed弹出框中的input出现光标错位的问题
 采用腾讯云直播断流续播相关问题
 论坛灌水机与注册机问题
 以下内容对于灵活修改textField中文本以及占位文本属性进行了完整的封装，加入项目中可以节约开发时间。
JS基础语法---总结
 JS基础语法---创建对象---三种方式创建对象：调用系统的构造函数；自定义构造函数；字面量的方式
 JS基础语法---编程思想和对象

原文地址：https://www.cnblogs.com/persistence-ok/p/11647296.html