zoukankan html css js c++ java

Django+Scrapy结合使用并爬取数据入库

1. 创建django项目，并编写models.py,启动django项目

2. 配置Django嵌入
　　Django项目根目录下创建Scrapy项目（这是scrapy-djangoitem所需要的配置）
　　配置Django嵌入，在Scrapy的settings.py中加入以下代码：

import os
import sys
sys.path.append(os.path.dirname(os.path.abspath('.')))
os.environ['DJANGO_SETTINGS_MODULE'] = '子app.settings'
# 手动初始化Django：
import django
django.setup()

3.编写爬虫

4.item.py中引入Django模型类

import scrapy
    
from scrapy_djangoitem import DjangoItem
from 子app import models
class TalksItem(DjangoItem):
    django_model = models.表名

5.pipelines.py中调用save()

class TalksPipeline(object):
    def process_item(self, item, spider):
        print('打开数据库')
        item.save() # 数据将会自动添加到指定的表
        print('关闭数据库')
        return item

6.启动爬虫：scrapy crawl 爬虫名

7.刷新admin后台，此时数据已经入库了！

开不开心！

查看全文

相关阅读:
文章块引用模版
 悬停工具提示
 各个知识点
 Github Fork 缎带.html
css重置样式
 暗灰色的圆形按钮.html
css中的居中的方法
 display：table的几个用法块级子元素垂直居中
 <meta>标签中http-equiv属性的属性值X-UA-Compatible详解
 jQuery难学是因为什么？

原文地址：https://www.cnblogs.com/kitshenqing/p/11059636.html