scrapy直接取出文章所有内容

示例：

import scrapy
from firstscrapy.items import CnblogsMysqlItem


class CnblogsSpider(scrapy.Spider):
    name = 'cnblogs'
    allowed_domains = ['www.cnblogs.com']
    # start_urls = ['http://www.cnblogs.com/']
    start_urls = ['http://www.cnblogs.com/lifei01/p/13440458.html']

    def parse(self, response):
        article = response.css('#main')
        print(article.css('#cb_post_title_url span::text').extract_first())
        article_body = response.xpath('.//div[@id="cnblogs_post_body"]//text()').extract()
        for line in article_body:
            print(line.strip())

查看全文

相关阅读:
python学习笔记 day14 各种推导式
 python学习笔记 day14 生成器表达式
 python学习笔记 day14 生成器进阶（二）
python学习笔记 day14 生成器进阶
 python学习笔记 day13 迭代器
 python 学习笔记 day12 作业讲解--员工信息表
 PAT L3-020 至多删三个字符
 2019省赛训练组队赛3.26周二---FJUT 2016
PAT L3-007 天梯地图
 POJ 2234 Matches Game

原文地址：https://www.cnblogs.com/baicai37/p/13443587.html