第三百四十节，Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器 - 走看看

zoukankan html css js c++ java

第三百四十节，Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器
第三百四十节，Python分布式爬虫打造搜索引擎Scrapy精讲—css选择器

css选择器

1、

2、

3、

::attr()获取元素属性，css选择器

::text获取标签文本

举例：

extract_first('')获取过滤后的数据，返回字符串，有一个默认参数，也就是如果没有数据默认是什么，一般我们设置为空字符串

extract()获取过滤后的数据，返回字符串列表
# -*- coding: utf-8 -*- import scrapy class PachSpider(scrapy.Spider): name = 'pach' allowed_domains = ['blog.jobbole.com'] start_urls = ['http://blog.jobbole.com/all-posts/'] def parse(self, response): asd = response.css('.archive-title::text').extract() #这里也可以用extract_first('')获取返回字符串 # print(asd) for i in asd: print(i)
查看全文

相关阅读:
mysql零碎问题合集
 mysql 纵表转横表需要用join不能直接where连接
 eclipse导出可执行jar包报main function not found错误
 shell脚本将mysql查询结果制作成csv格式
 linux shell中把句子中的单词提取作为变量值主要是使用了数组
 linux下文件字符编码转换
 Banner使用
 recyclerview的博客网址需要的权限
 okhttp权限
 Okhttp代码

原文地址：https://www.cnblogs.com/adc8868/p/7281447.html

Copyright © 2011-2022 走看看