scrapy中的xpath用法和css的用法

css

response.css(".list-left dd:not(.page)")

img.css("a::text").extract_first()

img.css("a::attr(href)").extract_first()

response.css(".page-en:nth-last-child(2)::attr(href)").extract_first()

result = html.xpath('//li/a[@href="link1.html"]')

result = html.xpath('//li[last()]/a/@href')

result = html.xpath('//li[last()-1]/a')

#result = html.xpath('//li/span')
#注意这么写是不对的：
#因为 / 是用来获取子元素的，而 <span> 并不是 <li> 的子元素，所以，要用双斜杠

result = html.xpath('//li//span')

查看全文

相关阅读:
AngularJS自定义表单验证器
 AngularJS自定义表单验证
 DataTables自定义筛选器
 DataTables列过滤器
 DataTables语言国际化
 DataTables DOM定位
 DataTables自定义事件
 DataTables给表格绑定事件
 自定义Celery任务记录器
 celery 日志设置