zoukankan      html  css  js  c++  java
  • python爬虫网页解析之parsel模块

    08.06自我总结

    python爬虫网页解析之parsel模块

    一.parsel模块安装

    官网链接https://pypi.org/project/parsel/1.0.2/

    pip install parsel==1.0.2

    二.模块作用

    改模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配

    三.使用

    import requests
    import parsel
    
    
    response = requests.get(url)
    sel = parsel.Selector(response.text)  #注意这里的S要大写
    
    # re正则
    # print(sel.re('正则匹配格式'))
    
    # xpath
    # print(sel.xpath('xpath').getall()) #getall获取所有
    
    # css选择器
    # print(sel.css('css选择器 ::text').extract_first())#获取第一个
    
  • 相关阅读:
    CSS之链接
    CSS之文本
    CSS之定位
    django 第四天
    django第三天
    django 第二天
    django第一天
    国庆贺礼
    珂朵莉树(ODT)笔记
    20190927
  • 原文地址:https://www.cnblogs.com/pythonywy/p/11311237.html
Copyright © 2011-2022 走看看