zoukankan      html  css  js  c++  java
  • BeautifulSoup 用法

    一、标签选择器

    1、子节点contents child(迭代器)

    2、子孙节点 descendants(迭代器)

    3、父节点 parent  

    4、祖节点  parents

    5、兄弟节点 next_siblings (下一个兄弟) previous_siblings(上一个兄弟)

    二、标准选择器

    1、find_all(name,attrs,recursive,text,**kwargs)

    name

    attrs        

    text

     

    2、find(name,attrs,recursive,text,**kwargs)

    find返回单个元素,find_all返回所有元素

     

     

    三、CSS选择器

    通过select()直接传入css选择器就可以完成选择

     

    获取属性

     

    获取内容

     

    总结

    推荐使用lxml解析库,必要是使用html.parser

    l 标签选择器筛选功能弱但是速度快

    建议使用find(),find_all()查询匹配单个结果或者多个结果

    如果对CSS选择器熟悉建议使用select

    l 记住常用的获取属性和文本值得方法

  • 相关阅读:
    linux 查看系统负载:uptime
    centos who命令 查看当前登录系统用户信息
    centos7 管理开机启动:systemd
    Linux ethtool 命令
    Linux ifconfig 命令
    linux centos7 目录
    POJ 1169
    POJ 1163
    POJ 1154
    POJ 1149
  • 原文地址:https://www.cnblogs.com/zlel/p/8849069.html
Copyright © 2011-2022 走看看