zoukankan      html  css  js  c++  java
  • 假期十一

    .find_all(name,attrs,recursive,string,**kwargs)

    name:对标签名称的检索字符串
    attrs:对标签属性值的检索字符串,可标注属性检索
    recursive:是否对子孙全部检索,默认为True
    string <>....</>中字符串区域的检索字符串


    soup.find_all('a')
    寻找a标签

    soup.find_all('a','b')
    寻找a标签和b标签并作为列表复制

    for tag in soup.find_all(True)
    print(tag.name)
    打印出所有的标签

    import re #正则表达式库
    for tag in soup.find_all(re.compile('b')):
    print(tag.name)
    以b开头的标签

    soup.find_all('p','course')
    打印p标签class属性为course的标签

    soup.find_all(id='link1')
    打印id=link1的属性的标签

    soup.find_all(id=re.compile('link')
    打印id中存在link如link,link1,link2......等等的标签

    soup.find_all('a')
    soup.find_all('a',recursive=False)
    从soup根节点开始儿子节点无a标签

    soup.find_all(string="Basic Python")
    可以检索Basic Python
    如果引入正则表达式库
    soup.find_all(string=re.compile("python"))
    可以检索出所有含有python的标签内部内容

  • 相关阅读:
    hbase二级索引学习
    redis-cluster集群Mac部署
    http-flume-kafka.conf
    linux 替换文件中的字符串
    flumeDemo
    redis_exporter监控安装
    Hbase内存磁盘大致关系
    spring cloud 尚硅谷学习
    C10K问题
    navicat 远程链接Mysql问题
  • 原文地址:https://www.cnblogs.com/jbwen/p/12297369.html
Copyright © 2011-2022 走看看