zoukankan      html  css  js  c++  java
  • python爬虫(二十) select方法

    有时候需要css选择器

    1、通过标签名查找:

    <style type="text/css">
          p{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p>123</p>
           <p>456</p>
    </body>
    print(soup.select('p'))

    这时就可以查到123和456得数据

    2、通过类名查找:

    <style type="text/css">
          .line{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p  class="line">123</p>
           <p>456</p>
    </body>
    print(soup.select('.line'))

    这样就可以查到123得数据

    3、通过id查找:

    <style type="text/css">
          #line1{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p  id="line1">123</p>
           <p>456</p>
    </body>
    print(soup.select('#sister'))

    这样可以查到123得数据

    4、通过组合查找:

    <style type="text/css">
          .box  p{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p>123</p>
           <p>456</p>
    </body>
    print(soup.select('p #sister'))

    这样可以得到box下面得p标签,123和456得值

    5、通过属性查找

    <style type="text/css">
          input[name='username']{
                background-color:pink;
            }
    </style>
    <body>
         <form>
         <input  type="text" name="username">
         </form>
    </body>
    print(soup.select('a[href="http://example.com/elsie"]'))

    可以得到这个input标签

  • 相关阅读:
    EnrichPipeline文档
    454ITS数据按barcode和primer分类程序v1.0
    linux系统中,文件的三种特殊权限
    ITS简要分析流程(using Qiime)
    SegmentFault错误汇总
    PCoA主坐标分析
    PCA主成份分析
    软件测试工程师面试题
    我的测试团队管理之道
    如何管理好测试团队
  • 原文地址:https://www.cnblogs.com/zhaoxinhui/p/12450379.html
Copyright © 2011-2022 走看看