zoukankan      html  css  js  c++  java
  • python爬虫(二十) select方法

    有时候需要css选择器

    1、通过标签名查找:

    <style type="text/css">
          p{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p>123</p>
           <p>456</p>
    </body>
    print(soup.select('p'))

    这时就可以查到123和456得数据

    2、通过类名查找:

    <style type="text/css">
          .line{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p  class="line">123</p>
           <p>456</p>
    </body>
    print(soup.select('.line'))

    这样就可以查到123得数据

    3、通过id查找:

    <style type="text/css">
          #line1{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p  id="line1">123</p>
           <p>456</p>
    </body>
    print(soup.select('#sister'))

    这样可以查到123得数据

    4、通过组合查找:

    <style type="text/css">
          .box  p{
                background-color:pink;
            }
    </style>
    <body>
           <div class="box">
           <p>123</p>
           <p>456</p>
    </body>
    print(soup.select('p #sister'))

    这样可以得到box下面得p标签,123和456得值

    5、通过属性查找

    <style type="text/css">
          input[name='username']{
                background-color:pink;
            }
    </style>
    <body>
         <form>
         <input  type="text" name="username">
         </form>
    </body>
    print(soup.select('a[href="http://example.com/elsie"]'))

    可以得到这个input标签

  • 相关阅读:
    Z算法
    CodeForces 939F
    CodeForces 15D
    ZOJ 3408
    CodeForces 962D
    CodeForces 29D
    CodeForces 1129C
    RabbitMQ.NET In Window Service
    封装RabbitMQ.NET Library 的一点经验总结 转载
    DotNetBar 使用笔记
  • 原文地址:https://www.cnblogs.com/zhaoxinhui/p/12450379.html
Copyright © 2011-2022 走看看