zoukankan      html  css  js  c++  java
  • BeautifulSoup基本用法

    BeautifulSoup是可以从HTML或者XML文件中提取数据的Python库

    一般配合requests使用

    一、引入

    from bs4 import BeautifulSoup

    BeautifulSoup 所支持的解析器

     Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment

        Tag对象:对象与XML或HTML原生文档中的tag相同
        每个tag 都有自己的名字,Tag.name 来获取,tag可能有很多个属性. tag <b class="boldest"> 有一个 “class” 的属性,值为 “boldest” . tag的属性的操作方法与字典相同: tag['class'] = "boldest"

        可以遍历字符串,字符串常被包含在tag内.Beautiful Soup用 NavigableString 类来包装tag中的字符串,tag.string


    ————————————————
    版权声明:本文为CSDN博主「maverick17」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/maverick17/article/details/79610050

  • 相关阅读:
    Java
    一个web项目web.xml的配置中<context-param>配置作用
    JVM之几种垃圾收集器简单介绍
    JVM日志和参数的理解
    Java GC日志查看
    Java-性能调优-理解GC日志
    理解Java的GC日志
    tomcat打印GC日志
    快速解读GC日志
    Java 堆内存
  • 原文地址:https://www.cnblogs.com/whisperbb/p/11398872.html
Copyright © 2011-2022 走看看