zoukankan      html  css  js  c++  java
  • Python beautifulsoup 选择器 select 选择<meta/>等不需要成对结尾标签未写‘/’

    一些不需要成对的标签<meta/> <img/>d等使用bs4的css选择器时出现的情况;

    选择某一标签,输出内容超出范围过多

    from bs4 import BeautifulSoup

    soup = BeautifulSoup(html,'html.parser')

    print(soup.select('html > meta'))

    html = '

    <META content="" name="description">

    <link type="text/css" rel="stylesheet" href="http://img00.zhaopin.cn/2012/css/reset.min.css" />'

    若<meta/>的/未写,

    此时实际上

    html ='

    <META content="" name="description">

    <link type="text/css" rel="stylesheet" href="http://img00.zhaopin.cn/2012/css/reset.min.css" /></meta>'

    会输出多余的内容;

    作用范围:

    如print(soup.select('html > head > meta'))

    html = '<head>

        <META content="" name="description">

        <link type="text/css" rel="stylesheet" href="http://img00.zhaopin.cn/2012/css/reset.min.css" />

        </meta></head>

        <body>

        xxxx

        </body>

    '

    </meta>会加到上一级,父节点的结尾。

    其他标签的结尾未写如<a></a>写成了<a>此时也会出现相同的状况

  • 相关阅读:
    SpringCloud Gateway使用实例
    Nacos服务注册与发现
    HashMap源码分析——put方法
    Volatile关键字——内存可见性
    Java的JIT编译器
    why spring?
    mysql 锁
    sql server 表变量和临时表
    mysql 存储过程
    mysql 截取字符串
  • 原文地址:https://www.cnblogs.com/liuda9495/p/7326710.html
Copyright © 2011-2022 走看看