zoukankan      html  css  js  c++  java
  • Python beautifulsoup 选择器 select 选择<meta/>等不需要成对结尾标签未写‘/’

    一些不需要成对的标签<meta/> <img/>d等使用bs4的css选择器时出现的情况;

    选择某一标签,输出内容超出范围过多

    from bs4 import BeautifulSoup

    soup = BeautifulSoup(html,'html.parser')

    print(soup.select('html > meta'))

    html = '

    <META content="" name="description">

    <link type="text/css" rel="stylesheet" href="http://img00.zhaopin.cn/2012/css/reset.min.css" />'

    若<meta/>的/未写,

    此时实际上

    html ='

    <META content="" name="description">

    <link type="text/css" rel="stylesheet" href="http://img00.zhaopin.cn/2012/css/reset.min.css" /></meta>'

    会输出多余的内容;

    作用范围:

    如print(soup.select('html > head > meta'))

    html = '<head>

        <META content="" name="description">

        <link type="text/css" rel="stylesheet" href="http://img00.zhaopin.cn/2012/css/reset.min.css" />

        </meta></head>

        <body>

        xxxx

        </body>

    '

    </meta>会加到上一级,父节点的结尾。

    其他标签的结尾未写如<a></a>写成了<a>此时也会出现相同的状况

  • 相关阅读:
    结对编程作业——毕设导师智能匹配
    结对项目之需求分析与原型设计
    Excel绘制之甘特图
    Excel绘图之数据波动条形图
    Excel绘图之漏斗图
    Excel绘图之四象限散点图
    软件工程实践总结
    发送手机验证码
    个人作业——软件产品案例分析
    用例图
  • 原文地址:https://www.cnblogs.com/liuda9495/p/7326710.html
Copyright © 2011-2022 走看看