zoukankan      html  css  js  c++  java
  • Beautiful Soup:四大常用对象

    from bs4 import BeautifulSoup

    text='''
    <?xml version="1.0" encoding="ISO-8859-1"?>
    <bookstore>
    <book>
    <title lang='eng'>Harry Potter</title>
    <price>29.9</price>
    </book>
    <book>
    <title lang='eng'>Learning XML</title>
    <price>39.95</price>
    </book>
    </bookstore>
    '''
    soup=BeautifulSoup(text)
    #按标准输出
    # print(soup.prettify)
    #获取所有文字
    # print(soup.get_text())
    #tag 对象
    tag=soup.title
    # print(tag)
    tag.name #标签name
    tag.attrs #标签属性
    tag['lang'] #某一属性
    tag.string #获取文字

    string='<p><!--注释note--></p>'
    sp=BeautifulSoup(string)
    # sp.p.string

    # print(soup.find_all('title',{'lang':'eng'}))
    # print(soup.find('title',lang='eng'))
    # soup.book
    # soup.book.contents
    # for child in soup.book.children: #字节点
    # print(child)

    # for parent in soup.book.parent: #父节点
    # print(parent)

    # for parents in soup.book.parents: #所有父节点
    # print(parents.name)
    soup.title.next_sibling #下一个兄弟
    soup.title.previous_sibling #上一个兄弟
    for sibling in soup.title.next_siblings: #所有兄弟
    print(sibling)

  • 相关阅读:
    Azkaban的架构(三)
    Azkaban的功能特点(二)
    Hadoop工作流不足(六)
    Hadoop工作流--JobControl(五)
    ruby on rails创建的页面訪问很慢
    C#实现树的双亲表示法
    SetCapture ReleaseCapture
    HDU 4923 Room and Moor
    Spring概述
    WinMM.dll 函数汇总
  • 原文地址:https://www.cnblogs.com/tiankong-blue/p/11610040.html
Copyright © 2011-2022 走看看