zoukankan      html  css  js  c++  java
  • Python库-BeautifulSoup

    sp = BeautifulSoup.bs4.BeautifulSoup(html.text,"html.parser")

    方法

    1.sp.title

    返回网页标题

    2.sp.text

    返回去除所有HTML标签后的网页内容

    3.sp.find(name=None, attrs={}, recursive=True, text=None, **kwargs)

    该函数返回值为字符串

    第一个参数是标签名字,第二个是个网页属性的字典,例如:

    <a href = "http://www.baidu.com"
    class = "sister" id = "link1">Elsie</a>
    sp.find("a",{"id":"link1"})
    sp.find("a",{"href":"http://www.baidu.com"})

    4.sp.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs)

    第一个参数可以是多个标签名字构成的列表,例如:

    sp.find(['a','b'],{"id":"link1"})

    5.sp.select(selector, _candidate_generator=None, limit=None)

    该函数返回值为列表

    第一个参数可以是控件id值,要在引号之内加入#,例如:

    t = m.select("#userAccount")
    # 输出 [<input id="userAccount" style="position:absolute; top:7px;" type="text" value=""/>]

    第一个参数也可以是css类名,例如:

    <p class ="title"><b>文件标题</b></p>
    datal = sp.select(".title")

    6.get(属性名称)

    <a href = "http://www.baidu.com"
    class = "sister" id = "link1">Elsie</a>
    datal = sp.find("a",{"id":"link1"})
    print(datal.get("href"))
    # 输出 http://www.baidu.com
  • 相关阅读:
    函数柯里化
    常用正则
    校验table行内的form编辑
    前端代码 读取excel表格数据
    cocos2d-x 帧动画学习
    Linux 下vim配置
    Android开发笔记 二
    cocos2d-x CCDictionary类学习
    Android开发笔记
    Cococs2d-x移植到Window下的问题
  • 原文地址:https://www.cnblogs.com/woxiaosade/p/10014134.html
Copyright © 2011-2022 走看看