zoukankan      html  css  js  c++  java
  • python安装BeautifulSoup库解析HTML页面

     BeautifulSoup三大特点:

    1. BeautifulSoup提供了一些简单的方法和Pythonic成语,用于浏览,搜索和修改解析树:一个解剖文档并提取所需内容的工具包。编写应用程序并不需要太多代码
    2. BeautifulSoup自动将传入文档转换为Unicode和传出文档为UTF-8。您不必考虑编码,除非文档未指定编码,而美丽汤不能检测到编码。然后您只需指定原始编码。
    3. Beautiful Soup位于流行的Python解析器(如lxmlhtml5lib)之上,允许您尝试不同的解析策略或交易速度以获得灵活性

    下载链接: https://share.weiyun.com/5f6ZawU (密码:fODC)

    安装BeautifulSoup:

    分以下几步:

      1.解压BeautifulSoup的安装包到python的安装目录,如下图

    2.在cmd中cd到BeautifulSoup的安装目录输入python  setup.py install 回车会出现如下图的加载:

    这个时候就证明安装成功了,还有最后一步。

    3.进入python->Lib->site-packages将bs4文件夹复制到Lib文件夹下

    将python安装目录下的Tools->scripts->2to3.py文件复制到Lib下,这一步同上

    最后在cmd中cd到lib目录,然后写入python 2to3.py bs4 -w如下图即可:

    在eclipse上就可以正常的导入BeautifulSoup库了

  • 相关阅读:
    File操作
    集合
    几个python资料地址
    Case1-用list写shoppingcart
    字符串操作
    运算-Dictionary
    运算-list
    Python数据类型
    标准库和库导入
    Pycharm
  • 原文地址:https://www.cnblogs.com/liuduanwu/p/9226928.html
Copyright © 2011-2022 走看看