zoukankan      html  css  js  c++  java
  • 【Python3网络爬虫开发实战】1.3.2-Beautiful Soup的安装

    Beautiful Soup是Python的一个HTML或XML的解析库,我们可以用它来方便地从网页中提取数据。它拥有强大的API和多样的解析方式,本节就来了解下它的安装方式。

    1. 相关链接

    2. 准备工作

    Beautiful Soup的HTML和XML解析器是依赖于lxml库的,所以在此之前请确保已经成功安装好了lxml库,具体的安装方式参见上节。

    3. pip安装

    目前,Beautiful Soup的最新版本是4.x版本,之前的版本已经停止开发了。这里推荐使用pip来安装,安装命令如下:

    pip3 install beautifulsoup4

    命令执行完毕之后即可完成安装。

    4. wheel安装

    当然,我们也可以从PyPI下载wheel文件安装,链接如下:https://pypi.python.org/pypi/beautifulsoup4

    然后使用pip安装wheel文件即可。

    5. 验证安装

    安装完成之后,可以运行下面的代码验证一下:

    from bs4 import BeautifulSoup
    soup = BeautifulSoup('<p>Hello</p>', 'lxml')
    print(soup.p.string)

    运行结果如下:

    Hello

    如果运行结果一致,则证明安装成功。

    注意,这里我们虽然安装的是beautifulsoup4这个包,但是在引入的时候却是bs4。这是因为这个包源代码本身的库文件夹名称就是bs4,所以安装完成之后,这个库文件夹就被移入到本机Python3的lib库里,所以识别到的库文件名就叫作bs4。

    因此,包本身的名称和我们使用时导入的包的名称并不一定是一致的。

    来源:华为云社区  作者:崔庆才丨静觅

  • 相关阅读:
    HDU 2795
    HDU 1394
    HDU 1754
    HDU 1166
    SDOI 2006
    HDU 1423
    HDU 1561
    centos7.4 搭建zabbix-server 3.4.5
    vim 简单笔记
    jdk环境并配置环境变量
  • 原文地址:https://www.cnblogs.com/2020-zhy-jzoj/p/13165913.html
Copyright © 2011-2022 走看看