zoukankan      html  css  js  c++  java
  • lxml解析库的安装和使用

    一、lxml的安装
    lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。本节中,我们了解一下lxml的安装方式,这主要从Windows、Linux和Mac三大平台来介绍。
    官方网站:http://lxml.de
    GitHub:https://github.com/lxml/lxml
    PyPI:https://pypi.python.org/pypi/lxml

    在Windows下,可以先尝试利用pip安装,此时直接执行如下命令即可:

    pip3 install lxml

    如果出现报错,比如提示缺少libxml2库等信息,可以采用wheel方式安装。
    推荐直接到这里(链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下载对应的wheel文件,找到本地安装Python版本和系统对应的lxml版本,例如Windows 64位、Python 3.6,就选择lxml‑4.2.3‑cp36‑cp36m‑win_amd64.whl,将其下载到本地。
    然后利用pip安装即可,命令如下:

    pip3 install 路径/lxml‑4.2.3‑cp36‑cp36m‑win_amd64.wh

    在Linux平台下安装问题不大,同样可以先尝试pip安装,命令如下:
    pip3 install lxml
    如果报错,可以尝试下面的解决方案。

    CentOS、Red Hat
    执行如下命令安装所需的库即可:

    sudo yum groupinstall -y development tools
    sudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

    主要是libxslt-devel和libxml2-devel这两个库,lxml依赖它们。安装好之后,重新尝试pip安装即可。

    Ubuntu、Debian和Deepin
    在这些系统下,报错的原因同样可能是缺少了必要的类库,执行如下命令安装:

    sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev

    安装好之后,重新尝试pip安装即可。

    Python命令行下测试:

    >>> import lxml #不报错即可

  • 相关阅读:
    基于Diff机制的多个状态合并
    do_mmap解读
    Linux对用户态的动态内存管理
    我的WordPress站点
    使用Bochs学习硬件原理
    inode的若干锚
    Use sed and awk to prettify json
    IO完成端口
    如何使用iText制作中文PDF
    Font and PDF
  • 原文地址:https://www.cnblogs.com/xuyingzhong/p/9345525.html
Copyright © 2011-2022 走看看