zoukankan      html  css  js  c++  java
  • 安装beautifulsoup库时遇到麻烦

    一、Beautiful Soup库遇到的问题

           1.ImportError: No module named BeautifulSoup       

    当你成功安装BeautifulSoup 4库后,“from BeautifulSoup import BeautifulSoup”可能会遇到该错误。


            其中的原因是BeautifulSoup 4库改名为bs4,需要使用“from bs4 import BeautifulSoup”导入。

            2.TypeError: an integer is required

            当你使用“print soup.title.string”获取title的值时,可能会遇到该错误。如下:

            它应该是IDLE的BUG,当使用命令行Command没有任何错误。参考:stackoverflow。同时可以通过下面的代码解决该问题:
            print unicode(soup.title.string)
            print str(soup.title.string)

    下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/

    下载完成后解压到python安装包的地方,存放在Beautifulsoup.**文件下

    win+R  ————cmd  cd (第 2 步放置安装包的位置)C:\Python36\beautifulsoup4-4.6.0

    安装:python steup.py install

    二. 安装及介绍Beautiful Soup库

    安装beautiful soup库

    #安装
    pip install beautifulsoup4
    #检查
    from bs4 import Beautiful Soup
    #安装 lxml
    pip install lxml
    捷径

    别的就不多说了

    pip install beautifulsoup4

    安装完成后

    from bs4 import BeautifulSoup

    进行导入模块,如果运行没有问题,那么我们就是成功了--------如果是报的‘import name HTMLParseError’,就说明我们的python版本与beautiful soup4的支持版本不符,那么我要更新运行beautiful soup,或者直接下载最新的(才脑壳痛哦)

    pip3 install --upgrade beautifulsoup4

    更新完成后,那么我们就可以使用 bs4 了,如果还是报错 (那么我就进入他老巢————文件夹看看)打开 finder ,前往文件夹:

    /usr/local/lib/python3.6/site-packages

    在这个文件夹里找一找,看有没有两个beautifuls4的文件,如果有,删掉那个旧版本的,我的是不知道什么原因,site-packages里多了个 ‘‘beautifulsoup4-4.1.0-py3.6.egg-info’’文件,删除掉就好了。

    beautifulsoup4安装完成之后,还需要一个叫 lxml 的依赖库:

    pip3 install lxml

    ok,完成,我的也就是到这里为止了,可能还有更好的操作方法也说不定的哈,小弟课多也就再花功夫在研究咯0.....0

    Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。

    Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。

    Beautiful Soup已成为和lxml、html6lib一样出色的python解释器,为用户灵活地提供不同的解析策略或强劲的速度

    具体的介绍我们还是参考官方文档吧:
     http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html

     
  • 相关阅读:
    shell下如何删除文件的某一列
    git如何列出最简短的commit(tag和head名都不显示)
    git如何列出每次提交对应有哪些文件被修改
    linux下如何使用命令行配置网络
    64bit ubuntu如何使能安装32bit软件
    linux下如何查看当前机器提供了哪些服务
    vi如何修改注释颜色
    uboot启动提示Error, wrong i2c adapter 0 max 0 possible后卡住了怎么办
    linux 如何改变文件属性与权限1
    Linux文件系统只读Read-only file system的解决方法
  • 原文地址:https://www.cnblogs.com/scriptchild/p/8796533.html
Copyright © 2011-2022 走看看