zoukankan      html  css  js  c++  java
  • Windows平台安装Beautiful Soup

    Windows平台安装Beautiful Soup  

    2013-04-01 09:31:23|  分类: Python|举报|字号 订阅

     
     
    Beautiful Soup是一个Python的一个库,主要为一些短周期项目比如屏幕抓取而设计。有三个特性使得它非常强大:
    1.Beautiful Soup提供了一些简单的方法和Python术语,用于检索和修改语法树:一个用于解析文档并提取相关信息的工具包。这样你写一个应用不需要写很多代码。
     
    2.Beautiful Soup自动将输入文档转换为Unicode编码,并将输出文档转化为UTF-8编码。你不需要考虑编码,除非输入文档没有指出其编码并且Beautiful Soup无法自动检测到,这时你需要指出原来的编码方式。
     
    3.Beautiful Soup位于一些流行的Python解析器比如lxmlhtml5lib的上层,这允许你使用不同的解析策略或者牺牲速度来换取灵活性。
     
    Beautiful Soup解析你提哦那个的任何东西,并且替你完成树的便利。你可以告诉它“查找所有的链接” 或者“查找类externalLink的所有链接”或者“查找所有url地址匹配foo.com的链接”或者“查找使用粗体的表头,返回那些粗体的文本”。
     
    在一些设计不良的网站上很难获取的宝贵的数据,使用Beautiful Soup便可以获得。 原先需要运行几个小时工程,使用Beautiful Soup仅需要几分钟而已。
     
    下面说一下在Windows下面如何安装Beautiful Soup:
    1.到http://www.crummy.com/software/BeautifulSoup/网站上上下载,最新版本是4.1.3。
    2.下载完成之后需要解压缩,假设放到D:/python下。
    3.运行cmd,切换到D:/python/beautifulsoup4-4.1.3/目录下(根据自己解压缩后的目录和下载的版本号修改),
    cd /d D:/python//beautifulsoup4-4.1.3
    4.运行命令:
    setup.py build
    setup.py install
    5.在IDE下from bs4 import BeautifulSoup,没有报错说明安装成功。
  • 相关阅读:
    算法
    autoreleasepool和weak
    记录一下锁如何使用
    RunLoop相关知识
    NSTimer内存泄漏的解决方案
    ARC下block循环引用的解决方式
    MGJRouter源码解析及使用方法
    Instruments 中Time Profile的使用
    NSFileManager的基本使用
    Runtime相关知识
  • 原文地址:https://www.cnblogs.com/shgq/p/4018536.html
Copyright © 2011-2022 走看看