zoukankan      html  css  js  c++  java
  • python:3种爬虫的优缺点

                                                                 性能对比
               爬取方法
               性    能
             使用难度
              安装难度
           正则表达式
                     快
                   困难
           简单(内置模块)
         BeautifulSoup
                     慢
                   简单
                   简单
                 Lxml
                     快
                   简单
                相对困难
     
    当网页结构简单并且想要避免额外依赖(不需要安装库),使用正则表达式更为合适。当需要爬取数据量较少时,使用较慢的BeautifulSoup也可以的。当数据量大时,需要追求效益时,Lxml时最好选择。

  • 相关阅读:
    音频可视化
    accunulate
    node
    js 中编码(encode)和解码(decode)的三种方法
    ES6高阶 同步和异步 回调地狱 promise async和await
    区间dp
    树形dp1
    背包dp(多重)
    树形dp
    背包dp(完全)
  • 原文地址:https://www.cnblogs.com/zgen1/p/8525526.html
Copyright © 2011-2022 走看看