pyquery的问题 - 走看看

zoukankan html css js c++ java

pyquery的问题

在使用pyquery时发现一些问题，

1.爬取的html中如果有较多的错误时，不能很好的补全。

2.如果要获取某个class中的内容时，如果内容太多不能取完整！只能取一部分。

这个在现在的最新版本中还没有很好的解决吧！

所以我就换回beautifulsoup，就没有这两个问题了！

使用lxml HTML 解析器：

BeautifulSoup(markup,"lxml")

速度也不会差到哪里去，html容错能力比pyquery好的多！

附上bs文档>>>

查看全文

相关阅读:
Redis 设计与实现-内部数据结构
 RuntimeBinderException 异常
 IPv4和IPv6地址库
 -Xms -Xmx -Xmn -Xss -XX：
倒计时
 列表操作-分片赋值
 20175316毕设准备Day1-2
20175316毕业设计——基于区块链服务的仓库管理系统
 Python学习笔记：sys.argv入参
 Python学习笔记：bisect模块实现二分搜索

原文地址：https://www.cnblogs.com/feng18/p/6104636.html

Copyright © 2011-2022 走看看