bs4爬虫的一点心得----坑 - 走看看

zoukankan html css js c++ java

bs4爬虫的一点心得----坑

bs4 里提取a标签里的坑啊

今天遇到了一个很坑的事情

使用bs4（全称：BeautifulSoup）提取一个网页里所有a标签里的href属性

比较坑的地方是这个网页里有的a标签里没有href属性，所以一运行循环提取a标签的href就可劲的报错，搞得人很焦灼

我尝试用控制循环的次数和字符串的替换来跳过这个坑。

你懂的

都失败了

最后

我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑！！！！！！

这个bug！！！好坑！！！

查看全文

相关阅读:
远程安装WinXP OEM版系统的痛苦经历
 许可证服务因许可证不够出现占用CPU的故障
 AvayaP133G2和3Com 3300交换机间的Vlan连接
 从win2000升级到win2003后ISA2000缓存的问题
 大型局域网中用ISA隔离部分计算机
 ORACLE学习第二天
 ORACLE ROWID解析
 ORA32773问题解决
 ORACLE学习第三天
 ORACLE表空间迁移

原文地址：https://www.cnblogs.com/phying/p/8832604.html

Copyright © 2011-2022 走看看