zoukankan
html css js c++ java
bs4爬虫的一点心得----坑
bs4 里提取a标签里的坑啊
今天遇到了一个很坑的事情
使用bs4(全称:BeautifulSoup)提取一个网页里所有a标签里的href属性
比较坑的地方是这个网页里有的a标签里没有href属性,所以一运行循环提取a标签的href就可劲的报错,搞得人很焦灼
我尝试用控制循环的次数和字符串的替换来跳过这个坑。
你懂的
都失败了
最后
我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑!!!!!!
这个bug!!!好坑!!!
查看全文
相关阅读:
自编游戏
宣言
Leetcode: 12. Integer to Roman
Leetcode: 11. Container With Most Water
Leetcode: 10. Regular Expression Matching
网络编程:listen函数
网络编程:connect函数
Leetcode: 9. Palindrome Number
Leetcode: 8. String to Integer (atoi)
Leetcode: 7. Reverse Integer
原文地址:https://www.cnblogs.com/phying/p/8832604.html
最新文章
lintcode-160-寻找旋转排序数组中的最小值 II
lintcode-158-两个字符串是变位词
lintcode-157-判断字符串是否没有重复字符
lintcode-156-合并区间
lintcode-155-二叉树的最小深度
lintcode-153-数字组合 II
python内置函数易混点
开篇词 | To Be a HTTP Hero
adb命令使用bat展示:截屏和双清(清数据和删文件夹)
fiddler-重定向AutoResponder(三)
热门文章
fiddler界面工具栏介绍(二)
Fiddler的工作原理与主菜单介绍(一)
postman+newman+jenkins 接口自动化
postman—随机数和Monitors
postman—使用newman来执行postman脚本
npm 和 cnpm 区别
页面摧毁游戏
【洛谷P1056】排座椅
访客数量统计教程
LJ语录
Copyright © 2011-2022 走看看