zoukankan
html css js c++ java
bs4爬虫的一点心得----坑
bs4 里提取a标签里的坑啊
今天遇到了一个很坑的事情
使用bs4(全称:BeautifulSoup)提取一个网页里所有a标签里的href属性
比较坑的地方是这个网页里有的a标签里没有href属性,所以一运行循环提取a标签的href就可劲的报错,搞得人很焦灼
我尝试用控制循环的次数和字符串的替换来跳过这个坑。
你懂的
都失败了
最后
我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑!!!!!!
这个bug!!!好坑!!!
查看全文
相关阅读:
POJ 2407 Relatives 欧拉函数
HDU 4704 Sum 超大数幂取模
HDU 4699 Editor 维护栈
HDU 4696 Answers 水题
HDU 4686 Arc of Dream 矩阵
[转]高斯消元题集
[转]计算几何题集
POJ 2981 Strange Way to Express Integers 模线性方程组
Linux 设置文件默认打开方式
FZU 1402 猪的安家 中国剩余定理
原文地址:https://www.cnblogs.com/phying/p/8832604.html
最新文章
android 双击返回按钮退出程序。
Android 自定义表格显示数据
android 动态设置控件宽高度
AChartEngine 图表绘制
自定义的加载弹窗
Android软件更新安装。
Android RadioGroup设置默认选中项
Android 使用 ksoap2-android 访问WebService(C#)
Android ImageView显示本地图片
rspec+rest-client测试第三方web service
热门文章
ruby类名之间<,<=方法
解决rspec 生成报告时报utf-8错误的方法
HDU 1166 敌兵布阵 线段树
NOI2004 郁闷的出纳员 splay
HDU 4731 Minimum palindrome 打表找规律
HDU 4717 The Moving Points 三分
POJ 1981 Circle and Points 单位圆覆盖
CSU 8月月赛 Decimal 小数化分数
趣题: 按二进制中1的个数枚举1~2^n (位运算技巧)
WHU 1470 Join in tasks 水题
Copyright © 2011-2022 走看看