zoukankan
html css js c++ java
bs4爬虫的一点心得----坑
bs4 里提取a标签里的坑啊
今天遇到了一个很坑的事情
使用bs4(全称:BeautifulSoup)提取一个网页里所有a标签里的href属性
比较坑的地方是这个网页里有的a标签里没有href属性,所以一运行循环提取a标签的href就可劲的报错,搞得人很焦灼
我尝试用控制循环的次数和字符串的替换来跳过这个坑。
你懂的
都失败了
最后
我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑!!!!!!
这个bug!!!好坑!!!
查看全文
相关阅读:
远程安装WinXP OEM版系统的痛苦经历
许可证服务因许可证不够出现占用CPU的故障
AvayaP133G2和3Com 3300交换机间的Vlan连接
从win2000升级到win2003后ISA2000缓存的问题
大型局域网中用ISA隔离部分计算机
ORACLE学习第二天
ORACLE ROWID解析
ORA32773问题解决
ORACLE学习第三天
ORACLE表空间迁移
原文地址:https://www.cnblogs.com/phying/p/8832604.html
最新文章
MooTools 1.4 源码分析 Fx
MooTools Class 使用、继承详解
MooTools 1.4 源码分析 Class 修正版
MooTools 1.4 源码分析 Fx.Morph
MooTools官方插件 Chain.Wait
Anaconda下载安装教程。。。
JDK8的安装及环境配置
GSM/GPRS/EDGE简介
地图精度与比例尺的关系
GIS开源程序收集(转载)
热门文章
售前技术支持工作职责和能力要求
在VC程序中添加TODO、FIXME编译警告
批处理文件编写
三种3G网络制式简介
移动运营商简介
中国航天科工集团介绍
sps2003更新SP1后访问页面出现500错误或者HRESULT 中的异常0x80040E14
WinXP SP2 IE不能使用cookie的解决方法
DFS不能创建根目录的解决方法
HP6000r服务器阵列故障
Copyright © 2011-2022 走看看