zoukankan
html css js c++ java
bs4爬虫的一点心得----坑
bs4 里提取a标签里的坑啊
今天遇到了一个很坑的事情
使用bs4(全称:BeautifulSoup)提取一个网页里所有a标签里的href属性
比较坑的地方是这个网页里有的a标签里没有href属性,所以一运行循环提取a标签的href就可劲的报错,搞得人很焦灼
我尝试用控制循环的次数和字符串的替换来跳过这个坑。
你懂的
都失败了
最后
我将提取href的方式从[‘href’]改为get(‘href’)就逃过这个坑!!!!!!
这个bug!!!好坑!!!
查看全文
相关阅读:
可持久化+Trie || BZOJ 3261最大异或和 || Luogu P4735 最大异或和
费用流+SPFA ||Luogu P3381【模板】最小费用最大流
费用流+SPFA ||【模板】最小费用最大流
Dinic二分图匹配 || Luogu P3386
Dinic最大流 || Luogu P3376 【模板】网络最大流
fhq_treap || BZOJ1861: [Zjoi2006]Book 书架 || Luogu P2596 [ZJOI2006]书架
fhq_treap || BZOJ 3223: Tyvj 1729 文艺平衡树 || Luogu P3391 【模板】文艺平衡树(Splay)
fhq_treap || BZOJ 3224: Tyvj 1728 普通平衡树 || Luogu P3369 【模板】普通平衡树
Manacher || BZOJ 2342: [Shoi2011]双倍回文 || Luogu P4287 [SHOI2011]双倍回文
Manacher || P4555 [国家集训队]最长双回文串 || BZOJ 2565: 最长双回文串
原文地址:https://www.cnblogs.com/phying/p/8832604.html
最新文章
【bzoj1576/Usaco2009 Jan】安全路经Travel——dijkstra+并查集
【bzoj1592/Usaco2008 Feb】Making the Grade 路面修整——dp
【Atcoder Grand Contest 004】D
【Atcoder Grand Contest 010】D
【bzoj1036/ZJOI2008】树的统计Count——树链剖分套(zkw)线段树
[51nod] 1613 翻硬币
[BZOJ] 1833: [ZJOI2010]count 数字计数
[51nod] 1028 大数乘法v2
[51nod] 1040 最大公约数之和
[51nod] 1467 旋转绳
热门文章
[Codeforces] 876F. High Cry
[Codeforces] #441 div.2
[BZOJ] 2083: [Poi2010]Intelligence test
[BZOJ] 1597: [Usaco2008 Mar]土地购买
[UOJ] #128. 【NOI2015】软件包管理器
[Luogu] 金秋集训营提高组 Noip模拟#2 T3 伪神
[BZOJ] 1036: [ZJOI2008]树的统计Count
[UOJ] #78. 二分图最大匹配
[BZOJ] 1712: [Usaco2007 China]Summing Sums 加密
[51nod] 1766 树上的最远点对
Copyright © 2011-2022 走看看