zoukankan html css js c++ java

用python正则表达式提取网页的url

 1 import re
 2 import urllib
 3 url="http://www.itokit.com"
 4 s=urllib.urlopen(url).read()
 5 ss=s.replace(" ","")
 6 urls=re.findall(r"<a.*?href=.*?</a>",ss,re.I)
 7 for i in urls:
 8 print i
 9 else:
10 print 'this is over'

挺好用的，记录下

查看全文

相关阅读:
windows下编译及使用libevent
安装和使用memcached
BroadcastReceiver插件化解决方案
 Service插件化解决方案
 Activity插件化解决方案
 换肤-插件化
 资源的插件化
 startActivity进行Hook
代理模式
 对反射的封装

原文地址：https://www.cnblogs.com/mmix2009/p/3221000.html

Copyright © 2011-2022 走看看