爬取乌云的最后日期大概是16年2月,十个压缩包,图文并茂,唯一的缺点就是少个目录,于是写了个按照漏洞标题生成目录的脚本
import os f0= open('index.html', 'w') cnt=1 list=os.listdir('bugs'); for i in range(0,len(list)): path=os.path.join('bugs',list[i]) if os.path.isfile(path): f=open(path,'r'); t=0; for li in f.readlines(): t=t+1; if t==6: f0.write('<li><a href="'+path+'">'+' '+li[7:-22]+'</a></li>'+' ') break cnt=cnt+1 f.close() f0.close() print cnt #40294 means success #this script cost about 1min or so