zoukankan      html  css  js  c++  java
  • 乌云精华漏洞爬取匹配

    # -*- coding:utf-8 -*-
    import urllib
    import urllib2
    import re
    import sys

    reload(sys)

    sys.setdefaultencoding('utf-8')
    page=1
    file_object=open('jinghua.txt','w')
    while (page<4418):
        url="http://wooyun.org/bugs/page/"+str(page)
        try:
            request=urllib2.Request(url)
            response=urllib2.urlopen(request)
            #print response.read()
            content = response.read().decode('utf-8')
            pattern = re.compile('<td><a.*?href="(.*?)">(.*?)</a>(.*?)</td>',re.S)
            items = re.findall(pattern,content)
            for item in items:
                haveImg=re.search('credit.png',item[2])
                if haveImg:
                    #print item[0]+" ",item[1]
                    file_object.write(item[0]+" "+item[1]+" ")
        except urllib2.URLError,e:
            if hasattr(e,"code"):
                print e.code
            if hasattr(e,"reason"):
                print e.reason
        page=page+1
    file_object.close()
    View Code
  • 相关阅读:
    Java工具类——UUIDUtils
    Python中的split()函数的用法
    学习笔记
    hdu 1558 线段相交+并查集
    hdu 4609 FFT
    hdu1402 FFT入门
    多项式乘法快速算法
    FFT
    GDUT校赛
    light oj 1236 分解质因数
  • 原文地址:https://www.cnblogs.com/shellr00t/p/5220984.html
Copyright © 2011-2022 走看看