zoukankan      html  css  js  c++  java
  • 乌云精华漏洞爬取匹配

    # -*- coding:utf-8 -*-
    import urllib
    import urllib2
    import re
    import sys

    reload(sys)

    sys.setdefaultencoding('utf-8')
    page=1
    file_object=open('jinghua.txt','w')
    while (page<4418):
        url="http://wooyun.org/bugs/page/"+str(page)
        try:
            request=urllib2.Request(url)
            response=urllib2.urlopen(request)
            #print response.read()
            content = response.read().decode('utf-8')
            pattern = re.compile('<td><a.*?href="(.*?)">(.*?)</a>(.*?)</td>',re.S)
            items = re.findall(pattern,content)
            for item in items:
                haveImg=re.search('credit.png',item[2])
                if haveImg:
                    #print item[0]+" ",item[1]
                    file_object.write(item[0]+" "+item[1]+" ")
        except urllib2.URLError,e:
            if hasattr(e,"code"):
                print e.code
            if hasattr(e,"reason"):
                print e.reason
        page=page+1
    file_object.close()
    View Code
  • 相关阅读:
    Singleton模式
    Factory模式
    AbstactFactory模式
    Maven的介绍及使用
    MySQL索引分析及使用
    Runnable接口和Callable接口的区别
    Java中的常见数学运算
    mkdir()和mkdirs()区别
    面试小问题——Object中有哪些常用方法?
    面试小问题——什么是多态?
  • 原文地址:https://www.cnblogs.com/shellr00t/p/5220984.html
Copyright © 2011-2022 走看看