zoukankan html css js c++ java

python3 简单web目录扫描脚本（后续更新完整）

做题过程中需要目录遍历，就简单写了扫描脚本，但是还没学到多线程，就先这样吧，后续更新完整

import urllib.request as req
import urllib.error as er,sys
file_hou=['.tar','.tat.gz','.zip','.rar','.bak']
file_name=['web','website','backup','back','www','wwwroot','temp']
f=open("D:/lenovo/desktop/ctfhub.txt",'a',encoding=('utf-8'))
web_success=[]
n=(len(file_name)*len(file_hou))
nn=0
for x in file_name:
    for y in file_hou:
        try:
            url = 'http://taobao.com'+x+y
            webpage = req.urlopen(url)  # 根据超链访问链接的网页
            #print(url + "  ok")
            web_success.append(url)
        except er.HTTPError as e:
            #print(url + "  ", e)#显示错误信息
            pass
        except er.URLError as f:
            #print(url + "  ", f)#显示错误信息
            pass
        except:
            #print(sys.exc_info())#显示错误信息
            raise
        nn+=1
        print("%.2f"%((nn/n)*100),"%")#进度显示
for x in web_success:
    f.write(x)

注意：

urllib2中的HTTPError、URLError异常处理都合并到了urllib中
如果要把结果存到文本中，要以encoding=('utf-8')编码打开文本，txt默认是gbk编码，pycharm也默认使用系统的编码

查看全文

相关阅读:
IO模型（一）
协程（效率最快、重点）--初识协程、gevent模块、协程爬虫、协程socket（一）
servlet工作原理解析
 servlet:servletconfig对象和它在开发过程中的应用场景
 servlet:线程安全问题
 servlet:启动的时机
 servlet:第一个demo
安装myeclipse的一些配置
 同时安装32和64位的jdk
fiddler:网络限速

原文地址：https://www.cnblogs.com/rower/p/12730809.html