最近在整理用于暴力破解的字典,目的是用于Web平台的弱口令爆破、破解忘记密码的压缩包、office文档等。
只是靠工具盲目的生成随机字典命中率会不高,于是决定把近几年网上泄露的一些数据库的密码合并并去重和排序。
这里简单分享下整理步骤:
第一步先把字典整理成每行一个密码的状态,这个过程可能需要用到正则表达式去进行处理。
如果是多个文件则需要对文本进行合并,可使用工具或者CMD命令把多个字典内的密码合并。
Windows系统可以直接使用CMD命令:
copy A.txt B.txt C.txt D.txt N.txt > 合并.txt
图形化工具推荐以下两款,处理过几个较大的文件都合并成功了,没有出现软件崩溃的情况。
另一款工具:
Linux系统可使用以下命令进行合并:
cat A.txt B.txt C.txt N.txt > 合并.txt
合并后对字典文件进行去重和排序:
Linux下使用该命令:
sort 合并.txt | uniq > 去重排序.txt
Windows去重工具推荐这一款,按照名字去搜很容易就找到了,这里就不附上下载链接了。