teleport使用说明
浏览器下载网页:
只能浏览主页和少数网页,其它不能浏览,容量几百kb
teleport下载项目一
能完全离线看网页,7328多文件 9个JPG文件,大小134M
teleport下载项目二
部分网页采集内容和项目一基本一致,但大几兆
部分网页需要项目二(复制站点)才能浏览,项目一看不到图片
项目二比项目一耗时多,但要全面
视频教程
https://www.youtube.com/watch?v=qt0az3mPK3s
https://www.youtube.com/watch?v=RWB7tS_NdqI
YouTube
![图片](http://r.photo.store.qq.com/psb?/V12tOODF3PCwT1/nMJkAkDRBz*L6JEUAhKi871zb*8RhYs4YeI54E0FA*Q!/o/dHMBAAAAAAAA&ek=1&kp=1&pt=0&bo=9wI3AvcCNwIDACU!&su=189805025&sce=0-12-12&rf=2-9)
离线浏览,网站镜像,文件提取工具
遍历网站的所有链接网址,网站关键字搜索
1. 复制一个可浏览的网站,文件存放在硬盘
2.复制一个网址,包括文件结构
3.在网址搜索指定文件
包括声音,食品,背景图片,zip等等。这种方式速度快。
4.遍历网址所有链接,不会写任何文件到硬盘,此速度很快
5.指定网址下载文件,爬虫不会去其它链接
6.搜索网站关键词
![图片](http://r.photo.store.qq.com/psb?/V12tOODF3PCwT1/qQpZCsXD67yZHak9uQxiXnTZ0JMVgjuL4MJm8*h4yZg!/o/dHABAAAAAAAA&ek=1&kp=1&pt=0&bo=7wKAAv4CjQIDADk!&su=114194225&sce=0-12-12&rf=2-9)
![图片](http://r.photo.store.qq.com/psb?/V12tOODF3PCwT1/cKdorhO5tEXdgOGQA7txQu3ghyGMsWtNpVXfkWLLAGo!/o/dHEBAAAAAAAA&ek=1&kp=1&pt=0&bo=3wLQAd8C0AEDACU!&su=1219990929&sce=0-12-12&rf=2-9)
(算法)工作原理:
1.把开始网址作为起点
2.遍历所有链接
3.对每个链接下载文件
4.重复判断
爬虫很灵活,很多参数可以自己设定。
爬虫有记忆功能,不会采集重复链接或文件
![图片](http://r.photo.store.qq.com/psb?/V12tOODF3PCwT1/tju*z2YYAQMwA9si56WMlrl6rrnhRHGhw*pHBdDrWA8!/o/dHEBAAAAAAAA&ek=1&kp=1&pt=0&bo=6wKDAesCgwEDACU!&su=135090865&sce=0-12-12&rf=2-9)
项目测试
1.抓取一个网址的所有链接
选择遍历网址所有链接,不会写任何文件到硬盘,此速度很快
详细资料可以看到链接信息:
可以看到网站的树状结构
![图片](http://r.photo.store.qq.com/psb?/V12tOODF3PCwT1/9ZcblcdusSwI3divacLzsizA0HZ8UGIQEL4zB4lVpEU!/o/dHABAAAAAAAA&ek=1&kp=1&pt=0&bo=rwPnAa8D5wEDACU!&su=153797265&sce=0-12-12&rf=2-9)
项目:选择第一项,创建一个可浏览的网站副本
打开所在文件夹,搜索index,就是主页,双击就可浏览
![图片](http://r.photo.store.qq.com/psb?/V12tOODF3PCwT1/a2uNK0olVIHa1WWXxn7.QW3Pf0IK7YnLMHdJXuRCRtQ!/o/dHEBAAAAAAAA&ek=1&kp=1&pt=0&bo=cwSAAiAGcQMDAIQ!&su=1165010513&sce=0-12-12&rf=2-9)
终止测试:
终止后,项目被放弃,如果再次启动项目,会重新开始
暂停测试
暂停后,
项目被放弃,如果再次启动项目,会重新开始
脚本之家项目2测试,
下载的网页不全,有点打不开
工标网不能每页采集,此软件功能有限,寻找新的软件
https://www.youtube.com/watch?v=qt0az3mPK3s
https://www.youtube.com/watch?v=RWB7tS_NdqI
YouTube
How to use Teleport Pro (Footprinting and Reconnaissance)
离线浏览,网站镜像,文件提取工具
遍历网站的所有链接网址,网站关键字搜索
1. 复制一个可浏览的网站,文件存放在硬盘
2.复制一个网址,包括文件结构
3.在网址搜索指定文件
包括声音,食品,背景图片,zip等等。这种方式速度快。
4.遍历网址所有链接,不会写任何文件到硬盘,此速度很快
5.指定网址下载文件,爬虫不会去其它链接
6.搜索网站关键词
(算法)工作原理:
1.把开始网址作为起点
2.遍历所有链接
3.对每个链接下载文件
4.重复判断
爬虫很灵活,很多参数可以自己设定。
爬虫有记忆功能,不会采集重复链接或文件
项目测试
1.抓取一个网址的所有链接
选择遍历网址所有链接,不会写任何文件到硬盘,此速度很快
详细资料可以看到链接信息:
可以看到网站的树状结构
项目:选择第一项,创建一个可浏览的网站副本
打开所在文件夹,搜索index,就是主页,双击就可浏览
终止测试:
终止后,项目被放弃,如果再次启动项目,会重新开始
暂停测试
暂停后,
项目被放弃,如果再次启动项目,会重新开始
脚本之家项目2测试,
下载的网页不全,有点打不开
工标网不能每页采集,此软件功能有限,寻找新的软件