zoukankan      html  css  js  c++  java
  • teleport使用说明

     

     
     
    teleport使用说明

    浏览器下载网页:
    只能浏览主页和少数网页,其它不能浏览,容量几百kb

    teleport下载项目一
    能完全离线看网页,7328多文件 9个JPG文件,大小134M


    teleport下载项目二
    部分网页采集内容和项目一基本一致,但大几兆
    部分网页需要项目二(复制站点)才能浏览,项目一看不到图片
    项目二比项目一耗时多,但要全面

    视频教程
    https://www.youtube.com/watch?v=qt0az3mPK3s


    https://www.youtube.com/watch?v=RWB7tS_NdqI

    YouTube

    How to use Teleport Pro (Footprinting and Reconnaissance)





    图片

    离线浏览,网站镜像,文件提取工具

    遍历网站的所有链接网址,网站关键字搜索


    1. 复制一个可浏览的网站,文件存放在硬盘
    2.复制一个网址,包括文件结构
    3.在网址搜索指定文件
    包括声音,食品,背景图片,zip等等。这种方式速度快。
    4.遍历网址所有链接,不会写任何文件到硬盘,此速度很快
    5.指定网址下载文件,爬虫不会去其它链接
    6.搜索网站关键词
    图片

    图片



    (算法)工作原理:
    1.把开始网址作为起点
    2.遍历所有链接
    3.对每个链接下载文件
    4.重复判断

    爬虫很灵活,很多参数可以自己设定。
    爬虫有记忆功能,不会采集重复链接或文件
    图片




    项目测试
    1.抓取一个网址的所有链接
    选择遍历网址所有链接,不会写任何文件到硬盘,此速度很快
    详细资料可以看到链接信息:
    图片


    可以看到网站的树状结构
    图片


    项目:选择第一项,创建一个可浏览的网站副本
    打开所在文件夹,搜索index,就是主页,双击就可浏览

    图片






    终止测试:
    终止后,项目被放弃,如果再次启动项目,会重新开始


    暂停测试
    暂停后,
    项目被放弃,如果再次启动项目,会重新开始





    脚本之家项目2测试,
    下载的网页不全,有点打不开




    工标网不能每页采集,此软件功能有限,寻找新的软件


  • 相关阅读:
    面试可能遇到的关联式容器(map、set等)相关问题
    C++学习 STL组件之vector部分总结
    C++ 菱形虚拟继承 与 指针偏移问题
    C++ 关键字 explicit 的使用
    C++ sort()排序函数用法
    C++ 字符流 stringstream
    C/C++ 每日一题
    C/C++ 超长正整数相加
    C++ 二叉搜索树原理及其实现
    Tomcat安装
  • 原文地址:https://www.cnblogs.com/webRobot/p/5219337.html
Copyright © 2011-2022 走看看