zoukankan      html  css  js  c++  java
  • 爬站软件teleport ultra

    之前领导安排了一任务,就是想要把一网站上的东西爬下来,然后改点东西,自己再做一个静态站放到自己的内建服务器上;

    其实就想想看这种需求其实却是还蛮多的;

    因此一个强大的网站爬虫还是需要的:

    推荐

    爬站利器-teleport ultra

    下载地址:https://pan.baidu.com/s/1lDN47o6GeR4uKFB9xOqGUQ

    下载完成后一路安装即可:

    打开软件操作界面:

    第一步:

    首先点击这个新建向导:

     第二步:

    第一个单选:在我的硬盘中创建一个可浏览的网站
    第二个单选:复制一个网站,包含该网站的目录结构
    第三个单选:在一个网站中搜索指定的文件类型
    第四个单选:从一个中心站点探测每一个链接的站点
    第五个单选:在已知地址下载一个或多个文件
    第六个单选:在一个网站中搜索指定关键字

    ** 这里我们使用第一个或者第二个都可以,都能够拉取静态资源,第一个下载的内容会直接将所有文件放入一个文件夹中,第二个会自动创建对应的目录,我们选择第一个**

    第三步:

     第四步:

     第五步:

    点击完成后选择保存文件路径;

    第六步:

    启动复制;

     就可以看到爬下来站点的东西了;

    但是我在爬取某个页面时也出现了无法爬取的错误,不知道是什么问题。

  • 相关阅读:
    二维数组中的查找
    排序算法——冒泡、选择、插入
    排序算法——快速、归并
    最小的K个数
    重建二叉树
    反转链表
    LeetCode 278 第一个错误的版本
    LeetCode 929 独特的电子邮件地址
    LeetCode 38 报数
    模型参数初始化
  • 原文地址:https://www.cnblogs.com/LeeSki/p/14188715.html
Copyright © 2011-2022 走看看