zoukankan      html  css  js  c++  java
  • wget 递归下载整个网站(网站扒皮必备)

    有时间看到别人网站的页面比较漂亮,就想给扒皮下来,学习学习。分享一个我常用网站扒皮命令wget
    这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接。

    wget加上参数之后,即可成为相当强大的下载工具。

    wget命令详解:

    wget -r -p -np -k http://xxx.com/xxx

    -r, --recursive(递归) specify recursive download.(指定递归下载)
    -k, --convert-links(转换链接) make links in downloaded HTML point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接)
    -p, --page-requisites(页面必需元素) get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)
    -np, --no-parent(不追溯至父级) don't ascend to the parent directory.

    另外断点续传用-nc参数 日志 用-o参数

    拿一个的网站扒皮试一下吧
    执行 wget -r -p -np -k https://wujunze.com/ 命令
    wget.png

    等网站递归下载完毕,你会发现你当前目录会有一个 wujunze.com的目录
    进入这个目录看一下
    file.png
    熟练掌握wget命令,可以帮助你扒皮网站。

  • 相关阅读:
    BZOJ 4503: 两个串 FFT
    [FJOI2014]最短路径树问题
    [JSOI2009]游戏Game
    bzoj 2463 [中山市选2009]谁能赢呢?
    [CQOI2007]余数求和
    [NOI2011]兔兔与蛋蛋游戏
    [HNOI2015]实验比较
    bzoj2125 最短路
    [COGS 2877]老m凯的疑惑
    [HNOI2015]开店
  • 原文地址:https://www.cnblogs.com/aksir/p/6777875.html
Copyright © 2011-2022 走看看