zoukankan      html  css  js  c++  java
  • win下安装wget以及使用wget

    1、 安装wget
    网址:http://gnuwin32.sourceforge.net/packages/wget.htm
    下载http://downloads.sourceforge.net/gnuwin32/wget-1.11.4-1-setup.exe
    双击安装
    2、系统环境变量,新建
    GNU_HOME=D:Program Files (x86)GnuWin32
    3、path添加
    ==========分割线==============
    ;%GNU_HOME%in
    ==========分割线==============
    4、下载整站:
    用wget下载东西,的确很方便,它会自动重连并断点续传。让人很放心。
    经常要下载一个网站或网站的某个目录。
    下载一个目录,例如下载网站www.example.com/目录mydir下的所有内容
    命令如下:
    wget -r -p -k -np -nc -e robots=off http://www.example.com/mydir/

    如果要想下载整个网站,最好去除-np参数。
    wget -r -p -k -nc -e robots=off http://www.example.com/mydir/

    -r 递归;对于HTTP主机,wget首先下载URL指定的文件,然后(如果该文件是一个HTML文档的话)递归下载该文件所引用(超级连接)的所有文件(递 归深度由参数-l指定)。对FTP主机,该参数意味着要下载URL指定的目录中的所有文件,递归方法与HTTP主机类似。
    -c 指定断点续传功能。实际上,wget默认具有断点续传功能,只有当你使用别的ftp工具下载了某一文件的一部分,并希望wget接着完成此工作的时候,才 需要指定此参数。
    -nc 不下载已经存在的文件
    -np 表示不追溯至父目录,不跟随链接,只下载指定目录及子目录里的东西;
    -p 下载页面显示所需的所有文件。比如页面中包含了图片,但是图片并不在/yourdir目录中,而在/images目录下,有此参数,图片依然会被正常下 载。
    -k 修复下载文件中的绝对连接为相对连接,这样方便本地阅读。
    -o down.log 记录日记到down.log
    -e robots=off 忽略robots.txt


    例子:
    wget -r -p -np -k http://www.52dachu.com/
    wget -T 5 -t 10 -Q 500m -nH -r -E -l inf -k -p -np 'http://www.w3school.com.cn/'

  • 相关阅读:
    AT4144[ARC098D]Donation【Kruskal重构树,dp】
    YbtOJ#643机器决斗【贪心,李超树】
    P3273[SCOI2011]棘手的操作【线段树,并查集】
    AT3950[AGC022E]Median Replace【贪心,dp】
    P3760[TJOI2017]异或和【树状数组】
    AT4505[AGC029F]Construction of a tree【构造题,hall定理,网络流】
    Ybt#452序列合并【期望dp】
    AT3949[AGC022D]Shopping【贪心】
    AT4995[AGC034E] Complete Compress【树形dp】
    P4338[ZJOI2018]历史【LCT】
  • 原文地址:https://www.cnblogs.com/yhdsir/p/5729261.html
Copyright © 2011-2022 走看看