zoukankan      html  css  js  c++  java
  • 我用wget干的事

    1、下载网站某个目录

    wget -c -r -np -k -L -p www.xxx.org/pub/path/
    • -c 断点续传
    • -r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件
    • -np 递归下载时不搜索上层目录,如wget -c -r www.xxx.org/pub/path/

        没有加参数-np,就会同时下载path的上一级目录pub下的其它文件

    • -k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数
    • -L 递归时不进入其它主机,如wget -c -r www.xxx.org/ 

        如果网站内有一个这样的链接: www.yyy.org,不加参数-L,就会像大火烧山一样,会递归下载www.yyy.org网站

    • -p 下载网页所需的所有文件,如图片等
    • -i 后面跟一个文件,文件内指明要下载的URL

    2、下载某一网页上所有的图片

    wget -e robots=off -r -nd -A.jpg http://tieba.baidu.com/p/1452400780
    • -e, –-execute=COMMAND 

        执行wgetrc命令。此处-e robots=off意思是忽略网站的robots.txt。

    • -nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录
    • -A 指定要下载的文件样式列表,多个样式用逗号分隔。如-A.jpg或-A jpg,png,gif。

    <---------------------待续------------------------->

  • 相关阅读:
    子网划分
    数据报分片
    CRC校验
    内部网关协议RIP与OSPF的特点、区别
    简述协议与服务的区别、关系
    算法思想
    上机实验题7--求解装载问题
    上机实验题6--求最长单调递增子序列
    python进程和线程
    python序列化操作
  • 原文地址:https://www.cnblogs.com/cloud2rain/p/3022807.html
Copyright © 2011-2022 走看看