zoukankan      html  css  js  c++  java
  • 文件同步之rsync

    第一章 文件同步之rsync

    官方网址:https://rsync.samba.org/

    一、rsync介绍

    1.1 什么是rsync

    Rsync是一款快速且非常通用的远程和本地文件复制工具,是可以实现增量备份的工具。配合任务计划,rsync能实现定时或间隔同步,配合inotify或sersync,可以实现触发式的实时同步

    Rsync使用三角传输算法,它提供了一种非常快速的方法来实现远程文件的同步。它只需通过链接发送文件的差异,而不需要事先将两套文件都存在于链接的一端。乍一看,这似乎是不可能的,因为计算两个文件之间的差异通常需要对两个文件进行本地访问

    1.2 rsync同步基本说明

    rsync的目的是实现本地主机和远程主机上的文件同步(包括本地推到远程,远程拉到本地两种同步方式),也可以实现本地不同路径下文件的同步,但不能实现远程路径1到远程路径2之间的同步(scp可以实现)

    rsync同步过程中由两部分模式组成:决定哪些文件需要同步的检查模式以及文件同步时的同步模式。

    (1).检查模式是指按照指定规则来检查哪些文件需要被同步,例如哪些文件是明确被排除不传输的。默认情况下,rsync使用"quick check"算法快速检查源文件和目标文件的大小、mtime(修改时间)是否一致,如果不一致则需要传输。当然,也可以通过在rsync命令行中指定某些选项来改变quick check的检查模式,比如"--size-only"选项表示"quick check"将仅检查文件大小不同的文件作为待传输文件。rsync支持非常多的选项,其中检查模式的自定义性是非常有弹性的。

    (2).同步模式是指在文件确定要被同步后,在同步过程发生之前要做哪些额外工作。例如上文所说的是否要先删除源主机上没有但目标主机上有的文件,是否要先备份已存在的目标文件,是否要追踪链接文件等额外操作。rsync也提供非常多的选项使得同步模式变得更具弹性

    1.3 rsync三种工作方式

    以下是rsync语法

    Local:  rsync [OPTION...] SRC... [DEST]
     
    Access via remote shell:
      Pull: rsync [OPTION...] [USER@]HOST:SRC... [DEST]
      Push: rsync [OPTION...] SRC... [USER@]HOST:DEST
     
    Access via rsync daemon:
      Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST]
            rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
      Push: rsync [OPTION...] SRC... [USER@]HOST::DEST
            rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
            
    SRC-源文件路径  DEST-目标路径
    

    语法可知,rsync有三种工作方式

    (1).本地文件系统上实现同步。命令行语法格式为上述"Local"段的格式。

    (2).本地主机使用远程shell和远程主机通信。命令行语法格式为上述"Access via remote shell"段的格式。

    (3).本地主机通过网络套接字连接远程主机上的rsync daemon。命令行语法格式为上述"Access via rsync daemon"段的格式。

    一般性问题说明

    rsync有两种不同的方式来联系远程系统:

    1、使用远程shell作为传输方式(ssh、rsh)

    当源路径或目标路径在主机规格后包含一个冒号(:)分隔符时,就会使用远程shell传输
    

    2、通过TCP直接联系rsync守护进程

    当源路径或目标路径在主机规范后包含双冒号(::)分隔符,或者指定了rsync://URL时,
    就会直接联系rsync守护进程(参见 "通过远程壳连接使用RSYNC-DAEMON功能
    

    3、特殊情况,如果有源文件路径却没有目标文件路径,那文件会类似“ls -l”格式列出

     [root@vm11 ~]# rsync 192.168.130.11:/tmp/              # 列出远程主机上/tmp/目录下的文件列表
    

    4、源路径如果是一个目录的话,带上尾随斜线和不带尾随斜线是不一样的,不带尾随斜线表示的是整个目录包括目录本身,带上尾随斜线表示的是目录中的文件,不包括目录本身。

    [root@vm11 ~]# rsync -a /etc /tmp
    [root@vm11 ~]# rsync -a /etc/ /tmp
    

    rsync(一):基本命令和用法

    1.4 rsync选项说明

    -v, --verbose 详细模式输出。
    -q, --quiet 精简输出模式。
    -c, --checksum 打开校验开关,强制对文件传输进行校验。
    -a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD。
    -r, --recursive 对子目录以递归模式处理。
    -R, --relative 使用相对路径信息。
    -b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
    --backup-dir 将备份文件(如~filename)存放在在目录下。
    -suffix=SUFFIX 定义备份文件前缀。
    -u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件,不覆盖更新的文件。
    -l, --links 保留软链结。
    -L, --copy-links 想对待常规文件一样处理软链结。
    --copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结。
    --safe-links 忽略指向SRC路径目录树以外的链结。
    -H, --hard-links 保留硬链结。
    -p, --perms 保持文件权限。
    -o, --owner 保持文件属主信息。
    -g, --group 保持文件属组信息。
    -D, --devices 保持设备文件信息。
    -t, --times 保持文件时间信息。
    -S, --sparse 对稀疏文件进行特殊处理以节省DST的空间。
    -n, --dry-run现实哪些文件将被传输。
    -w, --whole-file 拷贝文件,不进行增量检测。
    -x, --one-file-system 不要跨越文件系统边界。
    -B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节。
    -e, --rsh=command 指定使用rsh、ssh方式进行数据同步。
    --rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息。
    -C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件。
    --existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件。
    --delete 删除那些DST中SRC没有的文件。
    --delete-excluded 同样删除接收端那些被该选项指定排除的文件。
    --delete-after 传输结束以后再删除。
    --ignore-errors 及时出现IO错误也进行删除。
    --max-delete=NUM 最多删除NUM个文件。
    --partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输。
    --force 强制删除目录,即使不为空。
    --numeric-ids 不将数字的用户和组id匹配为用户名和组名。
    --timeout=time ip超时时间,单位为秒。
    -I, --ignore-times 不跳过那些有同样的时间和长度的文件。
    --size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间。
    --modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0。
    -T --temp-dir=DIR 在DIR中创建临时文件。
    --compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份。
    -P 等同于 --partial。
    --progress 显示备份过程。
    -z, --compress 对备份的文件在传输时进行压缩处理。
    --exclude=PATTERN 指定排除不需要传输的文件模式。
    --include=PATTERN 指定不排除而需要传输的文件模式。
    --exclude-from=FILE 排除FILE中指定模式的文件。
    --include-from=FILE 不排除FILE指定模式匹配的文件。
    --version 打印版本信息。
    --address 绑定到特定的地址。
    --config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件。
    --port=PORT 指定其他的rsync服务端口。
    --blocking-io 对远程shell使用阻塞IO。
    -stats 给出某些文件的传输状态。
    --progress 在传输时现实传输过程。
    --log-format=formAT 指定日志文件格式。
    --password-file=FILE 从FILE中得到密码。
    --bwlimit=KBPS 限制I/O带宽,KBytes per second。
    -h, --help 显示帮助信息。
    

    1.5 实例

    1.5.0 同步时删除多余文件

    在服务器A上同步/opt/work目录到远程服务器B的/tmp/work目录下同时删除B服务器/work/jira/data/目录下相比于A服务器/tmp/work中多余的文件,最近在处理策划资源文件的时候需要将目录A的文件全部同步到目录B的文件,并且把目录B内多余的文件全部删除掉。所以,就想到了使用rsync的--delete参数来实现功能

    1)A服务器
    [root@serverA ~]# cd /tmp/work
    [root@serverA work]# ls
    a b c d 11
    
    2)B服务器
    [root@serverB ~]# cd /tmp/work
    [root@serverB work]# ls
    c d 11 12 13 fg 5t
    
    3)从A服务器同步到B服务器(假设B服务器ip是192.168.130.11)
    [root@serverA work]#rsync -avzP --delete rsync -avzhP --delete  itadmin@192.168.130.11:/opt/data/ /work/jira/data/    #注意,--delete参数要放在源目录和目标目录前,并且两个目录结构一定要一致!不能使用./*
    sending incremental file list
    ./
    deleting fg
    deleting 5t
    deleting 13
    deleting 12
    11
    a
    b
    c
    d
    

    1.5.1 保留同步文件权限、属主、属组等信息

    rsync -avz /path/to/dirA/ /path/to/dirB/
    

    1.5.2 不同步一些文件和目录

    
    rsync -avz --exclude="fileA1.txt" --exclude="/path/to/dirA/test/" /path/to/dirA/ /path/to/dirB/
    
    rsync -avz --exclude 'fileA1.txt' --exclude '/path/to/dirA/test/' /path/to/dirA/ /path/to/dirB/
    

    1.5.3 拷贝本地文件

    rsync -ahvz backup.tar.gz  dirA/  # DESC 不存在时自动创建
    
    rsync -ahvz backup.tar.gz  /path/to/dirA/ /path/to/dirB/
    

    1.5.4 shell拷贝到远程(推送)

    rsync -avz  /path/to/dirA/  user@remoteip:/path/to/dirB/
    

    1.5.5 shell拷贝到本地(拉取)

    rsync -avz user@remoteip:/path/to/dirA/ /path/to/dirB/
    

    1.5.6 远程rsync服务器拷贝到本地

    rsync -av user@remoteip::www /path/to/dirB/    #www为rsync模块命令
    

    1.5.7 拷贝本地文件到rsync服务器

    rsync -av /path/to/dirB/ user@remoteip::www 
    

    1.5.8 rsync 使用非默认端口传输

    rsync -avz -e "ssh -p $port"/path/to/dirA/ user@remoteip:/path/to/dirB/
    

    1.5.9 显示备份进度

    可以使用 --progress或者P 选项来显示进度

    rsync -avzhe ssh --progress /path/to/dirA/ root@remoteip:/path/to/dirB/
    

    使用 rsync 增量同步备份文件

  • 相关阅读:
    友盟上报 IOS
    UTF8编码
    Hill加密算法
    Base64编码
    Logistic Regression 算法向量化实现及心得
    152. Maximum Product Subarray(中等, 神奇的 swap)
    216. Combination Sum III(medium, backtrack, 本类问题做的最快的一次)
    77. Combinations(medium, backtrack, 重要, 弄了1小时)
    47. Permutations II(medium, backtrack, 重要, 条件较难思考)
    3.5 find() 判断是否存在某元素
  • 原文地址:https://www.cnblogs.com/pansn/p/13356467.html
Copyright © 2011-2022 走看看