zoukankan      html  css  js  c++  java
  • inotify + rsync 方式实现数据同步

    工作原理:

    要利用监控服务(inotify),监控同步数据服务器目录中信息的变化
    发现目录中数据产生变化,就利用rsync服务推送到备份服务器上
    

    inotify:

    异步的文件系统事件监控机制,利用事件驱动机制,而无须通过诸如cron等的轮询机制来获取事件,
    linux内核从2.6.13起支持 inotify,通过inotify可以监控文件系统中添加、删除,修改、移动等各种事件

    实现inotify软件:

    inotify-tools

    sersync

    lrsyncd

    inotify+rsync使用方式

    inotify 对同步数据目录信息的监控

    rsync 完成对数据的同步

    利用脚本进行结合

    内核是否支持inotify:
    Linux支持inotify的内核最小版本为 2.6.13,参看man 7 inotify

    inotify 内核参数说明:

    max_queued_events:inotify 事件队列最大长度,如值太小会出现 Event Queue Overflow 错
    误,默认值:16384, 生产环境建议调大,比如:327679
    max_user_instances:每个用户创建inotify实例最大值,默认值:128
    max_user_watches:可以监视的文件的总数量(inotifywait 单进程),默认值:8192,建议调大
    

    范例:

    [root@data-centos8 ~]# vim /etc/sysctl.conf
    fs.inotify.max_queued_events=66666
    fs.inotify.max_user_watches=100000
    
    [root@centos8 ~]# sysctl -p
    fs.inotify.max_queued_events = 66666
    fs.inotify.max_user_watches = 100000
    [root@centos8 ~]# cat /proc/sys/fs/inotify/*
    66666
    128
    100000
    

    inotify-tools工具

    inotify-tools参考文档:https://github.com/rvoicilas/inotify-tools/wiki
    

    安装inotify-tools:基于epel源

    [root@data-centos8 ~]# yum -y install inotify-tools
    

    inotify-tools包主要工具:
    inotifywait: 在被监控的文件或目录上等待特定文件系统事件(open ,close,delete等)发生,常用于实时同步的目录监控
    inotifywatch:收集被监控的文件系统使用的统计数据,指文件系统事件发生的次数统计
    inotifywait 命令
    格式:

    inotifywait [ options ] file1 [ file2 ] [ file3 ] [ ... ]
    

    常用选项:

    -m, --monitor 始终保持事件监听
    -d, --daemon 以守护进程方式执行,和-m相似,配合-o使用
    -r, --recursive 递归监控目录数据信息变化
    -q, --quiet 输出少量事件信息
    --exclude <pattern> 指定排除文件或目录,使用扩展的正则表达式匹配的模式实现
    --excludei <pattern> 和exclude相似,不区分大小写
    -o, --outfile <file> 打印事件到文件中,相当于标准正确输出,注意:使用绝对路径
    -s, --syslogOutput 发送错误到syslog相当于标准错误输出
    --timefmt <fmt> 指定时间输出格式
    --format <fmt> 指定的输出格式;即实际监控输出内容
    -e 指定监听指定的事件,如果省略,表示所有事件都进行监听
    

    inotifywait 的--timefmt 时间格式
    参考 man 3 strftime

    %Y #年份信息,包含世纪信息
    %y #年份信息,不包括世纪信息
    %m #显示月份,范围 01-12
    %d #每月的第几天,范围是 01-31
    %H #小时信息,使用 24小时制,范围 00-23
    %M #分钟,范围 00-59
    %S #秒,范例 0-60
    

    范例:

    --timefmt "%Y-%m-%d %H:%M:%S"
    

    inotifywait 的 --format 格式定义

    %T #输出时间格式中定义的时间格式信息,通过 --timefmt option 语法格式指定时间信息
    %w #事件出现时,监控文件或目录的名称信息,相当于dirname
    %f #事件出现时,将显示监控目录下触发事件的文件或目录信息,否则为空,相当于basename
    %e #显示发生的事件信息,不同的事件默认用逗号分隔
    %Xe #显示发生的事件信息,不同的事件指定用X进行分隔
    

    范例:

    --format "%T %w%f event: %;e"
    --format '%T %w %f'
    

    inotifywait -e 选项指定的事件类型

    create #文件或目录创建
    delete #文件或目录被删除
    modify #文件或目录内容被写入
    attrib #文件或目录属性改变
    close_write #文件或目录关闭,在写入模式打开之后关闭的
    close_nowrite #文件或目录关闭,在只读模式打开之后关闭的
    close #文件或目录关闭,不管读或是写模式
    open #文件或目录被打开
    lsdir #浏览目录内容
    moved_to #文件或目录被移动到监控的目录中
    moved_from #文件或目录从监控的目录中被移动
    move #文件或目录不管移动到或是移出监控目录都触发事件
    access #文件或目录内容被读取
    delete_self #文件或目录被删除,目录本身被删除
    unmount #取消挂载
    

    范例:

    -e create,delete,moved_to,close_write,attrib
    

    范例:使用inotifywait

    #监控一次性事件
    inotifywait /data/www
    Setting up watches.
    Watches established.
    /data/www/ CREATE f1.txt
    
    #持续前台监控
    inotifywait -mrq /data/www --exclude=".*.swx|.swp"
    /data/www/ OPEN f1.txt
    /data/www/ ACCESS f1.txt
    /data/www/ CLOSE_NOWRITE,CLOSE f1.txt
    
    #持续后台监控,并记录日志
    inotifywait -o /root/inotify.log -drq /data/www --timefmt "%Y-%m-%d %H:%M:%S" --format "%T %w%f event: %e"
    
    #持续前台监控特定事件
    inotifywait -mrq /data/www --timefmt "%F %H:%M:%S" --format "%T %w%f event: %;e" -e create,delete,moved_to,close_write,attrib
    

    rsync

    rsync 常用于做为 linux系统下的数据镜像备份工具,实现远程同步,支持本地复制,或者与其他SSH、
    rsync主机同步数据,支持增量备份,配合任务计划,rsync能实现定时或间隔同步,配合inotify或
    sersync,可以实现触发式的实时数据同步
    官方网站: http://rsync.samba.org/
    软件包:rsync,rsync-daemon(CentOS 8)
    服务文件:/usr/lib/systemd/system/rsyncd.service
    配置文件:/etc/rsyncd.conf
    端口:873/tcp
    

    rsync命令

    rsync 格式

    #Local:
    rsync [OPTION...] SRC... [DEST]
    #Access via remote shell:
    Pull:
    rsync [OPTION...] [USER@]HOST:SRC... [DEST]
    Push:
    rsync [OPTION...] SRC... [USER@]HOST:DEST
    #Access via rsync daemon:
    Pull:
    rsync [OPTION...] [USER@]HOST::SRC... [DEST]
    rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
    Push:
    rsync [OPTION...] SRC... [USER@]HOST::DEST
    rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
    The ':' usages connect via remote shell, while '::' & 'rsync://' usages connect
    to an rsync daemon, and require SRC or DEST to start with a module name.
    

    rsync有三种工作方式:

    1. 本地文件系统上实现同步。命令行语法格式为上述"Local"段的格式。
    2. 本地主机使用远程shell和远程主机通信。命令行语法格式为上述"Access via remote shell"段的格
      式。
    3. 本地主机通过网络套接字连接远程主机上的rsync daemon。命令行语法格式为上述"Access via
      rsync daemon"段的格式。
      前两者的本质是通过本地或远程shell,而第3种方式则是让远程主机上运行rsyncd服务,使其监听在一
      个端口上,等待客户端的连接。

    常见选项:

    -v:显示rsync过程中详细信息。可以使用"-vvvv"获取更详细信息。
    -P:显示文件传输的进度信息。(实际上"-P"="--partial --progress",其中的"--progress"才是显
    示进度信息的)。
    -n --dry-run :仅测试传输,而不实际传输。常和"-vvvv"配合使用来查看rsync是如何工作的。
    -a --archive :归档模式,表示递归传输并保持文件属性。等同于"-rtopgDl"。
    -r --recursive:递归到目录中去。
    -t --times:保持mtime属性。强烈建议任何时候都加上"-t",否则目标文件mtime会设置为系统时间,导
    致下次更新
    :检查出mtime不同从而导致增量传输无效。
    -o --owner:保持owner属性(属主)。
    -g --group:保持group属性(属组)。
    -p --perms:保持perms属性(权限,不包括特殊权限)。
    -D :是"--device --specials"选项的组合,即也拷贝设备文件和特殊文件。
    -l --links:如果文件是软链接文件,则拷贝软链接本身而非软链接所指向的对象
    -z :传输时进行压缩提高效率
    -R --relative:使用相对路径。意味着将命令行中指定的全路径而非路径最尾部的文件名发送给服务端,
    包括它们的属性。用法见下文示例。
    --size-only :默认算法是检查文件大小和mtime不同的文件,使用此选项将只检查文件大小。
    -u --update :仅在源mtime比目标已存在文件的mtime新时才拷贝。注意,该选项是接收端判断的,不会
    影响删除行为。
    -d --dirs :以不递归的方式拷贝目录本身。默认递归时,如果源为"dir1/file1",则不会拷贝dir1
    目录,使用该选项将拷贝dir1但不拷贝file1。
    --max-size :限制rsync传输的最大文件大小。可以使用单位后缀,还可以是一个小数值(例如:"--
    max-size=1.5m")
    --min-size :限制rsync传输的最小文件大小。这可以用于禁止传输小文件或那些垃圾文件。
    --exclude :指定排除规则来排除不需要传输的文件。
    --delete :以SRC为主,对DEST进行同步。多则删之,少则补之。注意"--delete"是在接收端执行
    的,所以它是在
    :exclude/include规则生效之后才执行的。
    -b --backup :对目标上已存在的文件做一个备份,备份的文件名后默认使用"~"做后缀。
    --backup-dir:指定备份文件的保存路径。不指定时默认和待备份文件保存在同一目录下。
    -e :指定所要使用的远程shell程序,默认为ssh。
    --port :连接daemon时使用的端口号,默认为873端口。
    --password-file:daemon模式时的密码文件,可以从中读取密码实现非交互式。注意,这不是远程shell
    认证的密码,而是rsync模块认证的密码。
    -W --whole-file:rsync将不再使用增量传输,而是全量传输。在网络带宽高于磁盘带宽时,该选项比增
    量传输更高效。
    --existing :要求只更新目标端已存在的文件,目标端还不存在的文件不传输。注意,使用相对路径时如
    果上层目录不存在也不会传输。
    --ignore-existing:要求只更新目标端不存在的文件。和"--existing"结合使用有特殊功能,见下文示例。
    --remove-source-files:要求删除源端已经成功传输的文件
    

    案例:

    范例:两种格式访问 rsync daemon 服务

    #back安装软件
    [root@centos8 ~]# yum install rsync-daemon -y
    
    #server安装软件
    [root@centos8 ~]# yum install rsync -y
    
    #在备份服务器启动 rsync 进程
    [root@backup-centos8 ~]# rsync --daemon
    Failed to parse config file: /etc/rsyncd.conf
    [root@backup-centos8 ~]# touch /etc/rsyncd.conf
    [root@backup-centos8 ~]# rsync --daemon
    [root@backup-centos8 ~]# ss -ntlp|grep rsync
    LISTEN 0 5 0.0.0.0:873 0.0.0.0:*
    users:(("rsync",pid=2921,fd=4))
    LISTEN 0 5 [::]:873 [::]:*
    users:(("rsync",pid=2921,fd=5))
    
    [root@backup-centos8 ~]# cat /etc/rsyncd.conf
    [backup]
    path = /data/backup/
    read only = no #指定可读写,默认只读
    
    ##back
    #指定目录给nobody权限,默认用户以nobody访问此目录
    [root@backup-centos8 ~]# setfacl -m u:nobody:rwx /data/backup/
    
    ##server(注意:backup-server都是备机的ip:172.31.0.28)
    #查看rsync服务器的模块名称
    [root@data-centos8 ~]# rsync rsync://backup-server
    backup
    [root@data-centos8 ~]#rsync backup-server::
    backup
    
    #访问rsync服务器的共享目录
    #推
    [root@data-centos8 ~]# rsync /etc/networks root@backup-server::backup #默认所有
    用户都映射为nobody用户
    [root@data-centos8 ~]# rsync /etc/issue long@backup-server::backup #默认所有
    用户都映射为nobody用户
    [root@data-centos8 ~]# rsync /etc/passwd backup-server::backup
    [root@data-centos8 ~]# rsync /etc/shells rsync://root@backup-server/backup
    
    #拉
    [root@data-server ~]# rsync backup-server::backup/* /opt
    [root@data-server ~]# rsync rsync://backup-server/backup/* /mnt
    

    范例:以独立服务方式运行 rsync并实现验证功能

    [root@backup-centos8 ~]# dnf -y install rsync-daemon
    #创建rsync服务器的配置文件
    
    [root@centos8 ~]# vim /etc/rsyncd.conf
    uid = root #提定以哪个用户来访问共享目录,将之指定为生成的文件所有者,默认为nobody
    gid = root #默认为nobody
    #port = 875 可指定非标准端口,默认873/tcp
    #use chroot = no
    max connections = 0
    ignore errors
    exclude = lost+found/
    log file = /var/log/rsyncd.log
    pid file = /var/run/rsyncd.pid
    lock file = /var/run/rsyncd.lock
    reverse lookup = no
    #hosts allow = 172.31.0.0/16
    [backup] #每个模块名对应一个不同的path目录,如果同名后面模块生效
    path = /data/backup/
    comment = backup dir
    read only = no #默认是yes,即只读
    auth users = rsyncuser #默认anonymous可以访问rsync服务器
    secrets file = /etc/rsync.pas
    
    #服务器端准备目录
    [root@centos8 ~]# mkdir -pv /data/backup
    
    #服务器端生成验证文件
    [root@centos8 ~]# echo "rsyncuser:centos" > /etc/rsync.pas
    [root@centos8 ~]# chmod 600 /etc/rsync.pas
    
    #服务器端启动rsync服务
    [root@centos8 ~]# rsync --daemon #可加入/etc/rc.d/rc.local实现开机启动
    [root@centos8 ~]# systemctl start rsyncd #CentOS 7 以上版本
    
    #客户端配置密码文件
    #也可将密码赋值给环境变量RSYNC_PASSWORD变量,但不安全
    #export RSYNC_PASSWORD=centos
    [root@centos8 ~]# echo "centos" > /etc/rsync.pas
    [root@centos8 ~]# chmod 600 /etc/rsync.pas #此为必要项,权限必须修改
    
    #查看远程rsync服务器的模块信息
    [root@centos8 ~]# rsync rsync://rsync服务器IP
    backup backup dir
    
    #交互式验证查看具体模块内的文件
    [root@centos8 ~]# rsync rsync://rsyncuser@rsync服务器IP/backup
    Password:
    
    #非交互式查看共享目录
    [root@centos8 ~]# rsync --password-file=/etc/rsync.pas
    rsync://rsyncuser@rsync服务器IP/backup
    
    #客户端测试同步数据
    [root@centos8 ~]# rsync -avz --delete --password-file=/etc/rsync.pas
    /data/www/ rsyncuser@rsync服务器IP::backup
    [root@centos8 ~]# rsync -avz --delete --password-file=/etc/rsync.pas
    rsyncuser@rsync服务器IP::backup /data/www/
    

    范例:inotify+rsync+shell 脚本实现实时数据同步

    搭建好 rsyncd的备份服务器,在数据服务器上创建inotify_rsync.sh脚本
    注意: 此脚本执行前先确保两主机初始数据处于同步状态,此脚本实现后续的数据同步
    
    [root@centos8 ~]# vim inotify_rsync.sh
    #!/bin/bash
    SRC='/data/www/' #注意最后的/
    DEST='rsyncuser@rsync服务器IP::backup'
    rpm -q rsync &> /dev/null || yum -y install rsync
    inotifywait -mrq --exclude=".*.swp" --timefmt '%Y-%m-%d %H:%M:%S' --format '%T %w %f' -e create,delete,moved_to,close_write,attrib ${SRC} |while read DATE
    TIME DIR FILE;do
        FILEPATH=${DIR}${FILE}
        rsync -az --delete --password-file=/etc/rsync.pas $SRC $DEST && echo "At ${TIME} on ${DATE}, file $FILEPATH was backuped up via rsync" >> /var/log/changelist.log
    done
    
    #查看文件传输日志
    [root@centos8 ~]# tail -f /var/log/changelist.log
    
  • 相关阅读:
    webpack --- 详解
    vue 配置文件详解
    webstorm添加vue模板支持
    golang制作系统服务
    PMBOK 项目管理 九大知识领域和五大流程
    人工智能——数据、信息与知识
    阿里云大数据三次技术突围:Greenplum、Hadoop和“飞天”
    海量数据处理利器greenplum——初识
    CentOS如何禁用root本地或远程ssh登录
    Tomcat学习—Tomcat的简介和目录以及配置文件介绍(Windows环境)
  • 原文地址:https://www.cnblogs.com/xuanlv-0413/p/14853981.html
Copyright © 2011-2022 走看看