zoukankan      html  css  js  c++  java
  • linux下数据推送(同步)方案

     

    相信各位小伙伴在日常的工作中,经常会遇到需要将数据定时推送到别的服务器,甚至是要实时同步的情况。

    下面笔者将会介绍几种可行的方式。

    一.scp+ssh-key+crontab

            这种是最原始的办法,但也是最基本,最不受限制的,基本只要能ssh到对端,这种方法就是可行的。笔者曾经在项目中遇到过两端的服务器之间存在多重网络限制。折腾来折腾去,最后还是选用这种方法。

            首先,如果要做到脚本推送,这中方法最大的问题就是在scp的过程中需要输入密码,这样就做不到自动化执行脚本了。技术厉害的同学用expect来实现用户交互,如果是还在打基础阶段的同学,可以选用ssh密钥的方式去规避这个问题。

    假设:

    有两台server,server1和server2

    我们需要定期从server1推从数据到server2。

    server1:

    ssh-keygen     (一路回车到最后)

    cd ~/.ssh/          (这个是存放ssh私密文件的路径)

    文件夹会出现下图的两个文件

    其中id_rsa是私钥,是要放在本地的。

    而id_rsa.pub是公钥,里面有跟私钥相互匹配的信息。

    vim id_rsa.pub    把里面的信息复制出来

    server2:

    cd ~/,ssh/     (如果没有,自行创建)

    vim  authorized_keys  这个是认证文件 

    将刚才的公钥粘贴进去,保存。

    这个时候回到server1,ssh到server2就不用使用密码啦。

    接下来就是自由发挥的时间了,可以针对想要传输、备份的数据,进行匹配、打包,最后scp到对端相应的目录。

    例如:

    复制代码
    #!/bin/bash
    find /home/gzdssapp-service/peizhi/decision/jcrd -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/jcrd ; find /home/gzdssapp-service/peizhi/decision/mrtqbg -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/mrtqbg ; find /home/gzdssapp-service/peizhi/decision/qhyc -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/qhyc/ ; find /home/gzdssapp-service/peizhi/decision/qtyb -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/qtyb ; find /home/gzdssapp-service/peizhi/decision/ssxx -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/ssxx ; find /home/gzdssapp-service/peizhi/decision/tqybqs -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/tqybqs ; find /home/gzdssapp-service/peizhi/decision/ywzy -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/ywzy ; find /home/gzdssapp-service/peizhi/decision/zdqxkb -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/zdqxkb ; find /home/gzdssapp-service/peizhi/decision/zdqxzb -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/zdqxzb ; find /home/gzdssapp-service/peizhi/decision/zdtqgc -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/zdtqgc ; find /home/gzdssapp-service/peizhi/decision/zjtx -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/zjtx ; find /home/gzdssapp-service/peizhi/decision/zx -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/zx ; find /home/gzdssapp-service/peizhi/decision/zxxx -type f -mmin -10 -exec scp {} 10.12.13.30:/home/gzdssapp/peizhi/decision/zxxx ;
    复制代码

    上面的脚本是在指定的目录下搜索最新十分钟内更新的文件,并推送到对端。

    最后把这个脚本加进定时任务

    crontab -uroot -e

    */5 * * * *  /bin/bash  /scripts/decision.sh  > /dev/null  2&>1

    这样就实现了实时推送了。

    二.ftp

            这种方法就建立在对端有ftp的情况下可以实现,笔者在项目中经常用到这种方法来对数据做出实时备份。

    复制代码
    #!/bin/bash
    date=`date "+%Y%m%d"`
    full_date=`date "+%Y-%m-%d %H:%m:%S"`
    tar -cvzf /scripts/test.$date.tar.gz /scripts/test/
    cd /scripts/
    ftp -in  << EOF
    open 172.16.1.199
    user backup1 tqw961110
    put test.$date.tar.gz
    bye
    EOF
    rm -f /scripts/test.$date.tar.gz
    echo "$full_date test.$date.tar.gz has been put!!!" >> /scripts/backup.logs
    复制代码

            上述的脚本主要是针对需要备份的目录进行打包,并且通过ftp的方式将数据推送到对端。这里的精髓是

    ftp -in  << EOF
    open 172.16.1.199
    user backup1 tqw961110
    put test.$date.tar.gz
    bye
    EOF
    这里的ftp -i -n 经常在脚本中会用到,其意思是不要自动登陆并取消用户交互模式,这样就不会出现系统向你询问用户名和密码的情况了。
    后续就是ftp里面的一些操作了,手动操作是怎样的,脚本里面就是怎样写的,最后通过bye来登出ftp即可。
    同样,这个脚本添加进定时任务里面,就可以实现定时备份拉。



    --------------------------------------------------华丽的分割线------------------------------------------------------
    上述两种方法都是定时推送数据,其两端的数据会存在一定的延时。
    接下来为大家介绍另外两种方法,可以做到数据的实时同步。

    一.inotify+rsync
    inotify这款软件主要是实时监测系统中的某个目录,当目录下某个文件发生增删改的操作的时候,就会把文件的全路径打印出来,后续配合我们的脚本中的while read file
    就可以对这些被打印出来的文件做出下一步的处理了。而rsync则是一个数据传输工具,其有三种工作方式,在这里笔者就不一一介绍了,感兴趣的同学可以自动搜索,接下来将会
    着重介绍他的daemon模式。
    同样假设有两台server,server1需要把数据实时同步到server2

    server1:
    配置rsync

        vim /etc/rsyncd.conf

    ##rsync.conf start

    uid = rsync    进程用户

    gid = rsync     进程用户组

    use chroot = no  安全相关

    max connections = 200   最大连接数

    timeout = 300   超时时间

    pid file = /var/run/rsyncd.pid 进程对应的进程号文件

    lock file = /var/run/rsync.lock  锁文件

    log file = /var/log/rsyncd.log   日志文件

    [backup]   模块名称

    path = /backup/  服务器端提供访问的目录

    ignore errors  忽略错误

    read only = false  可写

    list = false   不能列表

    #hosts allow = 172.16.1.0/24                 #这里默认的是全部都allow

    #hosts deny = 0.0.0.0/32

    auth users = rsync_backup

    secrets file = /etc/rsyncd.password

    ##rsync.conf end


    创建密码文件
    vim /etc/rsyncd.password
    rsync_backup:tqw961110
    修改密码文件的权限(这里是一定要修改的,不然会报错。)
    chmod 600 /etc/rsyncd.password

    创建用户
    useradd rsync -s /sbin/nologin -M  (不能登陆,没有家目录)

    创建推送文件夹
    mkdir /backup/

    更改属主
    chown -R rsync:rsync /backup/
    启动服务
    rsync --daemon

    开放端口
    firewall-cmd --add-port=873/tcp --permanent
    firewall-cmd --reload

    server1
    配置密码文件
    vim /etc/rsyncd.password
    tqw961110
    chmod 600 /etc/rsyncd.password

    尝试将文件推送到server2
    rsync ./1 rsync_backup@172.16.1.199::backup/  --password-file=/etc/rsyncd.password
    成功则证明rsync搭建成功

    配置inotify
    server1:
    yum -y install inotify-tools

    编写监控脚本
    复制代码
    #!/bin/bash
    Path=/scripts/test/
    IP=172.16.1.199
    inotifywait  -mrq   --format  '%w%f'  -e  create,close_write,delete  $Path | while read file
      do
        cd $Path
        rsync $file rsync_backup@172.16.1.199::backup/ --password-file=/etc/rsyncd.password
      done
    复制代码

    上述脚本监控/scripts/test/这个目录,当目录下有文件创建或者内容更新,则执行下面的rsync命令。

    将脚本放到后台运行

    nohup  /scripts/test.sh &

    测试

    cd  /scripts/test/

    touch  test1   看看文件有没有同步到server2上

    echo “test123” > test1  看看内容有没有同步到server2上

    有,则证明同步成功。

    二.sersync

    在上面的方法中,可以做到文件实时同步到对端,但是这个是单层目录的同步,也就是说,当目录下有子目录下面的文件更新,上述方法是监控不到的。而且上面的方法也不知道删除文件。因此,接下来为大家介绍笔者经常使用的方法。

    rsync的配置步骤跟上面方法一样。不一样的是,我们不需要用到inotify,而是用到sersync这个工具。

    配置sersync

    这款软件直接解压就可以使用了,无需编译安装。

    将软件包解压到对应的目录后,进入目录,会看到两个文件。

    编辑配置文件

    vim  confxml.xml

    复制代码
    <sersync>
            <localpath watch="/scripts/test/">                                                  #指定监控本地的哪个目录
                <remote ip="172.16.1.199" name="backup"/>                                       #指定对端ip和rsync模块名
                <!--<remote ip="192.168.8.39" name="tongbu"/>-->
                <!--<remote ip="192.168.8.40" name="tongbu"/>-->
            </localpath>
            <rsync>
                <commonParams params="-avz"/>                                                   #配置rsync命令参数选项
                <auth start="true" users="rsync_backup" passwordfile="/etc/rsyncd.password"/>   #配置rsync模块用户名和密码文件
                <userDefinedPort start="false" port="874"/><!-- port=874 -->                    #这里可以修改rsync的传输端口,当对端rsync不是启动在873端口上,这里就需要配置。
                <timeout start="false" time="100"/><!-- timeout=100 -->
                <ssh start="false"/>
            </rsync>
            <failLog path="/scripts/sersync.log" timeToExecute="60"/><!--default every 60mins execute once-->      #指定错误日志的路径
            <crontab start="false" schedule="600"><!--600mins-->
                <crontabfilter start="false">
                    <exclude expression="*.php"></exclude>
                    <exclude expression="info/*"></exclude>
                </crontabfilter>
            </crontab>
            <plugin start="false" name="command"/>
        </sersync>
    复制代码

    执行命令

    /usr/local/sersync/GNU-Linux-x86/sersync2 -d -r -n 8 -o /usr/local/sersync/GNU-Linux-x86/confxml.xml

    一般来说,出现下面信息,则证明运行成功。可以到监控的目录进程文件增删改的操作,看看server2对应的目录是否有同步到。

    sersync的参数详解

    参数-d:启用守护进程模式

    参数-r:在监控前,将监控目录与远程主机用rsync命令推送一遍

    c参数-n: 指定开启守护线程的数量,默认为10个

    参数-o:指定配置文件,默认使用confxml.xml文件

    参数-m:单独启用其他模块,使用 -m refreshCDN 开启刷新CDN模块

    参数-m:单独启用其他模块,使用 -m socket 开启socket模块

    参数-m:单独启用其他模块,使用 -m http 开启http模块

    不加-m参数,则默认执行同步程序

  • 相关阅读:
    Hive分桶bucket
    Error: java.io.IOException: org.apache.hadoop.hdfs.BlockMissingException: Could not obtain block
    接上一篇嵌套循环问题之解决
    RPA自动化机器人uibot之循环嵌套坑
    Chrom谷歌浏览器没网之最全解决办法之一
    (语法糖)列表生成式之怪诞--(暂时无法理解)
    浅析scrapy与scrapy-redis的区别
    浅谈Python中函数式编程、面向对象编程以及古怪的PythonIC
    OpenCV+TensorFlow图片手写数字识别(附源码)
    TensorFlow Object Detection API中的Faster R-CNN /SSD模型参数调整
  • 原文地址:https://www.cnblogs.com/dengbingbing/p/12324930.html
Copyright © 2011-2022 走看看