zoukankan      html  css  js  c++  java
  • canal接binlog

    最近业务开始需要实时抽取数据,中间权限需要沟通,为了不让自己给DBA添加麻烦,还是补补关于这方面的基础:

    来源:http://blog.csdn.net/heiyeshuwu/article/details/8619338

    先介绍下背景吧,方便理解:

    早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求。不过早期的数据库同步业务,主要是基于trigger的方式获取增量变更,不过从2010年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务。

    项目介绍

    名称:canal [kə'næl]

    译意: 水道/管道/沟渠

    语言: 纯java开发

    定位: 基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了mysql

    工作原理

    mysql主备复制实现:

    从上层来看,复制分成三步:

    1. master将改变记录到二进制日志(binary log)中(这些记录叫做二进制日志事件,binary log events,可以通过show binlog events进行查看);
    2. slave将master的binary log events拷贝到它的中继日志(relay log);
    3. slave重做中继日志中的事件,将改变反映它自己的数据。

    canal的工作原理:

    1. canal模拟mysql slave的交互协议,伪装自己为mysql slave,向mysql master发送dump协议
    2. mysql master收到dump请求,开始推送binary log给slave(也就是canal)
    3. canal解析binary log对象(原始为byte流)

    几点说明:

    a:canal的原理是基于mysql binlog技术,所以一定要需要开启mysql的binlog写入功能,并且配置binlog模式为row.

    b:canal的原理是模拟自己为mysql salave,所以这里一定需要做为mysql slave的相关权限。

  • 相关阅读:
    第一节 变量与常量
    go语言学习笔记
    Java日期时间API系列41-----根据毫秒值计算倒计时
    数据库DML(数据操纵)
    数据库概述和DDL(数据库定义)
    软件测试基础理论
    软件测试学习大纲
    matplotlib
    pandas详细应用和文件处理
    DataFrame
  • 原文地址:https://www.cnblogs.com/judylucky/p/4318798.html
Copyright © 2011-2022 走看看