zoukankan      html  css  js  c++  java
  • Kafka笔记7(构建数据管道)

     构建数据管道需要考虑的问题:

        及时性  可靠性 高吞吐量和动态吞吐量   数据格式  转换    安全性   故障处理能力  耦合性与灵活性

        数据管道的构建分为2个阵营,ETL和ELT

      ETL:提取-转换-加载   当数据流经管道时,数据管道负责处理他们

      ELT:提取-加载-转换:数据管道只做少量的转换,高保真

      数据管道最重要的作用是解耦数据源和数据池

        发生耦合情况: 临时数据管道    元数据丢失    末端处理

     

    Connect工作原理

      连接器和任务

        连接器实现了ConnectorAPI ,API 包含以下2部分:

          连接器负责以下3件事: 决定运行多少任务,按照任务拆分数据复制,从worker进程获取任务配置并将其传递下去

        任务:负责将数据移入/移出Kafka

      work进程

        

      转化器和Connect数据模型

        

      偏移量管理器

        

      

  • 相关阅读:
    [LeetCode]Sort List
    [LeetCode]Single Number II
    合并两个排序的列表
    翻转链表
    链表中倒数第k个结点
    调整数组顺序使奇数位于偶数前面
    数值的整数次方
    二进制中1的个数
    矩形覆盖
    变态跳台阶
  • 原文地址:https://www.cnblogs.com/zy1234567/p/10342913.html
Copyright © 2011-2022 走看看