zoukankan      html  css  js  c++  java
  • HDFS的架构

    HDFS开发

    HDFS理论讲解

    集群和分布式概念

    • 集群:集群就是逻辑上处理统一任务的机器集合,可以属于同一机房,也可以分属不同的机房
    • 分布式:分布式文件系统把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
    • 分布式文件系统的结构
      • 主节点
      • 名称节点
      • 数据节点

    HDFS架构

      • HDFS的文件被分成块进行存储
      • 块是文件存储处理的逻辑单元
    • 块存储的优点
      • 支持大规模文件存储,一个大规模文件可以被拆成若干个文件块,不同的文件块可以被分发到不同的节点上
      • 简化系统设计
      • 适合数据备份

    HDFS中的节点

    • namenode
      • 是管理节点,存储元数据
      • 存储文件和数据块的映射表
      • 存储数据块和数据节点的映射表
      • 负责管理分布式文件系统的命名空间
    • namenode数据结构
      • FsImage:维护文件系统树以及文件书中所有的文件和文件夹的元数据
      • EditLog:记录了所有针对文件的创建、删除、重命名等操作
    • datanode
      • 是hdfs的工作节点,负责数据的存储和读取
      • 根据客户端或者是名称节点的调度来警醒数据的存储和检索
      • 定期向名称节点发送自己所存储的块的列表
      • 每个数据节点中的数据会被保存在各自节点的本地linux文件系统中
  • 相关阅读:
    Chrome快捷键
    Nginx之基本介绍(一)
    windows程序调试
    python有序字典
    value是列表的字典排序
    构造Map并对其排序
    python读取文件时遇到非法字符的处理 UnicodeDecodeError: 'gbk' codec can't decode bytes in position
    python正则表达式 分割字符串
    python3 导入模块
    python3 以utf-8编码写文件
  • 原文地址:https://www.cnblogs.com/hannahzhao/p/11756581.html
Copyright © 2011-2022 走看看