zoukankan      html  css  js  c++  java
  • GFS的系统架构

    刘鹏《云计算(第二版)》

    ①~⑤是控制流,⑥是数据流

    Client: 应用程序的访问接口

    Master(主服务器):管理节点在逻辑上只有一个,保存系统的元数据(Metadata,描述数据的数据),负责整个文件系统的管理。

    Chunk Server(数据库服务器):负责具体的存储工作。数据以文件的形式存储在Chunk Server上。

    架构设计成这样的好处是:

    1、Client和Master之间只有控制流(①~⑤),没有数据流,因此降低了Master的负载因为控制流只需传送指令和状态,数据量小

    2、Client与Chunk Server之间直接传输数据流,同时由于文件被分成多个chunk进行分布式存储,因此Client可以同时并行访问多个Chunk Server,从而让系统的I/O并行度提高

    GFS的特点:

    1、采用中心服务器模式

    好处是:(1)可以方便的增加Chunk Server

        (2)Master可以掌握系统内所有Chunk Server的情况,方便进行负载均衡

        (3)不存在元数据的一致性问题(因为只有一个中心server,所以云数据也只有一份

    2、不缓存数据(没有系统cache

    好处是:(1)文件操作大部分是流式读写,不存在大量重复的读写,因此即使使用cache对系统性能的提高也不大

        (2)Chunk Server上的数据存储在本地文件系统上(Linux File System),若真的出现频繁存取,那么本地文件系统的cache也可以支持

        (3)若建立系统cache,那么cache中的数据与Chunk Server中的数据的一致性很难保证

    思考:

    GFS采用中心服务器的模式,该模式的最大优点是便于管理,因为中心服务器可以获知所有子服务器的状态,因而可以很方便的得知各个子服务器的负载状况等。但是这一模式也有一个比较致命的缺点,那就是单点故障。当单点故障发生在中心服务器时,将导致整个系统的不可用。

    不过,按照上述描述,GFS的中心服务器只是逻辑上是一个,因此可以想象,其实GFS的Manster还是有后备机制的,因此GFS比较像伪集中式管理

  • 相关阅读:
    验证SMTP工作过程
    FileZilla FTP服务器的安装和配置
    最后一块石头的重量
    不用加号的加法
    同构字符串
    最长公共子序列
    Telnet 验证HTTP工作过程
    矩阵的最小路径和
    子数组的最大累加和问题
    海思开发板——YOLOv3模型移植(4)
  • 原文地址:https://www.cnblogs.com/elaron/p/2706049.html
Copyright © 2011-2022 走看看