zoukankan      html  css  js  c++  java
  • 笔记之分布式文件系统(DFS)

    不知何故,老外都挺喜欢使用DFS,但是国内公司用这个的不多。一个具体的需求就是,备份服务器在国外,所以启用DFS把国内的数据同步一份到国外进行备份。最近有机会接触DFS,把一些心得体会记录一下。

    1. DFS中文解释为分布式文件系统,我之前一直认为它和“同步”有关系,其实不然,从添加角色时就能看出:DFS Namespaces和DFS Replication无需同时安装。前者可以理解为一个将松散的共享文件夹组织到一起的功能,类似“入口”、“门牌号”;后者则主要提供“同步”、“容错”、“复制”的功能。

    2. 假如在不同主机上有若干个共享文件夹,例如\浙江服务器杭州夹,\江苏服务器南京夹,\福建服务器福州夹等,那么"\域名中国夹"就是命名空间了。“命名空间”可以存放在一台或者多台机器上,目的是起到冗余作用:无论哪台服务器宕机,用户都不至于找不到“入口”。另外,一个我认为比较好的做法是“命名空间”所在的文件夹只用来存放后续会说到的“指针文件夹”,而不要存放文件或真正的文件夹。


    3. 一个“指针文件夹”可以对应多个“目标文件夹”,目的也是用做冗余。但是,如果对应多个,那么如何保证它们之间数据一致呢?于是,DFS Replication登场了,从创建完第二个“目标文件夹”后系统弹出的提示也能印证这点。

    4. 设置Replication的过程中,有一步是选择哪台服务器是主要成员,换言之是以哪台服务器上的数据为母本。待同步完成后,所有服务器上的数据都会和主要成员上的数据一致,达到平衡状态。

    5. 客户端也有“彩蛋”。

    6. 不建议在命名空间文件夹下直接存取文件(夹),刚开始的时候我就被这个搞糊涂。

    7. DFS replication可以单独使用,效果就和云同步盘一样了。

    8. 关于Replication做了个实验:初次设置时,设置FS1为主要成员,然后创建双向同步。此时手动点选FS2->FS1方向的同步,结果是无效的。说明“主要成员”优先级高。

    http://healthvalidator.com/zh-cn/dfs2/html/4ea2c4b9-efc8-4e47-bd54-ce0acb62aa30.htm

  • 相关阅读:
    从hadoop框架与MapReduce模式中谈海量数据处理
    Hadoop
    Clone Graph
    Gas Station
    ZigZag Conversion
    String to Integer (atoi)
    Palindrome Number
    Container With Most Water
    Longest Common Prefix
    求和问题总结(leetcode 2Sum, 3Sum, 4Sum, K Sum)
  • 原文地址:https://www.cnblogs.com/IvanChen/p/6397827.html
Copyright © 2011-2022 走看看