HDFS04 - 走看看

zoukankan html css js c++ java

HDFS04

===================HDFS副本放置策略===================

一个文件划分成多个block，每个 block存多份，如何为每个block选择节点存储这几份数据？

Block副本放置策略：

√副本1：同Client节点上

√副本2：不同机架的节点上

√副本3：与第二个副本同一机架的另一个节点上

√其他副本：随机挑选

===================HDFS不适合存储小文件===================

元信息存储在NameNode内存中 ------------->

√一个节点的内存是有限的

存储大量小文件消耗大量的寻到时间 ------------->

√类比拷贝大量小文件与拷贝同等大小的一个大文件

NameNode存储block数目有限 ------------->

√一个block元信息消耗大约150byte内存

√存储1亿个block，大约需要20GB内存

√如果一个文件大小为10K，则1亿个文件大小仅为1TB（但要消耗掉 NameNode 20GB内存）

查看全文

相关阅读:
使用netty实现im聊天
 使用rabbitmq实现集群im聊天服务器消息的路由
 springcloud feign使用
 10万用户一年365天的登录情况如何用redis存储，并快速检索任意时间窗内的活跃用户
 redis的rdb与aof持久化机制
 springcloud-zinpin的安装与使用
 kafka的基本安装与使用
 RabbitMq 实现延时队列-Springboot版本
 RabbitMq 基本命令
 Dcoker 安装 rabbitMq

原文地址：https://www.cnblogs.com/xtdxs/p/7074649.html

Copyright © 2011-2022 走看看