笔记：Hadoop权威指南第3章 HDFS - 走看看

zoukankan html css js c++ java

笔记：Hadoop权威指南第3章 HDFS
一、适合 HDFS 的场合

1、超大文件：几百MB、几百GB、几百TB、PB

2、流式访问：一次写入，多次访问

3、商用硬件：不昂贵，可以容忍故障

二、不适合HDFS的场合

1、低时间延迟的数据访问 (可以用HBase)

2、大量的小文件：将耗尽NameNode 的内存

3、多用户写入，任意修改文件

三、HDFS 概念

1、块：默认64M 大小，好处：可以最小化寻址时间；文件容量可以大于磁盘容量；简化存储子系统，适用于存储。

2、NameNode：管理文件系统的命名空间，包括命名空间镜像文件fsimage、编辑日志文件 edits。丢失NameNode，整个文件系统将无法使用。

3、DateNode：存储并检索数据块，向Namenode 发送文件裂变

4、NameNode 容错保证：备份NameNode 元数据；在hadoop2 中运行StandBy NameNode，保证HA。

四、HDFS操作

1、通过命令行借口：put get ls rm cat mkdir 等。

2、通过 FileSystem API:
```
Configuration conf = new Configuration()
String uri = "hdfs://10.1.1.1:9000/user/admin/content.txt" 
FileSystem fs = FileSystem.get(URI.create(uri), conf); 
InputStream in = fs.open(new Path(uri));
```
可支持随机访问

五、HDFS 的数据流

1、文件读取

2、文件写入
查看全文

相关阅读:
Run Book Automation
Android.mk中的经常使用语法
 层的匀速运动波动处理
 【ArcGIS 10.2新特性】ArcGIS 10.2 for Server常见问题
 WPF-19：分享一个样式（左右滑动选中的checbox）
[置顶] 程序员期望月薪那些事儿
 【VB/.NET】Converting VB6 to VB.NET 【Part II】【之四】
两种方式给列表增加自动增长序号列
 在后台运行erlang；在需要时连回交互模式
 php设计模式——UML类图

原文地址：https://www.cnblogs.com/leeeee/p/7276216.html

Copyright © 2011-2022 走看看