作业要求来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3319
1.用自己的话阐明Hadoop平台上HDFS和MapReduce的功能、工作原理和工作过程。
HDFS常用功能
1.元数据
2.检查点
3.DataNode功能
HDFS工作原理
1 分布式文件系统,它所管理的文件是被切块存储在若干台datanode服务器上.2 hdfs提供了一个统一的目录树来定位hdfs中的文件,客户端访问文件时只要指定目录树的路径即可,不用关心文件的具体物理位置.3 每一个文件的每一个切块,在hdfs集群中都可以保存多个备份(默认3份),在hdfs-site.xml中,dfs.replication的value的数量就是备份的数量.4 hdfs中有一个关键进程服务进程:namenode,它维护了一个hdfs的目录树及hdfs目录结构与文件真实存储位置的映射关系(元数据).而datanode服务进程专门负责接收和管理"文件块"-block.默认大小为128M(可配置)(dfs.blocksize).(老版本的hadoop的默认block是64M的)
HDFS工作过程
客户端要向HDFS写数据,首先要跟namenode通信以确认可以写文件并获得接收文件block的datanode,然后,客户端按顺序将文件逐个block传递给相应datanode,并由接收到block的datanode负责向其他datanode复制block的副本。
MapReduce功能实现系列:
MapReduce功能实现一---Hbase和Hdfs之间数据相互转换
MapReduce功能实现二---排序
MapReduce功能实现三---Top N
MapReduce功能实现四---小综合(从hbase中读取数据统计并在hdfs中降序输出Top 3)
MapReduce功能实现五---去重(Distinct)、计数(Count)
MapReduce功能实现六---最大值(Max)、求和(Sum)、平均值(Avg)
MapReduce功能实现七---小综合(多个job串行处理计算平均值)
MapReduce功能实现八---分区(Partition)
MapReduce功能实现九---Pv、Uv
MapReduce功能实现十---倒排索引(Inverted Index)
MapReduce功能实现十一---join
2.HDFS上运行MapReduce
1)查看是否已经安装python:
2)在/home/hadoop/路径下建立wc文件夹,在文件夹内新建mapper.py、reducer.py、run.sh和文本文件HarryPotter.txt:
Atitit.dwr3 不能显示错误详细信息的解决方案,控件显示错误详细信息的解决方案 java .net php
Atitit.实现继承的原理and方法java javascript .net c# php ...
Atitit. 解压缩zip文件 的实现最佳实践 java c# .net php
Atitit..文件上传组件选型and最佳实践总结(2)断点续传
atitit.web的动态include 跟变量传递 java .net php
Atitit. BigConfirmTips 控件 大数据量提示确认控件的原理and总结O9
Atitit.guice3 ioc 最佳实践 o9o
Atitit.hybrid混合型应用 浏览器插件,控件的实现方式 浏览器运行本地程序的解决方案大的总结提升用户体验and开发效率..
atitit.提升开发效率使用服务器控件生命周期 asp.net 11个阶段 java jsf 的6个阶段比较
- 最新文章
-
2000多变一
读取外部xml
分享jQuery瀑布流的插件和案例、几款jquery瀑布流插件、jquery瀑布流下载
php反射类
SQL to MongoDB Mapping Chart
CodeIgniter中设计一个全局exception hook
PHP JQUERY JSON 实现瀑布流
php常用函数
Chrome浏览器开发者扩展工具:Postman REST Client 在线测试rest api 或者普通http web m模拟接口的最佳工具。
PHP中array
- 热门文章
-
SQL to Aggregation Framework Mapping Chart
PHP 为你提供一个叫__toString() 的函数,你可以用它来返回表示对象的字符串信息,而且一旦定义它,打印命令将调用它并打印出返回的字符串。
Atitit..文件上传组件选型and最佳实践总结(3)断点续传控件的实现
atitit. 浏览器插件 控件 applet 的部署,签名总结 浏览器 插件 控件 的签名安全机制o9o
Atitit.javascript 实现类的方式原理大总结
Atitit.auto complete 自动完成控件的实现总结
Atitit. .net c# web 跟客户端winform 的ui控件结构比较
atitit.404错误的排查流程总结vOa6
atitit. web 在线文件管理器最佳实践(1) elFinder 的使用流程解决之道 。打开浏览服务器文件夹java .net php
atitit. applet 浏览器插件 控件 的环境,开发,提示总结o9o
Copyright © 2011-2022 走看看