zoukankan      html  css  js  c++  java
  • 1、Hadoop常见问题

    1、简要描述如何安装配置一个apache开源版hadoop,描述即可

    (1)解压Hadoop

    (2)配置JDK,防火墙、Hadoop环境

    (3)修改Hadoop配置

    (4)格式化namenode,对数据缓存的的路径进行格式化

    (5)启动Hadoop

    2、请列出正常工作的hadoop集群中hadoop都需要启动哪些进程,他们的作用分别是什么

    --namenode =>HDFS的守护进程,负责维护整个文件系统,存储着整个文件系统的元数据信息,有image+edit log namenode不会持久化存储这些数据,而是在启动时重建这些数据。

    --datanode =>是具体文件系统的工作节点,当我们需要某个数据,namenode告诉我们去哪里找,就直接和那个DataNode对应的服务器的后台进程进行通信,由DataNode进行数据的检索,然后进行具体的读/写操作

    --secondarynamenode =>一个冗余的守护进程,相当于一个namenode的元数据的备份机制,定期的更新,和namenode进行通信,将namenode上的image和edits进行合并,可以作为namenode的备份使用

    --resourcemanager =>是yarn平台的守护进程,负责所有资源的分配与调度,client的请求由此负责,监控nodemanager

    --nodemanager => 是单个节点的资源管理,执行来自resourcemanager的具体任务和命令

  • 相关阅读:
    CF949C Data Center Maintenance 题解
    P1438 无聊的数列 题解
    CF620E New Year Tree 题解
    结构体优先队列的定义
    CF464E The Classic Problem 题解
    CF427C Checkposts
    CF161D Distance in Tree 题解
    P4375 [USACO18OPEN]Out of Sorts G 题解
    SCI, SCIE, 和ESCI的区别
    Matlab画图中图的方法
  • 原文地址:https://www.cnblogs.com/whxiao/p/13227959.html
Copyright © 2011-2022 走看看