电脑如果是8G内存或者以下建议搭建3节点集群,如果是搭建5节点集群就要增加内存条了。当然实际开发中不会用虚拟机做,一些小公司刚刚起步的时候会采用云服务,因为开始数据量不大。
但随着数据量的增大才会考虑搭建自己的集群,中大型公司肯定会搭建自己的专属集群,毕竟云服务用起来方便,但是还是有很多的局限性。
简单的集群架构图
1.journalnode来现主备节点之间的数据共享。
2.zookeeper实现主备节点的切换,通过选举机制来实现的。
1. 内存的选择一部是大内存容量的,64G 128G以上的,磁盘选择TB级别的,企业里会根据数据量的增大定期添加服务器,一般需要提前规划好,大概一年添加一次这样。
2.集群的部署方面,主节点和从节点是分开部署的,但一定要注意了,计算节点跟数据节点一定要部署在同一个节点上,datanode和nodemanager。
3.如果集群规模比较小20--30台机器这样子,namenode和resourcemanager可以部署在同一个节点上。
4.影响集群规模的因素还有在做高可用HA的时候,namenode和resourcemanager的高可用,还有就是客户的client要跟连接到集群上,我们建议客户端跟集群单独部署。
5.从性能考虑集群是规模,比如说处理1T的数据需要多少时间,比方说导入1T的数据要求是1个小时,对功能性要要求的。
6.可靠性需要,比如说系统一个月只能运行当机一次,可用性考虑,如果当机了要花多少时间能恢复,比如说要2个小时。所以在选择机器的时候可以廉价但不能太廉价,不能以后都把时间花在维护上面。还有就是每个节点的故障率,单个节点当机恢复时间也不能太久。
7.容错性需求,比如说节点当机或者硬件损坏了,但我们尽可能不能让数据丢失,或者说能恢复部分数据,对恢复时间有要求,namenode当机了恢复时间也需要快点。
8.还有就是机架--机架感知。
HADOOP HA
启动集群的时候要注意了先启动zookeeper,再启动hadoop,关闭的时候先关闭hadoop,再关闭zookeeper。
这个共享存储存的是编辑日志editlog.
Datanode这执行Active状态的Namenode命令
如何克隆节点:
先在想克隆的节点那里选中克隆选项,必须确保是关闭状态的
现在打开克隆好的节点
会发现主机名跟之前的是一样的,所以这里需要我们自己去修改了。
由于各个克隆出来的节点还不能上网
ping他的网关是不通的,可能是网卡没启动,需要我们去修改网卡了!
经过查看网卡已经启动了!ONBOOT=yes
是因为我们克隆了又两个网卡,网卡的地址不一样
我们可以看到有两个网卡,正常情况下只有eth0网卡,克隆完了之后多了一个eth1网卡
接下来我们需要做的就是把eth0注释掉,把eth1改成eth0,同时把eth1的这个地址记下来
把他修改一下
把刚刚记下来的地址修改到这里来
路径在这里
保存之后重启一下网卡,结果发现重启失败!!
那我们就是reboot重启一下系统
重启之后可以看到网卡启动成功了
网卡能ping通了
查看一下他的ip地址
可以看到是一个静态ip地址,也就是说跟克隆前的那个节点是一样的,毕竟是克隆过来嘛,所以可以根据自己的需要去进行修改。
ping一下他的ip地址也是可以ping通的
可以看到网络是通的
好了,现在实现了克隆完节点之后的网络通信的几个步骤,关于这点我之前一直不敢去克隆。建议大家克隆完以后把主机名、ip地址都修改一下,不要跟之前的重复了,不然一起启动的时候容易出问题的。
(四)集群安装前的环境检查
时钟同步
所有节点的系统时间要与当前时间保持一致。
查看当前系统时间
date Tue Nov 3 06:06:04 CST 2015
如果系统时间与当前时间不一致,进行以下操作。
[root@hadoop11 ~]# cd /usr/share/zoneinfo/ [root@hadoop11 zoneinfo]# ls //找到Asia [root@hadoop11 zoneinfo]# cd Asia/ //进入Asia目录 [root@hadoop11 Asia]# ls //找到Shanghai [root@hadoop11 Asia]# cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime //当前时区替换为上海
我们可以同步当前系统时间和日期与NTP(网络时间协议)一致。
[root@hadoop11 Asia]# yum install ntp //如果ntp命令不存在,在线安装ntp [root@hadoop11 Asia]# ntpdate pool.ntp.org //执行此命令同步日期时间 [root@hadoop11 Asia]# date //查看当前系统时间
hosts文件检查
所有节点的hosts文件都要配置静态ip与hostname之间的对应关系。
[root@hadoop11 Asia]# vi /etc/hosts 192.168.1.171 hadoop11 192.168.1.172 hadoop12 192.168.1.173 hadoop13 192.168.1.174 hadoop14 192.168.1.175 hadoop15
禁用防火墙
所有节点的防火墙都要关闭。
查看防火墙状态
[root@hadoop11 Asia]# service iptables status iptables: Firewall is not running.
如果不是上面的关闭状态,则需要关闭防火墙。
[root@hadoop11 Asia]# chkconfig iptables off //永久关闭防火墙 [root@hadoop11 Asia]# service iptables stop //临时关闭防火墙
(五)配置SSH免密码通信
这里我们以hadoop11来配置ssh。
[root@hadoop11 ~]# su hadoop //切换到hadoop用户下 [hadoop@hadoop11 root]$ cd //切换到hadoop用户目录 [hadoop@hadoop11 ~]$ mkdir .ssh [hadoop@hadoop11 ~]$ ssh-keygen -t rsa //执行命令一路回车,生成秘钥 [hadoop@hadoop11 ~]$cd .ssh [hadoop@hadoop11 .ssh]$ ls id_rsa id_rsa.pub [hadoop@hadoop11 .ssh]$ cat id_rsa.pub >> authorized_keys //将公钥保存到authorized_keys认证文件中 [hadoop@hadoop11 .ssh]$ ls authorized_keys id_rsa id_rsa.pub [hadoop@hadoop11 .ssh]$ cd .. [hadoop@hadoop11 ~]$ chmod 700 .ssh [hadoop@hadoop11 ~]$ chmod 600 .ssh/* [hadoop@hadoop11 ~]$ ssh hadoop11 //第一次执行需要输入yes [hadoop@hadoop11 ~]$ ssh hadoop11 //第二次以后就可以直接访问
集群所有节点都要行上面的操作。
将所有节点中的共钥id_ras.pub拷贝到hadoop11中的authorized_keys文件中。
cat ~/.ssh/id_rsa.pub | ssh hadoop@hadoop11 'cat >> ~/.ssh/authorized_keys' 所有节点都需要执行这条命令
然后将hadoop11中的authorized_keys文件分发到所有节点上面。
scp -r authorized_keys hadoop@hadoop12:~/.ssh/ scp -r authorized_keys hadoop@hadoop13:~/.ssh/ scp -r authorized_keys hadoop@hadoop14:~/.ssh/ scp -r authorized_keys hadoop@hadoop15:~/.ssh/
大家通过ssh 相互访问,如果都能无密码访问,代表ssh配置成功。
(六)脚本工具的使用
在hadoop11节点上创建/home/hadoop/tools目录。
[hadoop@hadoop11 ~]$ mkdir /home/hadoop/tools cd /home/hadoop/tools
将本地脚本文件上传至/home/hadoop/tools目录下。这些脚本大家如果能看懂也可以自己写, 如果看不懂直接使用就可以,后面慢慢补补Linux相关的知识。
[hadoop@hadoop11 tools]$ rz deploy.conf [hadoop@hadoop11 tools]$ rz deploy.sh [hadoop@hadoop11 tools]$ rz runRemoteCmd.sh [hadoop@hadoop11 tools]$ ls deploy.conf deploy.sh runRemoteCmd.sh
查看一下deploy.conf配置文件内容。
[hadoop@hadoop11 tools]$ cat deploy.conf hadoop11,all,namenode,zookeeper,resourcemanager, hadoop12,all,slave,namenode,zookeeper,resourcemanager, hadoop13,all,slave,datanode,zookeeper, hadoop14,all,slave,datanode,zookeeper, hadoop15,all,slave,datanode,zookeeper,
查看一下deploy.sh远程复制文件脚本内容。
[hadoop@hadoop11 tools]$ cat deploy.sh #!/bin/bash #set -x if [ $# -lt 3 ] then echo "Usage: ./deply.sh srcFile(or Dir) descFile(or Dir) MachineTag" echo "Usage: ./deply.sh srcFile(or Dir) descFile(or Dir) MachineTag confFile" exit fi src=$1 dest=$2 tag=$3 if [ 'a'$4'a' == 'aa' ] then confFile=/home/hadoop/tools/deploy.conf else confFile=$4 fi if [ -f $confFile ] then if [ -f $src ] then for server in `cat $confFile|grep -v '^#'|grep ','$tag','|awk -F',' '{print $1}'` do scp $src $server":"${dest} done elif [ -d $src ] then for server in `cat $confFile|grep -v '^#'|grep ','$tag','|awk -F',' '{print $1}'` do scp -r $src $server":"${dest} done else echo "Error: No source file exist" fi else echo "Error: Please assign config file or run deploy.sh command with deploy.conf in same directory" fi
查看一下runRemoteCmd.sh远程执行命令脚本内容。
[hadoop@hadoop11 tools]$ cat runRemoteCmd.sh #!/bin/bash #set -x if [ $# -lt 2 ] then echo "Usage: ./runRemoteCmd.sh Command MachineTag" echo "Usage: ./runRemoteCmd.sh Command MachineTag confFile" exit fi cmd=$1 tag=$2 if [ 'a'$3'a' == 'aa' ] then confFile=/home/hadoop/tools/deploy.conf else confFile=$3 fi if [ -f $confFile ] then for server in `cat $confFile|grep -v '^#'|grep ','$tag','|awk -F',' '{print $1}'` do echo "*******************$server***************************" ssh $server "source /etc/profile; $cmd" done else echo "Error: Please assign config file or run deploy.sh command with deploy.conf in same directory" fi
以上三个文件,方便我们搭建hadoop分布式集群。具体如何使用看后面如何操作。
如果我们想直接使用脚本,还需要给脚本添加执行权限。
[hadoop@hadoop11 tools]$ chmod u+x deploy.sh [hadoop@hadoop11 tools]$ chmod u+x runRemoteCmd.sh
同时我们需要将/home/hadoop/tools目录配置到PATH路径中。
[hadoop@hadoop11 tools]$ su root Password: [root@hadoop11 tools]# vi /etc/profile PATH=/home/hadoop/tools:$PATH export PATH
我们在hadoop11节点上,通过runRemoteCmd.sh脚本,一键创建所有节点的软件安装目录/home/hadoop/app。
[hadoop@hadoop11 tools]$ runRemoteCmd.sh "mkdir /home/hadoop/app" all
我们可以在所有节点查看到/home/hadoop/app目录已经创建成功。
(七)jdk安装
将本地下载好的jdk1.7,上传至hadoop11节点下的/home/hadoop/app目录。
[root@hadoop11 tools]# su hadoop [hadoop@hadoop11 tools]$ cd /home/hadoop/app/ [hadoop@hadoop11 app]$ rz //选择本地的下载好的jdk-7u79-linux-x64.tar.gz [hadoop@hadoop11 app]$ ls jdk-7u79-linux-x64.tar.gz [hadoop@hadoop11 app]$ tar zxvf jdk-7u79-linux-x64.tar.gz //解压 [hadoop@hadoop11 app]$ ls jdk1.7.0_79 jdk-7u79-linux-x64.tar.gz [hadoop@hadoop11 app]$ rm jdk-7u79-linux-x64.tar.gz //删除安装包
添加jdk环境变量。
[hadoop@hadoop11 app]$ su root Password: [root@hadoop11 app]# vi /etc/profile JAVA_HOME=/home/hadoop/app/jdk1.7.0_79 CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar PATH=$JAVA_HOME/bin:$PATH export JAVA_HOME CLASSPATH PATH [root@hadoop11 app]# source /etc/profile //使配置文件生效
查看jdk是否安装成功。
[root@hadoop11 app]# java -version java version "1.7.0_79" Java(TM) SE Runtime Environment (build 1.7.0_79-b15) Java HotSpot(TM) 64-Bit Server VM (build 24.79-b02, mixed mode)
出现以上结果就说明hadoop11节点上的jdk安装成功。
然后将hadoop11下的jdk安装包复制到其他节点上。
[hadoop@hadoop11 app]$ deploy.sh jdk1.7.0_79 /home/hadoop/app/ slave
hadoop12,hadoop13,hadoop14,hadoop15节点重复hadoop11节点上的jdk配置即可。
(八)Zookeeper安装
将本地下载好的zookeeper-3.4.6.tar.gz安装包,上传至hadoop11节点下的/home/hadoop/app目录下。
[hadoop@hadoop11 app]$ rz //选择本地下载好的zookeeper-3.4.6.tar.gz [hadoop@hadoop11 app]$ ls jdk1.7.0_79 zookeeper-3.4.6.tar.gz [hadoop@hadoop11 app]$ tar zxvf zookeeper-3.4.6.tar.gz //解压 [hadoop@hadoop11 app]$ ls jdk1.7.0_79 zookeeper-3.4.6.tar.gz zookeeper-3.4.6 [hadoop@hadoop11 app]$ rm zookeeper-3.4.6.tar.gz //删除zookeeper-3.4.6.tar.gz安装包 [hadoop@hadoop11 app]$ mv zookeeper-3.4.6 zookeeper //重命名
修改Zookeeper中的配置文件。
[hadoop@hadoop11 app]$ cd /home/hadoop/app/zookeeper/conf/ [hadoop@hadoop11 conf]$ ls configuration.xsl log4j.properties zoo_sample.cfg [hadoop@hadoop11 conf]$ cp zoo_sample.cfg zoo.cfg //复制一个zoo.cfg文件 [hadoop@hadoop11 conf]$ vi zoo.cfg dataDir=/home/hadoop/data/zookeeper/zkdata //数据文件目录 dataLogDir=/home/hadoop/data/zookeeper/zkdatalog //日志目录 # the port at which the clients will connect clientPort=2181 //默认端口号 #server.服务编号=主机名称:Zookeeper不同节点之间同步和通信的端口:选举端口(选举leader) server.1=hadoop11:2888:3888 server.2=hadoop12:2888:3888 server.3=hadoop13:2888:3888 server.4=hadoop14:2888:3888 server.5=hadoop15:2888:3888
通过远程命令deploy.sh将Zookeeper安装目录拷贝到其他节点上面。
[hadoop@hadoop11 app]$ deploy.sh zookeeer /home/hadoop/app slave
通过远程命令runRemoteCmd.sh在所有的节点上面创建目录:
[hadoop@hadoop11 app]$ runRemoteCmd.sh "mkdir -p /home/hadoop/data/zookeeper/zkdata" all //创建数据目录 [hadoop@hadoop11 app]$ runRemoteCmd.sh "mkdir -p /home/hadoop/data/zookeeper/zkdatalog" all //创建日志目录
然后分别在hadoop11、hadoop12、hadoop13、hadoop14、hadoop15上面,进入zkdata目录下,创建文件myid,里面的内容分别填充为:1、2、3、4、5, 这里我们以hadoop11为例。
[hadoop@hadoop11 app]$ cd /home/hadoop/data/zookeeper/zkdata [hadoop@hadoop11 zkdata]$ vi myid 1 //输入数字1
配置Zookeeper环境变量。
[hadoop@hadoop11 zkdata]$ su root Password: [root@hadoop11 zkdata]# vi /etc/profile JAVA_HOME=/home/hadoop/app/jdk1.7.0_79 ZOOKEEPER_HOME=/home/hadoop/app/zookeeper CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar PATH=$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin:$PATH export JAVA_HOME CLASSPATH PATH ZOOKEEPER_HOME [root@hadoop11 zkdata]# source /etc/profile //使配置文件生效
在hadoop11节点上面启动Zookeeper。
[hadoop@hadoop11 zkdata]$ cd /home/hadoop/app/zookeeper/ [hadoop@hadoop11 zookeeper]$ bin/zkServer.sh start [hadoop@hadoop11 zookeeper]$ jps 3633 QuorumPeerMain [hadoop@hadoop11 zookeeper]$ bin/zkServer.sh stop //关闭Zookeeper
使用runRemoteCmd.sh 脚本,启动所有节点上面的Zookeeper。
runRemoteCmd.sh "/home/hadoop/app/zookeeper/bin/zkServer.sh start" zookeeper
查看所有节点上面的QuorumPeerMain进程是否启动。
runRemoteCmd.sh "jps" zookeeper
查看所有Zookeeper节点状态。
runRemoteCmd.sh "/home/hadoop/app/zookeeper/bin/zkServer.sh status" zookeeper
如果一个节点为leader,另四个节点为follower,则说明Zookeeper安装成功。
(九)hadoop集群环境搭建
将下载好的apache hadoop-2.6.0.tar.gz安装包,上传至hadoop11节点下的/home/hadoop/app目录下。
[hadoop@hadoop11 app]$ rz //将本地的hadoop-2.6.0.tar.gz安装包上传至当前目录 [hadoop@hadoop11 app]$ ls hadoop-2.6.0.tar.gz jdk1.7.0_79 zookeeper [hadoop@hadoop11 app]$ tar zxvf hadoop-2.6.0.tar.gz //解压 [hadoop@hadoop11 app]$ ls hadoop-2.6.0 hadoop-2.6.0.tar.gz jdk1.7.0_79 zookeeper [hadoop@hadoop11 app]$ rm hadoop-2.6.0.tar.gz //删除安装包 [hadoop@hadoop11 app]$ mv hadoop-2.6.0 hadoop //重命名
切换到/home/hadoop/app/hadoop/etc/hadoop/目录下,修改配置文件。
[hadoop@hadoop11 app]$ cd /home/hadoop/app/hadoop/etc/hadoop/
配置HDFS
配置hadoop-env.sh
[hadoop@hadoop11 hadoop]$ vi hadoop-env.sh export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
配置core-site.xml
[hadoop@hadoop11 hadoop]$ vi core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster1</value>
</property>
< 这里的值指的是默认的HDFS路径 ,取名为cluster1>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/data/tmp</value>
</property>
< hadoop的临时目录,如果需要配置多个目录,需要逗号隔开,data目录需要我们自己创建>
<property>
<name>ha.zookeeper.quorum</name>
<value>hadoop11:2181,hadoop12:2181,hadoop13:2181,hadoop14:2181,hadoop15:2181</value>
</property>
< 配置Zookeeper 管理HDFS>
</configuration>
配置hdfs-site.xml
[hadoop@hadoop11 hadoop]$ vi hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
< 数据块副本数为3>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>
< 权限默认配置为false>
<property>
<name>dfs.nameservices</name>
<value>cluster1</value>
</property>
< 命名空间,它的值与fs.defaultFS的值要对应,namenode高可用之后有两个namenode,cluster1是对外提供的统一入口>
<property>
<name>dfs.ha.namenodes.cluster1</name>
<value>hadoop11,hadoop12</value>
</property>
< 指定 nameService 是 cluster1 时的nameNode有哪些,这里的值也是逻辑名称,名字随便起,相互不重复即可>
<property>
<name>dfs.namenode.rpc-address.cluster1.hadoop11</name>
<value>hadoop11:9000</value>
</property>
< hadoop11 rpc地址>
<property>
<name>dfs.namenode.http-address.cluster1.hadoop11</name>
<value>hadoop11:50070</value>
</property>
< hadoop11 http地址>
<property>
<name>dfs.namenode.rpc-address.cluster1.hadoop12</name>
<value>hadoop12:9000</value>
</property>
< hadoop12 rpc地址>
<property>
<name>dfs.namenode.http-address.cluster1.hadoop12</name>
<value>hadoop12:50070</value>
</property>
< hadoop12 http地址>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
< 启动故障自动恢复>
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://hadoop11:8485;hadoop12:8485;hadoop13:8485;hadoop14:8485;hadoop15:8485/cluster1</value>
</property>
< 指定journal>
<property>
<name>dfs.client.failover.proxy.provider.cluster1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
< 指定 cluster1 出故障时,哪个实现类负责执行故障切换>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/home/hadoop/data/journaldata/jn</value>
</property>
< 指定JournalNode集群在对nameNode的目录进行共享时,自己存储数据的磁盘路径 >
<property>
<name>dfs.ha.fencing.methods</name>
<value>shell(/bin/true)</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/hadoop/.ssh/id_rsa</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>10000</value>
</property>
< 脑裂默认配置>
<property>
<name>dfs.namenode.handler.count</name>
<value>100</value>
</property>
</configuration>
配置 slave
[hadoop@hadoop11 hadoop]$ vi slaves hadoop13 hadoop14 hadoop15
向所有节点分发hadoop安装包。
[hadoop@hadoop11 app]$ deploy.sh hadoop /home/hadoop/app/ slave
hdfs配置完毕后启动顺序
1、启动所有节点上面的Zookeeper进程
[hadoop@hadoop11 hadoop]$ runRemoteCmd.sh "/home/hadoop/app/zookeeper/bin/zkServer.sh start" zookeeper
2、启动所有节点上面的journalnode进程
[hadoop@hadoop11 hadoop]$ runRemoteCmd.sh "/home/hadoop/app/hadoop/sbin/hadoop-daemon.sh start journalnode" all
3、首先在主节点上(比如,hadoop11)执行格式化
[hadoop@hadoop11 hadoop]$ bin/hdfs namenode -format / /namenode 格式化 [hadoop@hadoop11 hadoop]$ bin/hdfs zkfc -formatZK //格式化高可用 [hadoop@hadoop11 hadoop]$bin/hdfs namenode //启动namenode
4、与此同时,需要在备节点(比如,hadoop12)上执行数据同步
[hadoop@hadoop12 hadoop]$ bin/hdfs namenode -bootstrapStandby //同步主节点和备节点之间的元数据
5、hadoop12同步完数据后,紧接着在hadoop11节点上,按下ctrl+c来结束namenode进程。 然后关闭所有节点上面的journalnode进程
[hadoop@hadoop11 hadoop]$ runRemoteCmd.sh "/home/hadoop/app/hadoop/sbin/hadoop-daemon.sh stop journalnode" all //然后停掉各节点的journalnode
6、如果上面操作没有问题,我们可以一键启动hdfs所有相关进程
[hadoop@hadoop11 hadoop]$ sbin/start-dfs.sh
启动成功之后,关闭其中一个namenode ,然后在启动namenode 观察切换的状况。
7、验证是否启动成功
通过web界面查看namenode启动情况。
http://hadoop11:50070
YARN安装配置
配置mapred-site.xml
[hadoop@hadoop11 hadoop]$ vi mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<指定运行mapreduce的环境是Yarn,与hadoop1不同的地方>
</configuration>
配置yarn-site.xml
[hadoop@hadoop11 hadoop]$ vi yarn-site.xml
<configuration>
<property>
<name>yarn.resourcemanager.connect.retry-interval.ms</name>
<value>2000</value>
</property>
< 超时的周期>
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>
< 打开高可用>
<property>
<name>yarn.resourcemanager.ha.automatic-failover.enabled</name>
<value>true