背景知识:
1.数据分布存储,不是复制存储
2.数据不动,代码动,由于分布式存储,所以把代码移动到数据的地方计算。
3.数据如何分割,hadoop提供的分割文件的编程接口
安装:
1.安装JDK
1.解压
2.配置环境变量,为了直接查看java进程,linux查看方法就是jps命令。
3.vim /etc/profile (全局的)
export JAVA_HOME=/usr/java/jdk1.6.0_45
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
2.安装HDFS
1.vim conf/hadoop_env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_51
2.vim core-site.xml
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/tmphadoop</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
3.