zoukankan      html  css  js  c++  java
  • Java之使用Hadoop探索大数据的世界

      什么是大数据

      PB = 1024tb

      7123913827189tb

      Reids

      无共享

      HDFS

      优点 :特别适合存储大型文件

      TFS

      hdfs 架构

      NameNode: 整个hadoop总管,只有一个,DataNode down了

      存储为镜像文件fsimage 和edites

      secondary 定期合并日志文件及镜像文件

      DataNode 负责存储数据

      以固定大小的block为基本单位组织文件内容 默认大小是64M

      MapReduce

      JobTracker 主要负责资源监控及作业调度

      TaskTrachker

      slot 分为Map slot Reduce slot

      Task

      map Task Reduce Tack

      配置单台hadoop 伪分布式环境

      1编辑 ~/.bashrc

      export HADOOP_HOME=/usr/local/hadoop //hadoop 安装路径

      export HADOOP_INSTALL=$HADOOP_HOME

      export HADOOP_MAPRED_HOME=$HADOOP_HOME

      export HADOOP_COMMON_HOME=$HADOOP_HOME

      export HADOOP_HDFS_HOME=$HADOOP_HOME

      export YARN_HOME=$HADOOP_HOME

      export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

      export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

      保存后让设置生效

      source ~/.bashrc

      ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

      数据本地化

      运算移动,数据不移动

      需求:查询哪个账户钱最

      moneys[] ....//moneys = 56789778687687;

      max = 0L;

      for(i=0L:moneys){

      if(i>max){

      max=i;

      }

      }

      MapReduce

      Map1 Map 2 Map4

      1233 4223423 423432

      1000 800 1200

      1200

      ./etc/hadoop/core-site.xml

      <configuration>

      <property>

      <name>hadoop.tmp.dir</name>

      <value>file:/usr/local/hadoop/tmp</value>

      <description>Abase for other temporary directories.</description>

      </property>

      <property>

      <name>fs.defaultFS</name>

      <value>hdfs://localhost:9000</value>

      </property>

      </configuration>

      hdfs-site.xml

      <configuration>

      <property>

      <name>dfs.replication</name>

      <value>1</value>

      </property>

      <property>

      <name>dfs.namenode.name.dir</name>

      <value>file:/usr/local/hadoop/tmp/dfs/name</value>

      </property>

      <property>

      <name>dfs.datanode.data.dir</name>

      <value>file:/usr/local/hadoop/tmp/dfs/data</value>

      </property>

      </configuration>

      优酷Java视频总汇地址:http://i.youku.com/i/UMTI4MTEzNTA0MA==?spm=a2hww.20023042.uerCenter.5~5!2~A

  • 相关阅读:
    D365: 笔记(VS无法打开表浏览器)
    D365: 笔记(跟踪调试批处理代码)
    D365: 笔记(非批处理执行class中弹出交互式窗体或报表)
    D365: 笔记(现有量增加批号表字段查询条件)
    D365: 新功能(二)采购发票自动化流程
    D365: 新功能(一)按日期设置编号规则
    ES6 入门教程(未完)
    深入理解TypeScript(未完)
    项目
    vue + threejs 项目踩坑总结
  • 原文地址:https://www.cnblogs.com/anjijiji/p/6233409.html
Copyright © 2011-2022 走看看