zoukankan      html  css  js  c++  java
  • Spark2 文件处理和jar包执行

    上传数据文件

    mkdir -p data/ml/

    hadoop fs -mkdir -p /datafile/wangxiao/

    hadoop fs -ls /

    hadoop fs -put /home/wangxiao/data/ml/Affairs.txt /datafile/wangxiao/

    hadoop fs -ls -R /datafile

    hdfs://ns1/datafile/wangxiao/Affairs.txt

    执行jar包  

      mkdir -p jar/

      $SPARK_HOME/bin/spark-submit  

      --class "ML2"  

      --master local[2]  

      /home/wangxiao/jar/test.jar

    下载数据文件到本地

    hadoop fs -get  /datafile/wangxiao/Affairs.txt  /home/wangxiao/data/ml/

    删除HDFS上的文件

    hadoop fs -rm -r -f /datafile/wangxiao/data*

    hadoop fs -cat /user/wangxiao/bfeed.txt  输出文本内容

    hadoop fs –mkdir //user/wangxiao/dir/ 在指定位置创建目录。
       
    hadoop fs -du -h /user/wangxiao/ 统计目录下文件大小

    hadoop fs -count -q /user/wangxiao/ 统计文件(夹)数量

    命名空间的quota(限制文件数) 剩余的命名空间quota 物理空间的quota (限制空间占用大小) 剩余的物理空间 目录数统计 文件数统计 目录逻辑空间总大小 路径

    逻辑空间,即分布式文件系统上真正的文件大小
    物理空间,即存在分布式文件系统上该文件实际占用的空间

    分布式文件系统为了保证文件的可靠性,往往会保存多个备份(一般是3份),
    只要备份数不为1的情况下,一般物理空间会是逻辑空间的几倍。

    HDFS物理空间=逻辑空间*block备份数

  • 相关阅读:
    使用pd从数据库逆向生成pdm文件
    js中的this指向
    js中的深浅拷贝
    使用eclipse遇到问题:the-package-collides-with-a-type
    电脑环境设置
    VIP
    win7操作技巧
    遍历Map的四种方法
    win7下安装tomcat
    Eclipse下快速打开本地文件的插件easy explore
  • 原文地址:https://www.cnblogs.com/wwxbi/p/5965131.html
Copyright © 2011-2022 走看看