zoukankan      html  css  js  c++  java
  • HDFS常用文件操作

    put

    上传文件    hadoop fs -put wordcount.txt   /data/wordcount/
    text
    查看文件内容   hadoop fs -text /output/wordcount/part-r-00000 
    ls
    hadoop fs -ls /   列出hdfs文件系统根目录下的目录和文件

    hadoop fs -ls -R /   列出hdfs文件系统所有目录和文件

    rm

    hadoop fs -rm < hdfs file > ...

    hadoop fs -rm -r < hdfs dir>...

    每次可以删除多个文件或目录
    mkdir
    只能一级一级建目录,父目录不存在的话使用这个命令会报错
    所创建的目录如果父目录不存在就创建该父目录

    cp

    目标文件不能存在,否则命令不能执行,相当于给文件重命名并保存,源文件还存在
    hadoop fs -cp < hdfs file or dir >... < hdfs dir >

    目标文件夹要存在,否则命令不能执行

    mv

    目标文件不能存在,否则命令不能执行,相当于给文件重命名并保存,源文件不存在

    源路径有多个时,目标路径必须为目录,且必须存在。

    count

    统计hdfs对应路径下的目录个数,文件个数,文件总计大小
    显示为目录个数,文件个数,文件总计大小,输入路径

    du

    显示hdfs对应路径下每个文件夹和文件的大小
    显示hdfs对应路径下所有文件和的大小

    stat

    返回对应路径的状态信息

    tail

    在标准输出中显示文件末尾的1KB数据

    balancer

    如果管理员发现某些DataNode保存数据过多,某些DataNode保存数据相对较少,可以使用上述命令手动启动内部的均衡过程

    hdfs dfsadmin -safemode < enter | leave | get | wait >

    enter:进入安全模式;leave:离开安全模式;get:获知是否开启安全模式;

    wait:等待离开安全模式

    distcp

    用来在两个HDFS之间拷贝数据

    setrep

    改变一个文件在hdfs中的副本个数,上述命令中数字3为所设置的副本个数,-R选项可以对一个人目录下的所有目录+文件递归执行改变副本个数的操作

  • 相关阅读:
    centos 7 安装nvidia显卡驱动
    Ubuntu 16.04LTS 安装 MATLAB 2014B
    Linux 查看CPU温度
    pip: unsupported locale setting
    ubuntu 卸载从源码安装的 emacs
    html css使用特殊自定义字体避免侵权
    JS操作iframe父级子级元素,jquery自动点击iframe里按钮
    Iframe标签显示目标网页的指定区域,视频可全屏可缩小
    禁止所有搜索爬虫访问网站指定目录robots.txt
    ThinkPHP5.0、5.1和6.0教程文档合集(免费下载)
  • 原文地址:https://www.cnblogs.com/dtstack/p/10065530.html
Copyright © 2011-2022 走看看