zoukankan      html  css  js  c++  java
  • hadoop fs –stat 命令

    当向HDFS上写文件时,可以通过设置dfs.blocksize配置项来设置文件的block size,这导致HDFS上不同文件的block size是不同的。有时候我们需要知道HDFS上某个文件的block size,比如想知道该该文件作为job的输入会创建几个map等。

    Hadoop FS Shell提供了一个-stat选项可以达到目的。官方文档描述这个选项时遗漏了可选参数。-stat选项的使用格式是:

    hadoop fs –stat [format]
    其中可选的format被官方文档遗漏了。下面列出了format的形式:
    %b:打印文件大小(目录为0)
    %n:打印文件名
    %o:打印block size (我们要的值)
    %r:打印备份数
    %y:打印UTC日期 yyyy-MM-dd HH:mm:ss
    %Y:打印自1970年1月1日以来的UTC微秒数
    %F:目录打印directory, 文件打印regular file

    注意以下几点:

    1.当使用-stat选项但不指定format时候,只打印文件创建日期,相当于%y:

    hadoop fs -stat file1

    2015-01-06 01:43:23

    2.查看文件的block size和备份个数

    hadoop fs -stat "%o %r"  file1
    134217728 1
     
    可以看到file1件的blocksize大小为128M,有一份。
  • 相关阅读:
    python 安装包总结
    python wmi使用
    Jquery
    查看linux操作系统位数
    三元
    git clone 指定分支的内容
    慕课网
    http://amazeui.org 后天框架
    tp between
    git pull
  • 原文地址:https://www.cnblogs.com/wqbin/p/11672091.html
Copyright © 2011-2022 走看看