zoukankan      html  css  js  c++  java
  • hadoop fs –stat 命令

    当向HDFS上写文件时,可以通过设置dfs.blocksize配置项来设置文件的block size,这导致HDFS上不同文件的block size是不同的。有时候我们需要知道HDFS上某个文件的block size,比如想知道该该文件作为job的输入会创建几个map等。

    Hadoop FS Shell提供了一个-stat选项可以达到目的。官方文档描述这个选项时遗漏了可选参数。-stat选项的使用格式是:

    hadoop fs –stat [format]
    其中可选的format被官方文档遗漏了。下面列出了format的形式:
    %b:打印文件大小(目录为0)
    %n:打印文件名
    %o:打印block size (我们要的值)
    %r:打印备份数
    %y:打印UTC日期 yyyy-MM-dd HH:mm:ss
    %Y:打印自1970年1月1日以来的UTC微秒数
    %F:目录打印directory, 文件打印regular file

    注意以下几点:

    1.当使用-stat选项但不指定format时候,只打印文件创建日期,相当于%y:

    hadoop fs -stat file1

    2015-01-06 01:43:23

    2.查看文件的block size和备份个数

    hadoop fs -stat "%o %r"  file1
    134217728 1
     
    可以看到file1件的blocksize大小为128M,有一份。
  • 相关阅读:
    sql语句常考知识点总结
    服务器搭建
    软件测试面试题
    linux常用命令
    kibana常用查询删除语法
    python从kafka消费数据
    foxmail客户端,写邮件窗口弹不出来
    JMeter学习——测试文件下载
    python中取两个列表中不同的元素
    MySQL主从复制
  • 原文地址:https://www.cnblogs.com/wqbin/p/11672091.html
Copyright © 2011-2022 走看看