zoukankan      html  css  js  c++  java
  • hdfs学习(二)

    一、HDFS文件限额配置

    在多人共用HDFS的环境下,配置设置非常重要。特别是在Hadoop处理大量资料的环境,如
    果没有配额管理,很容易把所有的空间用完造成别人无法存取。Hdfs的配额设定是针对目录
    而不是针对账号,可以 让每个账号仅操作某一个目录,然后对目录设置配置。


    hdfs文件的限额配置允许我们以文件个数,或者文件大小来限制我们在某个目录下上传的文
    件数量或者文件内容总量,以便达到我们类似百度网盘网盘等限制每个用户允许上传的最大
    的文件的量。

    ①数量限额

    hdfs dfs  -mkdir -p /user/root/dir   #创建hdfs文件夹
    hdfs dfsadmin -setQuota 2 dir    # 给该文件夹下面设置最多上传两个文件,发现只能上传一个文件,因为系统把文件本身也当作文件

    清除文件数量限制

    hdfs dfsadmin -clrQuota /user/root/dir  # 清除文件数量限制

    ②空间大小限额

    在设置空间配额时,设置的空间至少是block_size * 3大小

     生成任意大小文件的命令:

    dd if=/dev/zero of=1.txt  bs=1M count=2   #生成2M的文件

    清除空间配额限制

     

    二、hdfs的安全模式

    安全模式是hadoop的一种保护机制,用于保证集群中的数据块的安全性。当集群启动的时
    候,会首先进入安全模式。当系统处于安全模式时会检查数据块的完整性。


    假设我们设置的副本数(即参数dfs.replication)是3,那么在datanode上就应该有3个副本存
    在,假设只存在2个副本,那么比例就是2/3=0.666。hdfs默认的副本率0.999。我们的副本率
    0.666明显小于0.999,因此系统会自动的复制副本到其他dataNode,使得副本率不小于0.999。
    如果系统中有5个副本,超过我们设定的3个副本,那么系统也会删除多于的2个副本。


    在安全模式状态下,文件系统只接受读数据请求,而不接受删除、修改等变更请求。在,当
    整个系统达到安全标准时,HDFS自动离开安全模式

    安全模式操作命令:

    hdfs dfsadmin  -safemode  get #查看安全模式状态
    hdfs dfsadmin  -safemode enter #进入安全模式
    hdfs dfsadmin  -safemode leave #离开安全模式

    三、HDFS基准测试

    ①测试写入速度

    向HDFS文件系统中写入数据,10个文件,每个文件10MB,文件存放到/benchmarks/TestDFSIO中

     完成之后查看写入速度结果:

     

    ②测试读取速度

    在HDFS文件系统中读入10个文件,每个文件10M

     查看读取果

     

    清除测试数据

     

    HDFS文件写入过程

     HDFS读取过程

     

  • 相关阅读:
    【Spring】 AOP Base
    【Offer】[20] 【表示数值的字符串】
    【Offer】[19] 【字符串匹配】
    【设计模式】代理模式
    【LeetCode】[0002] 【两数之和】
    【Offer】[18-1] 【在O(1)时间内删除链表节点】
    【Offer】[18-2] 【删除链表中重复的节点】
    【Offer】[17] 【打印1到最大的n位数】
    【Offer】[16] 【数值的整数次方】
    python_内置函数
  • 原文地址:https://www.cnblogs.com/xiaofengzai/p/13499619.html
Copyright © 2011-2022 走看看