zoukankan      html  css  js  c++  java
  • HDFS目标大文件夹下文件索引建立

    一、索引命令

      1、非分布式,单机

    1  hadoop jar /usr/lib/hadoop/lib/hadoop-lzo.jar com.hadoop.compression.lzo.LzoIndexer ${path}

      2、分布式:任务提交到yarn,需要使用集群资源  

    1 hadoop jar /usr/lib/hadoop/lib/hadoop-lzo.jar com.hadoop.compression.lzo.DistributedLzoIndexer  ${path}

      注: 可能遇到的情况,在某些需要队列或者有keyberos认证的机器, DistributedLzoIndexer 可能不会那么理想,需要添加队列或者加上keyberos参数。

    二、执行linux shell命令java参考模板

      

     1 public class ExecCMD {
     2 
     3     private static final Logger log = LoggerFactory.getLogger(ExecCMD.class);
     4 
     5     public static String exec(String cmd) {
     6         try {
     7             String[] cmdA = { "/bin/sh", "-c", cmd };
     8             Process process = Runtime.getRuntime().exec(cmdA);
     9             LineNumberReader br = new LineNumberReader(new InputStreamReader(process.getInputStream()));
    10             StringBuffer buff = new StringBuffer();
    11             String line;
    12             while ((line = br.readLine()) != null) {
    13                 buff.append(line).append("
    ");
    14             }
    15             String result = buff.toString();
    16             if (!cmd.isEmpty())
    17                 log.info("cmd executed, result: " + result);
    18             return result;
    19         } catch (Exception e) {
    20             log.error("Failed to exec cmd: " + cmd, e);
    21         }
    22         return null;
    23     }
    24 }
  • 相关阅读:
    访问控制模型+强制访问控制
    防火墙体系结构
    信息安全工程师手记
    关于PHPSESSIONID的一些发现
    中级测评师10-物联网
    WAPI学习记录
    1. Jenkins 入门使用
    Springboot druid监控配置
    Springboot 添加数据源报错
    mysql function 查询子级机构
  • 原文地址:https://www.cnblogs.com/Swidasya/p/7482617.html
Copyright © 2011-2022 走看看