zoukankan      html  css  js  c++  java
  • [Linux] shell中for循环grep正则统计指定关键字

    需求是统计某个业务的访问个数日志服务器上的目录结构是如下,搜索最近7天的指定关键字数据,并排重统计个数:

    drwxr-xr-x 2 root root 4096 Nov 15 08:00 2019-11-15
    drwxr-xr-x 2 root root 4096 Nov 16 08:00 2019-11-16
    drwxr-xr-x 2 root root 4096 Nov 17 08:00 2019-11-17
    drwxr-xr-x 2 root root 4096 Nov 18 08:00 2019-11-18
    drwxr-xr-x 2 root root 4096 Nov 19 08:00 2019-11-19
    drwxr-xr-x 2 root root 4096 Nov 20 08:00 2019-11-20
    drwxr-xr-x 2 root root 4096 Nov 21 08:00 2019-11-21
    drwxr-xr-x 2 root root 4096 Nov 22 08:00 2019-11-22
    [root@mail tmp]# ll /data1/mailLog/app/kafka/2019-11-22/
    total 5708872
    -rw-r--r-- 1 root root 4847545594 Nov 22  2019 api-mail-sina-com-cn.log

    for循环的一行表示形式for ((i=15;i<=21;i++));do xxx;done
    while循环的一行表示 while true;do xxx;done
    获取当前年月`date +%Y-%m`
    grep -oP只显示正则匹配到的内容
    uniq|sort -u是去重

     for ((i=15;i<=21;i++));do cat `date +%Y-%m-$i`/api-mail-sina-com-cn.log|grep -oP "appid=2026078627&uid=d+"|uniq|sort -u >/tmp/`date +%Y-%m-$i`.android.log;done

    把匹配到的日志去重放入了/tmp/2019-11-22.android.log

    wc -l *.android.log
       87851 2019-11-15.android.log
       78686 2019-11-16.android.log
       76190 2019-11-17.android.log
       90938 2019-11-18.android.log
       91705 2019-11-19.android.log
       91388 2019-11-20.android.log
       91796 2019-11-21.android.log

    如果有不同的关键字,就多加几个grep,类似下面这个

     for ((i=15;i<=21;i++));do cat `date +%Y-%m-$i`/api-mail-sina-com-cn.log|grep "2026078627"|grep "active_client"|grep -oP "device_id=[^&]+|uniq|sort -u >/tmp/`date +%Y-%m-$i`.android.device.log;done

  • 相关阅读:
    jpa入门案例----使用jpa对数据库进行查询、删除、修改操作
    ssm详细流程和步骤
    Dubbo
    ssm运行BUG
    mybatis 入门
    Linux
    Redis
    maven
    三层架构 开发模式
    转发和重定向的区别
  • 原文地址:https://www.cnblogs.com/taoshihan/p/11913739.html
Copyright © 2011-2022 走看看