zoukankan      html  css  js  c++  java
  • shell分析日志常用指令合集

      数据分析对于网站运营人员是个非常重要的技能,日志分析是其中的一个。日志分析可以用专门的工具进行分析,也可以用原生的shell脚本执行,下面就随ytkah看看shell分析日志常用指令有哪些吧。(log_file表示所在路径,完整的路径像这样:/www/var/***.log)

      1、查看当天有多少个IP访问:

    awk '{print $1}' log_file|sort|uniq|wc -l
    

      2、查看某一个页面被访问的次数:

    grep "/index.php" log_file | wc -l
    

      3、查看每一个IP访问了多少个页面:

    awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file
    

      4、将每个IP访问的页面数进行从小到大排序:

    awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n
    

      5、查看某一个IP访问了哪些页面:

    grep ^111.111.111.111 log_file| awk '{print $1,$7}'
    

      6、去掉搜索引擎统计当天的页面:

    awk '{print $12,$1}' log_file | grep ^"Mozilla | awk '{print $2}' |sort | uniq | wc -l
    

      7、查看2018年11月21日14时这一个小时内有多少IP访问:

    awk '{print $4,$1}' log_file | grep 21/Nov/2018:14 | awk '{print $2}'| sort | uniq | wc -l
    

      8、列出当天访问次数最多的IP

    cut -d- -f 1 log_file |uniq -c | sort -rn | head -20

      原理

           cut
    
           -d, --delimiter=DELIM
    
                  use DELIM instead of TAB for field delimiter
    
                  表示用-分割,然后-f 1 
    
           -f, --fields=LIST
    
                  select only these fields;  also print any line that contains  no
    
                  delimiter character, unless the -s option is specified
    
               表示打印第一部分,就是ip
    
     uniq 是将重复行去掉, -c表示前面前面加上数目,
    
           sort -rn 就是按照数字从大到小排序,
    
           head -20取前面20行
    

      

      你可能会喜欢:shell日志分析进阶篇

  • 相关阅读:
    如何理解c和c++ 的复杂类型声明
    xp自带扫雷bug
    求三角形的外接圆
    判断一个点是否在一个三角形内
    三角函数角度公式
    弗洛伊德(Floyd)算法
    在Win32应用程序中用Console控制台输出信息
    无法打开libcp.lib
    C#获取当前应用程序所在路径及环境变量
    C#事件的发送方和接收方(订阅方)【转】
  • 原文地址:https://www.cnblogs.com/ytkah/p/10082032.html
Copyright © 2011-2022 走看看