zoukankan      html  css  js  c++  java
  • [apache]用shell分析网站的访问情况

     随着网站正式运行,我们可以通过通用的免费日志分析工具比如awstats获得一些实际访问网站的信息,例如每天ip量,pv量,用户所用的的浏览器,用户所用的操作系统等,但是有时候希望通过手工方式从WEB日志文件中获得一些信息,下面列出了一些最近一段时间我经常在用的命令
    获得访问前10位的ip地址
    cat access.log|gawk ‘{print $1}’ |sort|uniq -c|sort -nr |head -10
    访问次数最多的文件或页面
    cat access.log|gawk ‘{print $11}’|sort|uniq -c|sort -nr
    通过子域名访问次数,依据referer来计算,稍有不准
    cat access.log | awk ‘{print $11}’ | sed -e ‘ s/http:////’ -e ‘ s//.*//’ | sort | uniq -c | sort -rn | head -20
    列出传输大小最大的几个文件
    cat www.access.log |awk ‘($7~/.php/){print $10 ” ” $1 ” ” $4 ” ” $7}’|sort -nr|head -100
    列出输出大于200000byte(约200kb)的页面以及对应页面发生次数
    cat www.access.log |awk ‘($10 > 200000 && $7~/.php/){print $7}’|sort -n|uniq -c|sort -nr|head -100
    如果日志最后一列记录的是页面文件传输时间,则有列出到客户端最耗时的页面
    cat www.access.log |awk ‘($7~/.php/){print $NF ” ” $1 ” ” $4 ” ” $7}’|sort -nr|head -100
    列出最最耗时的页面(超过60秒的)的以及对应页面发生次数
    cat www.access.log |awk ‘($NF > 60 && $7~/.php/){print $7}’|sort -n|uniq -c|sort -nr|head -100
    列出传输时间超过 30 秒的文件
    cat www.access.log |awk ‘($NF > 30){print $7}’|sort -n|uniq -c|sort -nr|head -20
    列出当前服务器每一进程运行的数量,倒序排
    ps -ef | awk -F ‘ ‘ ‘{print $8 ” ” $9}’ |sort | uniq -c |sort -nr |head -20

     
     
    1、查看当天有多少个IP访问:
    awk '{print $1}' log_file|sort|uniq|wc -l
    2、查看某一个页面被访问的次数:
    grep "/index.php" log_file | wc -l
    3、查看每一个IP访问了多少个页面:
    awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file
    4、将每个IP访问的页面数进行从小到大排序:
    awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n
    5、查看某一个IP访问了哪些页面:
    grep ^111.111.111.111 log_file| awk '{print $1,$7}'
    6、去掉搜索引擎统计当天的页面:
    awk '{print $12,$1}' log_file | grep ^"Mozilla | awk '{print $2}' |sort | uniq | wc -l
    7、查看2009年6月21日14时这一个小时内有多少IP访问:
    awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq | wc -l
    8-------------------------------------------------
    [日志分析] shell统计日志客户端ip总流量排序
    #linux apache nginx
    awk '{a[$1]=a[$1]+$10}END{for(i in a)print a/1024/1024"MB",i}' access_bbs.linuxtone.org.20110114|sort -nr >ip_tarffic_bbs.linuxtone.org.20110114
    #iis
    awk '{a[$7]=a[$7]+$NF}END{for(i in a)print a/1024/1024"MB",i}' access_bbs.linuxtone.org.20110114|sort -nr >ip_tarffic_bbs.linuxtone.org.20110114
    特定时间段:
    #linux apache nginx
    sed -n '/[13/Jan/2011:16:00:00/,/[13/Jan/2011:19:00:00/p' access_bbs.linuxtone.org.20110114|awk '{a[$1]=a[$1]+$10}END{for(i in a)print a[i]/1024/1024"MB",i}' |sort -nr >ip_tarffic_bbs.linuxtone.org.20110114_16-18
    #iis
    sed -n '/16:00:00/,/19:00:00/p' access_bbs.linuxtone.org.20110114|awk '{a[$7]=a[$7]+$NF}END{for(i in a)print a[i]/1024/1024"MB",i}' |sort -nr >ip_tarffic_bbs.linuxtone.org.20110114_16-18
  • 相关阅读:
    sql知识点记录
    makefile编译错误情况整理
    web worker 简介
    实现跨域访问的方法总结
    fiddler使用指南
    [转]SASS用法指南
    koa文档参考
    [转]html5: postMessage解决跨域和跨页面通信的问题
    [转]JavaScript ES6 class指南
    [转]前端利器:SASS基础与Compass入门
  • 原文地址:https://www.cnblogs.com/hanxianlong/p/4572624.html
Copyright © 2011-2022 走看看