zoukankan      html  css  js  c++  java
  • 使用shell统计出出现次数排名top10的网址(在博客园中没找到,特转一下)

    转自:http://blog.csdn.net/guaguastd/article/details/8332757
    使用shell统计出出现次数排名top10的网址
    分类: Shell脚本
    [plain] view plaincopy在CODE上查看代码片派生到我的代码片
     
    1. #!/bin/sh  
    2.   
    3.   
    4. foo()  
    5. {  
    6.     if [ $# -ne 1 ];  
    7.     then  
    8.         echo "Usage:$0 filename";   
    9.         exit -1  
    10.     fi  
    11.   
    12.   
    13. egrep -o "http://[a-zA-Z0-9.]+.[a-zA-Z]{2,3}" website | awk '{ count[$0]++ } END { printf("%-30s %s ","wensite","count"); for(ind in count) { printf("%-30s %d ",ind,count[ind]); } }' | sort -nrk 2 | head -n 10 >websorted2.txt;  
    14.   
    15.   
    16. }  
    17.   
    18.   
    19. foo website   

    例子:

    文件website中的内容:

    http://www.google.com
    http://www.baidu.com
    http://www.sina.com
    http://www.bjtu.edu.cn
    http://www.codeproject.com
    http://www.csdn.com
    http://www.sohu.com
    http://www.yahoo.com
    http://mail.163.com
    http://www.bjtu.edu.cn
    http://www.codeproject.com
    http://www.csdn.com
    http://www.sohu.com
    http://www.yahoo.com
    http://mail.163.com
    http://www.codeproject.com
    http://www.csdn.com
    http://www.sohu.com
    http://www.yahoo.com
    http://mail.163.com
    http://www.qq.com
    http://www.hao123.com
    http://www.163.com
    http://youku.com
    http://taobao/com
    http://www.bjtu.edu.cn
    http://www.codeproject.com
    http://www.csdn.com
    http://www.sohu.com
    http://www.yahoo.com
    http://mail.163.com
    http://www.codeproject.com
    http://www.csdn.com
    http://www.sohu.com
    http://www.yahoo.com
    http://mail.163.com
    http://www.qq.com
    http://www.hao123.com
    http://www.163.com
    http://youku.com
    http://taobao/com

    生成的文件内容为(即结果)

    http://www.yahoo.com           5
    http://www.sohu.com            5
    http://www.csdn.com            5
    http://www.codeproject.com     5
    http://mail.163.com            5
    http://www.bjtu.edu.cn         3
    http://youku.com               2
    http://www.qq.com              2
    http://www.hao123.com          2
    http://www.163.com             2

  • 相关阅读:
    ElasticSearch--------->附录------->curl------->附录一:下载、安装、配置cURL
    ElasticSearch--------------------->step2,了解elasticsearch相关的基本概念
    1. anaconda安装与配置
    js 浮点型数据运算
    2.0 VMware安装教程
    2.2 es6之Promise对象
    代理模式
    oracle原始对象
    锁理论
    策略模式
  • 原文地址:https://www.cnblogs.com/yidaxia/p/4459682.html
Copyright © 2011-2022 走看看