zoukankan      html  css  js  c++  java
  • Linux下统计出现次数最多的指定字段值

    假设桌面上有一个叫“data.txt”的文本,内容如下:

    {id='xxx' info='xxx' kk='xxx' target='111111' dd='xxx'}
    {id='xxx' info='xxx' kk='xxx' target='777' dd='xxx'}
    {id='xxx' info='xxx' kk='xxx' target='yyyy' dd='xxx'}
    {id='xxx' info='xxx' kk='xxx' target='5555' dd='xxx'}
    {id='xxx' info='xxx' kk='xxx' target='777' dd='xxx'}
    {id='xxx' info='xxx' kk='xxx' target='555566' dd='xxx'}

    要求:找出“data.txt”文件中target字段出现次数最多的值。

    Linux下统计字符串

    在linux终端通过常用工具进行解决,方法如下:

    其中组合用到了一些命令行和工具,有cat、awk、cut、sed、sort、uniq、tail——

    cat

    cat data.txt,获取并显示“data.txt”文件的每一行内容:

    awk

    cat data.txt | awk '{print $4}',显示传入的每一行中第四个字段:

    cut

    cat data.txt | awk '{print $4}' | cut -c 8-,从传入字符串的第八位开始,截取字符串到最后:

    sed

    cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g",去掉传入字符串中包含的 ' 字符:

    sort

    cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | sort,对结果进行排序:

    uniq

    cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | sort | uniq -c | sort,去重并统计每种字符串出现的次数:

    tail

    cat data.txt | awk '{print $4}' | cut -c 8- | sed "s/'//g" | sort | uniq -c | sort | tail -n 1,显示结果中的最后一行:

    我们至此已知出现次数最多的target字段值为777,出现次数为2。若有多个相同次数的字段值出现,可以通过修改tail -n后面接的数值来查看,改为10即显示结尾10行。

  • 相关阅读:
    Centos环境下部署游戏服务器-自动化
    Centos环境下部署游戏服务器-SVN
    Centos环境下部署游戏服务器-权限
    Centos环境下部署游戏服务器-Eclipse
    Centos环境下部署游戏服务器-编译
    Centos环境下部署游戏服务器-软件安装
    基本的Logstash 例子
    安装Logstash
    安装Logstash
    mysqldump --master-data
  • 原文地址:https://www.cnblogs.com/LanTianYou/p/5206832.html
Copyright © 2011-2022 走看看