zoukankan      html  css  js  c++  java
  • linux统计单词数

    sort +awk+uniq 统计文件中出现次数最多的前10个单词

    实例
    cat logt.log|sort -s -t '-' -k1n |awk '{print $1;}'|uniq -c|sort -k1nr|head -100


    使用linux命令或者shell实现:文件words存放英文单词,格式为每行一个英文单词(单词可以重复),统计这个文件中出现次数最多的前10个单词。

    cat words.txt | sort | uniq -c | sort -k1,1nr | head –10

     

    主要考察对sort、uniq命令的使用,相关解释如下,命令及参数的详细说明请自行通过man查看,简单介绍下以上指令各部分的功能:

    sort:  对单词进行排序

    uniq -c:  显示唯一的行,并在每行行首加上本行在文件中出现的次数

    sort -k1,1nr:  按照第一个字段,数值排序,且为逆序

    head -10:  取前10行数据

    参考: http://man.linuxde.net/

  • 相关阅读:
    Xamarin.Forms 开发IOS、Android、UWP应用
    C# 根据路径删除文件或文件夹
    UWP应用程序使用Prism框架构建MVVM
    创建UWP通用应用程序
    初体验uglifyjs压缩JS
    ecarts图与表格切换时,echarts全变形的原因及解决办法
    vue表格绑定数据中的值发生改变时,表格未刷新
    基于pycaffe的网络训练和结果分析(mnist数据集)
    安装python caffe过程中遇到的一些问题以及对应的解决方案
    logistic regression浅析
  • 原文地址:https://www.cnblogs.com/yepei/p/5649212.html
Copyright © 2011-2022 走看看