zoukankan      html  css  js  c++  java
  • 文本处理工具 – wc,cut,sort,uniq

    wc命令:

    word count 统计文本中的字符个数
    -l:行数
    -w:单词数
    -c:字节数

    cut命令:
    用来做文件分隔
    -d DELIMETER:指明分隔符;
    -f 指定输出的数据
    #:第#个字段
    #,#[,#]:离散的多个字段,例如1,3,6
    #-#:连续多个字段,例如1-6
    混合使用:1-3,7
    --output-delimiter=‘xx’:指定以什么字符串输出;

    sort命令:

    排序,默认查看第一个字符(包括数字字母以及空格和特殊符号),以ASCII码来排序
    -f:忽略字符的大小写
    -r:逆序
    -t DELIMETER:指定字段分隔符;
    -k #:以指定的字段为标准排序;
    -n:以数值大小进行排序
    -u:uniq,排序后去重;

    uniq命令:
    连续且相同的命令,才被视为重复
    -d, --repeated:仅显示重复的行;
    -u, --unique:仅显示不曾重复的行;

    *   -c, --count:统计某些字符重复的次数

    sort FINENAME | uniq -c

  • 相关阅读:
    什么事数据对象以及属性分为什么类型?
    Oracle数据库安装
    红黑树和B树
    Java多线程02
    HashMap分析
    java虚拟机——垃圾回收与内存分配
    Java虚拟机——对象
    Java虚拟机——内存
    java数据结构03
    LeetCode刷题
  • 原文地址:https://www.cnblogs.com/azuressy/p/11344106.html
Copyright © 2011-2022 走看看