zoukankan      html  css  js  c++  java
  • 文本处理器 wc cut sort uniq

    wc 

      word count统计文本文件中的字符个数

      用法: wc filename

      行数  字符个数  文件大小 (字节)  文件名

      -l

      -w

      -c

    cut 

      用来做文件分隔

      -d   指定分隔符(delimiter)

        -d[ :]不行

      -f  指定输出的列数据:

        -f2

        -f1-3

        -f1,3

      --output-delimiter='xx'

      [cut的局限性:1、-d指定分隔符,不能同时指定多个2、不能做高级的格式化输出;所以我要熟练掌握awk]

    sort

      排序,默认查看第一个字符(包括数字字母以及空格和特殊字符),以ASCII码来排序(大小写不是)

      -f 忽略大小写的差异, 例如A与a视为编码相同;
      -b忽略最前面的空格符部分;
      -M以月份的名字来排序,例如JAN DEC等等的排序方法;
      -n使用纯数字进行排序,默认是以文件形态来排序的;
      -r反向排序;
      -u就是uniq,相同的数据中,仅出现一行代表;
      -t分隔符,默认是用tab键分割;
      -k以那个区间(field)来进行排序的意思

    uniq

      连续且相同的命令,才被视为重复

      建议,先排序,后去重

    tar 归档-》 对目录

      -c统计某些字符重复次数(重要)

      sort filename | uniq -c

  • 相关阅读:
    如何写Makefile?
    C语言变量的存储类别详解
    Longest Palindrome Substring
    Count Primes
    Closest Binary Search
    Search Insert Position
    Set Matrix Zeros ****
    Search for a Range
    Two Sum II
    Jump Game
  • 原文地址:https://www.cnblogs.com/yjkyjk/p/11344166.html
Copyright © 2011-2022 走看看