zoukankan      html  css  js  c++  java
  • cut sort uniq wc 一 文本处理工具

    cut

    cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。
    一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。
    
    
    -c :
    	以字符为单位进行分割。
    
    	cut -c1-3 test.txt:打印第1个到第3个字符
    	cut -c5- test.txt:打印从第5个字符开始到结尾
    
    -d :
    	自定义分隔符,默认为制表符。
    
    	cut -d';' -f 1
    
    -f :
    	用-d将文本分隔成一段一段后,-f用来取出第几段
    
    	cut -f1 test.txt:取出一行分割后的第一个
    
    	cut -f2,3 test.txt:取出一行分割后的第2到3个
    

    sort

    sort将文件的每一行作为一个单位,相互比较。
    比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。
    
    -u : 
    	它的作用很简单,就是在输出行中去除重复行。
    
    -r : 
    	sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。
    
    -n : 
    	以数值来进行排序。
    
    -f : 
    	忽略大小写
    
    
    cat ld | sort -n
    

    uniq

    uniq命令可以在排序后处理重复的行。
    
    常用选项:
    
    -i
    	忽略大小写
    
    -c
    	在行的开头输出该行出现的次数
    
    -d
    	只输出重复的行
    
    -u
    	只输出出现过一次的行
    
    
    sort -n ld | uniq -c
    

    wc

    wc统计文件里面有多少单词,多少行,多少字符。
    
    -l
    	仅列出行;
    
    -w
    	仅列出多少字(英文单字);
    
    -m
    	多少字符;
    
  • 相关阅读:
    349. Intersection of Two Arrays
    346. Moving Average from Data Stream
    345. Reverse Vowels of a String
    344. Reverse String
    342. Power of Four
    POJ2823 Sliding Window
    《STL源码剖析》笔记
    [jobdu]扑克牌顺子
    [jobdu]第一个只出现一次的字符
    [jobdu]包含min函数的栈
  • 原文地址:https://www.cnblogs.com/loveer/p/11621718.html
Copyright © 2011-2022 走看看