文本处理工具 -wc,cut,sort,uniq
wc:word count 统计文本文件中的字符个数
用法:wc filename
行数 字符个数 文件大小(字节) 文件名
-l 行数
-w 字符个数
-c 文件大小(字节)
cut:用来做文件分割
默认使用 空格 做文件分隔
-d 指定分隔符(delimiter)
-d[ :] //不可以这样写,cut的局限性:1、-d指定分隔符,不能同时指定多个。2、不能做高级的格式化输出,所以需要熟练的掌握awk
-f 指定提取那一列
-f1 输出第一列
-f1-3 输出1到3列
-f1,3 输出第一列和第三列
--output-delimiter=‘xx’ 将输出的分隔符,替换为自己想用的分隔符
sort:排序,根据ASCLL码排序
-n 按数字大小排序
-r 逆序
-f 忽略字符大小写
-t 指定分隔符
-k 指定第几段进行排序
-u 排序去重复
uniq:去重,连续且重复的命令才视为重复
建议先排序后去重
-d 显示重复的行
-c 统计某些字符重复的次数
sort FINENAME | uniq -c