1. cut命令
cut命令用于从文件或者标准输入中读取内容并截取每一行的特定部分并送到标准输出。
截取的方式有三种:
一是按照字符位置,二是按照字节位置,
三是使用一个分隔符将一行分割成多个field,并提取指定的fields。
cut命令有5个参数,其中-c,-b,-f分别表示"character", "byte"以及"field"截取方式。
当采用field模式截取时,需要用"-d"参数指定一个分隔符,分割符只能为单个字符。另外还有一个"-s",suppress,表示如果行中没有给出的分割符则不输出该行(默认为如果没有分隔符则将该行原封不动输出)
以下为几个例子:
按字符截取:echo hello, world | cut -c 8-12 则输出"world"(截取字符串中从第8到第12个共12个字符)
按分隔符截取:echo hello, world | cut -f 2 -d " "则输出"world"(截取以空格分割的第二部分)
echo Long, long ago | cut -f 2,3 -d " "则输出" long ago"(截取以空格分割的第2、3部分,注意输出的结果也以-d指定的分隔符分割)
使用"-s"安静地忽略没有给出地分隔符地行:echo hello |cut -d "!" -f 1 -s则什么也不输出(因为行中没有"!"字符)
如果命令执行成功则返回0,遇到错误则返回一个大于0的数字。
其中-c,-b,好理解,下面我自己理解的-f参数,自己多试验几次,多输出几次,就明白了。
# echo Long,long ago,ddddddd | cut -f 2 -d , long ago # echo Long,long ago,ddddddd | cut -f 2- -d , long ago,ddddddd # echo Long,long ago,ddddddd,hhhhhhhhhhh | cut -f 2- -d , long ago,ddddddd,hhhhhhhhhhh
上面三个对比一下就会很清楚。
# echo Long,long ago,ddddddd | cut -f 2,3 -d , long ago,ddddddd # echo Long,long ago,ddddddd | cut -f 1,3 -d , Long,ddddddd # echo Long,long ago,ddddddd | cut -f 1,2 -d , Long,long ago # echo Long,long ago ddddddd | cut -f 2 -d , long ago ddddddd # echo Long,long ago ddddddd | cut -f 2,3 -d , long ago ddddddd
2. tr命令
通过使用 tr,您可以非常容易地实现 sed 的许多最基本功能。您可以将 tr 看作为 sed 的(极其)简化的变体:它可以用一个字符来替换另一个字符,或者可以完全除去一些字符。您也可以用它来除去重复字符。这就是所有 tr 所能够做的。
tr用来从标准输入中通过替换或删除操作进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。使用tr时要转换两个字符串:字符串1用于查
询,字符串2用于处理各种转换。tr刚执行时,字符串1中的字符被映射到字符串2中的字符,然后转换操作开始。
带有最常用选项的tr命令格式为:
tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file
这里:
-c 用字符串1中字符集的补集替换此字符集,要求字符集为ASCII。
-d 删除字符串1中所有输入字符。
-s 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。
input-file是转换文件名。虽然可以使用其他格式输入,但这种格式最常用。
指定字符串1或字符串2的内容时,只能使用单字符或字符串范围或列表。
[a-z] a-z内的字符组成的字符串。
[A-Z] A-Z内的字符组成的字符串。
[0-9] 数字串。
octal 一个三位的八进制数,对应有效的ASCII字符。
[O*n] 表示字符O重复出现指定次数n。因此[O*2]匹配OO的字符串。
tr中特定控制字符的不同表达方式
速记符含义八进制方式
a Ctrl-G 铃声 07
Ctrl-H 退格符 10
f Ctrl-L 走行换页 14
Ctrl-J 新行 12
Ctrl-M 回车 15
Ctrl-I tab键 11
v Ctrl-X