当awk逐行处理文本的时候,以输入分隔符为准,将文本切成多个片段,默认使用空格,但是,如果一段文字中没有空格,我们可以指定以特定的文字或符号作为输入分割符,比如下图中的例子,我们指定使用"#"作为输入分隔符。
[root@server01 ~]# cat test abc#123#iuy#ddd 8ua#456#auv#ppp#7y7 [root@server01 ~]# awk -F# '{print $1m$2}' test abc123 8ua456
我们使用了-F 选项,指定了使用#号作为输入分隔符,于是,awk将每一行都通过#号为我们分割了。除了使用 -F 选项指定输入分隔符,还能够通过设置内部变量的方式,指定awk的输入分隔符,awk内置变量FS可以用于指定输入分隔符,但是在使用变量时,需要使用-v选项,用于指定对应的变量,比如 -v FS='#',
[root@server01 ~]# awk -v FS="#" '{print $1,$2}' test abc 123 8ua 456
awk的语法如下
awk [options] 'Pattern{Action}' file而-F,就是options的一种,用于指定输入分隔符。-v也是options的一种,用于设置变量的值。
输出分隔符
输出分割符的意思就是:当我们要对处理完的文本进行输出的时候,以什么文本或符号作为分隔符。
我们可以使用awk的内置变量OFS来设定awk的输出分隔符,当然,使用变量的时候要配合使用-v选项,示例如下
[root@server01 ~]# awk -F="#" -v OFS="+++" '{print $1,$2}' test abc#123#iuy#ddd+++ 8ua#456#auv#ppp#7y7+++ [root@server01 ~]# awk -v FS="#" -v OFS="+++" '{print $1,$2}' test abc+++123 8ua+++456
在输出的时候,我们想要让两列合并在一起显示,不使用输出分隔符分开显示,该怎么做呢?如下图所示,蓝线之上使用默认的输出分隔符进行了分隔,而蓝线之下的两种方法均未使用输出分隔符进行分隔,而是将两列合在一起显示了。
[root@server01 ~]# cat test1 abc 123 iuy ddd 8ua 456 auv ppp 7y7 [root@server01 ~]# awk '{print $1 $2}' test1 abc123 8ua456 [root@server01 ~]# awk '{print $1,$2}' test1 abc 123 8ua 456
[root@server01 ~]# awk '{print $1$2}' test1
abc123
8ua456
语法上的区别就是,一个有"逗号",一个没有"逗号"。
awk '{print $1 $2}' 表示每行分割后,将第一列(第一个字段)和第二列(第二个字段)连接在一起输出。
awk '{print $1,$2}' 表示每行分割后,将第一列(第一个字段)和第二列(第二个字段)以输出分隔符隔开后显示。