awk常用的命令
概述
awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入(stdin)、一个或多个文件,或其它命令的输出。
它支持用户自定义函数和动态正则表达式等先进功能,它在命令行中使用,但更多是作为脚本来使用。
一、基本用法
awk 动作 文件名
比如:awk '{print $0}' stat.log
上面示例中, stat.log是awk所要处理的文本文件。前面单引号内部有一个大括号,里面就是每一行的处理动作print $0。其中,print是打印命令,$0代表当前行,因此上面命令的执行结果,就是把每一行原样打印出来。
1)原样打印
我们先用标准输入(stdin)演示上面这个例子:
echo 'this is a test' | awk '{print $0}'
打印结果:
上面代码中,print $0就是把标准输入this is a test,重新打印了一遍。
2)分成若干字段
awk会根据空格和制表符,将每一行分成若干字段,依次用$1、$2、$3代表第一个字段、第二个字段、第三个字段等等。
echo 'this is a test' | awk '{print $3}'
在stat.log中文件写入:
1 t:x:0:0:root:/root:/usr/bin/zsh 2 3 daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin 4 5 bin:x:2:2:bin:/bin:/usr/sbin/nologin 6 7 sys:x:3:3:sys:/dev:/usr/sbin/nologin 8 9 sync:x:4:65534:sync:/bin:/bin/sync
这个文件的字段分隔符是冒号(:),所以要用-F参数指定分隔符为冒号。然后,才能提取到它的第一个字段。
命令如下:
awk -F ':' '{ print $1 }' stat.log
输出结果:
二、变量
1、NF
除了$ + 数字表示某个字段,awk还提供其他一些变量。
变量NF表示当前行有多少个字段,因此$NF就代表最后一个字段。
比如:echo 'this is a test' | awk '{print $NF}
$(NF-1)代表倒数第二个字段。
比如:awk -F ':' '{print $1, $(NF-1)}' demo.txt
2、NR
变量NR表示当前处理的是第几行。
awk -F ':' '{print NR ") " $1}' stat.log
参考链接:
http://www.ruanyifeng.com/blog/2018/11/awk.html
https://segmentfault.com/a/1190000021462472