zoukankan html css js c++ java

awk命令

awk是一个非常棒的数字处理工具。相比于sed常常作用于一整行的处理，awk则比较倾向于将一行分为数个“字段”来处理。运行效率高，而且代码简单，对格式化的文本处理能力超强。

awk的一般语法格式为：
　　awk [-参数变量] ' BEGIN{初始化} 条件类型1{动作1} 条件类型2{动作2}。。。。 END{后处理}'
其中：BEGIN和END中的语句分别在开始读取文件（in_file）之前和读取完文件之后发挥作用，可以理解为初始化和扫尾。

参数说明：
　　 -F             分隔符，允许awk更改其字段分隔符,默认为空格。
      -v var=$v     定义变量，把v值赋值给var，如果有多个变量要赋值，那么就写多个-v，每个变量赋值对应一个-v
　　-f progfile    调用脚本，允许awk调用并执行progfile程序文件，当然progfile必须是一个符合awk语法的程序文件。

(1)模式和动作
任何awk语句都是由模式和动作组成，在一个awk脚本中可能有许多语句。模式部分决定动作语句何时触发及触发事件。动作即对数据进行的操作，如果省去模式部分，动作将时刻保持执行状态。
模式可以是任何条件语句或复合语句或正则表达式，模式包含两个特殊字段BEGIN和END，使用BEGIN语句设置计数和打印头，BEGIN语句使用在任何文本浏览动作之前，之后文本浏览动作依据输入文件开始执行;END语句用来在awk完成文本浏览动作后打印输出文本总数和结尾状态标志，有动作必须使用{}括起来。
实际动作在大括号{}内指明，常用来做打印动作，但是还有更长的代码如if和循环looping语句及循环退出等，如果不指明采取什么动作，awk默认打印出所有浏览出的记录。

(2)域和记录
awk执行时，其浏览标记为$1，$2...$n，这种方法称为域标记。使用$1，$3表示参照第1和第3域，注意这里使用逗号分隔域，使用$0表示使用所有域。

　例如:
　　awk '{print $0}' temp.txt > sav.txt
　　表示打印所有域并把结果重定向到sav.txt中

　　awk '{print $0}' temp.txt|tee sav.txt
　　表示打印所有域并把结果屏幕上显示出来

　　awk '{print $1,$4}' temp.txt
　　只打印出第1和第4域

　　awk 'BEGIN {print "NAME GRADE\n----"} {print $1"\t"$4}' temp.txt
　　表示打信息头，即输入的内容的第一行前加上"NAME GRADE\n-----"，同时内容以tab分开

　　awk 'BEGIN {print "being"} {print $1} END {print "end"}' temp
　　同时打印信息头和信息尾

(3)条件操作符:
<、<=、==、!=、>=、~匹配正则表达式、!~不匹配正则表达式

    匹配 ~     :       awk '{if ($4~/ASIMA/) print $0}' temp    表示如果第四个域包含ASIMA，就打印整条
    精确匹配 == :   awk '$3=="48" {print $0}' temp          只打印第3域等于"48"的记录
    不匹配！~     :     awk '$0 !~ /ASIMA/' temp             　　打印整条不包含ASIMA的记录
    不等于！=     :     awk '$1 != "asima"' temp
    小于   <   :       awk '{if ($1<$2) print $1 "is smaller"}' temp
    设置大小写: awk '/[Gg]reen/' temp             　　　　打印整条包含Green，或者green的记录
    任意字符:   awk '$1 ~/^...a/' temp             　　　　打印第1域中第四个字符是a的记录，符号’^’代表行首，符合’.’代表任意字符
    或关系匹配   : awk '$0~/(abc)|(efg)/' temp         　　使用|时，语句需要括起来
    AND与关系 &&   : awk '{if ( $1=="a" && $2=="b" ) print $0}' temp
    OR或关系 ||    :   awk '{if ($1=="a" || $1=="b") print $0}' temp
     + : 匹配时表示1个或1个以上

(4)awk内置变量:

ARGC	命令行参数个数	NF	浏览记录的域个数,就是有多少列（重要）
AGRV	命令行参数排列	NR	已经读出的记录数，就是行号，从1开始（重要）
ENVIRON	支持队列中系统环境变量的使用	OFS	输出域分隔符
FILENAME	awk浏览的文件名	ORS	输出记录分隔符
FNR	浏览文件的记录数	RS	控制记录分隔符
FS	设置输入域分隔符，同- F选项

　　例: awk 'END {print NR}' temp 　　　　　　　　　　　　在最后打印已读记录条数

　　awk '{if (NR>0 && $4~/Brown/) print $0}' temp 　　至少存在一条记录且包含Brown

NF的另一用法: echo $PWD | awk -F/ '{print $NF}' 显示当前目录名

(5) awk操作符:
　　在awk中使用操作符，基本表达式可以划分成数字型、字符串型、变量型、域及数组元素。

　　设置输入域到变量名:
   　　   awk '{name=$1;six=$3; if (six=="man") print name " is " six}' temp

     域值比较操作:
　　　　awk 'BEGIN {BASE="27"} {if ($4<BASE) print $0}' temp

    修改数值域取值:(原输入文件不会被改变)
　　　　awk '{if ($1=="asima") $6=$6-1;print $1，$6，$7}' temp

    修改文本域:
　　　　awk '{if ($1=="asima) ($1=="desc");print $1}' temp

    只显示修改记录:(只显示所需要的，区别上一条命令，注意{})
　　　　awk '{if ($1=="asima) {$1=="desc";print$1}}' temp

    创建新的输出域:
　　　　awk '{$4=$3-$2; print $4}' temp

    统计列值:
　　　　awk '(tot+=$3);END {print tot}' temp           会显示每列的内容
　　　　awk '{(tot+=$3)};END {print tot}' temp         只显示最后的结果

    文件长度相加:
　　　　ls -l|awk '/^[^d]/ {print $9"\t"$5} {tot+=$5} END{print "totKB:" tot}'

    只列出文件名:
　　　　ls -l|awk '{print $9}'     常规情况文件名是第9域

(6)awk内置字符串函数:
　　gsub(r，s)          　　　　　　在整个$0中用s替代r                             //awk 'gsub(/name/，"xingming") {print $0}' temp
　　gsub(r，s，t)         　　　　   在整个t中用s替代r
　　index(s，t)         　　　　      返回s中字符串t的第一位置　　　　　　　　//awk 'BEGIN {print index("Sunny"，"ny")}' temp     返回4
　　length(s)           　　　　　　返回s的长度
　　match(s，r)         　　　　   测试s是否包含匹配r的字符串　　　　　　    //awk '$1=="J.Lulu" {print match($1，"u")}' temp    返回4
　　split(s，a，fs)      　　　　　在fs上将s分成序列a　　　　　　　　        //awk 'BEGIN {print split("12#345#6789"，myarray，"#")"'返回3
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　 //同myarray[1]="12"， myarray[2]="345"， myarray[3]="6789"

　　sprint(fmt，exp)     　　　　返回经fmt格式化后的exp
　　sub(r，s)   　　　　　　　　从$0中最左边最长的子串中用s代替r(只更换第一遇到的匹配字符串)
　　substr(s，p)        　　　　返回字符串s中从p开始的后缀部分
　　substr(s，p，n)     　　　返回字符串s中从p开始长度为n的后缀部分

查看全文

相关阅读:
2018ACM上海大都会赛 F Color it【基础的扫描线】
2018大都会赛 A Fruit Ninja【随机数】
两个数互质的概率
 【shell脚本学习-3】
【mysql学习-1】
【HCNE题型自我考究】
【为系统营造的一个安全的环境】
【nginx下对服务器脚本php的支持】
【linux基于Postfix和Dovecot邮件系统的搭建】
不同状态的动态路由协议对比

原文地址：https://www.cnblogs.com/sunziying/p/6382232.html