zoukankan      html  css  js  c++  java
  • linux脚本Shell之awk详解

    一.基本介绍
    1.awk:
    awk是一个强大的文本分析工具,在对文本文件的处理以及生成报表,awk是无可替代的。awk认为文本文件都是结构化的,它将每一个输入行定义为一个记录,行中的每个字符串定义为一个域(段),域和域之间使用分割符分割。

    2.功能:流控制、数学运算、进程控制、内置的变量和函数、循环和判断

    3.工作原理:
    awk 会把每行进行一个拆分,用相应的命令对拆分出来的“段”进行处理。
    (1)行工作模式,读入文件的每一行,会把一行的内容,存到$0里
    (2)使用内置的变量FS(段的分隔符,默认用的是空白字符),分割这一行,把分割出来的每个段存到相应的变量$(1-100)
    (3)输出的时候按照内置变量OFS(out FS),输出
    (4)读入下一行继续操作
    简单实例

    1 [root@tx3 ~]# echo "this is a book" > awk.txt
    2 [root@tx3 ~]# awk '{print $2,$1,$3,$4}' awk.txt
    is this a book

    4. Awk常用内置变量表:
    1 $0 当前记录(作为单个变量)
    2 $1~$n 当前记录的第n个字段,字段间由FS分隔
    3 FS 输入字段分隔符 默认是空格 (可记忆为:FieldsSpace缩写)
    4 NF 当前记录中的字段个数,就是有多少列 (可记忆为:NumberFields缩写)
    5 NR 已经读出的记录数,就是行号,从1开始 (可记忆为:NumberRows缩写)
    6 RS 输入的记录他隔符默 认为换行符 (可记忆为:RowsSpace缩写)
    7 OFS 输出字段分隔符 默认也是空格 (可记忆为:OutputFieldsSpace缩写)
    8 ORS 输出的记录分隔符,默认为换行符 (可记忆为:OutputRowsSpace缩写) 
    9 ARGC 命令行参数个数
    10 ARGV 命令行参数数组
    11 FILENAME 当前输入文件的名字
    12 IGNORECASE 如果为真,则进行忽略大小写的匹配
    13 ARGIND 当前被处理文件的ARGV标志符
    14 CONVFMT 数字转换格式 %.6g
    15 ENVIRON UNIX环境变量
    16 ERRNO UNIX系统错误消息
    17 FIELDWIDTHS 输入字段宽度的空白分隔字符串
    18 FNR 当前记录数
    19 OFMT 数字的输出格式 %.6g
    20 RSTART 被匹配函数匹配的字符串首
    21 RLENGTH 被匹配函数匹配的字符串长度

    二.print的简单使用
    例:打印整行: $0

    1 [root@tx3 ~]# cp /etc/passwd p1
    2 [root@tx3 ~]# awk '{print $0}' p1

    例:打印每行的最后一个字段: $NF

    1 [root@tx3 ~]# awk -F : '{print $NF}' p1

    例:打印第三个字段: $3

    [root@tx3 ~]# awk -F : '{print $3}' p1

    例:打印第一行NR==1

    1 [root@tx3 ~]# awk 'NR==1{print $0}' p1
    root:x:0:0:root:/root:/bin/bash

    例:打印最后一行

    1 [root@tx3 ~]# awk 'END{print $0}' p1
    tx:x:500:500:tx:/home/tx:/bin/bash

    例:打印第一行最后一个字段

    1 [root@tx3 ~]# awk -F: 'NR==1{print $NF}' p1
    /bin/bash

    例:打印最后一行最后一个字段

    1 [root@tx3 ~]#awk -F: 'END{print $NF}' p1

    例:打印每行的倒数第二个字段,并在其后打印你好

    1 [root@tx3 ~]# awk -F: '{print $(NF-1),"nihao"}' p1
    /root nihao
    /bin nihao
    /sbin nihao

    例:打印行号

    1 [root@tx3 ~]# awk '{print NR,$0}' p1
    1 root:x:0:0:root:/root:/bin/bash
    2 bin:x:1:1:bin:/bin:/sbin/nologin
    3 daemon:x:2:2:daemon:/sbin:/sbin/nologin

    例:打印当前系统环境变量的某个特定值

    1 [root@tx3 ~]# awk 'BEGIN{print ENVIRON["PATH"];}'
    /usr/kerberos/sbin:/usr/kerberos/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

    例: 用:分割,删除第2个字段

    1 [root@tx3 ~]# awk 'BEGIN{FS=":";OFS=":"}{print $1,$3,$4,$5,$6,$7}' p1
    root:0:0:root:/root:/bin/bash
    bin:1:1:bin:/bin:/sbin/nologin
    daemon:2:2:daemon:/sbin:/sbin/nologin

    BEGIN和END:(打印报表实例)

    在Unix awk中两个特别的表达式,BEGIN和END,这两者都可用于pattern中(参考前面的awk语法),提供BEGIN和END的作用是给程序赋予初始状态和在程序结束之后执行一些扫尾的工作。

    任何在BEGIN之后列出的操作(在{}内)将在Unix awk开始扫描输入之前执行,而END之后列出的操作将在扫描完全部的输入之后执行。因此,通常使用BEGIN来显示变量和预置(初始化)变量,使用END来输出最终结果。

    例:累计销售文件xs中的销售金额(假设销售金额在记录的第三字段):

    1 [root@tx3 ~]#awk 'BEGIN{FS=":";print "统计销售金额";total=0}{print $3;total=total+$3;}END{printf "销售金额总计:%.2f",total}' sx

    在这里,BEGIN预置了内部变量FS(字段分隔符)和自定义变量total,同时在扫描之前显示出输出行头。而END则在扫描完成后打印出总合计。

  • 相关阅读:
    Memcache 缓存系统
    galera-cluster 集群
    CentOS 文件中行内容操作
    快速查找日志文件最后一行及某个时间段的日志
    CentOS 下生成随机颜色
    Linux 下紧急删除大文件不能及时释放空间应急处理办法
    Access to XMLHttpRequest at '' from origin '' has been blocked by CORS policy: The value of the 'Access-Control-Allow-Origin' header in the response must not be the wildcard '*'
    Ant design vue 引入echarts
    .net core 发布时 IIS 站点 提示:文件名 web.config 错误:配置文件的 xml 格式不正确
    远程连接MySQL出现1130错误
  • 原文地址:https://www.cnblogs.com/itxiongwei/p/5542514.html
Copyright © 2011-2022 走看看