zoukankan      html  css  js  c++  java
  • Lniux学习-AWK使用

    AWK

    AWK 与 sed 的区别

    • AWK用于比较规范的文本处理,用于统计数量并输出指定字段
    • sed 用于将不规范的文本,处理为比较规范的文本

    AWK的字段引用和分离

    • AWK也是按行读取,每行称作记录,使用空格、制表符分隔开的单词称作字段,可以自己指定分隔符来隔开字段。
    • 使用$1 $2 ... $n 表示每一个字段,$0 表示一整行
      • awk '{print $1,$2,$3}' filename
      • awk -F "'" '/^menu/{ print $2 }' /boot/grub2/grub.cfg 以'号进行分割字段,取出文件中的内核信息
      • { print x++,$2 } x++ 可以显示行数
    • -F 选项用于指定分隔符
      • awk -F ',' '{print $1,$2,$3}' filename
      • 分隔符可以使用正则表达式表示

    AWK的表达式

    • 系统变量
      • FS 和 OFS 字段分隔符,OFS 表示输出的字段分隔符

        • head -5 /etc/passwd | awk 'BEGIN{FS=":"}{ print $1 }'
          BEGING,在读入文件之前,进行预处理。在读入passwd文件之前,就通过FS选项指定好了以“:”作为分隔符。
        • head -5 /etc/passwd | awk 'BEGIN{FS=":";OFS="-"}{ print $1,$2 }' OFS="-",OFS是在查找到字段后,系统是默认使用空格进行隔开,而OFS改变了默认隔开的符号。
      • RS 行记录分隔符,记录行,RS 默认就是一个换行符,在多行合并成单行时,使用RS进行处理

        • head -5 /etc/passwd | awk 'BEGIN{RS=":"}{ print $1 }' 系统默认的行记录分隔符是换行符,RS=":",把行记录分隔符换成:
      • NR 和 FNR 行数

        • head -5 /etc/passwd | awk '{ print NR,$0 }' NR显示行号,$0显示行内容
        • awk '{ print NR,$0 }' /etc/hosts /etc/hosts
        • awk '{ print FNR,$0 }' /etc/hosts /etc/hosts
          对单个文件,使用NR和FNR没什么区别,若是接多个文件,NR会按顺序对内容一直排序,不区分文件;FNR是以先文件进行区分,再各自进行排序。
      • NF 字段数量,最后一个字段内容可以用 $NF 取出

        • head -5 /etc/passwd | awk 'BEGIN{FS=":"}{ print NF }' 输出每一行中有多少个字段

    AWK 的条件和循环语句

    条件语句格式:
    If(表达式)

    awk语句1

    [ else

    awk语句2

    ]

    若有多个语句需要执行可以使用{}将多个语句括起来

    例如:kpi.txt
    user1 88 28 34 34 44
    user2 45 55 22 33 66

    • awk '{if($2>=80) print $1}' kpi.txt
    • awk '{if($2>=80) {print $1 ; print $2} }' kpi.txt

    循环语句

    • while 循环格式

    while(表达式)

    awk 语句1

    • do 循环格式

    do{

    awk 语句1

    } while(表达式)

    • for 循环格式

    for{初始值;循环判断条件:累加}

    awk 语句1

    • head -1 kpi.txt | awk '{for(c=2;c<=NF;c++) sum+=$c;print $sum}' kpi.txt 计算第一行的kpi总值
    • head -1 kpi.txt | awk '{for(c=2;c<=NF;c++) sum+=$c;print sum/(NF-1)}' kpi.txt 计算第一行的kpi平均值
    • awk '{sum=0; for(c=2;c<=NF;c++) sum+=$c;print sum/(NF-1)}' kpi.txt 计算所有行各自的kpi平均值

    AWK 数组

    数组:一组具有某种关联的数据,可通过下标依次访问

    • 数组名[下标]=值
    • 下标可用数字或字符串表示

    查看数组所有元素

    • for( 变量 in 数组名 )
      使用 数组名[变量],依次对每个数组的元素进行操作

    • awk '{sum=0; for(c=2;c<=NF;c++) sum+=$c;avg[$1]=sum/(NF-1)} END { for(user in avg) sum12+=avg[user];print sum2/NR}' kpi.txt 计算所有人各自的平均值后,再计算总的平均值

    • awk的脚本文件以.awk结尾,加载awk脚本文件:awk -f avg.awk kpi.txt

    删除数组
    - delete 数组名[下标]

    命令行参数数组

    • ARGC:awk 后面所带的命令行参数的个数
    • ARGV:具体每一个参数的内容

    demo:
    demo.awk 内容

    BEGIN{
    
        for (x=0;x<ARGC;x++)
            print ARGV[x]
            print ARGC
    }
    

    执行: awk -f demo.awk 11 22 33

    awk 数据功能的使用

    Demo:
    统计得分的总数和平均分

    score1 99 44 55 66 42
    score2 90 45 67 89 32
    score3 34 43 65 65 36
    score4 45 76 34 34 56

    {
    sum = 0
    for( c=2; c<=NF; c++)
    	# sum,每个人的总得分
    	sum+=$c  
    
    # avg,每个人的平均得分,NF 表示分隔的字段总数
    avg[$1] = sum / ( NF-1 ) 
    
    # 设置等级
    if ( avg[$1] >= 80 )
    	letter = "S"
    else if ( avg[$1] >= 70 ) 
    	letter = "A"
    else if( avg[$1] >= 60 )
    	letter = "B"
    else
    	letter = "C"
    
    # 输出每个人的平均得分和等级
    print $1,avg[$1],letter
    
    # 计算相同等级的有多少个,这种方法可以使用在统计某一个IP使用的次数,某一个时间发生的次数这些场景中
    letter_all[letter]++	
    
    }
    END{
    for ( user in avg)
    	# 计算所有平均值的总数
    	sum_all += avg[user] 
    
    # 计算总的平均得分,NR表示行数
    avg_all = sum_all / NR
    print "average all",avg_all
    
    # 计算在总的平均值之下和之上各自有几个
    for (user in avg)
    	if ( avg[user] > avg_all )
    		above++
    	else
    		below++
    
    print "above",above
    print "below",below
    
    print "S:",letter_all["S"]
    print "A:",letter_all["A"]
    print "B:",letter_all["B"]
    print "C:",letter_all["C"]
    
    }
  • 相关阅读:
    mysql多表关系
    mysql支持的数据类型
    数据库基本操作
    线程基础
    生产者和消费者模型
    并发编程一
    元类
    linux 关机/重启命令
    linux前后台任务切换
    centos7最小化安装后,yum安装pstree及mlocate
  • 原文地址:https://www.cnblogs.com/chenri/p/12735256.html
Copyright © 2011-2022 走看看