zoukankan      html  css  js  c++  java
  • awk

    1.awk介绍    

    默认情况下不编辑源文件  报告生成器--通过模式匹配以及自己本身的语言格式,来获取并输出客户所需要的内容;

    eg:获取系统上面用户ID大于等于1小于等于500的用户的用户名和用户ID

    for i in $(cut -d:-f3/etc/passwd);do

    if [ $i -ge 1 -a $i -le 500 ];then

    echo grep $i | cut -d:-f1,3

    fi

    done

    -------------------------------------------

    #awk -F:’{if($3>=1&&$3<=500){print $3}}’ /etc/passwd

    2.awk工作原理  

     

    3.awk的用法

     awk [option]... ‘program’FILE...

    1. program 必须使用!单引号!
    2. 多条program语句使用大括号包含起来可以并列可以嵌套

    awk’{print} /etc/passwd’

    4.awk的常见option

    -F  指定分隔符

    awk -F[/:]’{print $1 $3}’a.txt 其中[ ]内表示多个字符中的任意一个

    -v  因为awk是一种语言编译器,能够自己定义变量,同时也有内置变量(与环境变量类似)手动指定变量参数

    awk-v a=”a/b” ‘{print a}’ a.txt

    a赋值打印a这个变量

    1、a是自定义变量 -v FS=”.”

    2、awk中调用变量不用加$符号

    扩展:了解cutawk的区别

    5.awk语法格式--program

    1print

     默认输出(在屏幕上)

    awk中没有保存命令,我们可以关联别的命令来保存awk的结果;

     awk '{a="a/b";print a}' a.txt | tee a.bak

     2printf  -- 实现格式化输出

     printf "%s%d班学的最好的学生",变量1,变量2  

    【仅仅只有顺序关系】

       格式符

    %s   字符串

     %d  %i  数值

     %e  %E  科学计算数值

     %c  ACSii码值

     %f   浮点数

    %u  无符号整数

    %%  逃逸符 只显示 % 自己

             修饰符

    默认为右对齐

    -  代表左对齐

    %5.4f   

    5  所占位数

    4  所取小数位

     awk '/^UUID/{printf "被挂载文件:%-50s  挂载点:%-10s  文件系统格式:%-10s ",$1,$2,$3}' /etc/fstab

     注意:这里提到了地址定界

     sed /PAT1/,/PAT2/

     3、变量(内置变量、自定义变量)

    内置变量 -- 环境变量(bash(envset -C +C)

     awk语言所默认支持的变量

    FS   定义输入分隔符的变量

    OFS   定义输出分隔符的变量

     NF  定义行分隔以后的参数个数 ($NF 分隔以后最后的一列变量)

    *变量引用的时候,不用加$$0,$1...$n

     awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd

     NR  定义文件的行数,定义多个文件的文件的,行号叠加

     FNR  文件只计算自己的行号

     awk '{print NR}' /etc/fstab /etc/passwd

     awk '{print FNR}' /etc/fstab /etc/passwd

     FILENAME 存储文件的名字

     awk '{print FILENAME}' /etc/passwd   //把文件名打印N次,N文件的行数

     awk 'BEGIN{print FILENAME}' /etc/passwd   //BEGIN{语句} 只在行循环开始时,执行一次;

     ARGC  整个命令的 段数  【注意:不包含 'program' 本身】

     ARGV  数组,用来调取命令中,指定的段 ARGV[2]  【注意:数组中也不包含 'program'

     awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow

     awk 'BEGIN{print ARGV[3]}' /etc/passwd /etc/fstab /etc/shadow

     RS   指定换行符 可以指定新的换行符,不影响本身的换行

     ORS   输出的时候指定的换行符,将默认换行符替换为指定字符

     awk -v RS=" " '{print}' /etc/passwd

    awk -v ORS=" " '{print}' /etc/passwd  //可以用来取消换行

     自定义变量

     -v 变量=

    在后面'program'中去调用自定义变量时,直接使用即可

     或者将 “变量=值”语句直接写在'program'亦可;

     awk -v a="a/b" '{print a}' a.txt

    awk '{a="a/b";print a}' a.txt

     4、模式匹配(地址定界)

    1.空值,没有定义,默认就将文件中所有的行,放入awk进行循环

    2.对固定的1,3 进行操作

    sed -n ‘1,3p’ /etc/passwd

    awk ‘NR==1&&NR<=3{print}’ /etc/passwd

    3./pat1/

    sed/pat1/p /etc/paswd

    awk’/r..ter/{print}’ /etc/passwd

    4./pat1/,/pat2/第一次匹配到pat1到第一次匹配pat2,之间的行

    练习 :判断/^r..ter/,/user.*>/之间行的用户,是bash的用户,并显示用户的用户名和uid

    shell:

    a=`awk’/^r..ter/,/user.*>/{print $1,$3,$NF}’ /etc/passwd`

    for i in `awk’/^r..ter/,/user.*>/{print $NF}’ /etc/passwd`;do

    if[[ $i == “/bin/bash” ]];then

    echo’’

    done

    awk -F:’/^r..ter/,/^usesr.*>/{if($NF ==/bin/bash);print $1,$3}’ /etc/passwd

    5.模式匹配可以直接使用判断语句

    awk -F:’$NF ==”/bin/bash”{print $1,$3}’ /etc/passwd

    6.BEGIN|END

    BEGIN定义在默认循环进行操作前所要执行的语句:

    awk -F:’BEGIN{print “shell程序为bash的用户为: ”}$NF==”/bin/bash”{print $1,$3}’ /etc/passwd

    awk -F:’BEGIN{print “shell程序为bash的用户为: ”}$NF==”/bin/bash”{print $1,$3}END{printf end }’ /etc/passwd

    一般在格式化输出的时候,打印表头和表未;

     5、操作符

    运算操作符:

    + - * / %(取余、取模) ^ //(取整)

    比较运算符:

    == != > < >= <=

    ~ !~

    awk -F: '$NF~"/bin/bash"{print $1,$3}' /etc/passwd

    awk -F: '$NF!~"/bin/bash"{print $1,$3}' /etc/passwd

    逻辑操作符:

    &&

    ||

    !

    赋值操作符:

    =  +=  -=  /=   *=  %=  ^=   //=

    条件表达式:

    条件语句?条件成立语句:条件不成立的语句

    awk '/^title/{FN<=2? print: printf "参数过 "}' /boot/grub/grub.conf  //有点问题

    6、常见action

    print printf 以及 它任何命令的操作都是 action;
    1、expressions 常见表达式
    2、control statement 控制语句 例如: if while等
    逻辑关系语句判断来进行结合
    3、组合语句 compound statements
    /pat1/{{ }{ ; }}
    4、input statements 输入语句
    5、output statements 输出语句

    7、常见语言(if while do for break continue delete switch

    1if语句

    语法格式:if(条件表达式) {执行语句}

    if(条件表达式) {执行语句} else {执行语句}

    awk '/^title/{if(NF<=2) {print}else {print "参数过少"}}' /boot/grub/grub.conf

    awk '/^title/{if(NF>=2) print $4}' /boot/grub/grub.conf

    2while语句

    只有对行参数进行遍历的时候才会使用循环;

    语法格式:while(条件表达式) {循环体}

    练习:过滤grub.conf文件中kernel这一行,然后对每一个参数的字符个数进行统计,并显示出来;

    初始值

    while 条件判断;do

    循环体

    初始控制语句

    done

    awk '/^[[:space:]]*kernel>/{i=1;while(i<=NF){printf $i" ";print length($i);i++}}' grub.conf

    3for语句

    语法格式:for(初始值;条件判断;初始值控制语句){循环体}

    awk '/^[[:space:]]*kernel>/{for(i=1; i<=NF; i++){printf $i" "; print length($i)}}' grub.conf

    循环建议使用for语句

    awk中,for也可以使用和 shell 中一样的格式:

    回顾:

    for i in 列表;do

    循环体

    done

    for(i in 列表){循环体}

    echo "xia  liang z shi k hen  n shuai   da fa le " | awk '{for(i in {1..NF}) { ls=() if(length(ls[i])<=3){print $i}}}'  

    shell

    =====================================

    ls=(xia  liang z shi k hen  n shuai   da fa le)

    for i in `seq 0..${$ls[*]}`;do

    if [[ ${#${ls[$i]}} <= 3 ]];then

    print ls[$i]

    fi

    done

    =====================================

    4do-while 循环

    语法:do {循环体} while (循环条件)

    注意和while的却别:while语句只有在满足条件的时候,才会进入循环,而do while会先执行循环体(一次),在进行条件判断;

    5、循环跳出语句

    break [n]  跳出n次循环;

    continue   跳出本次循环;

    next  跳出默认的当前循环;

    awk '{if(NR%2==1) {next} else {print}}' /etc/passwd

    6switch 类似于case

    语法格式:switch(expression){case VALUE1 or /REGXP/: statement; case VALUE2 or /REGEXP2/:statement; ,default: statement}

    switch(表达式){case 模式匹配值:执行语句;case 模式匹配值:执行语句,...,default:执行语句}  文件

    shell

    case 变量 in

    pat1)

    执行语句

    ;;

    *)

    执行语句

    ;;

    esac

    8、数组

    awk中,数组和shell中的数组特性相同:

    注意:awk中数组不用定义,只要使用了,就有值为空的默认数组;这在做数据统计的时候非常常见!!!!!

    行遍历 -->  实际上就是整个文件的遍历

    列遍历 --> 取对象固定某列的中的,相同数据的统计

    注意:数组通过for语句,再给其他变量进行赋值的时候,赋值的是index索引信息;

    练习:统计一下某个文件中指定行中单词出现的次数;

    awk -v RS=" " {print} a.txt | awk '{ls[$1]++}END{for(i in ls){print i,ls[i]}}'

    练习:统计一下一个文件中每个单词(以空格隔开的字符串)出现的次数;

    awk '{for(i=1;i<=NF;i++){count[$i]++}}END{for(i in count) {print i,count[i]}}' /etc/fstab

    awk '{for(i=1;i<=NF;i++){ls[$i]++}}END{for(j in ls){print j,ls[j]}}' /var/log/httpd/access_log | sort -t" " -k2 -nr

    9、函数

    1、内置函数

    函数的调用:funcation(参数)

    length()  统计字符串长度

    数学运算上使用的行数 sin() cos() ...

    sub(x,x,x)   替换第一个匹配到的值

    awk '{print sub(o,O,$1)}' /etc/fstab  //o 替换为 O 文件中的 第一列(第一个匹配值)

    gsub(x,x,x)    替换该行所匹配到的所有值

    awk '{print gsub(o,O,$1)}' /etc/fstab  //o 替换为 O 文件中的 第一列(全部匹配值)

    split(x,x,x)   指定分隔符去切割文件

      netstat -tan | awk '/^tcp>/{split($5,ip,":");print ip[1]}'

      netstat -tan | awk '/^tcp>/{split($5,ip,":");count[ip[1]]++}END{for (i in count) {print i,count[i]}}'

    2、自定义函数

  • 相关阅读:
    Python安装appium 遇见的报错
    appium
    QQ邮箱/微信邮箱发送邮件
    Python-变量
    神秘的咒语
    宿命的PSS
    E. Congruence Equation
    D. Substring
    leetcode 761. Special Binary String
    F
  • 原文地址:https://www.cnblogs.com/bishuyu/p/11392330.html
Copyright © 2011-2022 走看看