zoukankan      html  css  js  c++  java
  • shell脚本-awk

    一、awk工作原理

     

    二、awk的用法

     awk [option] ... 'program' FILE ...
        1、program语句必须使用单引号!
        2、多条program语句使用用大括号包含起来,可以并列,可以嵌套
    三、awk的常用参数

     -F   #指定分隔符

     示例:awk -F: '{print $1}' /etc/passwd     #输出/etc/passwd/文件中以:为分隔符的第一列

       

       -v    #因为awk是一种语言编译器,能自己定义变量,同时也有自己的内置变量(与shell中的环  变量类似),所以要手动指定变量参数。

     示例:awk -v a="a+b" '{print a}' test.txt     #给a复制,打印a这个变量(在awk中调用变量不需要 加$符)

      

     

    四、awk的语法格式

     1.print     #默认输出

      在awk中没有保存的命令,我们可以关联别的命令来保存awk的结果

      示例:awk '{a="a+b";print a}' test.txt | tee a.txt

      

     2.printf   #实现格式化输出

      示例:printf "%s是%d班学习最棒的",变量1,变量2

      (1)格式符

           %s   字符串
                %d  %i  数值
                %e  %E  科学计算数值
                %c  ACSii码值
                %f   浮点数
                %u  无符号整数
                %%  逃逸符 只显示 % 自己

        (2)修饰符

        默认为右对齐

        -  代表左对齐

        %5.4f    #5代表所占的位数,4代表所取的小数位

      3.变量

      变量分为内置变量和自定义变量

      内置变量是awk语言所默认支持的变量

      变量:

        FS      #定义输入分割符的变量

        OFS    #定义输出分隔符的变量

        NF       #定义行分隔以后的参数个数($NF 分隔以后最后的一列变量)

      示例:awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd    

     

                NR  定义文件的行数,定义多个文件的文件的,行号叠加
                FNR  文件只计算自己的行号

      示例:awk '{print NR}' /etc/fstab /etc/passwd

     
                awk '{print FNR}' /etc/fstab /etc/passwd 

      

          FILENAME 存储文件的名字

       示例:awk '{print FILENAME}' /etc/passwd    #把文件名打印N次,N文件的行数

      

      BEGIN{语句} 只在行循环开始时,执行一次;

      示例:awk 'BEGIN{print FILENAME}' /etc/passwd

    五、模式匹配(地址定界)
      1、空值,没有定义,默认就将文件中所有的行,放入awk进行循环
      2、对固定的 1,3 行进行操作
                  sed -n '1,3p' /etc/passwd

      
                  awk '1,3{print}' /etc/passwd //awk默认不支持使用 1-3 1,3 等等,这样数值的直接写法;
                  awk 'NR>=1&&NR<=3{print}' /etc/passwd //通过NR变量来指定

      
      3、/pat1/
                 sed -n /pat1/p /etc/passwd
                 awk '/r..ter/{print}' /etc/passwd
      4、/pat1/,/pat2/ 第一次匹配pat1到第一次匹配pat2,之间的行
      练习:判断/^r..ter/,/^user.*>/之间的行的用户,是bash的用户,并显示用户的用户名,和UID

       awk -F: '/^r..t/,/^ftp>/{if($NF==/bin/bash);print $1,$3}' /etc/passwd

      
      5、模式匹配可以直接使用判断语句
                 awk -F: '$NF=="/bin/bash"{print $1,$3}' /etc/passwd       #

      
      6、BIGEIN|END语句
                BIGEIN定义在默认循环进行操作前所要执行的语句;
                awk -F: 'BEGIN{printf "shell程序为bash的用户为: "}$NF=="/bin/bash"{print $1,$3}' /etc/passwd

      
              awk -F: 'BEGIN{printf "shell程序为bash的用户为: "}$NF=="/bin/bash"{print $1,$3}END{printf "end "}' /etc/passwd

      
          一般在格式化输出的时候,打印表头和表未;
    六、操作符
           运算操作符:
                  + - * / %(取余、取模) ^ //(取整)
           比较运算符:
                   == != > < >= <=
                    ~ !~
                    awk -F: '$NF~"/bin/bash"{print $1,$3}' /etc/passwd
                    awk -F: '$NF!~"/bin/bash"{print $1,$3}' /etc/passwd
           逻辑操作符:
                    &&
                    ||
                    !
           赋值操作符:
                    = += -= /= *= %= ^= //=
          条件表达式:
                 条件语句?条件成立语句:条件不成立的语句
    七、常见action
                print printf 以及 它任何命令的操作都是 action;
                1、expressions 常见表达式
                2、control statement 控制语句 例如: if while等
                逻辑关系语句判断来进行结合
                3、组合语句 compound statements
                      /pat1/{{ }{ ; }}
                4、input statements 输入语句
                5、output statements 输出语句
    八、常见语言

    (if while do for break continue delete switch)
      1、if语句
            语法格式:if(条件表达式) {执行语句}
             if(条件表达式) {执行语句} else {执行语句}
             awk '/^title/{if(NF<=2) {print}else {print "参数过少"}}' /boot/grub/grub.conf
             awk '/^title/{if(NF>=2) print $4}' /boot/grub/grub.conf
      2、while语句
            只有对行参数进行遍历的时候才会使用循环;
            语法格式:while(条件表达式) {循环体}
    练习:过滤grub.conf文件中kernel这一行,然后对每一个参数的字符个数进行统计,并显示出来;
        初始值
        while 条件判断;do
        循环体
        初始控制语句
        done
        awk '/^[[:space:]]*kernel>/{i=1;while(i<=NF){printf $i" ";print length($i);i++}}' grub.conf
      3、for语句
           语法格式:for(初始值;条件判断;初始值控制语句){循环体}
           awk '/^[[:space:]]*kernel>/{for(i=1; i<=NF; i++){printf $i" "; print length($i)}}' grub.conf                
    在awk中,for也可以使用和 shell 中一样的格式:
      for(i in 列表){循环体}
      echo "xia liang z shi k hen n shuai da fa le " | awk '{for(i in {1..NF}) { ls=() if(length(ls[i])<=3){print $i}}}'
    shell
    =====================================
    ls=(xia liang z shi k hen n shuai da fa le)
    for i in `seq 0..${$ls[*]}`;do
    if [[ ${#${ls[$i]}} <= 3 ]];then
    print ls[$i]
    fi
    done
    =====================================
      4、do-while 循环
         语法:do {循环体} while (循环条件)
         注意和while的却别:while语句只有在满足条件的时候,才会进入循环,而do while会先执行循环体(一次),在进行条件判断;
      5、循环跳出语句
          break [n] 跳出n次循环;
          continue 跳出本次循环;
          next 跳出默认的当前循环;
          awk '{if(NR%2==1) {next} else {print}}' /etc/passwd
      6、switch 类似于case
           语法格式:switch(expression){case VALUE1 or /REGXP/: statement; case VALUE2 or /REGEXP2/:statement; … ,default: statement}
            switch(表达式){case 模式匹配值:执行语句;case 模式匹配值:执行语句,...,default:执行语句} 文件
    shell:
    case 变量 in
    pat1)
    执行语句
    ;;
    *)
    执行语句
    ;;
    esac

    九、数组
           在awk中,数组和shell中的数组特性相同:
           注意:awk中数组不用定义,只要使用了,就有值为空的默认数组;这在做数据统计的时候非常常见!!!!!
           行遍历 --> 实际上就是整个文件的遍历
            列遍历 --> 取对象固定某列的中的,相同数据的统计
    注意:数组通过for语句,再给其他变量进行赋值的时候,赋值的是index索引信息;
    练习:统计一下某个文件中指定行中单词出现的次数;
              awk -v RS=" " {print} a.txt | awk '{ls[$1]++}END{for(i in ls){print i,ls[i]}}'
      
    练习:统计一下一个文件中每个单词(以空格隔开的字符串)出现的次数;
              awk '{for(i=1;i<=NF;i++){count[$i]++}}END{for(i in count) {print i,count[i]}}' /etc/fstab
              awk '{for(i=1;i<=NF;i++){ls[$i]++}}END{for(j in ls){print j,ls[j]}}' /var/log/httpd/access_log | sort -t" " -k2 -nr
    十、函数
       1、内置函数
            函数的调用:funcation(参数)
             length() 统计字符串长度
                数学运算上使用的行数 sin() cos() ...
                sub(x,x,x) 替换第一个匹配到的值
                awk '{print sub(o,O,$1)}' /etc/fstab //将o 替换为 O 文件中的 第一列(第一个匹配值)
                gsub(x,x,x) 替换该行所匹配到的所有值
                awk '{print gsub(o,O,$1)}' /etc/fstab //将 o 替换为 O 文件中的 第一列(全部匹配值)
                split(x,x,x) 指定分隔符去切割文件
                netstat -tan | awk '/^tcp>/{split($5,ip,":");print ip[1]}'
                netstat -tan | awk '/^tcp>/{split($5,ip,":");count[ip[1]]++}END{for (i in count) {print i,count[i]}}'
    2、自定义函数
         function FunctionName(parameter list)
         {
              statements
              return 表达式或结果
         }
        function:函数标识
        FunctionName:用户自定义函数的名称,不能使用awk的保留关键字
        parameter list:用户自定义函数的参数列表,参数为可选
        statements:函数主体
        return:返回函数的结果

  • 相关阅读:
    HTTP协议详情
    HTTP入门
    DNS vs CDN
    TCP/IP协议和互联网协议群
    常用docker镜像
    linq to sql 把数据库连接字段写入配置文件
    微信开发--one.微信平台验证
    项目--ajax上传文件(本次是图片)(.net)
    项目--Repeater嵌套横向显示
    项目--物流查询实现
  • 原文地址:https://www.cnblogs.com/hmm01031007/p/11402609.html
Copyright © 2011-2022 走看看