zoukankan      html  css  js  c++  java
  • awk

    awk 【单独的编程语言解释器】
    1、awk介绍
        全称:Aho Weinberger Kernaighan 三个人的首字母缩写;

        1970年第一次出现在Unix机器上,后来在开源领域使用它;
        所以,我们在Linux中使用,改名为GNU awk;所以,在Linux上实际上叫做gawk;

        grep 行过滤器
            -o -i -v -E  grep  egrep  fgrep【写什么就匹配什么】
        sed 行编辑器
            -n p 1、地址定界 3,5,/pat/【e】 2、命令 p a i w c s/pat/str/g|1|2..|&
            ${var/pat/str} ${var//pat/str}
            ${test}、${#test}、${test:offset:length}、${test#*word}、${test##*word}、${test%word}、${test%%*word}、${test/pattern/string}、${test//pattern/string}、${test:-word}
        
        awk 报告生成器
            通过模式匹配以及自己本身的语言格式,来获取、并输出客户所需要的内容;
        【默认情况下,三个工具都不去编辑源文件】

        示例:获取系统上面用户id大于等于1小于等于500的用户的用户名和用户ID
        for i in $(cut -d: -f3 /etc/passwd);do
            if [ $i -ge 1 -a $i -le 500 ];then
                echo grep $i | cut -d: -f1,3
            fi
        done
        
        awk -F: '{if($3>=1&&$3<=500){print $3}}' /etc/passwd
        # awk最后实现这个功能的时候只需要一句话就可以!

        格式化输出的意义:
        awk -F: -v OFS=":" 'BEGIN{printf "   username      uid    ======================== "}{if($3>=1&&$3<=500){printf "用户名:%-10s UID:%-10d ",$1,$3}}END{printf "--------------------------- end "}' /etc/passwd

    2、awk工作原理
        xxxxx(看图)

    3、awk的用法
        awk [option] ... 'program' FILE ...
        1、program  必须使用 !单引号!
        2、多条program语句使用大括号包含起来,可以并列,可以嵌套

        awk '{print}' /etc/passwd

    4、awk的常见option
        -F    指定分隔符
        awk -F[/:] '{print $1,$3}' a.txt
            其中 [  ] 内表示多个字符中的任意一个
        -v    因为awk是一种语言编译器,能自己定义变量,同时也有内置变量(与环境变量类似)
            手动指定变量参数
        awk -v a="a/b" '{print a}' a.txt
            给a赋值,打印a这个变量
            1、a是自定义变量  -v FS=":"
            2、在awk中调用调用变量 不用加 $ 符号
        awk '{a="a/b";print a}' a.txt

        扩展:了解 cut 与 awk 的区别;
      awk 以空格为分割域时,是以单个或多个连续的空格为分隔符的;
      cut则是以单个空格作为分隔符。

    5、awk的语法格式  -- program
        1、print
            默认输出(在屏幕上)
            在awk中没有保存命令,我们可以关联别的命令来保存awk的结果;
        awk '{a="a/b";print a}' a.txt | tee a.bak
        
        2、printf  -- 实现格式化输出
            printf "%s是%d班学的最好的学生",变量1,变量2  
            【仅仅只有顺序关系】
            格式符
                %s   字符串
                %d  %i  数值
                %e  %E  科学计算数值
                %c  ACSii码值
                %f   浮点数
                %u  无符号整数
                %%  逃逸符 只显示 % 自己
            修饰符
                默认为右对齐
                -  代表左对齐
                %5.4f   需要五个格 4大多指浮点数默认保留4位
                5  所占位数
                4  所取小数位
        awk '/^UUID/{printf "被挂载文件:%-50s  挂载点:%-10s  文件系统格式:%-10s ",$1,$2,$3}' /etc/fstab
            注意:这里提到了地址定界
            sed /PAT1/,/PAT2/
        
        3、变量(内置变量、自定义变量)
            内置变量 -- 环境变量(bash)(env、set -C +C)
                awk语言所默认支持的变量
                FS   定义输入分隔符的变量
                OFS   定义输出分隔符的变量
                NF  定义行分隔以后的参数个数 ($NF 分隔以后最后的一列变量)
                    *变量引用的时候,不用加$,$0,$1...$n
            awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd
                NR  定义文件的行数,定义多个文件的文件的,行号叠加
                FNR  文件只计算自己的行号
            awk '{print NR}' /etc/fstab /etc/passwd
            awk '{print FNR}' /etc/fstab /etc/passwd
                FILENAME 存储文件的名字
            awk '{print FILENAME}' /etc/passwd   //把文件名打印N次,N文件的行数
            awk 'BEGIN{print FILENAME}' /etc/passwd   //BEGIN{语句} 只在行循环开始时,执行一次;
                ARGC  整个命令的 段数  【注意:不包含 'program' 本身】
                ARGV  数组,用来调取命令中,指定的段 ARGV[2]  【注意:数组中也不包含 'program' 】
            awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow
            awk 'BEGIN{print ARGV[3]}' /etc/passwd /etc/fstab /etc/shadow    
                RS   指定换行符 可以指定新的换行符,不影响本身的换行
                ORS   输出的时候指定的换行符,将默认换行符替换为指定字符
            awk -v RS=" " '{print}' /etc/passwd
            awk -v ORS=" " '{print}' /etc/passwd  //可以用来取消换行
            
            自定义变量
                -v 变量=值
                    在后面'program'中去调用自定义变量时,直接使用即可
                   或者将 “变量=值”语句直接写在'program'亦可;
           awk -v a="a/b" '{print a}' a.txt
             awk '{a="a/b";print a}' a.txt

  • 相关阅读:
    Linux内核同步方法
    C++11写轻量级AOP框架
    Typora夜樱主题
    MySQL添加主键和外键
    命题连接词和命题逻辑
    打印一个类全部信息的方法
    getClass()和instanceof以及类的equals方法
    多态
    在构造函数中调用另一个构造函数
    参数传递
  • 原文地址:https://www.cnblogs.com/azuressy/p/11392393.html
Copyright © 2011-2022 走看看