zoukankan      html  css  js  c++  java
  • 上课笔记:awk

    awk 【单独的编程语言解释器】
    1、awk介绍
     全称:Aho Weinberger Kernaighan 三个人的首字母缩写;
     1970年第一次出现在Unix机器上,后来在开源领域使用它;
     所以,我们在Linux中使用,改名为GNU awk;所以,在Linux上实际上叫做gawk;
     grep 行过滤器
      -o -i -v -E  grep  egrep  fgrep【写什么就匹配什么】
     sed 行编辑器
      -n p 1、地址定界 3,5,/pat/【e】 2、命令 p a i w c s/pat/str/g|1|2..|&
      ${var/pat/str} ${var//pat/str}
      ${test}、${#test}、${test:offset:length}、${test#*word}、${test##*word}、${test%word}、${test%%*word}、${test/pattern/string}、${test//pattern/string}、${test:-word}
     
     awk 报告生成器
      通过模式匹配以及自己本身的语言格式,来获取、并输出客户所需要的内容;
     【默认情况下,三个工具都不去编辑源文件】
     示例:获取系统上面用户id大于等于1小于等于500的用户的用户名和用户ID
     for i in $(cut -d: -f3 /etc/passwd);do
      if [ $i -ge 1 -a $i -le 500 ];then
       echo grep $i | cut -d: -f1,3
      fi
     done
     
     awk -F: '{if($3>=1&&$3<=500){print $3}}' /etc/passwd
     # awk最后实现这个功能的时候只需要一句话就可以!
     格式化输出的意义:
     awk -F: -v OFS=":" 'BEGIN{printf "   username      uid    ======================== "}{if($3>=1&&$3<=500){printf "用户名:%-10s UID:%-10d ",$1,$3}}END{printf "--------------------------- end "}' /etc/passwd
    2、awk工作原理
     xxxxx(看图)
    3、awk的用法
     awk [option] ... 'program' FILE ...
     1、program  必须使用 !单引号!
     2、多条program语句使用大括号包含起来,可以并列,可以嵌套
     awk '{print}' /etc/passwd
    4、awk的常见option
     -F 指定分隔符
     awk -F[/:] '{print $1,$3}' a.txt
      其中 [  ] 内表示多个字符中的任意一个
     -v 因为awk是一种语言编译器,能自己定义变量,同时也有内置变量(与环境变量类似)
      手动指定变量参数
     awk -v a="a/b" '{print a}' a.txt
      给a赋值,打印a这个变量
      1、a是自定义变量  -v FS=":"
      2、在awk中调用调用变量 不用加 $ 符号
     awk '{a="a/b";print a}' a.txt
     扩展:了解 cut 与 awk 的区别;
    5、awk的语法格式  -- program
     1、print
      默认输出(在屏幕上)
      在awk中没有保存命令,我们可以关联别的命令来保存awk的结果;
     awk '{a="a/b";print a}' a.txt | tee a.bak
     
     2、printf  -- 实现格式化输出
      printf "%s是%d班学的最好的学生",变量1,变量2 
      【仅仅只有顺序关系】
      格式符
       %s   字符串
       %d  %i  数值
       %e  %E  科学计算数值
       %c  ACSii码值
       %f   浮点数
       %u  无符号整数
       %%  逃逸符 只显示 % 自己
      修饰符
       默认为右对齐
       -  代表左对齐
       %5.4f  
       5  所占位数
       4  所取小数位
     awk '/^UUID/{printf "被挂载文件:%-50s  挂载点:%-10s  文件系统格式:%-10s ",$1,$2,$3}' /etc/fstab
      注意:这里提到了地址定界
      sed /PAT1/,/PAT2/
     
     3、变量(内置变量、自定义变量)
      内置变量 -- 环境变量(bash)(env、set -C +C)
       awk语言所默认支持的变量
       FS   定义输入分隔符的变量
       OFS   定义输出分隔符的变量
       NF  定义行分隔以后的参数个数 ($NF 分隔以后最后的一列变量)
        *变量引用的时候,不用加$,$0,$1...$n
      awk -v FS=":" '//bash$/{print $1,$NF}' /etc/passwd
       NR  定义文件的行数,定义多个文件的文件的,行号叠加
       FNR  文件只计算自己的行号
      awk '{print NR}' /etc/fstab /etc/passwd
      awk '{print FNR}' /etc/fstab /etc/passwd
       FILENAME 存储文件的名字
      awk '{print FILENAME}' /etc/passwd   //把文件名打印N次,N文件的行数
      awk 'BEGIN{print FILENAME}' /etc/passwd   //BEGIN{语句} 只在行循环开始时,执行一次;
       ARGC  整个命令的 段数  【注意:不包含 'program' 本身】
       ARGV  数组,用来调取命令中,指定的段 ARGV[2]  【注意:数组中也不包含 'program' 】
      awk 'BEGIN{print ARGC}' /etc/passwd /etc/fstab /etc/shadow
      awk 'BEGIN{print ARGV[3]}' /etc/passwd /etc/fstab /etc/shadow 
       RS   指定换行符 可以指定新的换行符,不影响本身的换行
       ORS   输出的时候指定的换行符,将默认换行符替换为指定字符
      awk -v RS=" " '{print}' /etc/passwd
      awk -v ORS=" " '{print}' /etc/passwd  //可以用来取消换行
      
      自定义变量
       -v 变量=值
        在后面'program'中去调用自定义变量时,直接使用即可
       或者将 “变量=值”语句直接写在'program'亦可;
      awk -v a="a/b" '{print a}' a.txt
      awk '{a="a/b";print a}' a.txt
     4、模式匹配(地址定界)
     5、操作符
     6、常见action
     7、常见语言(if while do for break continue delete switch)
     8、数组
     9、函数
  • 相关阅读:
    引号的区别
    QT中加载动态链接库
    QString 转换为 char *
    C++虚继承初识
    虚析构函数详解
    赋值兼容规则
    利用docker搭建spark hadoop workbench
    《用Java写一个通用的服务器程序》03 处理新socket
    《用Java写一个通用的服务器程序》02 监听器
    《用Java写一个通用的服务器程序》01 综述
  • 原文地址:https://www.cnblogs.com/dongxu2019/p/11392313.html
Copyright © 2011-2022 走看看