zoukankan      html  css  js  c++  java
  • AWK---linux系统三剑客(三)

    grep 、sed、awk被称为linux中的"三剑客"。

      grep 更适合单纯的查找或匹配文本

      sed  更适合编辑匹配到的文本

      awk  更适合格式化文本,对文本进行较复杂格式处理


    AWK是一种优良的文本处理工具

      awk是linux中处理文本的强大工具,或者说是一种专门处理字符串的语言,它有自己的编码格式。awk的强大之处还在于能生成强大的格式化报告

      使用方法   : awk '{pattern + action}' {filenames}

      

       尽管操作可能会很复杂,但语法总是这样,programe 又分为 pattern 和 action ,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。


      案例分析

      数据链接 https://www.cnblogs.com/SliverLee/protected/p/11868443.html     密码 :123456

      现有数据如下,求出Reason=1000时,Lefts字段值汇总。

      



      1、从所有数据中,利用grep先过滤出 Reason=1000部分。

      [root@localhost tmp]# more demotest.txt | grep Reason=1000

      


      2、接下来就是awk的功能了

      AWK常用参数

          ARGV               命令行参数排列
          ENVIRON            支持队列中系统环境变量的使用
          FILENAME           awk浏览的文件名
          FNR                浏览文件的记录数
          FS                 设置输入域分隔符,等价于命令行 -F选项
          NF                 浏览记录的域的个数
          NR                 已读的记录数
          OFS                输出域分隔符
          ORS                输出记录分隔符
          RS                 控制记录分隔符
          $0变量是指整条记录。$1表示当前行的第一个域,$2表示当前行的第二个域,......以此类推。

      3、print和printf
        print 用于简单的输出,如果需要格式化的输出和打印,则需要选择printf.
        如下例子,打印数据中的第一列 $1即为第一列,使用的时候需要注意,{  },花括号内部print前后各有一个空格
          

      4、分隔符 :在awk中,分隔符默认为空格,但是我们可以利用  -F 这个参数自定义分隔符号,
        

        默认空格分隔符

        

         修改分隔符为 “  -  ”,对比默认空格,很明显发现不同。

        

        如根据多个分隔符进行分割呢?可以两次awk,但是我们可以一次告诉awk我们所有的分隔符,如-和|这两个,用[]包起来,想根据更多也可以继续加。

        


        5、计算

        根据前面的几个内容,我离最终的目的越来越近了,首先我先获取到Lefts这个列,分隔符为多个“-:,=”,

         

       


        当Lefts值大于2000时,才输出

         


     

        BEGIN与END

        特殊模式 BEGIN 用于匹配第一个输入文件的第一行之前的位置, END 则用于匹配处理过的最后一个文件的最后一行之后的位置。这个程序使用 BEGIN 来输出一个标题:

         


         下面求和

         

         结合END,计算如下

         

    最后结合之前所有的知识点总结一下:

          

    付出是用来忘记的,回报时悄然而至的。不要让梦想,只是梦想!!!
  • 相关阅读:
    22(1).模型融合---Random Forest
    Tesseract 模块
    非线性问题的三种处理方法
    jupyter 快捷键
    回归评价指标---MSE、RMSE、MAE、R-Squared
    理解JavaScript中的事件处理
    jquery事件重复绑定解决办法
    IE6 IE7 IE8(Q) 不支持 JSON 对象
    浏览器事件机制与自定义事件的实现
    浏览器加载和渲染html的顺序
  • 原文地址:https://www.cnblogs.com/SliverLee/p/11868544.html
Copyright © 2011-2022 走看看