zoukankan      html  css  js  c++  java
  • Shell基本语法---处理海量数据的awk命令

    awk命令

    • 其实是一门编程语言,支持条件判断,数组,循环等功能,与grep,sed被称为linux三剑客

    • 之所以叫AWK是因为取其三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的Family Name的首字符

    • awk的应用场景:通常对数据进行列的提取

    • 语法:

      • awk '条件 {执行动作}' 文件名

      • awk '条件1 {执行动作} 条件2 {执行动作} ...' 文件名

      • awk [选项] '条件1 {执行动作} 条件2 {执行动作} ...' 文件名

    • 常用变量和命令:

      • $0 #代表一整行 $1 #代表第一列 $2 #代表第二列

      • NR:行号

      • FS:分隔符

      • BEGIN:在读取所有行内容前就开始执行,常常被用于修改内置变量的值

      • END:结束的时候执行

      • /xxx/:xxx表示正则表达式的规则

      • printf #格式化输出,不会自动换行

        • %ns:字符串型,n代表有多少个字符

        • %ni:整型,n代表输出几个数字

        • %.nf:浮点型,n代表的是小数点后有多少个小数

      • print #打印出内容,默认会自动换行

      • #制表符

      • #换行符

    1 printf '%s	%s	%s	%s	%s	%s
    ' 1 2 3 4 5 6
    2 
    3 #打印第一列和第三列
    4 cat /etc/passwd | awk -F ":" '{print $1 $2}'
    • 三剑客的区别:

      • grep 更适合单纯的查找或匹配文本

      • awk 更适合格式化文本,对文本进行较复杂格式处理

      • sed 更适合编辑匹配到的文本

    • if、while以及for的使用和C语言类似,需要注意的是语句要整体包含在大括号类

     1 cat /etc/passwd | awk -F ":" '{if (NR == 20) {print $1} else if(NR == 21) {print $2} else {print $3}}'
     2 
     3 #手动格式化后,如下:
     4 {  #最外面的大括号不能少
     5     if (NR == 20) 
     6     {
     7         print $1
     8     } 
     9     else if(NR == 21) 
    10     {
    11         print $2
    12     } 
    13     else 
    14     {
    15         print $3
    16     }
    17 }
  • 相关阅读:
    umeng社交分享最新版5.0的跨进程使用崩溃的问题及解法-Android
    AlertDialog禁止返回键
    一个男人想经商,不读 100本商人自传,怎么会了解商人的思维状态
    Android中使用Gson解析JSON数据的两种方法
    DevExpress gridControl控件动态绑定列 zt
    获得WCF Client端的本地端口 z
    log4net.dll配置以及在项目中应用 zt
    系统交易策略 hylt
    判斷作業系統為 64bit 或 32bit z
    路徑 z
  • 原文地址:https://www.cnblogs.com/chusiyong/p/11273879.html
Copyright © 2011-2022 走看看