zoukankan      html  css  js  c++  java
  • 二,awk分隔符

      在前一篇文章中我们略微提到过"分隔符",但是并没有细说,那么我们今天就聊聊什么是分隔符,awk有哪些分隔符,awk的默认分割符是空格,但是,这样描述并不精确,因为,awk的分隔符还分为两种,"输入分隔符" 和 "输出分隔符" 。

      此处我们先将分隔符的概念列出,看不懂没关系,我们会一一进行举例,到时自然会明白。

       输入分隔符,英文原文为field separator,此处简称为FS

      输入分割符,默认是空白字符(即空格),awk默认以空白字符为分隔符对每一行进行分割。

       输出分割符,英文原文为output field separator,此处简称为OFS

      awk将每行分割后,输出在屏幕上的时候,以什么字符作为分隔符,awk默认的输出分割符也是空格。

       光看概念是不是不容易搞明白?没关系,我们来动手实践一下,胜过千言万语。

      

      输入分隔符

      我们现在通过一些小例子,搞明白这两个分隔符的作用,不过我们要一个一个来,我们先看一些"输入分隔符"的小例子

      输入分隔符比较容易理解,当awk逐行处理文本的时候,以输入分隔符为准,将文本切成多个片段,默认使用空格,但是,如果一段文字中没有空格,我们可以指定以特定的文字或符号作为输入分割符,比如下图中的例子,我们指定使用"#"作为输入分隔符。

    [root@node1 ~]# cat test
    abc#123#iuy#ddd
    8ua#456#auv#ppp#7y7
    [root@node1 ~]# awk -F# '{print $1,$2}' test
    abc 123
    8ua 456
    

       上图中,我们使用了-F 选项,指定了使用#号作为输入分隔符,于是,awk将每一行都通过#号为我们分割了。

      除了使用 -F 选项指定输入分隔符,还能够通过设置内部变量的方式,指定awk的输入分隔符,awk内置变量FS可以用于指定输入分隔符,但是在使用变量时,需要使用-v选项,用于指定对应的变量,比如 -v FS='#',如下图

    [root@node1 ~]# awk -v FS='#' '{print $1,$2}' test
    abc 123
    8ua 456
    

       其实不管是通过-F选项,还是通过FS这个内置变量,目的都是设置指定的输入分隔符,达到的效果是相同的,我们会在另一篇文章中单独对awk的变量进行总结,如果你不理解这些变量,没有关系,后面自然会明白。

      而此处,我们使用了awk中的一个选项,就是-F,还记得我们之前总结的awk的使用语法吗。

      我们说过,awk的语法如下

      awk [options] 'Pattern{Action}' file

      而-F,就是options的一种,用于指定输入分隔符。

      -v也是options的一种,用于设置变量的值。

      再结合之前的文章,我们已经将options 、pattern 、action都简单的应用了一遍,好了,我们已经"会用"awk了。

      

      输出分隔符

      那么什么是输出分隔符呢?聪明的你应该已经发现了,当awk为我们输出每一列的时候,会使用空格隔开每一列,其实,这个空格,就是awk的默认的输出分隔符,下图中红线标注的空格部分,就是awk的默认的输出分隔符。

       输出分割符的意思就是:当我们要对处理完的文本进行输出的时候,以什么文本或符号作为分隔符。

      我们可以使用awk的内置变量OFS来设定awk的输出分隔符,当然,使用变量的时候要配合使用-v选项,示例如下

    [root@node1 ~]# cat test1
    abc 123 iuy ddd
    8ua 456 auv ppp 7y7
    [root@node1 ~]# awk -v OFS="+++" '{print $1,$2}' test1
    abc+++123
    8ua+++456
    

       现在,我们可以同时指定输入分隔符和输出分割符了,示例如下

    [root@node1 ~]# cat test
    abc#123#iuy#ddd
    8ua#456#auv#ppp#7y7
    [root@node1 ~]# awk -v FS='#' -v OFS='---' '{print $1,$2}' test
    abc---123
    8ua---456
    

       我们刚才解释了awk的输出分隔符,如果,在输出的时候,我们想要让两列合并在一起显示,不使用输出分隔符分开显示,该怎么做呢?如下图所示,蓝线之上使用默认的输出分隔符进行了分隔,而蓝线之下的两种方法均未使用输出分隔符进行分隔,而是将两列合在一起显示了。

    [root@node1 ~]# cat test1
    abc 123 iuy ddd
    8ua 456 auv ppp 7y7
    [root@node1 ~]# awk  '{print $1 $2}' test1
    abc123
    8ua456
    [root@node1 ~]# awk  '{print $1$2}' test1
    abc123
    8ua456
    

       细心如你一定发现了,上图中的示例在语法上的区别就是,一个有"逗号",一个没有"逗号"。

      awk '{print $1 $2}' 表示每行分割后,将第一列(第一个字段)和第二列(第二个字段)连接在一起输出。

      awk '{print $1,$2}' 表示每行分割后,将第一列(第一个字段)和第二列(第二个字段)以输出分隔符隔开后显示。

  • 相关阅读:
    linux 加载模块时出现cannot insert '*.ko': Device or resource busy错误
    Beej's Guides [Share]
    linux 符号链接与硬链接的区别
    Source Insight 3.5 一直刷新问题
    linux 内核线程与普通进程的区别
    为明远智睿 imx6q Demo v2.5 添加spi5的支持
    linux dereferencing pointer to incomplete type错误
    imx6 ECSPI Config Register 中SS_CTL的使用
    linux Copy-on-Write
    C语言根据国家英文首字母进行排序
  • 原文地址:https://www.cnblogs.com/minseo/p/13678883.html
Copyright © 2011-2022 走看看