zoukankan      html  css  js  c++  java
  • Linux正则表达式,grep总结,sed用法

     

     

     

     

    原文:

    1、sed   流编辑器,实现对文字的增删改替换查(过滤、取行),能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件

    输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。

    流程:Sed软件从文件或管道中读取一行,处理一行,输出一行;再读取一行,再处理一行,再输出一行……

    模式空间:sed软件内部的一个临时缓存,用于存放读取到的内容。

    2、命令格式:sed  [选项]   [命令]   [输入文件]

    sed命令的常用选项:

    -n :只打印模式匹配的行,一般与 p 一起使用。如:sed -n  ' 2p '  /data  表示输出/data的第二行,如:sed  -n '20,30p'    /data/boy显示 /data/boy的20到30行。

    -e :进行多项编辑,即对输入行应用多条sed命令时使用,此为默认选项。如:sed -e '/^#/d'  -e '/^$/d'  /data/boy表示删除空格的行和#开头的行。

    -f :将sed的动作写在一个脚本文件内,用–f filename 执行filename内的sed动作。

    -r :支持扩展表达式

    -i :直接修改文件内容,如:sed   -i   s#old#new#g    

    常用基本命令:

      d        :delete, 删除匹配到的行;
        p        :print,  显示匹配到的行;通常 p 会与参数 sed -n 一起用
        a  ext:append, 在指定行后追加文本text,支持使用 实现多行追加;
        i  ext :insert, 在指定行前插入文本text,支持使用 实现多行插入;
        c  ext:将指定行的内容替换为文本text;
        w /file:write, 保存模式空间中匹配到的行至指定的文件中;

        r /file :read, 将指定文件的内容读取至当前模式空间中被匹配到的行后面,常用于实现文件合并;

                        sed  -i '/Ethernet/r myfile' test  匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后  

        s/pattern/replaces/:查找pattern用replaces替换;分隔符可自行指定,常用的分隔符有/, #, @等;
        替换标记:
                g:全局替换;
                w /file:将替换的结果保存至指定文件中;sed -i 's/pattern/replaces/w my.txt'  test    将替换后的结果保存到my.txt中
                p:显示替换成功的行;

        

        y:用于(对应)转换字符;

        =:打印行号;
        ! :匹配后取反;
        l :打印行号,并显示控制字符;
        q:读取匹配到的行后退出;

             

     3、sed在文件中查询文本的方式

      x/p   查询第x行   sed -n '2p' /data  
      x,y/p     查询从x到y行     sed -n '1,3p' /data  
      /pattern/p     查询包含pattern的行     sed -n '/pattern/p' /data  
      /pattern 1/,/pattern 2/p     查询包含pattern 1或pattern 2的行     sed -n '/pn1/,/pn2/p'  /data
      /pattern/,xp   查询从包含pattern的行到x行   sed -n '/pn/,5p'  /data
      x,/pattern/p   查询从x到包含pattern的行   sed -n '5,/pn/p'  /data
      x,y!p   查询不包含指定行号x和y的行   sed -n '5,8!p'  /data

     

     

     

     

     

     

     

     

     

     

     

     

     

    1. 10{sed-commands} 对第10行操作
    2.    10,20{sed-commands} 对10到20行操作,包括第10,20行

    3.    10,+20{sed-commands} 对10到30(10+20)行操作,包括第10,30行

    4.    1~2{sed-commands} 对1,3,5,7,……行操作

    5.    10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行

    6. /oldboy/{sed-commands} 对匹配oldboy的行操作

    7. /oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操作

    8. /oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操作

    9. /oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操作,注意:如果前10行没有匹配到oldboy,sed软件会显示10行以后的匹配oldboy的行,如果有。

    10. 1,/Alex/{sed-commands} 对第1行到匹配Alex的行操作

    11. /oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操作

    4、案例(sed 后不跟  -i  表示仅对输出改变,对源文件不改变)

    • 单行增加到第2行后:   sed '2a 106,dandan,CSO' person.txt

    • 单行增加到第2行前:   sed '2i 106,dandan,CSO' person.txt

    • 多行增加到第2行前:   sed '2i 106,dandan,CSO 107,bingbing,CCO' person.txt,每行之间加换行符    

    • 删除第二行:                   sed '2d' person.txt

    • 删除匹配oldboy或者Alex的行                  sed '/oldboy/,/Alex/d' person.txt

    • 用新行替代第2行                      sed '2c 106,dandan,CSO' person.txt

    • 分组替换( )和1的使用说明

    sed软件的( )的功能可以记住正则表达式的一部分,其中,1为第一个记住的模式即第一个小括号中的匹配内容,2第二记住的模

    式,即第二个小括号中的匹配内容,sed最多可以记住9个。

    例:echo I am oldboy teacher.如果想保留这一行的单词oldboy,删除剩下的部分,使用圆括号标记想保留的部分。

    echo I am oldboy teacher. |sed 's#^.*am ([a-z].*) tea.*$#1#g'

    思路:用oldboy字符替换I am oldboy teacher.

    下面解释用代替空格:

            ^.*am□ –>这句的意思是以任意字符开头到am□为止,匹配文件中的I am□字符串;

            ([a-z].*)□–>这句的外壳就是括号(),里面的[a-z]表示匹配26个字母的任何一个,[a-z].*合起来就是匹配任意

    多个字符,本题来说就是匹配oldboy字符串,由于oldboy字符串是需要保留的,因此用括号括起来匹配,后面通过1来取oldboy字符串。

            □tea.*$–>表示以空格tea起始,任意字符结尾,实际就是匹配oldboy字符串后,紧接着的字符串□teacher.;

    后面被替换的内容中的1就是取前面的括号里的内容了,也就是我们要的oldboy字符串。

            ()是扩展正则表达式的元字符,sed软件默认识别基本正则表达式,想要使用扩展正则需要使用转义,即()。sed使

    -r选项则可以识别扩展正则表达式,此时使用()反而会出错。

     

     

     

  • 相关阅读:
    微信Jssdk 认证签名
    枚举的变换
    mysql 事务
    Java中的堆和栈
    mysql-索引
    mysql-事务隔离 为什么你改了我还看不见
    mysql 一次更新语句是如何执行的
    mysql-一条sql的执行过程
    随笔
    设计模式之装饰者
  • 原文地址:https://www.cnblogs.com/tan-y-q/p/10801034.html
Copyright © 2011-2022 走看看