zoukankan      html  css  js  c++  java
  • sed基本用法

    sed命令基本用法
    sed是一个非交互式文本编辑器,它可以对文本文件和标准输入进行编辑,标准输入可以是来自键盘输入、文件重定向、字符串、变量、来自管道的文本等等。
    sed从文本的一个文本行或标准输入中读取数据,将其复制到缓存区,然后读取命令行或脚本的第一个命令,对此命令要求的行号进行编辑,重复此过程,直到命令行或脚本中所有命令都执行完了。sed可以一次性处理所有的编辑命令,非常高效
     
    sed适用于下面三种场合:
    * 编辑相对于交互式文本编辑器而言太大的场合
    * 编辑命令太复杂,在交互式文本编辑器中难以输入的情况
    * 对文件扫描一遍,但是需要执行多个编辑函数的情况
     
    sed只是对缓存区中原始文件的副本进行编辑,并不编辑原始文件。因此,如果需要保存更改内容,需要将输出重定向到另一个文件,可以使用下面的命令:
    sed 'sed命令' input_file > result_file
    或者还有另一种方法就是 -w 选项,这个后面讲到
     
    有三种方式调用sed:
    ① 直接在shell命令行上调用
    # sed [选项] 'sed命令' 输入文件
    ② 将sed命令插入脚本文件后,通过sed命令调用脚本:
    # sed [选项] -f sed脚本文件名 输入文件
    ③ 将sed命令写入脚本文件后,将其+x变成可执行
    ./sed脚本文件 输入文件
    第三种方式需要在文件头部加上 #!/bin/sed
     
    sed命令的常用选项:
    -n    不打印所有行到标准输出
    -e    表示将下一个字符串解析为sed编辑命令,如果只传递一个编辑命令,-e可以省略
    -f     表示正在调用sed脚本文件
     
    sed命令通常由定位文本行和sed编辑命令两部分组成,sed编辑命令对定位到的行进行各种编辑处理
    sed提供两种方式定位文本行:
    * 使用行号,指定一行或者行号范围
    * 使用正则表达式
     
    sed命令定位文本行的方法:

    选项 意义
    x x为指定行号
    x,y 指定从x到y的行号范围
    /pattern/ 查询包含模式的行
    /pattern/pattern/ 查询包含两个模式的行
    /pattern/,x 从与pattern的匹配行到x号行之间的行
    x,/pattern/ 从x号行到与pattern的匹配行之间的行
    x,y! 查询不包含x和y行号的行


     
    ===================================分割线=======================
    sed编辑命令表

    选项 意义
    p 打印匹配行
    = 打印匹配行号
    a 在定位行之后追加文本信息
    i 在定位行之前插入文本信息
    d 删除定位行
    c 用新文本替换定位行
    s 使用替换模式替换相应的模式
    r 从另一个文件中读文本
    w 将文本写入到另一个文件中
    y 变换字符
    q 第一个模式匹配完成后退出
    l 显示与八进制ASCII码等价的控制字符
    {} 在定位行执行的命令组
    n 读取下一个输入行,用下一个命令处理新的行
    h 将模式缓存区的文本复制到保持缓存区
    H 将模式缓存区的文本追加到保持缓存区
    x 互换模式缓存区和保持缓存区的内容
    g 将保持缓存区的内容复制到模式缓存区
    G 将保持缓存区的内容追加到模式缓存区


     
    ========================分割线============================
    各个选项和编辑命令详解:
    1,sed命令的-n选项和p命令
    # sed -n '1p' input
    # sed '1p' input
    从输出可以看出,加了-n后标准输出上只有第一行打印出来了,而不加-n时候,先打印第一行,然后打印整个文件内容。所以-n选项的意义是:不打印sed编辑内容也就是input的全部内容。只打印匹配的行
    # sed -n '3,6p' input   --> 打印从3到6行
    # sed -n '/certificate/p' input  --> 打印匹配模式行,注意大小写是敏感的
     
    2,sed命令的-e选项
    由于sed不支持同时带多个编辑命令的用法,因此需要用-e选项指定每个编辑命令
    # sed -n -e '/Certificate/p' -e '/Certificate/=' input
     
    3,sed命令的-f选项
    -f选项只有调用sed脚本文件时才起作用,追加文本、插入文本、修改文本、删除文本和替换文本等功能往往需要几条sed命令才能完成,所以,往往将这些命令写入sed脚本,然后调用sed脚本来完成。
    下面是这个sed的脚本:
    Sed代码  1. #!/bin/sed -f  
    2. /file:/a  
    3. We append a new line.  
    4. We append another line.  
    注:上面的/file:/a中的表示在换新行后添加内容,而下面内容中的也表示换行。
     
    4.2.2 sed文本定位的一组例子
    1. 匹配元字符
    如果目标字符串中包含元字符,需要使用转义符屏蔽其特殊意义。
    # sed -n '/./p' input --> 打印含有.的行
    2. 使用元字符进行匹配
    sed可以灵活使用正则表达式的元字符进行匹配,不过注意的是:$在正则表达式中表示行尾,但是在sed命令中却表示最后一行,而写在//中间的$就表示行尾了,哈哈。
    # sed -n '$p' input --> 打印最后一行
    # sed -n '/^$/p' input -> 打印空行
    3. !符号
    !表示取反,也就是不满足条件的时候就处理
    # sed -n '/.*this/!p' input  --> 打印不包含this的行
    # sed -n '3,6!p' input --> 打印不在3至6行间的行
     
    4.2.3 sed基本编辑命令的一组例子
    1. 插入文本
    插入文本和追加文本类似,区别仅仅是追加文本是在匹配行的后面插入,而插入文本是在匹配行的前面插入
    sed插入文本符号位i,插入文本的格式为:
    sed '指定地址 i ext' 输入文件
    新建名为insert.sed的脚本,内容如下:
    Bash代码  1. #!/bin/sed -f   
    2. # this is comment  
    3. # date : 2013/06/02  
    4. # author : xiongneng  
    5. /this is/i  
    6. We insert a new line #插入的文本内容  
     
     2. 修改文本
    修改文本是指将所匹配的问本行用新文本代替,也就是只能整行替换,sed修改文本符号位c
    sed '指定行 c ext' 输入文件
     
    3. 删除文本
    sed删除文本命令可以将指定行或指定行范围进行删除,sed的删除文本符号为d
    sed '指定行 d' 输入文件
     
    4.替换文本
    sed替换文本将所匹配的文本行中找到的字符串用新的字符串去代替,常用。而上面的修改文本只能整行,sed替换文本符号为s
    sed -n 's/被替换的字符串/新的字符串/p' --> 只替换每行中第一次找到的
    sed -n 's/被替换的字符串/新的字符串/gp' --> 替换每行中所有找到的
    sed -n 's/被替换的字符串/新的字符串/np' --> 替换每行中第n次找到的
    sed替换文本中有个重要的符号&,它表示保存被替换的字符串以供调用。
    比如下面两条命令等级:(都是将this字符串用括号括起来)
    # sed -n 's/this/(&)/gp' input
    # sed -n 's/this/(this)/gp' input
     
    5. 写入到一个新文件
    上面提到的都是对缓存区中输入文件的复制内容进行编辑,如果要保存编辑结果,需要将编辑后的文本重定向到另一个文件,sed写入文件符号为w,基本格式为:
    # sed -n '1,5 w output' input
    # sed -n '/this/2 output' input
    # sed -n 's/this/(&)/gw output' input  --> 将this加上括号后,匹配行写入到output中去
    注:这里写到新文件中的只有匹配的行修改后的数据,如果要整个文件内容都写进去,使用重定向>> 或者>
     
    6. 从文件中读入文本内容
    sed命令还可以将其他文件中的内容读入,并附加在指定地址后,sed读入文件的符号为r
    # sed '/this/r otherfile' input
     
    7. 退出命令
    sed命令的q选项表示完成指定地址匹配后立即退出
    # sed -n '/this/p' input  --> 打印出匹配的全部字符串
    # sed -n -e '/this/p' -e '/this/q' test.txt  --> 找到第一个匹配的打印后就立即退出
     
    8. 变换命令
    sed命令的y选项表示字符变换,它将一系列的字符变换为相应的字符,逐个处理的
    # sed 'y/被变换的字符序列/变换的字符序列/' 输入文件
    # sed 'y/12345/ABCDE' input --> 将input中1变成A,2变成B,3变成C,4变成D,5变成E
     
    9. 显示控制字符
    sed 1命令可以显示出文件中的控制字符,比如退格键、F1键、Shift键等
    # sed -n '1,$1' input
     
    10. 在定位行执行命令组
    sed编辑命令中的{}可以指定在定位行上所执行的命令组,它的作用与sed的-e选项类似,都是为了在定位行执行多个编辑命令。
    下面的命令等价:
    # sed -n -e '/this/p' -e '/this/q' test.txt 
    # sed -n '/this/{p;q}' test.txt -->显然这个更NB点
     
    4.2.4 sed高级编辑命令的一组例子
    1. 处理匹配行的下一行
    sed编辑命令n的意义是读取下一个输入行,用n后面的一个命令处理该行,由于此时通常有个多个编辑命令,所以命令n需要与{}配合使用
    # sed '/this is/{n;s/her/him/;}' input --> 找到this is关键词那行,然后将它下一行的her替换成him
     
    2. sed缓存区的处理
    前面提到的所有编辑命令都是将输入文件复制到缓存区,对缓存区的复制内容进行处理。实际上,sed有两个缓存区,模式缓存区 Pattern Buffer 和保持缓存区 Hold Buffer。前面都是Pattern Buffer,而保持缓存区是另一个内存空间,sed的一些编辑命令可以对保持缓存区进行处理,并与模式缓存区的内容互换
    # sed h、x、G命令的用法
    # sed  '/subject/h; /object/x; $G' input
    解释下:
    第一个h命令是将模式缓存区内容复制到保持缓存区,也就是说当找到subject的行的时候,就将该行复制到Hold Buffer,如果该行有object关键词就将模式缓存区和保持缓存内容互换后输出模式缓存区内容,第三条命令表示如果是到了最后一行,就直接输出保持 缓存区内容。
     
    h和H、g和G是两组对应的命令
    h和H命令是将模式缓存区内容替换掉保持缓存区内容,不过h是副本,即将保持缓存区的就内容覆盖掉,而H是追加,即在保持缓存区内容上增加新的内容
    g和G是将保持缓存区内容替换掉模式缓存区内容,同样,g是副本、G是追加。
     
    3.利用分号;分割多个编辑命令,这个比起-e选项更NB一点。^_^
    # sed  '/subject/h; /object/x; $G' input

  • 相关阅读:
    premake Ubuntu下的安装
    android设置eclipse中的自动提示功能
    SharePoint 2013的100个新功能之搜索(二)
    poj 4014 Dice 贪心
    代码手写UI,xib和StoryBoard间的博弈,以及Interface Builder的一些小技巧
    Android 英文文档下载地址
    winform网络编程之TcpClient类,TcpListener类和UdpClient类
    Spring Data MongoDB 三:基本文档查询(Query、BasicQuery)(一)
    const对象默觉得文件的局部变量
    springmvc自己定义拦截器
  • 原文地址:https://www.cnblogs.com/losbyday/p/5854736.html
Copyright © 2011-2022 走看看