zoukankan      html  css  js  c++  java
  • 【三剑客】sed命令

    1. Sed 简介

    sed 是Stream Editor(流编辑器)的缩写,是操作、过滤和转换文本内容的强大工具。常用功能有增删改查,过滤,取行。

     

    sed 是一种新型的,非交互式的编辑器 

    它能执行与编辑器vi 和 ex 相同的编辑任务。 

    sed 编辑器没有提供 交互式使用方式,使用者只能在命令行输入编辑命令、指定文件名,然后在屏幕上查看输出 

    sed 编辑器没有破坏性,它不会修改文件,除非使用 shell 重定向 来保存输出结果。

    默认情况下,所有的输出行都被打印到屏幕上。

    # 查看sed软件版本
    [root@oldboy ~]# sed --version
    GNU sed version 4.2.1

    2. sed 工作过程

    sed 编辑器逐行处理文件(或输入),并将输出结果发送到屏幕。 

    sed 的命令就是在 vi 和 ed/ex 编辑器中见到的那些。 

    sed 把当前正在处理的行 保存在一个临时缓存区,这个缓存区称为模式空间临时缓冲 

    sed 处理完模式空间中的行后(即在该行上执行 sed 命令后),就把该行发送到屏幕上(除非之前有命令删除这一行或取消打印操作)。 

    sed 处理完输入文件的最后一行后,sed 便结束运行 

    sed 把每一行都存在临时缓存区,对这个副本进行编辑,所以不会修改或破坏源文件。

    概括流程 

    sed软件从stdin读取加载一行,判断是否符合执行操作条件: 

    • 若不符合,则读取下一行,将下一行文本加载到模式空间;
    • 若符合条件,则执行相应的命令操作,就将该行内容发送到屏幕上。

    逐行进行,直至最后一行,结束。

     

    3. Sed 命令格式

    sed命令行格式为:sed [选项] 'command' 输入文本

        sed [options] [sed-commands] [input-file]
        sed [选项] [sed命令] [输入文件]

    说明:
    1. 注意sed和后面的选项之间至少有一个空格。
    2. 为了避免混淆,本文称呼sed为sed软件。sed-commands(sed命令)是sed软件内置的一些命令选项,为了和前面的options(选项)区分,故称为sed命令。
    3. sed-commands既可以是单个sed命令,也可以是多个sed命令组合。
    4. input-file(输入文件)是可选项,sed还能够从标准输入如管道获取输入。


    sed 定位

    sed 命令在没有给定的位置时,默认会处理所有行。

     

    sed 支持以下几种地址类型:

    1. first~step
      • first 指 起始匹配行
      • sed -n 2~5p
        • 从第二行开始匹配,隔5行匹配一次,即2,7,12,...
    2. $
      • 表示匹配最后一行
      • sed -n '$p' person.txt
    3. /REGEXP/

      • 表示匹配正则那一行,通过//之间的正则来匹配
    4. cREGEXPc

      • 表示匹配正则那一行,通过c和c之间的正则来匹配,c可以是任一字符
    5. addr1, addr2
      • 定址 addr1,addr2 决定用于对哪些行进行编辑。地址的形式可以是数字、正则表达式或二者的结合
      • 如果没有指定地址,sed 将处理输入文件中的所有行。
      • 如果定址是一个数字,则这个数字代表行号,如果是逗号分隔的两个行号,那么需要处理的定址就是两行之间的范围(包括两行在内)。范围可以是数字,正则或二者组合。
    6. addr1,+N
      • 从addr1 这行到往下 N行匹配,总共匹配N+addr1 行
    7. addr1,~N
      • 匹配从addr1开始,到找到N的倍数行结束。
      • 从第13行开始,到5的倍数行结束,这里即第15行结束:
      • sed -n "13,~5p" sed_test.txt
      • # 前面的输出为行号,后面为找到的匹配的值,符合N的倍数规则
        [root@oldboy /]# cat sed_test.txt -n|sed '/aa/,~2p' -n 101 aa 102 bb 108 aa 109 1 110 2 113 aa 114 5 117 aa 118 AAA

    指定执行的地址范围:

    • sed软件可以对单行或多行进行处理。如果在sed命令前面不指定地址范围,那么默认会匹配所有行。
    • 用法:n1[,n2]{sed-commands}
    • 地址用逗号分隔的,n1,n2可以用数字、正则表达式、或二者的组合表示。
    • 例如:

      • 10{sed-commands} 对第10行进行操作
      • 10,20{sed-commands} 对第10到20行进行操作,包括第10和20行
      • 10,+20{sed-commands} 对10到30(10+20)行操作,包括第10,30行
      • 1~2{sed-commands} 对1,3,5,7,……行操作 
      • 10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行
      • 10,~20 对10行到20的倍数行
    • 正则匹配和其他方式的混合的方式:

      • /oldboy/{sed-commands} 对匹配oldboy的行操作
      • /oldboy/,/Alex/{sed-commands} 对匹配oldboy的行到匹配Alex的行操作
      • /oldboy/,${sed-commands} 对匹配oldboy的行到最后一行操作

      • /oldboy/,10{sed-commands} 对匹配oldboy的行到第10行操作,注意:如果前10行没有匹配到oldboy,sed软件会显示10行以后的匹配oldboy的行,如果有。

      • 1,/Alex/{sed-commands} 对第1行到匹配Alex的行操作
      • /oldboy/,+2{sed-commands} 对匹配oldboy的行到其后的2行操作10,${sed-commands} 对10到最后一行($代表最后一行)操作,包括第10行

    sed的常用选项

    • -n 使用安静模式,在一般情况下所有的STDIN都会输出到屏幕上,-n选项只打印被sed 特殊处理的行
    • -e 多重编辑,且命令顺序会影响结果
    • -f 指定一个sed脚本文件到命令行执行
    • -r 可以使用扩展正则
    • -i 直接修改文档读取的内容,不在屏幕上输出

    sed 操作命令

    sed 操作命令告诉sed 如何处理由地址指定的各输入行。如果没有指定地址,sed就会处理输入的所有的行。

     

    • a 在当前行后 添加一行或多行 add
      • sed '5a 106,dandan,CSO' person.txt
    • i 在当前行之前插入文本 insert
      • sed '2i 106,dandan,CSO' person.txt

    • d 删除行 delete

    • c 用新行替换旧行:用新文本修改(替换)当前行中的文本 change
    • s 用一个字符串替换另一个
      • 单独使用,将每一行中第一处匹配的字符串进行替换,sed命令
      • g 每一行进行全部替换,是sed命令s的替换标志之一,非sed命令
      • 替换格式:
        • sed -i 's#old text#new text#g' filename_stdin
    • -i 修改文件内容,sed软件的选项
    • -r 可以使用扩展正则表达式
    • () 1 后向引用,分组替换,与-r结合使用,可以不使用转义符号;
      • 最多可以用上9个分组
    • $var 可以使用变量,双引号会解析变量
    • & 代表被替换的内容

    • p 打印行,输出指定内容,但默认会输出2次匹配的结果,因此使用-n取消默认输出
    • h 把模式空间里的内容复制到暂存缓冲区
    • H 把模式空间里的内容追加到暂存缓冲区
    • g 取出暂存缓冲区里的内容,将其复制到模式空间,覆盖该处原有内容
    • G 取出暂存缓冲区里的内容,将其复制到模式空间,追加在原有内容后面
    • l 列出非打印字符

    • n 读入下一输入行,并从下一条命令而不是第一条命令开始处理

    • q 结束或退出sed
    • r 从文件中读取输入行
    • ! 对所选行意外的所有行应用命令

    替换标志:

    • g 在行内进行全局替换 global
    • p 打印行
    • w 将行写入文件
    • x 交换暂存缓冲区与模式空间的内容
    • y 将字符转换为另一字符(不能对正则表达式使用y命令)

    报错信息和退出信息

    遇到语法错误时, sed 会向标准错误输出发送一条相当简单的报错信息。

    但是,如果 sed 判断不出错在何处,它会“断章取义”,给出令人迷惑的报错信息。

    如果没有语法错误, sed 将会返回给 shell 一个退出状态,状态为 0 代表成功,为非 0 整数代表失败。

     

    4. 实例 

    统一实例文本:

    [root@oldboy test]# cat person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    增删改查

    • a 追加文本到指定行后
    • i 插入文本到指定行前

    这两个参数和vi编辑器的意思是一样的,i是insert插入,a是add增加

     

    单行增加

    # 5a 在第五行之后添加文本
    [root@oldboy test]# sed '5a 106,dandan,CSO' person.txt   
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    106,dandan,CSO
    
    # 2i  在第二行之前添加文本
    [root@oldboy test]# sed '2i 106,dandan,CSO' person.txt
    101,oldboy,CEO
    106,dandan,CSO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    # 打印person.txt,发现add的文本未写入文件
    [root@oldboy test]# cat person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    多行增加:
    # 第一种写法:
    换行符
    [root@oldboy test]# sed '2a 106,dandan,CSO
    107,bingbing,CCO' person.txt  
    101,oldboy,CEO
    102,zhangyao,CTO
    106,dandan,CSO
    107,bingbing,CCO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    # 第二种写法:通过""(回车) 多行输入
    [root@oldboy test]# sed '2a 106,dandan,CSO 
    > 107,bingbing.CCO' person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    106,dandan,CSO 
    107,bingbing.CCO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    企业案例

    在我们学习系统优化时,有一个优化点:更改ssh服务远程登录的配置

    主要的操作是在ssh的配置文件加入下面5行文本。(下面参数的具体含义见其他课程。)

    Port 52113
    PermitRootLogin no
    PermitEmptyPasswords no
    UseDNS no
    GSSAPIAuthentication no

    我们可以使用vi命令编辑这个文本,但这样就比较麻烦,现在想一条命令增加5行文本到第13行前?

    sed '13i Port 52113
    PermitRootLogin no
    PermitEmptyPasswords no
    UseDNS no
    GSSAPIAuthentication no' /etc/ssh/sshd_config

    • d 删除行 delete
    # 删除所有行
    [root@oldboy test]# sed 'd' person.txt
    
    # 删除第2行
    [root@oldboy test]# sed '2d' person.txt
    101,oldboy,CEO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    # 删除第2到第5行
    [root@oldboy test]# sed '2,5d' person.txt
    101,oldboy,CEO
    
    # 删除第三行到最后一行
    [root@oldboy test]# sed '3,$d' person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    
    # 删除1,3,5行,剩余2,4行
    [root@oldboy test]# sed '1~2d' person.txt
    102,zhangyao,CTO
    104,yy,CFO
    
    # 删除1-3行,剩余4,5行
    [root@oldboy test]# sed '1,+2d' person.txt
    104,yy,CFO
    105,feixue,CTO
    
    # 删除匹配到zhangyao的行
    [root@oldboy test]# sed '/zhangyao/d' person.txt
    101,oldboy,CEO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    # 删除匹配到oldboy的行到匹配到Alex的行
    [root@oldboy test]# sed '/oldboy/,/Alex/d' person.txt           
    104,yy,CFO
    105,feixue,CTO
    
    # 删除从匹配到oldboy的行到第三行,剩余4,5行
    [root@oldboy test]# sed '/oldboy/,3d' person.txt       
    104,yy,CFO
    105,feixue,CTO

    特殊情况:正则匹配的行不在后面的行的范围限制内,直接匹配到第五行,并删除第五行,第2行保留。
    原因:正则范围内的行首,没匹配到还会继续匹配下去

    [root@oldboy test]# cat person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    [root@oldboy test]# sed '/feixue/,2d' person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO

    企业案例:打印文件内容但不包含oldboy

    [root@oldboy test]# sed '/oldboy/d' person.txt
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    改 

    • c 用新文本修改(替换)当前行中的文本 change
     

    按行替换

    # 将第二行内容修改
    [root@oldboy test]# sed '2c 106,dandan,CSO' person.txt
    101,oldboy,CEO
    106,dandan,CSO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    # 不指定行号,则会修改全部行
    [root@oldboy test]# sed 'c 106,dandan,CSO' person.txt 
    106,dandan,CSO
    106,dandan,CSO
    106,dandan,CSO
    106,dandan,CSO
    106,dandan,CSO

    文本替换

    • s:单独使用→将每一行中第一处匹配的字符串进行替换 ==>sed命令
    • g:每一行进行全部替换 ==>sed命令s的替换标志之一,非sed命令
    • -i:修改文件内容 ==>sed软件的选项
    sed软件替换模型(方框▇被替换成三角▲)
    
    sed -i 's/▇/▲/g' oldboy.log
    sed -i 's#▇#▲#g' oldboy.log

    观察特点: 

    1. 两边是引号,引号里面的两边分别为s和g,中间是三个一样的字符"/" 或 "#" 作为定界符。"#"能在替换内容包含"/" 有助于区别。定界符可以是任意符号如":"或"|"等,但当替换内容包含定界符时,需转义即":" "|"。经过长期实践,建议大家使用"#"作为定界符。
    2. 定界符"/" 或 "#",第一个和第二个之间的就是被替换的内容,第二个和第三个之间的就是替换后的内容。
    3. s#▇#▲#g,▇能用正则表达式,但▲不能用,必须是具体的。
    4. 默认sed软件是对模式空间(内存中的数据)操作,而-i选项会更改磁盘上的文件内容。
    #### [root@oldboy test]# cat person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    # 将zhangyao替换为oldboyedu
    [root@oldboy test]# sed 's#zhangyao#oldboyedu#g' person.txt
    101,oldboy,CEO
    102,oldboyedu,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    企业案例:指定行修改配置文件,防止修改多处

    [root@oldboy test]# sed '3s#0#9#g' person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    193,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    变量替换

    # 创建一个新的测试文本
    [root@oldboy test]# cat test.txt
    a
    b
    a
    
    # 定义变量x,y
    [root@oldboy test]# x=a
    [root@oldboy test]# y=b
    
    # 查看变量x,y
    [root@oldboy test]# echo $x $y
    a b
    
    # 将变量x替换成变量y,也就是a替换成b
    [root@oldboy test]# sed "s#$x#$y#g" test.txt
    b
    b
    b
    [root@oldboy test]# sed s#$x#$y#g test.txt  
    b
    b
    b

    单引号,所见即所得,不会将变量进行;
    双引号,变量置换功能,解析变量后输出,不加引号相当于双引号。

    [root@oldboy test]# sed 's#$x#$y#g' test.txt 
    a
    b
    a

    用eval解析:

    [root@oldboy test]# eval sed 's#$x#$y#g' test.txt
    b
    b
    b
    's#'$x'#'$y'#g'是  's#'  $x  '#'  $y  '#g' 字符串和变量的拼接:
    [root@oldboy test]# sed 's#'$x'#'$y'#g' test.txt
    b
    b
    b

    分组替换

    ( )和1的使用说明(后向引用):

    sed软件的 () 的功能可以记住正则表达式的一部分,其中,1为第一个记住的模式即第一个小括号中的匹配内容,2第二记住的模式,即第二个小括号中的匹配内容,sed最多可以记住9个。

     

    例:echo I am oldboy teacher.如果想保留这一行的单词oldboy,删除剩下的部分,使用圆括号标记想保留的部分。

    [root@oldboy test]# echo I am oldboy teacher.|sed -r 's#^.*(oldboy).*$#1#g'
    oldboy
    
    [root@oldboy test]# echo I am oldboy teacher.|sed -r 's#^.*am (.*) tea.*$#1#g'
    oldboy

    注意:

    1. 如果没有使用-r参数,就要使用转移符号将()转义;使用-r参数,表示可以使用扩展正则表达式
    2. ()1 2 这种是 后向引用的方式。
     

    企业案例:系统开机启动项优化

    [root@oldboy test]# chkconfig --list|grep '3:on'|grep -vE "sshd|crond|network|rsyslog|sysstat"|awk '{print $1}'|sed -r 's#^(.*)#chkconfig 1 off#g'|bash

    特殊符号& 代表被替换的内容

     
    # 将第1到第3行中的C替换为"--C--",此处:&代表C
    
    [root@oldboy test]# sed '1,3s#C#--&--#g' person.txt
    101,oldboy,--C--EO
    102,zhangyao,--C--TO
    103,Alex,--C--OO
    104,yy,CFO
    105,feixue,CTO

    企业案例:批量重命名文件

    [root@oldboy test]# touch stu_10299_{1..5}_finished.jpg
    [root@oldboy test]# ls
    person.txt                stu_10299_2_finished.jpg  stu_10299_4_finished.jpg  test.txt
    stu_10299_1_finished.jpg  stu_10299_3_finished.jpg  stu_10299_5_finished.jpg
    
    # 要求用sed命令重命名,效果为stu_102999_1_finished.jpg==>stu_102999_1.jpg,即删除文件名的_finished
    
    [root@oldboy test]# ls *.jpg|sed 's#(^.*)_finished(.*)$#mv & 12#g' -r
    mv stu_10299_1_finished.jpg stu_10299_1.jpg
    mv stu_10299_2_finished.jpg stu_10299_2.jpg
    mv stu_10299_3_finished.jpg stu_10299_3.jpg
    mv stu_10299_4_finished.jpg stu_10299_4.jpg
    mv stu_10299_5_finished.jpg stu_10299_5.jpg
    
    [root@oldboy test]# ls *.jpg|sed 's#(^.*)_finished(.*)$#mv & 12#g' -r|bash
    
    [root@oldboy test]# ls *.jpg
    stu_10299_1.jpg  stu_10299_2.jpg  stu_10299_3.jpg  stu_10299_4.jpg  stu_10299_5.jpg

    • p 打印行,输出指定内容,但默认会输出2次匹配的结果,因此使用-n取消默认输出
     

    查询:

    # p参数会默认输出两次,要使用-n参数取消默认输出
    [root@oldboy test]# sed '2p' person.txt
    101,oldboy,CEO
    102,zhangyao,CTO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
    
    [root@oldboy test]# sed '2p' person.txt -n
    102,zhangyao,CTO
    
    # 输出第2到第3行
    [root@oldboy test]# sed '2,3p' person.txt -n
    102,zhangyao,CTO
    103,Alex,COO
    
    # 输出1,3,5行
    [root@oldboy test]# sed '1~2p' person.txt -n    
    101,oldboy,CEO
    103,Alex,COO
    105,feixue,CTO
    
    # 输出所有行
    [root@oldboy test]# sed 'p' person.txt -n   
    101,oldboy,CEO
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    字符串查询:

    [root@oldboy test]# sed -n '/CTO/p' person.txt
    102,zhangyao,CTO
    105,feixue,CTO
    [root@oldboy test]# sed -n '/CTO/,/CFO/p' person.txt    
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO

    混合查询:

    [root@oldboy test]# sed -n '/CTO/p' person.txt
    102,zhangyao,CTO
    105,feixue,CTO
    [root@oldboy test]# sed -n '/CTO/,/CFO/p' person.txt    
    102,zhangyao,CTO
    103,Alex,COO
    104,yy,CFO
    105,feixue,CTO
     
  • 相关阅读:
    GET与POST类型接口
    sql查询优化 索引优化
    临时表操作
    sqlserver group by 分组使用详解
    js调用正则表达式
    后台对象转JSON字符串传到前台,前台JSON字符串转对象绑定标签赋值
    string 数组转 int 数组
    巧用XML格式数据传入存储过程转成表数据格式
    存储过程规范写法
    WebApi
  • 原文地址:https://www.cnblogs.com/zoe233/p/11921704.html
Copyright © 2011-2022 走看看