zoukankan      html  css  js  c++  java
  • sed 命令详解

    作用: sed 是一种流编辑器,它是文本处理中非常重要的工具, 能够完美的配合正则表达式使用。处理时,把当前处理的行存储在临时缓冲区中, 称为“模式空间(pattern space)”,接着用sed 命令处理缓冲区中的内容, 处理完成后, 把缓冲区中的内容送往屏幕。 接着处理下一行,不断重复, 直到文件末尾。 文件内容并没有改变,除非你使用重定向存储输出。sed 主要用来自动编辑一个或多个文件;简化对文件的反复操作; 编写转换程序等。
    命令格式:
    sed [options] 'command' file(s)
    sed [options] -f scriptsfile file(s)

    选项:

    -e <script> --expression : 以选项中的指定script来处理输入的文本文件
    -f <script> --file :以选项中指定的script 文件来处理输入的文本文件
    -n --quiet : 仅显示script处理后的结果

    sed 命令:

    a 在当前行下面插入文本
    i 在当前行上面插入文本
    c 把选定的行改为新的文本
    d 删除,删除选择的行
    D 删除模板块的第一行
    s 替换指定字符
    h 拷贝模块板的内容到内存中的缓冲区
    H 追加模板块的内容到内存中的缓冲区
    g 获得内存缓冲区的内容,并替代当前模板块中的文本。
    G获得内存缓冲区的内容,并追加当前模板块中的文本。 
    l 列表不能打印字符的清单。
    n 读取下一个输入行, 用下一个命令处理新的行而不是第一个命令。
    N 追加下一个输入行到模板块并在两者间嵌入一个新行,改变当前行号码
    p 打印模板块的行
    P 打印模板块的第一行
    q 退出sed 
    b label 分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾
    r file 从file中读行
    t lable if 分支,从最后一行开始,条件一单满足,将导致分支到带有标号的命令处,或者到脚本的末尾
    Tlabel 错误分支,从最后一行开始,一单发生错误,将导致分支到带有标号的命令处,或者脚本的末尾
    w file 写并追加模板块到file 末尾
    W file 写并追加模板板块的第一行到file末尾
    ! 表示后面的命令对所有没有选定的行发生作用
    = 打印当前行号码
    # 把注释扩展到下一个换行符以前、

    sed 替换标志

    g 表示行内全面替换
    p 表示打印行
    w 表示把行写入一个文件
    x 表示互换模板块中的文本和缓冲区中的文本
    y 表示把一个字符翻译为另外的字符(不用于正则表达式)
    1 子串匹配标记
    & 已匹配字符串标记

    sed 元字符集

    ^ 匹配行开始, 如: /^sed/ 匹配所有以sed开头的行
    $ 匹配行结束, 如:/sed$ / 匹配所有以sed 结尾的行
    . 匹配一个非换行符的任意字符, 如: /s.d/ 匹配s 后接一个任意字符,最后是d 
    * 匹配0 个或多个字符, 如:/s*ed/ 匹配0个或多个s 字符, 最后是ed 
    ? 匹配0个或一个字符, 如:/s? ed/ 匹配 0个或一个s 字符,最后是ed 
    [] 匹配一个指定范围内的字符,如/[sS] ed / 匹配 sed 或Sed
    [^] 匹配一个不再指定范围的字符,如: /[^A-RT-Z]ed/ 匹配不包含A-R T-Z 的一个字母开头,后面是ed
    (..) 匹配子串,保存匹配的字符, 如:/s/(love)able/1rs , loveable 被替换成lovers
    & 保存收缩字符用来替换其他字符,如:s/love/**&**/,  love 替换成 **love**.
    < 匹配单词的开始, 如:/<love/ 匹配包含以love 开头的单词的行
    > 匹配单词的结束, 如:/love>/ 匹配包含以love 结束的单词的行
    x{m} 重复字符x ,m 次,如 :/0{5} 匹配包含5个0 的行
    x{m,} 重复字符x ,至少m 次, 如:/0{5,} 匹配包含至少5个0 的行
    x{m,n} 重复字符x, 至少m 次,不多于n次 , 如:/0{5,10} 匹配包含5-10 个0的行

    sed 用法实例

    替换文本中的字符串
    sed 's/book/books/' file 
    -n p 一起使用表示只打印那些发生替换的行
    sed -n 's/test/TEST/p' file
    直接编辑文件选项-i ,会匹配文件中每一行的第一个book 替换成books 
    sed -i 's/book/books/g' file
    当需要从第N处匹配开始替换时,可以使用/NG;
    echo sksksksksksksk |sed 's/sk/SK/2g'
    skSKSKSKSKSKSK
    echo sksksksksksksk |sed 's/sk/SK/3g'
    skskSKSKSKSKSK
    echo sksksksksksksk |sed 's/sk/SK/4g'
    skskskskSKSKSK

    定界符

    命令中字符/在sed中作为定界符使用,也可以使用任意的定界符
    sed 's:test:TEST:g'
    sed 's|test|TEST|g'
    定界符出现在样式内部时,需要进行转义
    sed 's//bin//user/local/bin/g'

    删除操作

    删除空白行
    sed '/^$/d' file
    删除空格行
    sed '/^ $/d' file
    删除文件第二行
    sed '2d' file
    删除文件第二行至末尾所有行
    sed '2,$d' file
    删除文件最后一行
    sed '$d' file
    删除文件中所有开头是test 的行
    sed '/^test/'d file  / sed '/^test/d' file
    已匹配字符串标记&
    正则表达式w+ 匹配每一个单词,使用[&] 来替换它, &对应于之前匹配到的单词
    echo this is a test line| sed 's/w+[&]/g'
    [this][is][a][test][line]
    所有以192.168.0.1开头的行都会被替换成它自己加localhost 
    sed 's/^192.168.0.1/&localhost/' file
    192.168.0.1localhost

    子串匹配标记1

    匹配给定样式中的其中一部分
    echo this is a digit 7 in a number | sed 's/digit ([0-9])/1/'
    this is 7 in a number
    echo aaa BBB | sed 's/([a-z]+) (A-Z]+) /2 1/'
    BBB aaa

    组合多个表达式

    sed '表达式1' | sed '表达式2' 
    sed '表达式1;表达式2'

    引用

    sed 表达式可以使用单引号来引用,但是如果表达式内容包含变量字符串,就需要使用双引号
    test =hello
    echo hello world | sed “s/$test/HELLO"
    HELLO world

    选定行的范围: , 逗号

    所有在模板块test 和check 所确定的范围内的行都被打印
    sed -n '/test/,/check/p' file
    打印从第五航开始到第一个包含以test开始的行之间的所有行
    sed -n '5,/^test/p' file
    对于模板块test 和 west 之间的行, 每行的末尾用字符串aaa bbb 替换
    sed '/test/,/west/s/$/aaa bbb/' file

    多点编辑: e命令

    -e 选项允许在同一行里执行多条命令
    sed -e '1,5d' -e 's/test/check/' file   或  sed --expression='s/test/check/' --expression='/love/d' file

    从文件读入: r命令

    file 里的内容被读进来,显示在与test匹配的行后面,如果匹配多行, 则file的内容将显示在所有匹配行下面。
    sed '/test/r file' filename

    写入文件: w 命令

    在example中所有包含test的行都被写入到file里
    sed -n '/test/w file' example   file中原有数据被覆盖。

    追加(行下) a 命令

    将this is a test line 追加到以test 开头的行后面
    sed '/^test/a his is a test line' file
    在test.conf 文件第二行之后插入this is a test line
    sed -i '2a his is a test line' test.conf    (-i 写入文件   不加则临时写入)

    插入(行上) i 命令

    sed '/^test/i his is a test line' file  不写入
    sed -i  '5i his is' file    写入第五航之前
    变形: y 命令
    把1-10行内所有的abcde 转换为大写,注意,正则表达式元字符不能使用此命令
    sed '1,10y/abcde/ABCDE' file  单独修改每一个字符

    退出: q 命令

    打印完第十行之后,退出
    sed '10q' file

    保持和获取: h G 命令

    在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中, 除非行被删除或者输出被取消, 否则所有被处理的行都将被打印在屏幕上, 接着模式空间被清空, 并存如新的一行待处理.
    任何包含test的行都将被复制并追加到文件末尾
    sed -e '/test/h' -e '$G' file
    保持和互换 : h x 命令
    互换模式空间和保持缓冲区的内容,也就是把包含test 和check 的行互换
    sed -e '/test/h' -e '/check/x' file

    脚本scriptfile

    sed 脚本是一个sed的命令清单, 启动sed时以-f 选项引导脚本文件名, sed对于脚本中输入的命令非常挑剔,在命令的末尾不能有任何空白或文本,如果在一行中有多个命令。 要用分号分隔。 以#开头的行为注释行,不能跨行
    sed [option] -f scriptfile files
    打印奇数行或偶数行
    sed -n 'p;n' test  奇数
    sed -n 'n;p' test  偶数
    sed -n '1~2p' test 奇数
    sed -n '2~2p' test 偶数

    打印匹配字符串的下一行

    grep -A 1 SCC URFILE
    sed -n '/SCC/{n;p}' URFILE
    awk '/SCC/{getline;print}' URFILE
  • 相关阅读:
    Maven项目打包时指定配置策略
    使Jackson和Mybatis支持JSR310标准
    Java 8的Time包常用API
    MySQL 聚集拼接
    将List<E>内对象按照某个字段排序
    判断List<E>内是否有重复对象
    eclipse中Maven项目启动报错“3 字节的 UTF-8 序列的字节 3 无效。”
    控制层@Value注解取不到值
    IntelliJ IDEA实时代码模板
    OD: Exploit Me
  • 原文地址:https://www.cnblogs.com/LinuxSuDa/p/4428893.html
Copyright © 2011-2022 走看看