zoukankan      html  css  js  c++  java
  • 1.11 Linux基础(十一)-sed

    1.11 Linux基础(十一)

    1.11.1 处理文本的工具sed

    sed是一种流编编器,它是文本处理中非常中的工具,能够完美的配合正则表达式便用,功物能不同凡响。

    处理时,把当前处理的行存储在临时缓冲区中,称为”模式空间”( pattern space),接看用sed命令处理缓冲区中的内容,处理成后,把缓冲区的内容送往屏幕显示。

    接着理下一行,这样不断重复,直到文件末。文件内容没有改改变,除非使用了写入的命令,将内容更新。

    定址用于决定对哪些行进行编辑。地址的形式可以是数字、正则表达式、或二者的结合。如果没有指定地址,sed将处理输入文件的所有行。

    1.11.2 Stream EDitor, 行编辑器

    sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时 缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的 内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。 如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清 空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重 定向存储输出。

    功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

    参考: http://www.gnu.org/software/sed/manual/sed.html

    用法: sed [option] '地址定界编辑命令' inputfile

    1.11.3 常用选项:

    -n:不输出模式空间内容到屏幕,即不自动打印

    -e: 多点编辑

    -f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本

    -r: 支持使用扩展正则表达式

    -i.bak: 备份文件并原处编辑

    1.11.4 地址定界:

    #:#表示数字

    $:$表示最后一行;

    /regex/:任何能被正则表达式regex所匹配到的行(/可以换成其他符号做为边界符)

    #,/regex/:从第#行开始,到第一次被regex所匹配到的行结束,中间的所有行;

    #1,#2:从#1行到#2行
    /regex1/,/regex2/:从第一次被/regex1/匹配到的行开始到第一次被/regex2/匹配到的行结束,中间的所有行

    #,+n:从第#行开始,一直到向下的n行

    first~step:指定起始行,以及步长如2~2 就是从第二行开始,每两行显示一次即偶数行2,4,6,8。1~2奇数行

    1.11.5 sed编辑命令:

    • d:删除模式空间匹配的行,并立即启用下一轮循环
    • p:打印当前模式空间内容,追加到默认输出之后
    • a []text:在指定行后面追加文本,支持使用 实现多行追加
    • i []text:在行前面插入文本
    • c []text:替换行为单行或多行文本
    • w /path/to/somefile:保存模式匹配的行至指定文件
    • r /path/from/somefile:读取指定文件的文本至模式空间中匹配到的行后
    • !:模式空间中匹配行取反处理

    1.11.6 查找替换

    • s///:查找替换,支持使用其它分隔符,s@@@,s###
      替换标记:
      • g: 行内全局替换
      • p: 显示替换成功的行
      • w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
    • sed ‘2p’ /etc/passwd 显示第2行,默认会打印所有行,第二行重复打印
    • sed –n ‘2p’ /etc/passwd 只打印第二行
    • sed –n ‘1,4p’ /etc/passwd 只打印第一行到第四行
    • sed –n ‘/root/p’ /etc/passwd 只打印被root匹配到的行
    • sed –n ‘2,/root/p’ /etc/passwd 打印从2行开始到被root匹配到的行
    • sed -n ‘/^$/=’ file 显示空行行号
    • sed –n –e ‘/^$/p’ –e ‘/^$/=’ file
    • sed ‘/root/asuperman’ /etc/passwd 在被模式匹配到的行后添加新行superman
    • sed ‘/root/isuperman’ /etc/passwd 行前
    • sed ‘/root/csuperman’ /etc/passwd 用superman代替被模式匹配到的行
    • sed ‘/^$/d’ file
    • sed ‘1,10d’ file
    • nl /etc/passwd | sed ‘2,5d’
    • nl /etc/passwd | sed ‘2a tea’
    • sed 's/test/mytest/g' example
    • sed –n ‘s/root/&superman/p’ /etc/passwd 单词后 - sed –n ‘s/root/superman&/p’ /etc/passwd 单词前 - sed -e ‘s/dog/cat/’ -e ‘s/hi/lo/’ pets
    • sed –i.bak ‘s/dog/cat/g’ pets

    1.11.7 高级编辑命令

    • P:打印模式空间开端至 内容,并追加到默认输出之前
    • h: 把模式空间中的内容覆盖至保持空间中
    • H:把模式空间中的内容追加至保持空间中
    • g: 从保持空间取出数据覆盖至模式空间
    • G:从保持空间取出内容追加至模式空间
    • x: 把模式空间中的内容与保持空间中的内容进行互换
    • n: 读取匹配到的行的下一行覆盖至模式空间
    • N:读取匹配到的行的下一行追加至模式空间
    • d: 删除模式空间中的行
    • D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本,并不会读取新的输入行,而使用合成的模式空间重新启动循环。如果模式空间 不包含换行符,则会像发出d命令那样启动正常的新循环

    练习
    1、删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符

    cat /etc/grub2.cfg |sed -r 's/^[[:space:]]+//'
    

    2、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的# 和空白字符

    cat /etc/fstab |sed -r 's/^#[[:space:]]+//'
    

    3、在centos6系统/root/install.log每一行行首增加#号

    cat ./install.log |sed -r 's/^(.*)/#1/'
    

    4、在/etc/fstab文件中不以#开头的行的行首增加#号

    cat /etc/fstab |sed -r 's/^([^#]+)/#1/'
    

    5、处理/etc/fstab路径,使用sed命令取出其目录名和基名

    echo "/etc/fstab/sysconfig" |sed -r 's/^(.*)(/)([^/]+/?$)/3/'
    echo "/etc/fstab/sysconfig" |sed -r 's/^(.*)(/)([^/]+/?$)/1/'
    

    6、利用sed 取出ifconfig命令中本机的IPv4地址

    ifconfig ens33|sed -nr 's/^(.* inet)(.*)( netmask.*)/2/p'
    

    7、统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个 字段的重复次数

    ls|sed -r 's/^(.*.)([^.]+)(.rpm$)/2/'|sort|uniq -c |sort -nr
    

    8、统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和 sed两种方法分别实现)

    cat /etc/init.d/functions|grep -oE "[[:alnum:]]+\>" |sort |uniq -c|sort -n
    cat /etc/init.d/functions|sed -r 's/[^[:alnum:]]+/ /gp'|sed -nr 's/[[:space:]]+/
    /gp'|sed '/^$/d'|sort|uniq -c|sort -n
    

    9、将文本文件的n和n+1行合并为一行,n为奇数行

    seq 1 10|sed  'N;s/
    //g'
    
    1. 用sed取出ifconfig 中的IPV4地址
    [root@CentOS7 data]# ifconfig ens33 |sed  
    '2!d;s/^.*inet //;s/ netmask.*//' 
    192.168.110.131 
    [root@CentOS7 data]# ifconfig ens33 |sed -n '2p'|sed -e 's/^.*inet //' -e 's/ netmask.*//' 
    192.168.110.131 
    [root@CentOS7 data]# ifconfig ens33 |sed -n 's/^.*inet //pg'|sed -n 's/ netmask.*//pg'
    192.168.110.131 
    

    11 将/etc/fstab 下不是#开头的,开头加上#号

    cat /etc/fstab|sed  -r 's/^([^#])/#1/'
    cat /etc/fstab|sed   's/^[^#]/#&/'
    
  • 相关阅读:
    回文子序列数 编程之美 hihocoder 资格赛 第二题 2015年
    斐波那契数列 加速 骨牌覆盖 mod 19999997
    编程语言发展史
    document.getElementById和document.write
    正则表达式验证
    reg-replace
    正则表达式
    DOM&BOM
    pseudo-class与pseudo-element的相同点与不同点
    网格(grid)
  • 原文地址:https://www.cnblogs.com/huangsefeizhu/p/11506718.html
Copyright © 2011-2022 走看看