zoukankan      html  css  js  c++  java
  • 三剑客之grep命令

    一 grep介绍

    grep命令主要用于过滤文本,grep家族如下

    grep: 在文件中全局查找指定的正则表达式,并打印所有包含该表达式的行
    egrep:扩展的egrep,支持更多的正则表达式元字符
    fgrep:固定grep(fixed grep),有时也被称作快速(fast grep),它按字面解释所有的字符
    

    grep命令格式如下

    grep [选项] PATTERN 文件1 文件2 ...
    
    [root@egon ~]# grep 'root' /etc/passwd
    [root@egon ~]# fgrep 'bash' /etc/passwd
    
    找到:				grep返回的退出状态为0
    没找到:			grep返回的退出状态为1
    找不到指定文件:	  grep返回的退出状态为2
    

    grep 命令的输入可以来自标准输入或管道,而不仅仅是文件,例如:

    ps aux |grep 'nginx'
    

    二 选项

    -n, --line-number			在过滤出的每一行前面加上它在文件中的相对行号
    -o, --only-matching			只显示匹配的内容
    -q, --quiet, --silent		静默模式,没有任何输出,得用$?来判断执行成功没有,即有没有过滤到想要的内容
    --color						颜色
    -i, --ignore-case			忽略大小写
    -A, --after-context=NUM		如果匹配成功,则将匹配行及其后n行一起打印出来
    -B, --before-context=NUM	如果匹配成功,则将匹配行及其前n行一起打印出来
    -C, --context=NUM			如果匹配成功,则将匹配行及其前后n行一起打印出来
    -c, --count					如果匹配成功,则将匹配到的行数打印出来
    -v, --invert-match			反向查找,只显示不匹配的行
    -w							匹配单词
    -E							等于egrep,扩展
    
    
    
    -l, --files-with-matches	如果匹配成功,则只将文件名打印出来,失败则不打印
    							通常-rl一起用,grep -rl 'root' /etc 
    -R, -r, --recursive			递归
    

    示例

    # 1、-n
    [root@egon ~]# grep -n 'root' /etc/passwd
    1:root:x:0:0:root:/root:/bin/bash
    10:operator:x:11:0:operator:/root:/sbin/nologin
    [root@egon ~]# 
    
    # 2、-o
    [root@egon ~]# grep -o 'root' /etc/passwd
    root
    root
    root
    root
    [root@egon ~]# 
    
    # 3、-q
    [root@egon ~]# grep -q 'root' /etc/passwd 
    [root@egon ~]# echo $?
    0
    
    # 4、--color
    [root@egon ~]# alias grep
    alias grep='grep --color=auto'
    [root@egon ~]# 
    
    # 5、-i
    [root@egon ~]# echo "EGON" |grep -i egon 
    EGON
    [root@egon ~]# 
    
    # 6、-A-B-C
    [root@egon ~]# grep -A 2 'root' /etc/passwd
    [root@egon ~]# grep -B 2 'root' /etc/passwd
    [root@egon ~]# grep -C 2 'root' /etc/passwd
    
    # 7、-c
    [root@egon ~]# grep -c 'root' /etc/passwd
    2
    [root@egon ~]# 
    
    # 8、-v
    [root@egon ~]# ps aux | grep nginx |grep -v grep
    [root@egon ~]# 
    [root@egon ~]# ps aux | grep [n]ginx
    [root@egon ~]# 
    
    # 9、-w
    [root@egon ~]# netstat -an |grep -w 80
    tcp6       0      0 :::80                   :::*                    LISTEN    
    [root@egon ~]# netstat -an |grep  '<80>'
    tcp6       0      0 :::80                   :::*                    LISTEN    
    [root@egon ~]# netstat -an |grep  '80'
    tcp6       0      0 :::80                   :::*                    LISTEN   
                            
                            
    # 10、-rl
    [root@egon ~]# grep -rl 'root' /etc  # 将/etc目录下所有包含'root'内容的文件都列出来
    

    三 正则表达式

    3.1 正则表达式介绍

    正则表达式,又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式由元字符组成,通常被用来检索、替换那些符合某个模式(规则)的文本(许多程序设计语言都支持利用正则表达式进行字符串操作)。

    元字符:是一类可以表达出超越其字面本身含义的特殊字符

    shell元字符(也称为通配符): 由shell解释器来解析,如rm -rf *.pdf,元字符*Shell将其解析为任意多个字符
    正则表达式元字符		 : 由各种执行模式匹配操作的程序来解析,比如vi、grep、sed、awk
    
    例如:vim示例:
    :1,$ s/tom/EGON/g		 # 如anatomy、tomatoes及tomorrow中的“tom”被替换了,而Tom确没被替换
    :1,$ s/<[Tt]om>/EGON/g
    

    3.2 正则表达式元字符

    3.2.1 基本正则元字符集

    元字符			功能										  示例	
    ^ 			  行首										^love
    $ 			  行尾										 love$
    . 			  除了换行符以外的任意单个字符					 l..e
    * 			  前导字符的零个或多个						    ab*love
    .* 			  所有字符										a.*love
    [] 			  字符组内的任一字符								 [lL]ove
    [^] 		  对字符组内的每个字符取反(不匹配字符组内的每个字符)   [^a-z0-9]ove
    ^[^] 	      非字符组内的字符开头的行
    
    [a-z] 		  小写字母
    [A-Z] 		  大写字母
    [a-Z] 	      小写和大写字母
    [0-9] 	      数字
    
    	  		 用来转义元字符 									  love.	
    < 		     词首定位符 单词一般以空格或特殊字符做分隔、连续的字符组成  <love
    > 			 词尾定位符										   love>
    (..)		  匹配稍后将要使用的字符的标签	                (love)able1er	
                                                             :1,$ s/(192.168.11).66/1.50/g
    
    x{m}			字符x重复出现m次							     e{3}
    x{m,}			字符x重复出现m次以上								e{3,}						
    x{m,n}		字符x重复出现m到n次								e{3,6}	
    

    示例

    # 1、^ 行首
    [root@egon ~]# grep '^root' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    [root@egon ~]# 
    
    # 2、$ 行尾
    [root@egon ~]# grep 'bash$' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    user1:x:1002:1003::/home/user1:/bin/bash
    egon1:x:198:1005::/home/egon1:/bin/bash
    gg:x:1004:1006::/home/gg:/bin/bash
    egon:x:1005:1007::/home/egon:/bin/bash
    tom:x:1006:1008::/home/tom:/bin/bash
    [root@egon ~]# 
    
    
    # 3、. 除了换行符以外的任意单个字符
    [root@egon ~]# grep 'r..t' /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    operator:x:11:0:operator:/root:/sbin/nologin
    ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
    [root@egon ~]# 
    
    # 4、* 前导字符的零个或多个
    [root@egon ~]# cat a.txt 
    a
    
    ab
    abb
    abbb
    bbbbb
    [root@egon ~]# grep 'ab*' a.txt 
    a
    ab
    abb
    abbb
    [root@egon ~]# 
    
    # 5、.* 所有字符=贪婪
    [root@egon ~]# cat a.txt 
    a123+-*/c11113333c
    a1c
    a77Ac
    a23333c
    ac
    111
    222
    333
    [root@egon ~]# grep 'a.*c' a.txt 
    a123+-*/c11113333c
    a1c
    a77Ac
    a23333c
    ac
    [root@egon ~]# 
    
    # 5.1 .*?=》非贪婪,默认情况下,grep不支持非贪婪修饰符,但您可以使用grep -P来使用Perl语法来支持.*?
    [root@egon ~]# cat a.txt 
    <a href="http://www.baidu.com">"我他妈的是百度"</a>
    <a href="http://www.sina.com.cn">"我特么的是新浪"</a>
    [root@egon ~]# 
    
    [root@egon ~]# grep -o 'href=".*"' a.txt  # 贪婪
    href="http://www.baidu.com">"我他妈的是百度"
    href="http://www.sina.com.cn">"我特么的是新浪"
    [root@egon ~]# 
    
    [root@egon ~]# grep -oP 'href=".*?"' a.txt  # r非贪婪
    href="http://www.baidu.com"
    href="http://www.sina.com.cn"
    [root@egon ~]# 
    
    
    
    # 6、[] 字符组内的任一字符
    # 7、[^] 对字符组内的每个字符取反(不匹配字符组内的每个字符)
    [root@egon ~]# cat a.txt 
    a1c
    a2c
    a33c
    aAc
    aZc
    [root@egon ~]# grep 'a[0-9]c' a.txt
    a1c
    a2c
    [root@egon ~]# grep 'a[^0-9]c' a.txt
    aAc
    aZc
    [root@egon ~]# 
    [root@egon ~]# grep 'a[0-9][0-9]c' a.txt
    a33c
    [root@egon ~]# 
    
    # 8、^[^] 非字符组内的字符开头的行
    [root@egon ~]# cat a.txt 
    a1c
    a2c
    a33c
    aAc
    aZc
    [root@egon ~]# grep '^[^0-9]..$' a.txt
    a1c
    a2c
    aAc
    aZc
    [root@egon ~]# 
    
    # 9、[a-z] 小写字母
    # 10、[A-Z] 大写字母
    # 11、[a-Z] 小写和大写字母
    # 12、[0-9] 数字
    
    # 13、< 单词头 单词一般以空格或特殊字符做分隔,连续的字符串被当做单词
    # 14、> 单词尾
    [root@egon ~]# netstat -an |grep -w 80
    tcp6       0      0 :::80                   :::*                    LISTEN    
    [root@egon ~]# netstat -an |grep  '<80>'
    tcp6       0      0 :::80                   :::*                    LISTEN    
    [root@egon ~]# netstat -an |grep  '80'
    tcp6       0      0 :::80                   :::*                    LISTEN   
    

    Ps: grep匹配换行符和制表符

    [root@egon ~]# echo -e "a
    b" |grep $'a
    b'
    a
    b
    [root@egon ~]# 
    [root@egon ~]# echo -e "a	b" |grep $'a	b'
    a	b
    [root@egon ~]# 
    

    3.2.2 扩展正则元字符集

    # 扩展正则元字符
    +					匹配一个或多个前导字符		   [a-z]+ove	
    ?					匹配零个或一个前导字符		   lo?ve	
    a|b					匹配a或b					love|hate
    ()					组字符						love(able|rs)  (egon)+
    (..)(..)12		标签匹配字符				  (love)able1er
    x{n}			    x出现n次				    e{3}		
    x{n,}			    x出现n次至无穷次			  e{3,}
    x{n,m}		        x出现n次至m次			   e{3,6}
    
    # 若想使用扩展正则
    grep加-E 或 egrep 或转义
    
    sed 加 -r 参数 或转义
    
    AWK 直接支持大多数扩展正则,更多支持需要加选项--posix选项
    

    示例

    # ======================grep扩展正则示例======================
    [root@egon ~]# cat a.txt 
    a
    
    ab
    abb
    abbb
    abbbb
    abbbbb
    bbbbbbb
    [root@egon ~]# grep 'ab{2,4}' a.txt  # 默认不支持扩展正则,所以没效果
    [root@egon ~]# egrep 'ab{2,4}' a.txt 
    abb
    abbb
    abbbb
    abbbbb
    [root@egon ~]# 
    
    # ======================sed扩展正则示例======================
    [root@egon ~]# sed -n '/roo?/p' /etc/passwd  # 默认不支持扩展正则?
    [root@egon ~]# sed -n '/roo?/p' /etc/passwd  # 可以用转义扩展正则符号?
    有结果,结果略...
    [root@egon ~]# sed -rn '/roo?/p' /etc/passwd  # 也可以加-r选项
    有结果,结果略...
    [root@egon ~]# 
    
    # ======================awk扩展正则示例======================
    [root@egon ~]# cat a.txt 
    a
    
    ab
    abb
    abbb
    abbbb
    abbbbb
    bbbbbbb
    [root@egon ~]# awk '/ab{1,3}/{print}' a.txt
    ab
    abb
    abbb
    abbbb
    abbbbb
    [root@egon ~]# awk --posix '/ab{1,3}/{print}' a.txt
    ab
    abb
    abbb
    abbbb
    abbbbb
    [root@egon ~]# 
    

    总结

    grep:				使用基本元字符集	^, $, ., *, [], [^], < >,(),{}
    最好用egrep(或grep -E):	使用扩展元字符集	?, +, { }, |, ( )
    # 注:grep也可以使用扩展集中的元字符,仅需要对这些元字符前置一个反斜线
    
    w	所有字母与数字,称为字符[a-zA-Z0-9]	   'l[a-zA-Z0-9]*ve'	   		'lw*ve'
    W	所有字母与数字之外的字符,称为非字符	   'love[^a-zA-Z0-9]+' 	        'loveW+'
    	词边界								'love'					  '<love>'
    {0,}等同于*
    {1,}等同于+
    {0,1}等同于?
    
    

    3.2.3 posix定义的字符分类

    # 表达式       	  功能                              			示例
    [:alnum:]     	字母与数字字符                       		[[:alnum:]]+  
    [:alpha:]  		字母字符(包括大小写字母)					  [[:alpha:]]{4}
    [:blank:]     	空格与制表符                         		  [[:blank:]]*
    [:digit:]       	数字字母                            	[[:digit:]]?
    [:lower:]      	小写字母                            		[[:lower:]]{5,}
    [:upper:]      	大写字母                            		[[:upper:]]+
    [:punct:]      	标点符号                            		[[:punct:]]
    [:space:]      	包括换行符,回车等在内的所有空白[[:space:]]+
    
    
    # 详解
    [:alnum:] Alphanumeric characters.
    匹配范围为 [a-zA-Z0-9]
    [:alpha:] Alphabetic characters.
    匹配范围为 [a-zA-Z]
    [:blank:] Space or tab characters.
    匹配范围为 空格和TAB键
    [:cntrl:] Control characters.
    匹配控制键 例如 ^M 要按 ctrl+v 再按回车 才能输出
    [:digit:] Numeric characters.
    匹配所有数字 [0-9]
    [:graph:] Characters that are both printable and visible. (A space is print-
    able, but not visible, while an a is both.)
    匹配所有可见字符 但不包含空格和TAB 就是你在文本文档中按键盘上能用眼睛观察到的所有符号
    [:lower:] Lower-case alphabetic characters.
    小写 [a-z]
    [:print:] Printable characters (characters that are not control characters.)
    匹配所有可见字符 包括空格和TAB
    能打印到纸上的所有符号
    [:punct:] Punctuation characters (characters that are not letter, digits, con-
    trol characters, or space characters).
    特殊输入符号 +-=)(*&^%$#@!~`|"'{}[]:;?/>.<,
    注意它不包含空格和TAB
    这个集合不等于^[a-zA-Z0-9]
    [:space:] Space characters (such as space, tab, and formfeed, to name a few).
    
    [:upper:] Upper-case alphabetic characters.
    大写 [A-Z]
    [:xdigit:] Characters that are hexadecimal digits.
    16进制数 [0-f]
    
    # 使用方法:
    [root@egon ~]# grep --color '[[:alnum:]]' /etc/passwd
    

    四 练习

    正则表达式及字符处理

    目标文件/etc/passwd,使用grep命令或egrep
    1.显示出所有含有root的行:
    2.输出任何包含bash的所有行,还要输出紧接着这行的上下各两行的内容:
    3.  显示出有多少行含有nologin。
    4.显示出那些行含有root,并将行号一块输出。
    5.显示出文件中
    6.新建用户
        abominable
        abominate
        anomie
        atomize
        编写正则表达式,将他们匹配出来
        egrep 'a.omi(nabl|nat|z|)e' /etc/passwd
    7.建四个用户
        Alex213sb
        Wpq2222b
        yH438PIG
        egon666
        egon
    
        过滤出用户名组成是字母+数字+字母的行
    [root@MiWiFi-R3-srv ~]# egrep '^[a-Z]+[0-9]+[a-Z]+' /etc/passwd
    8.显示出/etc目录下所有包含root的文件名
    9. 过滤掉/etc/ssh/sshd_config内所有注释和所有空行
    grep -v '^#' /etc/ssh/sshd_config |grep -v '^ *$'
    
  • 相关阅读:
    Git一些简单但非常重要并常用的操作命令
    利用fastjson解析json并通过js&ajax实现页面的无跳转刷新
    利用Graphviz绘制逻辑关系依赖图
    oracle导入.dmp文件
    Linux查找当前目录5天的文件并打包
    Web安全相关(三):开放重定向(Open Redirection)
    Web安全相关(二):跨站请求伪造(CSRF/XSRF)
    Web安全相关(一):跨站脚本攻击(XSS)
    密码学应用(DES,AES, MD5, SHA1, RSA, Salt, Pkcs8)
    行为驱动开发(BDD)实践示例
  • 原文地址:https://www.cnblogs.com/caodan01/p/14949152.html
Copyright © 2011-2022 走看看