Linux grep命令详解:
grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix的grep家族grep、egrep和fgrep。egrep和fgrep的命令只只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符,fgrep就是fixed grep或fast grep,他们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示其自身的字面意义,不再特殊。Linux使用GUN版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep功能。
grep常用用法:
[root@www ~]#grep [-acinv] [--color=auto] `搜寻字符串` filename
选项与参数:
-a :将binary文件以text文件的方式搜寻数据
-c : 计算找到`搜寻字符串`的次数
-i :忽略大小写的不同,所以大小写视为相同
-n : 顺便输出行号
-v : 反向选择,亦即显示出没有`搜寻字符串`内容的那一行!
--color=auto : 可以将找到的关键词部分加上颜色的显示喔!
将 /etc/passwd,有出现root的行取出来
#grep root /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
或
#cat /etc/passwd |grep root
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
将/etc/passwd,有出现root的行提取,同时显示这些行在/etc/passwd的行号
#grep -n root /etc/passwd
1:root:x:0:0:root:/root:/bin/bash
30:operator:x:11:0:operator:/root:/sbin/nologin
在关键字的显示方面,grep可以使用--color=auto来讲关键字部分使用颜色显示。这可是个很不错的功能啊!但是如果每次使用grep都得要自行加上--color=auto又显得很麻烦~此时那个好用的alias就得来处理一下啦!你可以再~/.bashrc内加上这行:[alias grep=`grep --color=auto`] 再以[source ~/.bashrc]来立即生效即可喔!这样每次运行grep它都会自动帮你加上颜色显示啦
将/etc/passwd,将没有出现root的行取出来
#grep -v root /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
将/etc/passwd,将没有出现root和nologin的行取出来
#grep -v root /etc/passwd |grep -v nologin
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
用dmesg列出核心信息,再以grep找出含eth那行,要将捉到的关键字显色,且加上行号表示:
[root@www ~]#dmesg |grep -n --color=auto `eth`
247:eth0:RealTek RTL8139 at 0xee846000,00:90:cc:a6:34:84,IRQ 10
248:eth0:Identified 8139 chip type `RTL-8139C`
294:eth0:link up, 100Mbps,full-duplex,lpa 0xC5E1
305:eth0: no IPv6 routers present
#你会发现除了eth会有特殊颜色来表示之外,最前面还有行号喔!
用dmesg列出核心信息,再以grep找到内含eth那行,在关键字所在行的前两行与后三行也一起捉出来显示
#dmesg |-n A3 -B2 --color=auto `eth`
245-PCI:setting IRQ 10 as level-triggered
246-ACPI:pci Interrupt 0000:00:0e.0[A] -> Link [LIKB] ...
247:eth0:RealTek RTL8139 AT 0xee846000, 00:90:cc:a6:34:84,IRQ 10
248:eth0: Identified 8139 chip type `RTL-8139C`
249-input: PC Speaker as /class/input/input2
250-ACPI: PCI Interrupt 0000:00:01.4[B] ->Link [LIKB] ...
251-hdb: ATAPI 48X DVD-ROM DVD-R-RAM CD-R/RW drive,2048kB Cache, UDMA(66)
#如上所示,你会发现关键字 247所在的前两行及248后三行也都被现实出来!
#这样可以让你将关键字前后数据捉出来进行分析啦!
根据文件内容递归查找目录
#grep `energywise` * #在当前目录搜索带`energywise`行的文件
#grep -r `energywise` * #在当前目录及子目录下搜索`energywise`行的文件
#grep -l -r `energywise` * #在当前目录及其子目录下搜索`energywise`行的文件,但是不显示匹配的行,只显示匹配的文件
这几个命令很实用,是查找文件的利器。
grep与正则表达式
字符类
字符类的搜索:如果我想要搜寻test或taste这两个单字时,可以发现到,其实他们有共通的`t?st`存在~这个时候,我可以这样来搜寻:
[root@www ~]#grep -n `t[ae]st` regular_express.txt
8:I can't finish the test.
9:Oh! The soup taste good.
其实[]里面不论有几个字节,他都仅代表[一个]字节,所以,上面的例子说明了,我需要的字串是[tast]或[test]两个字而已!
字符类的反向选择[^]:如果想要搜索到有oo的行,但不想要oo前面有g,如下
[root@www ~]#grep -n `[^g]oo` regular_express.txt
2:apple is my favorite food.
3:Football game is not use feet only.
18:goole is the best tools for search keyword.
19:goooooogle yes!
第2,3行没有疑问,因为foo与Foo均可被接受!
但是第18行明明有google的goo啊~别忘记了,因为该行后面出现了tool的too啊!所以该行也被列出来~ 也就是说,18行里面虽然出现了我们所不要的项目(goo)但是由于有需要的项目(too),因此,是符合字串搜寻的喔!
至于第19行,同样的,因为goooooogle里面的00前面可能是o,例如:go(ooo)oogle,所以,这一行也是符合需求的!
字符类的连续:再来,假设我oo前面不想要有小写字节,所以,我可以这样写[……abcd....z]oo,但是这样似乎不怎么方便,由于小写字节的ASCII上编码的顺序是连续的,因此我们可以将之简化为底下这样:
[root@www ~]#grep -n `[^a-z]oo` regular_express.txt
3:Football game is not use feet only.
也就是说,当我们在一组集合字节中,如果该字节组是连续的,例如大写英文/小写英文/数字等等,就可以使用,[a-z],[A-Z],[0-9]等方式来书写,那么如果我们的要求字串是数字与英文呢?呵呵!就将它全部写在一起,变成:[a-zA-Z0-9]。
我们要取得有数字的那一行,就这样:
#grep -n `[0-9]` regular_express.txt
5:However,this dress is about $3138 dollars.
15:You are the best is mean you are the no.1.
行首与行尾字节……¥
行首字符:如果我想要让the只在行首列出呢?这个时候就得要使用定位字节了!我们可以这样做:
[root@www ~]#grep -n `^the` regular_express.txt
12:the synbol `*` is represented as start.
此时,就只剩第12行,因为只有第12行的行首是the开头啊~此时,如果我想要开头是小写字节的那一行就列出呢?可以这样:
[root@www ~]#grep -n `^[a-z]` regular_express.txt
2:apple is my favorite food.
4:this dress doesn't fit me.
10:motorcycle is cheap than car.
12the synbol `*`is represented as start.
18google is the best tools for search keyword.
19:goooooogle yes!
20:go! go! Let's go.