文件查找
locate,find两个命令
在文件系统上查找符合条件的文件:
实现工具:locate,find
locate命令:
依赖于事先构建好的索引库,索引库可以由下边两种方式构建
系统自动实现(周期性任务):不能实时更新
手动更新数据库(updatedb):
工作特性:
查询速度快:
模糊查找:
非实时查找:
SYNOPSIS
locate [OPTION]... PATTERN...
-b:只匹配路径中的基名
-c:统计出共有多少个符合条件的文件
-r:BRE
注意:索引构建过程需要遍历整个根文件系统,极其消耗资源
find命令:
实时查找工具,通过遍历指定起始路径下文件系统层级结构完成文件查找
工作特性:
查找速度略慢:
精确查找:
实时查找:
用法:
find [OPTIONS] [查找起始路径] [查找条件] [处理动作]
查找起始路径:指定具体搜索目标为起始路径,默认为当前目录
查找条件:指定的查找标准,可以根据文件名、大小、类型、从属关系、权限等等标准进行;默认为找出指定路径下的所有文件
处理动作:对符合查找条件的文件做出的操作,例如:删除等操作;默认为输出至标准输出
查找条件:
表达式:选项和测试
测试:结果通常为布尔型(结果要么为"true"要么为"false")
根据文件名查找:
-name "pattern" ##区分大小写
-iname "pattern" ##不区分大小写
支持glob风格的通配符:*,?,[],[^]
-regex pattern:基于正则表达式模式查找文件,匹配的是整个路径,而非基名
根据文件从属关系查找:
-user USERNAME:查找属主为指定用户的所有文件
-group GROUPNAME:查找属组为指定组的所有文件
-uid UID:查找属主为指定UID的所有文件
-gid GID:查找属组为指定GID的所有文件
-nouser USERNAME:查找没有属主的文件
-nogroup GROUPNAME:查找没有属组的文件
根据文件的类型查找:
-type TYPE:
f:普通文件
d:目录文件
l:符号链接文件
b:块设备文件
c:字符设备文件
p:管道文件
s:套接字文件
组合测试:
与:-a,默认组合逻辑
或:-o
非:-not,!
!A -a !B = !(A -o B)
!A -0 !B = !(A -a B)
根据文件的大小查找:
-size [+|-]#UNIT
常用单位:k,M,G
#UNIT:做精确查找,查找范围为(#-1,#]
-#UNIT:小于精确数值,查找范围为[0,#-1]
+#UNIT:大于精确数值,查找范围为(#,oo)
根据时间戳查找:
以“天”为单位:
-atime [+|-]#
#:[#,#-1)
-#:(#,0]
+#:(oo,#-1)
-mtime
-ctime
以“分钟”为单位:
-amin
-mmin
-cmin
根据权限来查找:
-perm [/|-]mode
mode:精确权限匹配
/mode:任何一类用户(u,g,o)的权限中的任何一位(r,w,x)符合条件即满足
9位权限之间存在“或”关系
-mode:每一类用户(u,g,o)的权限中的每一位(r,w,x)同时符合条件即满足
9位权限之间存在“与”关系
处理动作:
-print:输出至标准输出;默认的动作
-ls:类似于对查找到的文件执行"ls -l"命令,输出文件的详细信息
-delete:删除查找到的文件
-fls /PATH/TO/SOMEFILE:把查找到的所有文件的长格式信息保存至指定文件中
-ok COMMAND {} ;:对查找到的每个文件执行由COMMAND命令;每次操作都由用户确认
-exec COMMAND {} ;:对查找到的每个文件执行由COMMAND命令,不需要用户确认操作
注意:find传递查找到的文件路径至后面的命令时,是先查找出所有符合条件的文件路径,并一次性传递给后面的命令;但是有些命令不能接收过长的参数,此时命令执行会失败;另一种方式可规避此问题:
find | xargs COMMAND
课外作业:学习xargs命令的用法
xargs 是给命令传递参数的一个过滤器,也是组合多个命令的一个工具。
xargs 可以将管道或标准输入(stdin)数据转换成命令行参数,也能够从文件的输出中读取数据。
xargs 也可以将单行或多行文本输入转换为其他格式,例如多行变单行,单行变多行。
xargs 默认的命令是 echo,这意味着通过管道传递给 xargs 的输入将会包含换行和空白,不过通过 xargs 的处理,换行和空白将被空格取代。
xargs 是一个强有力的命令,它能够捕获一个命令的输出,然后传递给另外一个命令。
之所以能用到这个命令,关键是由于很多命令不支持|管道来传递参数,而日常工作中有有这个必要,所以就有了 xargs 命令,例如:
find /sbin -perm +700 |ls -l #这个命令是错误的
find /sbin -perm +700 |xargs ls -l #这样才是正确的
xargs 一般是和管道一起使用。
命令格式:
somecommand |xargs -item command
参数:
-a file 从文件中读入作为sdtin
-e flag ,注意有的时候可能会是-E,flag必须是一个以空格分隔的标志,当xargs分析到含有flag这个标志的时候就停止。
-p 当每次执行一个argument的时候询问一次用户。
-n num 后面加次数,表示命令在执行的时候一次用的argument的个数,默认是用所有的。
-t 表示先打印命令,然后再执行。
-i 或者是-I,这得看linux支持了,将xargs的每项名称,一般是一行一行赋值给 {},可以用 {} 代替。
-r no-run-if-empty 当xargs的输入为空的时候则停止xargs,不用再去执行了。
-s num 命令行的最大字符数,指的是 xargs 后面那个命令的最大命令行字符数。
-L num 从标准输入一次读取 num 行送给 command 命令。
-l 同 -L。
-d delim 分隔符,默认的xargs分隔符是回车,argument的分隔符是空格,这里修改的是xargs的分隔符。
-x exit的意思,主要是配合-s使用。。
-P 修改最大的进程数,默认是1,为0时候为as many as it can ,这个例子我没有想到,应该平时都用不到的吧。
练习:
1、查找/var目录下属主为root,且属组为mail的所有文件或目录
~]# find /var -user root -a -group mail -ls
2、查找/usr目录下不属于root,bin或hadoop的所有文件或目录;用两种方法
~]# find /usr -not -user root -a -not -user bin -a -not -user hadoop -ls
~]# find /usr -not ( -user root -o -user bin -o -user hadoop ) -ls
3、查找/etc目录下最近一周内其内容修改过,且属主不是root用户也不是hadoop用户的文件或目录
~]# find /etc -mtime -7 -a -not -user root -a -not -user hadoop -ls
~]# find /etc -mtime -7 -a -not ( -user root -o -user hadoop ) -ls
4、查找当前系统上没有属主或属组,且最近一周内曾被访问过的文件或目录
~]# find / ( -nouser -o -nogroup ) -a -ctime -7 -ls
5、查找/etc目录下大于1M,且类型为普通文件的所有文件
~]# find /etc -size +1M -type f -exec ls -lh {} ;
6、查找/etc目录下所有用户都没有写权限的文件
~]# find /etc -not -perm /222 -type f -ls
7、查找/etc目录下至少一类用户没有执行权限的文件
~]# find /etc -not -perm -111 -type f -ls
8、查找/etc/init.d/目录下,所有用户都有执行权限,且其它用户有写权限的普通文件
~]# find /etc/init.d -perm -113 -type f -ls