一般的log文件都是需要过滤
1.grep 过滤查找
查询ip 221.2.100.138的log
grep '221.2.100.138' web.access.log
grep 221.2.100.138 web.access.log
less web.access.log |grep "221.2.100.138"
统计error行数
grep error web.access.log |wc -l
将error重定向(linux是>python是>>)到文件中
grep error web.access.log >mylog1.txt
其他常用参数,位置放在前面后面都可以
-i 不区分大小写 grep -i 'HTTP' web.access.log或者grep 'HTTP' -i web.access.log
-n 输出行号
-c 统计行数
支持正则
2.sed 行筛选
显示第1行
显示第1-3行
常用选项:
-n∶不使用的时候,会把所有数据都显示出来,但如果加上 -n 参数后,只显示经过处理的那几行
-e∶直接在指令列模式上进行 sed 的动作编辑;
-f∶直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内的sed 动作;
-r∶sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)
-i∶直接修改读取的档案内容,而不是由萤幕输出。
常用命令:
a ∶新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c ∶取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d ∶删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i ∶插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p ∶列印,亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作~
s
命令是直接使用,参数是-一起使用
格式:
sed '/模式/' d filename或者sed '/模式d/' filename都可以。删除查询条件为模式的行
eg:删除以#开头的行,并将修改写入文件
sed '/^#/' d -i filename
如果不加-i是显示在屏幕上,这时候可以把结果重定向到文件中
sed '/^#/' d filename>filename_new 覆盖写入w
sed '/^#/' d -i filename>>filename_new追加写入aw
sed -n '/2015:08:39:59/,/2015:08:40:02/' p web.access.log 打印出这个时间段的log,p是打印的意思
sed -n '/2015:08:39:59/,/2015:08:40:02/' web.access.log |awk '{print $4,$5}'
awk分列
语法awk '{print $1}'打印第一列
awk -F : '{print $1}' 以:为分隔符打印出第一列 比如每行的数据格式是aa:bb,执行以后会取到aa,要想这个时候取值aa和bb,执行awk -F :'{print $1,$2}'
awk '{if(表达式){语句}}'
(1) awk '{print}' 打印所有列
(2)打印第一行的所有数据 awk 'NR==1{print}'
(3)打印第二行第一列 awk 'NR==2{print $1}'
grep '106.39.249.119' web.access.log | awk '{print $1,$2}' 打印出含有106这个ip地址的第一列和第二列
awk '{if($1=="106.39.241.119"){print $1,$2}}' web.access.log 打印出ip地址是106的第一列和第二列
awk '$1=="106.39.249.119" {print $1,$2}' web.access.log同上
其他组合用法
1.统计wc
统计行数(line) |wc -l more filename|wc -l或者wc -l filename
统计单词数(word) |wc -w
统计字符数 |wc -c (bytes)
2.排序sort 经常与|管道符使用
|sort -n 按照数字进行排序,不加,会出现1后面是10这种排序
|sort -nr 反序reverse排序
3.去重uniq
经常与管道符结合使用|
|uniq -c 将该重复的数据的行数统计出 一般在uniq -c|sort -n使用,因为uniq会把数字统计出来,然后sort -n按照数字进行排序
|uniq -d 只显示重复的行
|uniq -u 只显示不重复的行
例子:
统计出访问日志中有多少个不同的ip
awk '{print $1}' web.access.log |sort|uniq -c|wc -l
统计访问最高的ip
cat access.log|awk '{print $2}'|uniq -c|sort -nr|head -n 1
或者
cat acess.log|awk '{print $2}'|uniq -c|sort -nr|sed '1p'
字符转换tr,以下转换不会对源文件进行操作
tr '#' '!' 把#全部转换成!
cat a.log |tr 'a-z' 'A-Z'