zoukankan
html css js c++ java
计一次后怕的排错经历
因为武汉的肺炎,导致医院的重要性剧增.虽然已经过了维保也没用续约.但是商务关系还在这里.公司还是安排我们从1号开始继续给之前的合作医院做每天的巡检.
2020年2月7日,检查数据库messages日志.由于之前实施的同志做了切割.服务器一直有日志被切割的提醒.
由于当时对日志被切割机制不了解.一直认为被切割后的message-20201119文件为正常的.
所以巡检中仅仅查看了message文件与message-20201119文件.
直到今天2月7号.想对日志切割的机制做下了解.搜索后检查配置文件,发现日志切割的周期为7天,切割的结果是创建一个以切割当天日期为结尾的新文件
至此才发现从19号开始,所有的日志全部丢失了.
通过logrotate -d -v /etc/logrotate.conf 调试.
运行的结果是正常创建messages-20200202的日志文件和删除messages-20201119文件.
但是去掉-d 关闭debug模式执行logrotate,依然没用创建新的日志文件,
怀疑是否是磁盘问题导致写入或者删除失败.于是df -h
结果就hang住了.
我滴天,啥情况.磁盘挂了么.
也不对啊,19号到现在业务都是正常的,如果磁盘挂了,不应该不停业务啊.
打电话给之前实施的同事儿,同事儿说当时存储不够,额外挂了一块nfs磁盘做rman备份用.
检查/etc/fstab 确实有,nfs磁盘/back 目录无法访问.
但是showmount -e 10.20.10.17
能够显示nfs服务器提供的目录.
手动仅仅mount -t nfs 10.20.10.17/back /back成功.
但是使用原先/etc/fstab里面的rw,bg,wsize,rsize,timeo等参数挂载失败.
然后想起检查crontab -l里面执行的备份计划.是rman备份.
ps aux| grep rman |wc -l 结果显示65个备份的进程hang住.
挨个kill掉rman的进程
突然感到后怕.1月22到现在2月7号10多天,rman一直是失败的.是不是归档文件一直没有删除.到时候占满空间数据库会拒绝服务.
赶紧进入sql里面
select * from v$flash_recovery_area_usage
100g空间已经使用了76G.再过一周就会爆掉.
这个时间点,医院停业务估计会被狠狠的屌一顿.真的后怕
回头想想,自己有以下问题.
1) 22号医院重启了rac2服务器,导致日志文件里面产生了大量的信息.所以第一天巡检的时候,我忽略是22号的所有日志.包括当天最后一条nfs故障的告警
而且由于心理盲区,认为开始巡检的1号之前的日志和自己没有关系,7天的巡检都没有观察到这一点.
2) 巡检只按照离职同事发我的巡检文档工作,其中没有提及到rac2的rman备份,只有一台单独服务器提供的expdp备份,所以并没有检查服务器的计划任务.忽视了归档日志这一隐患.
希望这篇文章能提醒自己,运维工作看起来简单.但是不上心认真负责,风险很大.特别是接收其他人遗留的项目.
至于mount加参数后无法挂载的问题,今天太晚了 每天解决.
查看全文
相关阅读:
百度面试题:求绝对值最小的数
数据库工具
java内存:堆、栈、常量池、方法区
windows的cmd模式下目录名称中有空格
Tomcat启动45秒解决问题
sitemesh
向eclipse中导入myeclipse项目
HTTP学习
springCloud的使用01-----服务的注册和发现
springboot多数据库及分布式事务配置
原文地址:https://www.cnblogs.com/ggykx/p/12275286.html
最新文章
web项目中信息显示不全
qtp:操作mysql数据库时,提示"str open sql.conn对象打开时,不允许操作的解决方法
qtp:将excel数据导入DataTable并从第一行数据开始取值
qtp web随机获取下拉框的值
获取下拉值,这里以qtp自带的航班系统为例
qtp:如何给时间控件循环赋值
按时间段查询MYSQL语句
QTP连接mysql数据库
标准化体系建设(上):如何建立应用标准化体系和模型?
微服务架构时代,运维体系建设为什么要以“应用”为核心?
热门文章
业务打版上线注意事项
聊聊CMDB的前世今生
为什么Netflix没有运维岗位?
python day02练习和作业
带给你不一样的运维思考
优雅地关闭worker进程
热升级的完整流程
reload重载配置文件的真相
string和char数组
vs2013如何选择一个solution中的project来运行
Copyright © 2011-2022 走看看