机器挂了 进程挂了 线程死了 依赖的输入没有按时生成 数据丢失 定时任务没有启动 分布式系统节点挂了或者新加机器 数据迁移 :影响io 网络问题:超时,超过重试次数,网络抖动,瞬时流量飙升 数据慢查询 网络攻击:xss,csrf GC 磁盘满了 文件数超了 内存耗尽 数据一致性问题 多线程死锁 一个内部模块挂了 。。。
一个稳定的系统一定要考虑到任何可能出问题的地方,做好预案,才能保证系统稳定运行!!!