核心架构
解决的问题
故障排查 |
1、 这个请求在哪里失败了?A有调用B吗? 2、 为什么用户的请求/页面hung住了? 3、 为什么系统这么慢?那个组件最慢? |
应用容错性 |
1、 客户端没有配置timeout,导致应用整个卡住 2、 没有重试机制,某个pod偶尔出现异常也会导致用户页面错误 3、 某些节点异常(负载高),导致应用整体响应时间变长。 4、 某个pod有bug,会耗尽TCP连接数或者网络流量 |
应用升级发布 |
1、 新版本都是一次性升级,出错回滚造成的影响范围很大 2、 无法进行A/B测试,根据用户属性访问不同的应用版本 |
系统安全 |
1、 服务都是http,而不是https 2、 没有流量限制,任何人都可以发送请求进行服务攻击 |