1.资源优化与提升
- 资源利用率提升10%,再下线至少8台机器
- 用户使用收集与优化
2.kafka客户端重构
- 支持双活机房
- 优雅重启
- 安全性加强(访问认证/授权/隔离)
- 调度调配多集群间访问
- API接口简化,达到开箱即用
- 发送消息容灾、容错、降级支持
- 消息轨迹跟踪支持,帮助业务排查异常
- 消息发送耗时,消费耗时,消费失败异常采集上报,用于配置阀值监控
3.kafka管理平台迭代
- kafka平台性能提升,功能进一步完善
- kafka元数据体系完善和重构,解决元数据混乱,导致迭代开发周期长、风险大
- 聚焦“topic生产和消费”两大维度,重新组织和展现平台现有功能
- 功能太过分散导致用户无法快速定位所需;开源工具缺乏topic实时指标变化监控
4.集群稳定性持续提升
- 集群稳定性和可用性,收敛其他部门Kafka集群升级
5.技术调研
- 各个方向主流MQ调研(kafka、RocketMQ、pulsar)
- 各大公司实践调研
6.其他
- 博客与技术分享
- 业务推广