01 - 10
01 - Do the right thing!
在实践中,很难时刻关注目标并审视自己。
如果将DevOps看做是一个工具箱,那么就需要思考并从中找出合适的工具,来正确应对当前工作。
要确保在做正确的事情,而不是在不理解问题的前提下实现想法。
虽然有Sprint回顾会议机制,用来捕获潜在的改进空间,但往往没有真正地执行。
- 是否在做正确的事?
- 是否在正确的路上?
- 应该以怎样的积极行动来敏捷地面对?
02 - PCDA循环与DevOps
PDCA循环是一种管理方法,主要用于在企业和商业活动中进行持续生产改善,并采取相应的控制措施。
这一方法将业务分为Plan(计划)、Do(执行)、Check(检查)和Act(处理)四个阶段来进行,在执行改善措施之后,又回到Plan(计划)阶段,如此循环往复。
- P (Plan) 计划:包括方针和目标的确定,以及活动规划的制定。
- D (Do) 执行:根据已知的信息,设计具体的方法、方案和计划布局;再根据设计和布局,进行具体运作,实现计划中的内容。
- C (Check) 检查:总结执行计划的结果,分清哪些对了,哪些错了,明确效果,找出问题。
- A (Act)处理:对总结检查的结果进行处理,对成功的经验加以肯定,并予以标准化;对于失败的教训也要总结,引起重视。对于没有解决的问题,应提交给下一个PDCA循环中去解决。
以上四个过程不是运行一次就结束,而是周而复始的进行,一个循环完了,解决一些问题,未解决的问题进入下一个循环,阶梯式上升。
全面质量管理活动的全部过程,就是质量计划的制订和组织实现的过程,这个过程就是按照PDCA循环,不停顿地周而复始地运转的。
关于PDCA的现代观点
- P(Planning)——包括三小部分:目标(goal)、实施计划(plan)、收支预算(budget)。
- D(design)——设计方案和布局。
- C(4C)——4C管理:Check(检查)、Communicate(沟通)、Clean (清理)、Control(控制)。
- A(2A)——Act(执行,对总结检查的结果进行处理)、Aim(按照目标要求行事,如改善、提高)。
与DevOps的关系
实施DevOps需要以PDCA的方式循环进行,在DevOps中,敏捷开发方法是实现PDCA循环的方法之一。
也就是说,DevOps是融合在业务中的持续性的改善和实践,而不是为了一次性完成所有的改善。
03 - 组织形式与DevOps
康威定律:设计系统的组织,其产生的设计等同于组织的沟通结构。
通过引入DevOps的工具和文化,能够使系统架构和组织结构同时发生变化。
04 - 在DevOps中应用Docker
构建功能单一的轻量级容器镜像
- 容器以功能为单位进行分割,内容精简,缩小镜像
- 容器之间尽量松耦合,消除容器内部对环境的依赖因素,提高通用性
- 容器镜像本身不应保存与具体环境相关的信息
05 - From Traditional to Future
06 - DevOps技能图谱
仅作为参考,实际情况差异巨大。
- https://github.com/TeamStuQ/skill-map/blob/master/data/map-DevOps.md
- https://www.infoq.cn/article/the-must-know-checklist-for-devops-and-sre
- https://www.infoq.cn/article/NpBtkovq8idXk-Z0yoby
不同成长阶段对技能的需求是不同的,无法准确用一张图来表示合适的内容。
大而全的技能图谱,不是为具体实施场景所准备的,而且里面甚至包括了过时的信息,不适合作为了解的途径。
这种技能图谱中的很多知识点、工具和技能其实不是现在就必须掌握的,重点是要掌握实际实施所必须的最少必要知识,先开展工作,然后在后期工作中按照需求、循序渐进地接触和使用。。
什么都想接触都想了解,效果必然很差,浪费时间和精力。
07 - 分支策略
制定分支的创建规则和使用规则,避免随意创建新分支导致的分支混乱、难以区分和回溯等问题。
- 在什么时候需要使用分支?
- 在什么时候合并到哪个分支?
- 在不同的环境中分别使用哪个分支?
- 在修改bug或者添加新功能时使用哪个分支?
- ......
08 - DevOps几个关键点
- 系统思考(将开发、测试、运维等环节之间的流程视为一条管道,从整体分析、定位和解决问题)
- 增强反馈回路
- 培养不断试验和学习的文化
- 积极传播信息促进团队和个人成长
09 - 信息共享与管理
只有积极地传播和共享信息,才能推进DevOps的实施,提高团队的战斗力
- 传统的方式:以文件形式存储在一台共享服务器上,存在难于搜索内容、无法获知更改信息和文件实时状态等问题
- Web方式:Wiki、Confluence、看板等,易于创建和修改,能够快速准确找出所需信息
- 代码库方式:信息文件存储在代码库,能够准确获知信息内容的状态和变化,以及历史信息
10 - 管理工作技术化
- 需求失真,不透明,太抽象,需求管理混乱:明确唯一入口、团队共商共建、可视化、数据化等
- 代码质量差:代码扫描自动化、在CI环节限制、评审策略化等
- 测试反复,人力资源缺失:测试自动化、采用高效工具RobotFramework,Postman等
- 版本零散、分支混乱、发布环境不一致:明晰的管理策略(代码、分支、环境)
- 流程臃肿、数据繁杂,难以查看:可视化流程和数据
- ......
11 - 20
11 - DevOps和Agile
如果说Agile是内功和心法的话,那么DevOps则是力量与招式。
Agile描述了一套价值观,却没有显式的把方法论体系化,而DevOps定义了一套方法论,把价值观蕴含在其实践中。
12 - DevOps标准与认证
《研发运营一体化(DevOps)能力成熟度模型》
- 由工信部直属单位中国信息通信研究院牵头
- 云计算开源产业联盟、高效运维社区和 DevOps 时代社区联合发起
- 携手国内互联网、电信、金融等行业领先企业百余位专家共同编制
- 全球首个 DevOps 标准,已在联合国直属标准化组织 ITU-T、中国工信部、中国通信标准化协会(CCSA)正式立项。
13 - 九问DevOps
“问题”一定是着某种具体的“目的与需求”来提问的,关于答案,没有正不正确,只有“合不合适”。
- 你对DevOps的理解是什么?
- 你认为DevOps的发展趋势是怎样的?
- 如果让你来组织或者引导一个DevOps项目的实施,你如何开展工作?
- 你将如何去说服或引领关键人(例如决策者、管理者、最终使用者、反对者等)赞同并支持建立DevOps机制?
- DevOps项目的实施后,落地了工具和方法,如何去评价DevOps的成效?
- 你获取和更新DevOps信息的途径和方式有哪些?最常用的是什么?
- 一套DevOps系统建立后,你认为如何保证这套系统的健康稳定的运转?
- 你在实施或运维DevOps过程中,遇到最大的困难是哪方面的?如何解决的?具体的方法是怎么?
- 你在推动和建立DevOps的过程中,投入最多精力和时间的是哪方面?为什么?
14 - CI Pipeline
15 - 限制信息流动的因素
- 权责过于分明:不愿轻易踏足其他领域
- 流程繁琐:漫长的处理和反馈
- 严格的安全限制:担心违规,限制分享
- 精细的权限管理:一些基础操作 花费额外精力
16 - 问题产生的因素
所谓“难度”:
- 稀缺性 ---》 资源限制 -----》 开源共享
- 规模性 ---》 数量庞大,量变引发质变 -----》 标准化
- 重复性 ---》 产出低效 -----》 自动化
- 特殊性 ---》 全新未知 -----》基于标准的定制化
17 - ITIL(information technology infrastructure library, 信息技术基础架构库)
- 贯穿软件生命周期的大型框架,用以管理复杂变更
- 很多大型成熟企业采用的一种实践
- 某些ITIL描述的实践可以直接转换成相对应的DevOps实践
18 - 周期性的迭代
- 看板: 短周期,一般24小时,也就是一天,每日站会
- Scrum:一个sprint周期大概2到4周
- SAFe(Scaled Agile Framework,大规模敏捷框架):多个Scrum Sprint
19 - 滚动升级
- 避免让最终用户停机
- 极低的停机时间
- 国际企业可能并没有合适的时间窗口来处理升级,滚动升级可能是唯一的选择。
20 - 大规模部署
- 服务日志:统一搜集日志,快速针对某个业务问题定位到具体日志
- 服务监控与健康检查:自动化获取数量众多的实例运行状态
- 服务网络:避免网络复杂化和管理琐碎化,有效管理IP、端口等资源在满足服务隔离要求下实现服务互通
- 服务发现:自动化探测服务并加入集群,及时剔除不可用的服务
- 服务调度与编排:根据优先级和使用策略调度资源,编排和定义服务,实现定制化服务部署和可控频率的滚动更新
- 服务自动伸缩:自动的资源伸缩能力,应对性能问题
- 负载均衡:切换平稳,不影响业务运行,终端客户无感知
- 微服务支持:简化传统集群的部署结构,降低部署成本
- 数据存储:采用网络存储来应对容器实例非持久化
21 - 30
21 - DevOps与架构
# 关注点分离: 分开考虑系统不同的方面
- 内聚原则: 内聚(各部分之间相互关联的程度),单模块内的高内聚是可取的
- 耦合:模块间相互依赖的程度,要实现模块间的低耦合。
- 高内聚低耦合的系统自带关注点分离,反之亦然。
# 微服务
- 可以简单地将每个微服务视为一个隐式的三层架构(表示层、业务层、数据层),
- 但通常是指业务层,包含有许多小的服务组成,彼此之间使用语言无关的协议(通常为JSON Rest)来通信
- 适用于持续交付:部署小型独立的服务
# 康威定律
- 设计软件的组织结构等价于软件的组织结构
- DevOps的主要目标是与不同的角色共同协作,最好是一个跨职能团队。
- 微服务模式正好密切反映了跨职能团队
# 自动化测试
- 一切皆可自动化!
- 高效的自动化测试能够使部署变更有更好的质量。
# 监控
- 通过监控服务并在问题发生时采取适当的行动来缓解服务宕机的影响
- 针对不同的应用程序来提供监控接口,全面了解当前系统的健康状态
- 使用的监控软件类型不同,监控的结构也有所不同
22 - ChatOps
所有操作和处理都会通知到即时通讯工具,可以通过聊天工具来追踪、确认和推动DevOps全链路的状态。
一些常见工具
- Slack:https://slack.com/
- 企业版微信:https://work.weixin.qq.com/
- 钉钉DingTalk:https://www.dingtalk.com/
- 微软Teams:https://docs.microsoft.com/zh-cn/microsoftteams/teams-overview
- Cisco Jabber:https://www.cisco.com/c/zh_cn/products/unified-communications/jabber/index.html
- 华为云WeLink:https://www.huaweicloud.com/product/welink.html
23 - 镜像仓库规划
如果在公司或组织内部进行基于容器的私有云建设,那么往往同时也需要建立一个私有的镜像仓库。
镜像仓库是容器化的关键组成部分,如果镜像仓库服务异常,那么就无法发布和部署新版本。
一些镜像仓库规划的建议
- 除了建立容灾备份、实现负载均衡外,还需要建立集群,防止镜像服务异常
- 利用Jenkins任务自动化清理旧版本镜像,节省存储空间,简化管理
- 基于简单可靠的原则,测试和生产环境可以共用一套镜像仓库
- 如果测试和生产环境分别建立了镜像仓库,就需要特别关注“复制规则的制定”