一 墨菲定律
什么是墨菲定律?最简单的表达形式是“有可能出错的事情,就会出错(Anything that can go wrong will go wrong)。”爱德华·墨菲(Edward A. Murphy)是一名工程师,这句话迅速流传。墨菲定律的原句是这样的:If there are two or more ways to do something, and one of those ways can result in a catastrophe, then someone will do it.(如果有两种选择,其中一种将导致灾难,则必定有人会作出这种选择。)
二 CMDB
几个概念介绍
TIL即IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术基础架构库)由英国政府部门CCTA(Central Computing and Telecommunications Agency)在20世纪80年代末制订,现由英国商务部OGC(Office of Government Commerce)负责管理,主要适用于IT服务管理(ITSM)。ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。
1、事件管理(Incident Management)
事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。
2、问题管理(Problem Management)
问题管理是指通过调查和分析IT基础架构的薄弱环节、查明事故产生的潜在原因,并制定解决事故的方案和防止事故再次发生的措施,将由于问题和事故对业务产生的负面影响减小到最低的服务管理流程。与事故管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。
3、配置管理(Configuration Management)
配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,其目的是提供IT基础架构的逻辑模型,支持其它服务管理流程特别是变更管理和发布管理的运作。
4、变更管理(Change Management)
变更管理是指为在最短的中断时间内完成基础架构或服务的任一方面的变更而对其进行控制的服务管理流程。变更管理的目标是确保在变更实施过程中使用标准的方法和步骤,尽快地实施变更,以将由变更所导致的业务中断对业务的影响减小到最低。
5、发布管理(Release Management)
发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发
服务台:服务台是IT部门和IT服务用户之间的单一联系点。它通过提供一个集中和专职的服务联系点促进了组织业务流程与服务管理基础架构集成。服务台的主要目标是协调客户(用户)和IT部门之间的联系,为IT服务运作提供支持,从而提高客户的满意度。
CMDB --Configuration Management Database 配置管理数据库, CMDB存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。
CMDB 资产管理部分实现
- •存储所有IT资产信息
- •数据可手动添加
- •硬件信息可自动收集
- •硬件信息可自动变更
- •可对其它系统灵活开放API
- •API接口安全认证
构建CMDB的建议
1 识别业务场景 活动视图
2 明确资源对象(物理对象 比如 服务器/负载均衡/加速器 和逻辑对象IP地址 端口)的范围和力度
3 尽力资源对象模型 关键是降低资源对象的配置项管理成本?采用自动发现机制,特别是服务器上的一些配置信息,比如说进程、硬件配置和IP信息等等,尽量减少人工维护的工作量,只有在现网配置和机器配置产生冲突的时候,此时通过异常报告的形式让人为参与纠正。自动发现机制的引入可以大大降低人力成本
4 资源对象的生命周期管理 对于每一个资源对象,
我们需要了解他的状态变迁,最好有个变迁图(变更控制),每个状态变迁的驱动主体是谁(权限控制)。我个人主张复杂的变更控制场景化,最好都固化到一个变更管理系统中,做好清晰的流程设计和功能实现,把配置项的状态日志记录下来归档。
总结就是:首先提炼业务场景,找到要管理的对象,然后进行对象的建模,模型实现之后,通过自动化管理的方法降低人为管理成本,根据生命周期的模型去控制配置项的变更。