本文描述系统性失效和随机性失效,并介绍它们与硬件和软件失效的关系。
失效可以被分为两类:
1)随机性失效
2)系统性失效
随机性失效指发生的时间无法确定,但却遵循概率分布的失效。随机失效不适用于软件,只适用于硬件,所以也把它叫做随机硬件失效 (Random Hardware Failure)。随机失效由物理原因导致,比如腐蚀、热应力、老化。因为这些原因的随机特性,硬件在何时发生随机性失效是无法预测的,但是遵循概率分布(比如指数分布)。随机失效的概率分布可以从测试、历史数据中获得。因为随机失效符合概率分布,所我们可以计算随机失效的发生概率,和风险,即用定量的方法分析随机失效。
硬件随机失效的例子:某类型电阻的开路故障的概率为 1FIT,即平均运行 (10^9) 小时电阻会发生一次开路故障。但某个电阻何时失效是随机的,我们不确定。
系统性失效指和失效原因是决定关系的失效。当失效原因发生时,系统性失效就会发生。比如产品按照工作温度-20℃到80℃设计,实际的工作温度为-40℃至80℃。那么产品在-40℃环境不工作的失效就属于系统失效。每当失效原因(指环境温度-40℃)发生时,失效(指系统不工作)就会发生。
系统失效是系统开发和运行过程中人为失误造成的,一般是由设计阶段的规范错误、设计失误导致。产品生命周期的任何阶段都可能产生系统故障,包括需求规范、设计、生产、运行、维保和拆解阶段。
因为系统性失效由人为失误造成,不同团队的人的经验、知识、技能都差别很大,所以不能用概率来描述系统故障。
硬件失效包括随机性失效和系统性失效。简单硬件的失效主要是随机性而非系统性。随着硬件复杂度的增加,比如基于微处理器和特殊应用集成电路(ASIC)的控制器,系统性失效会增加。
所有的软件失效都是系统性失效。从统计上预测系统故障的概率是不可能的,因此对于软件来说,定量分析相关风险是不可能的。目前证明软件系统风险可接受的方法都是软件开发遵循了标准推荐的流程。比如ISO26262推荐用于功能安全系统的C语言程序应该满足MISRA-C。
硬件 | 软件 | |
---|---|---|
系统性失效 | √ | √ |
随机性失效 | √ | × |
例子:
硬件系统性失效: 规范错误(比如系统工作温度范围)导致的在过低温度环境下ECU计算结果不正确。
硬件随机失效:电阻开路失效;因为存储器1个位反转而导致的ECU计算结果不正确。
软件系统失效:越界数组访问;除零
软件随机性失效: 无此类失效。
版权声明: 本文为作者原创,未经许可禁止转载。原文地址:https://www.cnblogs.com/byronsh/p/system-and-random-faillure.html
本文的数字签名如下:
MGUCMQD8+RKEqrRo/yKm79PqnPBejUSGqhx0CfjpHLksMcGoX9jqqbrlTI517Ptjd9FA8A4CMAMi44X/Fc2OaUuqE3Bl9vTLx4DVUWNxTUGIiSyJtGBrZ91NbKLXGIh8rwLoDl2png==
--- 2019-7-20 9:28:37