1、精选完整ppt课件1 可靠性基础可靠性基础 精选完整ppt课件2第一节第一节 可靠性定义可靠性定义n产品的可靠性是指:产品在规定的条件下、在规定的时间内完成规定的功能的能力。从定义本身来说,它是产品的一种能力,这是一个很抽象的概念;n规定的条件n 工作条件:电压,负载,使用方法,维修方法,输出功率等。n 环境条件:温度,湿度,压力,振动,冲击,电场,磁场,电 磁场等。n 储存条件:运输,保管等精选完整ppt课件3规定的时间 指产品的生命周期(如交换机寿命20年,手机寿命5年,手机划盖工作寿命6万次,汽车寿命30万公里等)规定的功能 指产品标准或产品技术条件中所规定的各项技 术性能(技术指标)。
2、精选完整ppt课件4n对产品而言,可靠性越高就越好。可靠性高的产品,可以长时间正常工作(这正是所有消费者需要得到的);从专业术语上来说,就是产品的可靠性越高,产品可以无故障工作的时间就越长。精选完整ppt课件5我国的可靠性发展n我国的可靠性工作起步较晚,20世纪70年代才开始在电子工业和航空工业中初步形成可靠性研究体系,并将其应用于军工产品。其他行业可靠性工作起步更晚,差距更大,与先进国家差距2030年,虽然国家已制订可靠性标准,但尚未引起所有企业的足够重视。精选完整ppt课件6二、可靠性的重要性二、可靠性的重要性n调查结果显示(如某公司市场部2001年调查记录):“对可靠性的重视度,与地区的
3、经济发达程度成正比”。例如,英国电讯(BT)关于可靠性管理/指标要求有产品寿命、MTBF报告、可靠性框图、失效树分析(FTA)、可靠性测试计划和测试报告等;泰国只有MTBF和MTTF的要求;而厄瓜多尔则未提到,只是提出环境适应性和安全性的要求。精选完整ppt课件7n产品的可靠性很重要,它不仅影响生产公司的前途,而且影响到使用者的安全(前苏联的“联盟11号”宇宙飞船返回时,因压力阀门提前打开而造成三名宇航员全部死亡)。可靠性好的产品,不但可以减少公司的维修费用,而且可以很快就打出品牌,大幅度提升公司形象,增加公司收入。精选完整ppt课件8n随着市场经济的发展,竞争日趋激烈,人们不仅要求产品物美价
4、廉,而且十分重视产品的可靠性和安全性。日本的汽车、家用电器等产品,虽然在性能、价格方面与我国彼此相仿,却能占领美国以及国际市场。主要的原因就是日本的产品可靠性胜过我国一筹。美国的康明斯、卡勃彼特柴油机,大修期为12000小时,而我国柴油机不过1000小时,有的甚至几十小时、几百小时就出现故障。我国生产的电梯,平均使用寿命(指两次大修期的间隔时期)为3年左右,而国外的电梯平均寿命在10年以上,是我们的3倍;故障率,国外平均为0.05次,而我国为1次以上,高出20倍,这样的产品怎么有竞争力呢!因此要想在竞争中立于不败之地,就要狠抓产品质量,特别是产品可靠性,没有可靠性就没有质量,企业就无法在激烈的
5、竞争中生存和发展。因此,可靠性问题必须引起政府和企业的高度重视,抓好可靠性工作,不仅是关系到企业生存和发展的大问题,也是关系到国家经济兴衰的大问题。精选完整ppt课件9三、可靠性指标三、可靠性指标n衡量产品可靠性水平有好几种标准,有定量的,也有定性的,有时要用几种标准(指标)去度量一种产品的可靠性,但最基本最常用的有以下几种标准。1.可靠度可靠度R(t);它是产品在规定条件和规定时间内完成规定功能的概率。一批产品的数量为N,从t=0时开始使用,随着时间的推移,失效的产品件数逐渐增加,而正常工作的产品件数n(t)逐渐减少,用R(t)表示产品在任意时刻t的可靠度。精选完整ppt课件102.可靠寿命
6、可靠寿命CR(tr);它与一般理解的寿命有不同含义,概念也不同,设产品的可靠度为R(t),使可靠度等于规定值r时的时间tr的,即被定义为可靠寿命。3.失效率(故障率)失效率(故障率)(t);它是指某产品(零部件)工作到时间t之后,在单位时间t内发生失效的概率。精选完整ppt课件114.有效寿命与平均寿命有效寿命与平均寿命;有效寿命一般是指产品投入使用后至达到某规定失效率水平之前的一段工作时间。而平均寿命MTTF对于不可修复产品,指从开始使用直到发生失效这一段工作时间的平均值;对于可修复的产品,是指在整个使用阶段和除维修时间之后的各段有效工作时间的平均值。精选完整ppt课件125.平均无故障工作
7、时间平均无故障工作时间MTBF;是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。其他如可靠度、有效度、维修度、平均维修时间等也是衡量产品可靠性水平的一种标准精选完整ppt课件13重点指标1.平均故障间隔时间;平均故障间隔时间;可维修的产品,其可靠性主要的参数是 MTBF(Mean Time Between Fail),即平均故障间隔时间,也就是两次维修间的平均时间;不可维修的产品,用MTTF(Mean Time To Fail);两个参数的计算没有区别,下文只提到MTBF。MTBF越大,说明产品的
8、可靠性越高。精选完整ppt课件14n可以用以下理想测试来精确测试一批产品的MTBF;即将该批产品投入使用,当该批产品全部出现故障以后(假如第1个产品的故障时间为t1,第2个产品的故障时间为t2,第n个产品的故障时间为tn),计算发生故障的平均时间,则 有公式如下:精选完整ppt课件15nnntMTBF1/精选完整ppt课件162、失效密度、失效密度 另外一个常用的参数是,它是指在产品在t时刻失效的可能性,是失效间隔时间的倒数,也就是:1/MTBF。对某一类产品而言,产品在不同的时刻有不同的失效率(也就是失效率是时间的函数),对电子产品而言,其失效率符合浴盆曲线分布(如下图):精选完整ppt课件
9、17ttIIIIII精选完整ppt课件18n知道了,就可以找到产品连续工作 了t时间后、还正常的概率为R(t)=e-t,此时已经失效的概率为F(t)1-R(t)1 e-t。nR(t)=e-t是一个经验公式,一般电子产品的寿命服从这一指数分布,其它分布下文再叙;精选完整ppt课件19软件可靠性n软件的可靠性是用以衡量一个软件(指计算机程序)好坏很重要的一个评价指标。软件的可靠性与硬件的可靠性有许多相似之处,更有许多差别。这种差异是由于软、硬件故障机理的差异造成的,因而使软件可靠性在术语内涵、指标选择、设计分析手段以及提高软件可靠性的方法与途径等方面具有其自身的特点。然而,软件可靠性作为一个新的研
10、究领域正在发展和应用。精选完整ppt课件20基本概念n软件故障及其特征对于软件的不正常,常用三个术语来描述:缺陷(fault):指的是软件的内在缺陷。错误(error):缺陷在一定环境条件下暴露导致系统运行中出现可感知的不正常、不正确和不按规范执行的状态。故障(failure):由于对错误未作任何纠正而导致系统的输出不满足预定的要求。精选完整ppt课件21n缺陷可能导致错误并造成系统的故障,因此,缺陷是一切错误的根源,故存在下面的传递关系:缺陷缺陷错误错误故故障。障。但是发生过故障的软件通常仍然是可用的。只有当软件频繁发生故障,或公认已经“陈旧”时,软件才被废弃,这一版本软件的寿命也就终结。精
11、选完整ppt课件22n有缺陷的软件只有在特定条件下才能导致出错,而在一般情况下是能够正常工作的。软n件缺陷一般有以下特征:软件缺陷的固有性。软件一旦有缺陷,它将潜伏在软件中,直到它被发现和改正。反之,在一定的环境下,软件一旦运行是正确的。它将继续保持这种正确性,除非使用环境发生了变化。精选完整ppt课件23缺陷对环境的敏感性。对于一个软件来说,它的各部分之间有着密切的联系。软件的运行过程实际上是各部分间的一个逻辑组合过程,不同的逻辑组合就可得到不同的程序路径,而每一次软件运行或完成某功能都是选择了某一条程序路径。精选完整ppt课件24n选什么样的程序路径是由软件自身确定的输入环境决定的。对于不
12、同的输入环境,软件的运行路径可能有不同。如果软件在某些程序路径上含有缺陷,那么在执行这些程序路径时就有可能发生错误。这就是软件错误与输入环境的关系。精选完整ppt课件25n对在一定输入环境下工作出错的软件,当退出该环境后,对于其他环境,此软件又可能正常工作。但当再次进入该环境时,软件又会出错。这说明缺陷对环境是十分敏感的。精选完整ppt课件26软件错误的传染性。任一软件缺陷,只要未被排除,始终存在于该软件中,一旦暴露,处理过程就将产生错误,而这种错误往往是变化的。例如,由于某一处错误处理,使某个处理变量C 的值与要求不合,当变量C 继续参加运行时会引起处理过程中的其他错误。故这类错误是具有“传
13、染性”的。如果错误不被纠正,也许这种错误就一直存在以至继续“传染”,直到引起软件故障。精选完整ppt课件27n软件可靠性定义 软件可靠性是“软件在规定的条件下、规定的时间周期内执行所要求的功能的能力”。软件可靠性同样可用可靠度来衡量,而软件的可靠度是“软件在规定的条件下、规定的时间周期内不引起系统故障的概率”。精选完整ppt课件28常用参数n软件的故障与硬件不同,软件一旦出现故障,查明原因后相应的缺陷就可以得到纠正,以后不再重复出现。因此这是一个可靠性增长的问题。n常用的软件可靠性参数有以下一些。系统平均不工作间隔时间(MTBSD)设V T 为软件正常工作总时间,d 为软件系统由于软件故障而停
14、止工作的次数,则定义精选完整ppt课件29式中:T BSD 系统平均不工作间隔时间(MTBSD)。精选完整ppt课件30系统不工作次数(一定时期内)由于软件故障停止工作,必须由操作者介入再起动才能继续工作的次数。可用度(A)设V T 为软件正常工作总时间,D T 为由于软件故障使系统不工作的时间,则定义精选完整ppt课件31式中:BD T 平均工作时间(h);T DT 平均不工作时间(h)。一般情况下,生产计算机系统要求一般情况下,生产计算机系统要求A 99.8%99.8%;银行计算机系统要求;银行计算机系统要求A 99.9%99.9%。精选完整ppt课件32初期故障率 一般以软件交付使用方后
15、的三个月内为初期故障期。初期故障率以每100h 的故障数为单位。用它来评价交付使用的软件的质量并预测软件可靠性何时基本稳定。偶然故障率 一般以软件交付给使用方后的四个月后为偶然故障期。偶然故障率一般以每千小时的故障数为单位,它反映了软件处于稳定状态的质量。精选完整ppt课件33使用方误用率 使用方不按照软件规范及说明等文件来使用而造成的错误叫“使用方误用”。在总使用 次数中,使用方误用次数占的百分率叫“使用方误用率”。造成使用方误用的原因之一是使用方对说明理解不深,操作不熟练,但也可能是说明没有讲得非常清楚引起误解等。精选完整ppt课件34软件可靠性模型n虽然软件可靠性与硬件可靠性有相似之处,
16、都是用出故障的概率来表示的,但由于两者间故障机理不同,因此可靠性模型也不一样。软件可靠性模型有很多种,下面介绍常用的三类:从硬件可靠性理论导出的模型;根据程序内部特性得到的模型;用已知错误植入软件,经过测试、分析比较建立的可靠性模型。精选完整ppt课件35n第一种可靠性模型所做的假设是:在两次错误出现之间的调试时间随错误出现率呈现指数分布,而错误出现率和剩余错误数成正比;每个错误一经发现,立即排除,并使错误总数减1;产生错误的速率是个常数。精选完整ppt课件36n对软件来说,上面假设的合理性可能还有问题,例如,纠正一个错误的同时可能不小心而引入另一些错误,这样第个假设将不成立。n第二种可靠性模
17、型计算存在于软件中的错误的预期数目,根据软件复杂性度量函数导出的定量关系,这种模型建立了程序面向代码的(如操作符的数目)与程序中错误的初始估计数字之间的关系。精选完整ppt课件37n奈伯(Naib)在一项利用霍尔斯特德(Halstead)方法对软件出错率估算的研究中发现,环境因素对软件出错率的影响最大,并找出了三个起决定作用的随机变量,即:使用过该软件的总用户数X;当前用户人数Y;当前用户中有过出错历史的用户数Z。精选完整ppt课件38nX、Y、Z 为随机变量。这样软件出错率可表示为其中:式中:操作符个数;2 操作对象个数;N 2操作对象使用次数;B 3模块个数。经实验奈伯发现,该式的结果与实
18、验值相关系数达0.92。精选完整ppt课件39n第三种可靠性模型是由D.Mills 首先提出的。这种方法一开始用来估算野外生活的动物数或一个池塘内鱼的尾数。比如,要估算池塘内鲢鱼的尾数N,可以先把带有标记的N t尾鲢鱼放入池塘,过一段时间后,从池塘中捕捉鲢鱼。精选完整ppt课件40n数一数不带标记的鲢鱼有n 尾,带标记的有nt 尾。如果这些带与不带标记的鲢鱼分散均匀,又比较合群,而且捕捉的难易度相同,那么就可以求得N 为精选完整ppt课件41n植入模型就是在软件中“植入”已知的错误,并计算发现的植入错误数与发现的实际错 误数之比而开发出的模型。随机将一些已知的带标记的错误植入程序。设程序中尚未
19、发现的残留错误总数为N,植入的错误总数为Nt。在历经一段时间的测试之后,总共发现有程序的残留错误n 个和带标记的植入错误nt 个。精选完整ppt课件42n假定植入错误和程序中的残留错误都可以同等难易地被测试到,就可用上式求出程序中尚未发现的残留错误总数N。但这种模型依赖于测试技术。n例如,如何判定哪些错误是程序的残留错误,哪些是植入带标记的错误,不是件 容易的事。而且植入带标记的错误有可能导致新的错误。精选完整ppt课件43n还有其他一些软件可靠性模型,例如外延式。绘制单位时间内已检测到错误数目的关系曲线,然后用最小二乘法将曲线外延,以此来估计程序中尚残留的错误数目。精选完整ppt课件44提高
20、软件可靠性的途径n提高软件可靠性的根本途径是开展软件工程,减少软件缺陷。另外还应当:精选完整ppt课件45n严格的配置管理。软件的配置管理能标识和确定系统中的配置项,在系统整个寿命期内控制这些项目的投放与更动,记录并报告配置和更动要求,验证配置项的完备性和正确性。它能够完成软件的配置标识,配置控制,配置记录,技术状态审计(审核)四项任务。严格的配置管理是保证软件可靠性的重要措施之一。精选完整ppt课件46n软件(模块)的标准化。对硬件产品来说,一般地说标准化程度越高,其质量与可靠性也越高。软件也一样。软件标准件应由国家至少是部门来组织生产。这样软件的质量与可靠性将会有明显的提高。精选完整ppt
21、课件47n软件可靠性设计准则。实践证明:总结国内外,特别是本部门、单位的成功或失败的经验教训,制订并贯彻产品可靠性设计准则是提高产品可靠性的根本手段。对硬件产品如此,软件也相同。硬件可靠性设计的很多思路与方法可用在软件之中。精选完整ppt课件48n软件的设计评审。应像硬件一样建立严格的设计评审制度,使之成为把好软件质量关的重要手段。为了防止软件可靠性设计评审走过场,制订“软件可靠性与可维护性的设计评审检查单”是必要的,要按检查单逐项评审,审查软件是否严格按可靠性设计准则设计。精选完整ppt课件49 结束语n 本文仅对可靠性研究做了一个基本的概述,分别介绍了硬件可靠性和软件可靠性的定义,重要性和主要技术指标,以及软件可靠性的研究模型和增强软件可靠性的途径。希望通过本文,能让与会者对可靠性研究有最基本的认识和了解。n最后感谢大家的支持和参与