从实际系统中获取现场可靠性数据并对其进行分析处理可以按照以下5个步骤进行:
从现场数据中提取必要的信息。要进行该步骤就必须详尽地了解实际系统所涉及的操作系统、目标软件和系统操作等相关内容,实际的处理过程可根据数据类型而定。
对所获取数据进行分析。通过该步骤可达到两个目的,一是得到运行软件在实际环境中的可靠性特征,二是分析出影响软件系统可靠性的因素以便于提高系统性能。
根据数据分析的结果确定合适的可靠性模型(如Markov模型),并估计参数的实际变化范围。所确认的可靠性模型要能够对实际环境中的软件可靠性行为进行一种抽象描述,这些软件可靠性模型包括可执行性模型、错误和可恢复模型、现场捕捉到的有效故障的软件可靠性模型以及依靠工作负荷的软件可靠性模型。
在未得到所开发模型的求解技术的情况下进行的。一旦掌握了求解技术,那么利用真实数据就可以使该模型发挥作用。这里的模型求解还含有求得可靠性标准的含义(这些标准包括可靠性、可用性和运行性能等)。
对模型中由于各种因素变化而对软件可靠性产生的影响进行评估。通过该步骤可以确定系统的可靠性瓶颈,并且可以预测设计中的变动对软件可靠性所产生的影响。
软件可靠性的试验评估工作可以在软件生命周期的不同阶段进行。在开发阶段,可靠性数据需要通过代码检查和软件测试产生,很多研究都已经对开发阶段所收集的可靠性数据进行了评估。然而开发阶段的软件可靠性并不能代表运行阶段的软件可靠性,因为运行中软件的可靠性可能会与其开发阶段的可靠性有很大差别。在软件运行阶段,软件的更新速度相对低一些。由于各种故障软件的可视性和系统对它的容错特性都是不一样的,另外由于工作负荷的影响,软硬件平台的交互作用和环境因素对软件的影响也不尽相同,因此每一个软件的故障都对软件可靠性有着不同的影响,这样在运行阶段软件可靠性的估计就不能使用在开发阶段所收集的数据。在该阶段,最好的办法就是通过直接收集到的可靠性数据来分析运行软件的可靠性。 2100433B