




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT),课程目的,1、概述通信网的可用性,1、设备都是通信网络中的一个接点,网络的可靠性或者说端到端的可靠性是用户最终关心的。不能仅仅关注设备可靠性而忽视组网、网络其他部件对可靠性的影响;2、不同网络层次的设备有不同的可靠性要求。核心层设备偏重于HA,中间层设备偏重于成本与HA的良好结合,终端设备偏重于成本与返修率;3、HA不仅仅包括设备软、硬件的HA,而且包括计划性中断、人为差错等的HA,所以也要关注升级、数据配置、补丁等造成的业务中断;4、需求的落实需要可靠性工程师对产品设计方案的了解,需求跟踪,FIT测试验证。更需要开发人员的并肩作战。,产品的可靠性可以理解为三个规定,即规定条件下、规定时间内、产品完成规定功能的能力。从用户的角度考虑,可简单地理解为几个层面的要求:,硬件故障,仅对性能有部分影响,设备的功能不受损。,硬件不出故障,硬件故障,设备部分或全部功能受损。但能尽快恢复业务。,第二层面,第一层面,第三层面,1、概述可靠性的层次,电路应用规范、器件应力降额、环境适应性、EMC、防护、安规、HALT试验等,冗余、倒换策略,倒换条件完善,数据备份策略,故障检测、隔离,定位,维修性等,元器件降额分析,可靠性FMEA、CA分析,系统结构的考虑。如冗余、负荷分担。其他容错设计故障检测。重要故障需要“知情”。检测灵敏度;故障隔离。能隔离到影响最小,定位到FRU;故障恢复。倒换策略、复位、重启、数据恢复等;故障测试验证。重要、影响或措施不明确的故障、故障模式,FIT模拟测试;,器件使用的考虑。如降额、热设计、器件应用审查;简化设计等,AWP:availabilityworkprocess,1、概述业界可靠性流程(MOTOROLA的AWP),1、概述可靠性流程,工程设计调研与设计建议,可靠性工程基线2.0,板间信号级FMEA分析报告单板总体设计方案(可靠性),系统可靠性设计报告可靠性指标论证报告,器件级FMEA分析报告单板硬件详细设计报告(可靠性)元器件降额分析报告,IPDSE,HCMM3.0,FIT可靠性验证测试,可靠性工程师,硬件/软件开发工程师可靠性工程师,测试工程师可靠性工程师,1、系统可靠性设计报告,2、板间信号级FMEA分析报告,1产品构成及功能定义2产品功能层次框图3产品可靠性框图4产品编码原则5环境定义6严酷度等级定义7功能模块(单板)接口信号FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5分析总结,1产品概述2产品系统结构及可靠性建模3系统可靠性分析4主控类单板可靠性设计5网板(交叉)类单板可靠性设计6业务类单板可靠性设计7时钟子系统设计8电源子系统设计9监控及散热系统保护设计10存储保护与数据安全11系统及单板复位设计12系统可靠性设计规格及测试验证需求汇总,1、概述可靠性流程,1、器件级FMEA分析报告,1单板构成及功能定义2单板功能层次框图3单板可靠性框图4编码原则(可选)5环境定义6严酷度等级定义7单板器件级FMEA分析7.1单板器件级FMEA分析表格8总结8.1软件故障管理需求列表8.2硬件故障管理需求列表8.3测试验证需求列表8.4故障降级分析8.5故障定位率计算8.6冗余单元倒换成功率计算8.7分析总结,2、产品元器件降额分析报告,1、系统功能2、环境定义3、测试环境4、单板元器件降额分析4.1单板1元器件降额分析4.2单板2元器件降额分析5、总结,1、概述可靠性流程,可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT),课程目的,2、故障管理设计,故障检测:发现故障,故障诊断方法:1、自诊断(如:电压模块、风扇自带诊断);2、在线诊断;,故障定位方法:1、功能单元隔离(如影响到总线或通信通道的故障、二路电源的二极管隔离等)2、禁止功能单元工作;3、安全值输出(如:参考时钟的自激振荡)4、重选路由;,故障检测方法:1、数值范围检查;(如:温度、电压、槽位号、MAC地址等)2、数据正确性检查(如:奇偶校验、求检验和、CRC校验、槽位号异或校验等)3、比较检查(有冗余输出时)4、时间检查(如:心跳检测)5、用户直观检查(如:告警、声光显示),故障诊断(定位):确定造成故障的单元,故障定位:把检测到的故障隔离到必须进行修理范围的过程,通常是现场可更换单元。即确保单元的故障不会造成系统的故障。,故障恢复方法:1、倒换;(对主备用冗余)2、重新分配资源(对N+1冗余、资源池)3、软件复位;4、重启;,故障恢复(自动):恢复产品执行规定功能的能力。,2、故障管理设计,故障修复方法:1、更换功能单元;2、调试和诊断(离线)3、软件补丁;4、软件升级;,告警方法:,1、趋势图法;2、多变量综合分析法;3、专家系统法;,故障修复:故障完全排除的过程。,2、故障管理设计,1、报警;2、信息文本(如:写入运行日志中)3、故障分级处理(不同级别的故障采取不同的告警方法),预警方法:,可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT),课程目的,系统薄弱环节,可靠性设计,故障概率高,故障影响大,可靠性定性分析FMEA,可靠性定量分析建模预计,可靠性分析方法,3、可靠性分析方法,在产品设计过程中,通过对产品各组成单元潜在的各种故障模式及其对产品功能的影响进行分析,并把每一个潜在的故障模式按它的严酷度予以分类,提出可以采取的预防改进措施,以提高产品可靠性的一种设计分析方法。,FailureModeEffectAnalysis,故障模式影响分析,遍历性、系统性。,FMEA的基本思想:,.,3、可靠性分析方法可靠性FMEA,FMEA目的:,能帮助设计者和决策者从各种方案中选择满足可靠性要求的最佳方案保证所有元器件、单元的各种故障模式及影响都经过周密考虑能找出对系统故障有重大影响的元器件、元器件故障模式及单元、单元故障模式并分析其影响程度有助于在设计评审中对有关措施(如冗余措施)、检测设备等作出客观的评价能为进一步更改产品设计、定量计算提供资料,FMEA的分析层次:,系统级:按各功能模块进行分析板间信号级:单板的接口信号进行分析器件级:按各器件的故障模式进行分析,3、可靠性分析方法可靠性FMEA,FMEA的分析方法:,硬件法:从硬件的角度,对每个器件管脚输出分别去考虑故障模式、故障影响、检测补偿措施。,功能法:每个产品可以完成若干功能,而功能可以按输出分类。这种方法将输出一一列出,并对它们的故障模式进行分析。对应系统级、单板级分析。,3、可靠性分析方法可靠性FMEA,FMEA分析步骤:,3、可靠性分析方法可靠性FMEA,从可靠性工程师的角度去理解系统;包括对系统完成的功能、工作阶段以及各种工作方式给出详细的描述;网络位置、组网方式和典型配置,描述系统功能,系统按照功能划分,通常可以分为:电源模块、风扇监控模块、网管模块、功能模块。对于功能模块,再继续划分到功能实体上,如主控功能模块、交换网功能模块、线路处理功能模块等。,3、可靠性分析方法可靠性FMEA,定义严酷度类别,给产品故障造成的最坏潜在后果规定一个量度。,I.这种故障会导致整个系统崩溃或主要功能受到严重影响;II.这种故障会导致系统主要功能受到影响、任务延误的系统轻度损坏或存在较大的故障隐患;III.系统次要功能丧失或下降,须立即修理,但不影响系统主要功能实现的故障;IV.部分次要功能下降,只须一般维护的,不对功能实现造成影响(一般告警或指示灯故障等)。,III类故障通常称为重大故障,也即“单点故障”;III类故障可简单理解为需要尽快修复的故障。当一个故障不能被检测出来时,是“隐患”,级别上升一级。具体产品具体定义;,3、可靠性分析方法可靠性FMEA,描述功能层次框图,目的:为了描述系统各功能单元的工作情况、相互影响及相互依赖关系,以便可以逐层分析故障模式产生的影响。,表示系统及系统各功能单元的工作情况和相互关系,以及系统和每个约定层次的功能逻辑顺序。,3、可靠性分析方法可靠性FMEA,描述可靠性模型框图,目的:表示系统可靠性与各功能模块可靠性之间的关系。,可靠性模型框图分为基本可靠性模型框图和任务可靠性模型框图。,3、可靠性分析方法可靠性FMEA,描述结构图,目的:清晰功能模块之间的相互关系,主要输入/输出信号。,确定故障模式和故障原因(板间信号级),光信号无光、光功率衰减过大、时序错误电信号常高、常低、开路、时序错误,确定故障模式和故障原因(器件级),3、可靠性分析方法可靠性FMEA,确定故障模式和故障原因(系统级),业务类功能故障;对接类功能故障;信息上报类故障;故障诊断类故障;业务保障类故障;安全类故障;用户界面类故障;,子系统层面:全部功能不能实现;各部分功能不能实现;功能异常。,FMEA分析表格,3、可靠性分析方法可靠性FMEA,软件故障管理需求列表,硬件故障管理需求列表,3、可靠性分析方法可靠性FMEA,测试验证需求列表,CriticalityAnalysis,危害性分析,按每一种故障模式的严酷度类别及故障模式发生概率所产生的影响对其分类,以便全面地评价各种可能的故障模式的影响。是FMEA的补充和扩展。用RPN(RiskPriorityNumber,风险占先数)来定量表示,RPNSPD*,其中:S严重程度,对于IIV类故障分别选取100,5,1,0.2P故障发生的概率,器件失效率与故障模式发生概率的乘积,FIT;D客户发现故障的概率,很容易发现5,稍加注意即可发现1,不会发现0.2。*通常可不考虑该参数,3、可靠性分析方法CA,可靠性工作介绍故障管理设计FMEA分析方法介绍可靠性验证测试(FIT),课程目的,开发阶段验证产品MTBF或A:可靠性是基于统计的结果,需要有足够的样本量;时间较长;试验量大;难以模拟现场应用环境;,4、可靠性验证测试及评估可靠性验证测试,可靠性FIT测试验证目的:1、可靠性增长,测试发现问题,提高系统可靠性;2、验证系统可靠性,验证系统的故障管理能力;3、对产品故障恢复能力定量估计(可靠性指标验证);,FIT(FaultInsertionTest):故障插入测试,软件,硬件,维护操作,4、可靠性验证测试及评估可靠性验证测试,硬件常用器件失效模式,4、可靠性验证测试及评估可靠性验证测试,验证系统故障管理能力,1)出现故障后系统处理不当引起业务中断;比较典型的例子:线路的1.8V电源失效,网络发生复用段倒换,但几分钟后倒换确恢复了,导致网络业务中断;2)主备之间的信号检测未加过滤,导致误倒换;比较典型的例子:主备单板之间的主备信号、好坏信号等等的检测没有增加过滤,由于这些信号是时钟信号,因此外界出现干扰,系统主备出现误倒换;3)模块之间处理错误;比较典型的例子:时钟板的1.5V电源出现问题,由于BOIS和单板软件的接口错误,导致倒换失常;再比如:线路发现交叉过来的业务出现LOS,会上报给主机,但却被主机给抑制了,系统无法知道原因;4)重大故障无法准确定位;比较典型的例子:线路的622M晶振失效,系统出现很多业务的告警,但无法准确定位是哪一块单板出现故障;5)检测不全面;比较典型的例子:在位线或者ID线在单板运行过程中出现故障,系统无法知道,单板硬复位或者重起后,无法和主控联系,业务中断;6)告
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乳制品健康宣传活动创新创业项目商业计划书
- 电商平台用户画像深度挖掘创新创业项目商业计划书
- 老年婚恋交友平台创新创业项目商业计划书
- 线上购物线下试妆创新创业项目商业计划书
- 水利工程维修养护数字孪生管理创新创业项目商业计划书
- 电商供应链可视化管理系统创新创业项目商业计划书
- 汽车赛事直播服务创新创业项目商业计划书
- 辐射核安全知识培训内容课件
- 2025年数字货币对货币政策传导机制影响的金融科技视角研究
- 2025年文化与科技融合趋势下的数字文化内容创作创新模式研究报告
- 衡阳市物业服务收费管理实施细则
- 灾后重建生态修复建设林草植被恢复项目实施方案
- 缴纳社保免责协议书
- 《癫痫持续状态》课件
- 2025-2030在线语言教育行业发展分析及前景趋势与投资研究报告
- 骨干教师培训讲座内容
- 软件售后季度工作总结
- toc培训课件教学课件
- 菌毒种或样本等感染性材料管理制度
- 基于人工智能的智能投顾系统研究
- 汽车抵押借款合同协议范文样本
评论
0/150
提交评论