【2017年整理】电子行业试样的高效的制备方法_第1页
【2017年整理】电子行业试样的高效的制备方法_第2页
【2017年整理】电子行业试样的高效的制备方法_第3页
【2017年整理】电子行业试样的高效的制备方法_第4页
【2017年整理】电子行业试样的高效的制备方法_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子行业试样的高效的制备方法引言当必须在试样的特定的区域或者平面截取横截面时,需要特定面的显微切片样来用于显微镜观察。这种方法通常用于在电子行业的失效分析和质量控制,也用于研究和产品控制。因为不同的试样所关注的特征平面不同,通常情况下一次只能制备一个样品,所以特定面的显微切片试样的制备通常手工完成。如果试样表面足够平并且所关注的特征面的位置相近,使用能够同时高效的处理多个试样的高级显微去层系统也是可行的。例如,标乐PWBMET系统就是专门为电路板通孔的质量控制而设计的。通常的试样制备程序是用SIC砂纸手动粗磨,接下来用更细粒度砂纸研磨并通过便携式显微镜或者放大镜来观察直到到达所关注的平面的位置。然后通过两到三步不同粒度的氧化铝粉抛光。表1所示是这种方法的概要。这种传统的试样方式已经使用多年,但是他们仍然有很多局限性1制样效率低2不同操作者的习惯导致制样结果的不一致性3氧化铝在抛光布上干燥过程中的交叉污染4塑性流变可能导致特征丢失;例如,显微裂纹,金属间化合物显得更大或者剥离5抛光时间过长和软抛光布的使用导致的浮凸6SIC砂纸更换不方便一次制备一个样品通常意味着试样制备会成为一个瓶颈。在质量控制中,生产可能需要等待实验结果,这就意味着亏钱。更进一步讲,这意味着生产能力有限,样品的数量有限不能保证得到一个正确的统计结果,同时样品品质的无规则性会导致测量和评判错误。因此,对于改进现有的样品制备方法,加快制备速度,提高质量,将操作者从枯燥的工作中解放出来,显然会引起很多用户的兴趣。本章描述了一种改进的方法,它非常简单,且在逻辑上能够使特定面的显微切片制样方法更进一步。该改进的方法将会通过电子行业中三种常见的样品来说明芯片级封装CSP,印刷电路板PWB和焊线连接。改进后的方法遵循一个相当直接的样品制备方法首先通过手动研磨将试样研磨到与感兴趣的平面或者其附近相差一个“已知的距离”,然后进行自动抛光,材料的去除量可通过设定机器参数来控制。图3所示是该方法的原理图。尽管第一步仍然是手动研磨,这意味着一次只能制备一个样品,但是剩余的步骤可以通过自动的单点力一次制备多个样品来完成。而且第一步一般非常快,剩下的步骤通常是消耗时间较多的部分。一般而言,自动制备的优点如下1每个试样制备的平均总时间会减少2试样制备结果的质量和一致性将会显著提高3结果不会受操作者经验的影响4试样制备能力显著提高实例1CSP上的锡球制备步骤1对于这类试样,第一步手动研磨的时间长短视操作者的判断而定。如果目标距离镶嵌试样的底部太远,使用更粗的180P180或者240P280粒度的CARBIMET2SIC砂纸均可。如果“已知距离”相对较小,可用320P400粒度的CARBIMET2SIC砂纸替代。通常研磨时间大约23分钟。原理图和试样概貌如图45所示。当研磨到该平面时,在当前的研磨平面上将会出现“下一行”的浅浅的印记,表明目标已经非常接近了见图6。2半自动多试样研磨时通常使用600P1200粒度的CARBIMET2金相砂纸。将四个未完成试样装载在METASEV250/VECTOR研磨/抛光机单点力夹具上。另外,使用ECOMET/AUTOMET250/300研磨/抛光机时,它的6个单点力压头可以同时制备6个试样。延长研磨时间可导致目标丢失。在本例中,工作时间取决于单个试样。图8所示的是试样表面的最终状态。材料的去除通过研磨时间控制,且制备方案可以在下一批试样上重复,因为参数例如压力,速度完全由机器控制。3使用3MMETADI金刚石悬浮液见图9和VERDUTEX或者TRIDENT抛光布进行自动抛光。抛光时间大约3分钟。4使用MASTERPREP和CHEMOMET抛光布进行自动最终抛光。抛光时间不应超过2分钟见图10。金属间化合物层如图1112所示;此外,完整的试样制备方法和参数见表2。实例2PWB上PBSN焊料检测制备步骤1研磨至接近目标区域的时间视操作者的判断而定。在本例中,目标是大约距离边缘3MM左右的第二排焊料。只需要320P400粒度的CARBIMET2的SIC砂纸就足以去除第一排焊料,到达第二排焊料的目标平面。手动研磨时间23分钟。目标平面如图1314所示。第一步完成后,目标平面距离第二排焊料边缘已经很近了。在这时可观察到“第二排”的模糊的痕迹见图15。2将六个未完成试样装载在AUTOMET/ECOMET250研磨/抛光机单点力夹具上见图16。耗材选用600P1200粒度的CARBIMET2。在本例中,期望的停止的平面应该接近焊料的中心。3当完成600P1200粒度的CARBIMET2的研磨步骤后,剩下的抛光步骤会去除表面的变形材料并揭示其真实的显微组织。使用9MMETADI金刚石悬浮液见图17和TRIDENT抛光布进行自动抛光。由于弹性小,这种硬的抛光布能够获得更平整的抛光面。抛光时间大约3分钟。4软且易涂抹的材料如锡基焊料或者铜片通常需要通过金刚石抛光步骤来去掉变形层见图18。传统的氧化铝粉末抛光倾向于获得光泽的表面,但遗憾的是塑性的材料有时会掩盖材料的缺陷例如孔洞或者裂纹。金刚石研磨剂由于具有尖锐的切割边缘,所以能够显示真实的显微组织,因此被认为是最好的替代材料。如果一些小的缺陷不能通过3M抛光来显示,那么增加一步TRIDENT1M金刚石抛光就可解决。5通常情况下,使用MASTERPREP抛光液和CHEMOMET抛光布进行最终抛光;然而,抛光时间不应该超过15分钟。最终的显微组织如图19所示;当制样完成后,一个平面裂纹被显现出来见图20。改进方法的参数如表3所示。实例3铜线焊接连接制备步骤1因为在本实例中“已知距离”只有03MM见图2122,第一步手工研磨SIC砂纸的粒度可以选择更细。通常选用600P1200粒度的CARBIMET2SIC砂纸,它对硅片和铜球的损伤是可接受的。当使用P240或P180的粗的SIC砂纸时,通常易碎的硅片会产生裂纹。第一步最好的状况是刚好碰到铜球的边缘或者显示出铜球4060的面积见图23。研磨时间大概30秒到1分钟,另一个关于本例研磨位置的图示见图24。2将六个未完成试样装载在AUTOMET/ECOMET250研磨/抛光机单点力夹具上进行自动抛光。在大的压力下使用3MMETADI金刚石悬浮液和TRIDENT抛光布能够消除之前制样过程中产生的缺陷并获得一个相当好的抛光结果见图2526。3将98MLMASTERMET和1ML双氧水1ML氨水混合作为用于CHEMOMET抛光布上的特殊的最终抛光液。MASTERMET本身对于有色金属材料具有化学抛光效果,其他的化学物质的加入能够比较有效的促进整个化学抛光过程。抛光结果如图2730所示。完整的试样制备方法和参数见表4。结论回顾以上实例中的试样制备方法,毫无疑问的是,在获得一个完全成功的样品之前,需要对第一步研磨已知的距离有足够的练习。同时需要根据样品的类型和尺寸以及需要磨削的距离,凭借经验来选择合适的砂纸粒度。一般而言,磨削距离大于100M,320P400粒度的CARBIMET2砂纸经过23分钟研磨就能够快速的使磨削面达到分析位置附近。如果磨削距离小于60M,600P1200粒度的CARBIMET2砂纸是最合适的比较安全的选择,尽管其磨削率相对较低。如果磨削距离比上述值更小,需要特别小心以避免过度磨削。如果器件中含有一些非常脆的材料例如GAAS,需选择更细的SIC砂纸以避免灾难性的损坏。研磨时每10秒中在显微镜下检查一次通常是安全的做法。第一步之后,剩下的步骤都是完全自动的。需要做的是先找出正确的参数,但是因为是单点力模式,操作者可非常容易的随时停止机器检查试样。一旦完成该过程,该步骤就能够非常容易的复现。结果是对于每个试样可以最少节省10分钟是可能的,与此同时,样品质量更加均衡,生产能力更高,成本也得到降低。电厂分散控制系统故障分析与处理作者单位摘要归纳、分析了电厂DCS系统出现的故障原因,对故障处理的过程及注意事项进行了说明。为提高分散控制系统可靠性,从管理角度提出了一些预防措施建议,供参考。关键词DCS故障统计分析预防措施随着机组增多、容量增加和老机组自动化化改造的完成,分散控制系统以其系统和网络结构的先进性、控制软件功能的灵活性、人机接口系统的直观性、工程设计和维护的方便性以及通讯系统的开放性等特点,在电力生产过程中得到了广泛应用,其功能在DAS、MCS、BMS、SCS、DEH系统成功应用的基础上,正逐步向MEH、BPC、ETS和ECS方向扩展。但与此同时,分散控制系统对机组安全经济运行的影响也在逐渐增加;因此如何提高分散控制系统的可靠性和故障后迅速判断原因的能力,对机组的安全经济运行至关重要。本文通过对浙江电网机组分散控制系统运行中发生的几个比较典型故障案例的分析处理,归纳出提高分散系统的可靠性的几点建议,供同行参考。1考核故障统计浙江省电力行业所属机组,目前在线运行的分散控制系统,有TELEPERMME、MOD300,INFI90,NETWORK6000,MACS和MACS,XDPS400,A/I。DEH有TOSAMAPGS/C800,DEHIIIA等系统。笔者根据各电厂安全简报记载,将近几年因分散控制系统异常而引起的机组故障次数及定性统计于表1表1热工考核故障定性统计2热工考核故障原因分析与处理根据表1统计,结合笔者参加现场事故原因分析查找过程了解到的情况,下面将分散控制系统异常(浙江省电力行业范围内)而引起上述机组设备二类及以上故障中的典型案例分类浅析如下21测量模件故障典型案例分析测量模件“异常”引起的机组跳炉、跳机故障占故障比例较高,但相对来讲故障原因的分析查找和处理比较容易,根据故障现象、故障首出信号和SOE记录,通过分析判断和试验,通常能较快的查出“异常”模件。这种“异常”模件有硬性故障和软性故障二种,硬性故障只能通过更换有问题模件,才能恢复该系统正常运行;而软性故障通过对模件复位或初始化,系统一般能恢复正常。比较典型的案例有三种(1)未冗余配置的输入/输出信号模件异常引起机组故障。如有台130MW机组正常运行中突然跳机,故障首出信号为“轴向位移大”,经现场检查,跳机前后有关参数均无异常,轴向位移实际运行中未达到报警值保护动作值,本特利装置也未发讯,但LPC模件却有报警且发出了跳机指令。因此分析判断跳机原因为DEH主保护中的LPC模件故障引起,更换LPC模件后没有再发生类似故障。另一台600MW机组,运行中汽机备用盘上“汽机轴承振动高”、“汽机跳闸”报警,同时汽机高、中压主汽门和调门关闭,发电机逆功率保护动作跳闸;随即高低压旁路快开,磨煤机B跳闸,锅炉因“汽包水位低低”MFT。经查原因系1高压调门因阀位变送器和控制模件异常,使调门出现大幅度晃动直至故障全关,过程中引起1轴承振动高高保护动作跳机。更换1高压调门阀位控制卡和阀位变送器后,机组启动并网,恢复正常运行。(2)冗余输入信号未分模件配置,当模件故障时引起机组跳闸如有一台600MW机组运行中汽机跳闸,随即高低压旁路快开,磨煤机B和D相继跳闸,锅炉因“炉膛压力低低”MFT。当时因系统负荷紧张,根据SOE及DEH内部故障记录,初步判断的跳闸原因而强制汽机应力保护后恢复机组运行。二日后机组再次跳闸,全面查找分析后,确认2次机组跳闸原因均系DEH系统三路“安全油压力低”信号共用一模件,当该模件异常时导致汽轮机跳闸,更换故障模件后机组并网恢复运行。另一台200MW机组运行中,汽包水位高值,值相继报警后MFT保护动作停炉。查看CRT上汽包水位,2点显示300MM,另1点与电接点水位计显示都正常。进一步检查显示300MM的2点汽包水位信号共用的模件故障,更换模件后系统恢复正常。针对此类故障,事后热工所采取的主要反事故措施,是在检修中有针对性地对冗余的输入信号的布置进行检查,尽可能地进行分模件处理。(3)一块I/O模件损坏,引起其它I/O模件及对应的主模件故障如有台机组“CCS控制模件故障“及“一次风压高低”报警的同时,CRT上所有磨煤机出口温度、电流、给煤机煤量反馈显示和总煤量百分比、氧量反馈,燃料主控BTU输出消失,F磨跳闸(首出信号为“一次风量低”)。4分钟后CRT上磨煤机其它相关参数也失去且状态变白色,运行人员手动MFT(当时负荷410MW)。经检查电子室制粉系统过程控制站(PCU01柜MOD4)的电源电压及处理模件底板正常,二块MFP模件死机且相关的一块CSI模件(模位153,有关F磨CCS参数)故障报警,拔出检查发现其5VDC逻辑电源输入回路、第4输出通道、连接MFP的I/O扩展总线电路有元件烧坏(由于输出通道至BCS(24VDC),因此不存在外电串入损坏元件的可能)。经复位二块死机的MFP模件,更换故障的CSI模件后系统恢复正常。根据软报警记录和检查分析,故障原因是CSI模件先故障,在该模件故障过程中引起电压波动或I/O扩展总线故障,导致其它I/O模件无法与主模件MFP03通讯而故障,信号保持原值,最终导致主模件MFP03故障(所带AF磨煤机CCS参数),CRT上相关的监视参数全部失去且呈白色。22主控制器故障案例分析由于重要系统的主控制器冗余配置,大大减少了主控制器“异常”引发机组跳闸的次数。主控制器“异常”多数为软故障,通过复位或初始化能恢复其正常工作,但也有少数引起机组跳闸,多发生在双机切换不成功时,如(1)有台机组运行人员发现电接点水位计显示下降,调整给泵转速无效,而CRT上汽包水位保持不变。当电接点水位计分别下降至甲300MM,乙250MM,并继续下降且汽包水位低信号未发,MFT未动作情况下,值长令手动停炉停机,此时CRT上调节给水调整门无效,就地关闭调整门;停运给泵无效,汽包水位急剧上升,开启事故放水门,甲、丙给泵开关室就地分闸,油泵不能投运。故障原因是给水操作站运行DPU死机,备用DPU不能自启动引起。事后热工对给泵、引风、送风进行了分站控制,并增设故障软手操。(2)有台机组运行中空预器甲、乙挡板突然关闭,炉膛压力高MFT动作停炉;经查原因是风烟系统I/O站DPU发生异常,工作机向备份机自动切换不成功引起。事后电厂人员将空预器烟气挡板甲1、乙1和甲2、乙2两组控制指令分离,分别接至不同的控制站进行控制,防止类似故障再次发生。23DAS系统异常案例分析DAS系统是构成自动和保护系统的基础,但由于受到自身及接地系统的可靠性、现场磁场干扰和安装调试质量的影响,DAS信号值瞬间较大幅度变化而导致保护系统误动,甚至机组误跳闸故障在我省也有多次发生,比较典型的这类故障有(1)模拟量信号漂移为了消除DCS系统抗无线电干扰能力差的缺陷,有的DCS厂家对所有的模拟量输入通道加装了隔离器,但由此带来部分热电偶和热电阻通道易电荷积累,引起信号无规律的漂移,当漂移越限时则导致保护系统误动作。我省曾有三台机组发生此类情况(二次引起送风机一侧马达线圈温度信号向上漂移跳闸送风机,联跳引风机对应侧),但往往只要松一下端子板接线(或拆下接线与地碰一下)再重新接上,信号就恢复了正常。开始热工人员认为是端子柜接地不好或者I/O屏蔽接线不好引起,但处理后问题依旧。厂家多次派专家到现场处理也未能解决问题。后在机组检修期间对系统的接地进行了彻底改造,拆除原来连接到电缆桥架的AC、DC接地电缆;柜内的所有备用电缆全部通过导线接地;UPS至DCS电源间增加1台20KVA的隔离变压器,专门用于系统供电,且隔离变压器的输出端N线与接地线相连,接地线直接连接机柜作为系统的接地。同时紧固每个端子的接线;更换部份模件并将模件的软件版本升级等。使漂移现象基本消除。(2)DCS故障诊断功能设置不全或未设置。信号线接触不良、断线、受干扰,使信号值瞬间变化超过设定值或超量程的情况,现场难以避免,通过DCS模拟量信号变化速率保护功能的正确设置,可以避免或减少这类故障引起的保护系统误动。但实际应用中往往由于此功能未设置或设置不全,使此类故障屡次发生。如一次风机B跳闸引起机组RB动作,首出信号为轴承温度高。经查原因是由于测温热电阻引线是细的多股线,而信号电缆是较粗的单股线,两线采用绞接方式,在震动或外力影响下连接处松动引起轴承温度中有点信号从正常值突变至无穷大引起(事后对连接处进行锡焊处理)。类似的故障有民工打扫现场时造成送风机轴承温度热电阻接线松动引起送风机跳闸;轴承温度热电阻本身损坏引起一次风机跳闸;因现场干扰造成推力瓦温瞬间从99突升至117,1秒钟左右回到99,由于相邻第八点已达85,满足推力瓦温度任一点105同时相邻点达85跳机条件而导致机组跳闸等等。预防此类故障的办法,除机组检修时紧固电缆和电缆接线,并采用手松拉接线方式确认无接线松动外,是完善DCS的故障诊断功能,对参与保护连锁的模拟量信号,增加信号变化速率保护功能尤显重要(一当信号变化速率超过设定值,自动将该信号退出相应保护并报警。当信号低于设定值时,自动或手动恢复该信号的保护连锁功能)。(3)DCS故障诊断功能设置错误我省有台机组因为电气直流接地,保安1A段工作进线开关因跳闸,引起挂在该段上的汽泵A的工作油泵A连跳,油泵B连锁启动过程中由于油压下降而跳汽泵A,汽泵B升速的同时电泵连锁启动成功。但由于运行操作速度过度,电泵出口流量超过量程,超量程保护连锁开再循环门,使得电泵实际出水小,B泵转速上升到5760转时突然下降1000转左右(事后查明是抽汽逆止阀问题),最终导致汽包水位低低保护动作停炉。此次故障是信号超量程保护设置不合理引起。一般来说,DAS的模拟量信号超量程、变化速率大等保护动作后,应自动撤出相应保护,待信号正常后再自动或手动恢复保护投运。24软件故障案例分析分散控制系统软件原因引起的故障,多数发生在投运不久的新软件上,运行的老系统发生的概率相对较少,但一当发生,此类故障原因的查找比较困难,需要对控制系统软件有较全面的了解和掌握,才能通过分析、试验,判断可能的故障原因,因此通常都需要厂家人员到现场一起进行。这类故障的典型案例有三种(1)软件不成熟引起系统故障此类故障多发生在新系统软件上,如有台机组80额定负荷时,除DEH画面外所有DCS的CRT画面均死机(包括两台服务器),参数显示为零,无法操作,但投入的自动系统运行正常。当时采取的措施是运行人员就地监视水位,保持负荷稳定运行,热工人员赶到现场进行系统重启等紧急处理,经过30分钟的处理系统恢复正常运行。故障原因经与厂家人员一起分析后,确认为DCS上层网络崩溃导致死机,其过程是服务器向操作员站发送数据时网络阻塞,引起服务器与各操作员站的连接中断,造成操作员站读不到数据而不停地超时等待,导致操作员站图形切换的速度十分缓慢(网络任务未死)。针对管理网络数据阻塞情况,厂家修改程序考机测试后进行了更换。另一台机组曾同时出现4台主控单元“白灯”现象,现场检查其中2台是因为A机备份网停止发送,1台是A机备份网不能接收,1台是A机备份网收、发数据变慢(比正常的站慢几倍)。这类故障的原因是主控工作机的网络发送出现中断丢失,导致工作机发往备份机的数据全部丢失,而双机的诊断是由工作机向备份机发诊断申请,由备份机响应诊断请求,工作机获得备份机的工作状态,上报给服务器。由于工作机的发送数据丢失,所以工作机发不出申请,也就收不到备份机的响应数据,认为备份机故障。临时的解决方法是当长时间没有正确发送数据后,重新初始化硬件和软件,使硬件和软件从一个初始的状态开始运行,最终通过更新现场控制站网络诊断程序予以解决。(2)通信阻塞引发故障使用TELEPERMME系统的有台机组,负荷300MW时,运行人员发现煤量突减,汽机调门速关且CRT上所有火检、油枪、燃油系统均无信号显示。热工人员检查发现机组EHF系统一柜内的I/OBUS接口模件ZT报警灯红闪,操作员站与EHF系统失去偶合,当试着从工作站耦合机进入OS250PC软件包调用EHF系统时,提示不能访问该系统。通过查阅DCS手册以及与SIEMENS专家间的电话分析讨论,判断故障原因最大的可能是在三层CPU切换时,系统处理信息过多造成中央CPU与近程总线之间的通信阻塞引起。根据商量的处理方案于当晚11点多在线处理,分别按三层中央柜的同步模件的SYNC键,对三层CPU进行软件复位先按CPU1的SYNC键,相应的红灯亮后再按CPU2的SYNC键。第二层的同步红灯亮后再按CPU3的同步模件的SYNC键,按3秒后所有的SYNC的同步红灯都熄灭,系统恢复正常。(3)软件安装或操作不当引起有两台30万机组均使用CONDUCTORNT50作为其操作员站,每套机组配置3个SERVER和3个CLIENT,三个CLIENT分别配置为大屏、值长站和操作员站,机组投运后大屏和操作员站多次死机。经对全部操作员站的SERVER和CLIENT进行全面诊断和多次分析后,发现死机的原因是1一台SERVER因趋势数据文件错误引起它和挂在它上的CLIENT在当调用趋势画面时画面响应特别缓慢(俗称死机)。在删除该趋势数据文件后恢复正常。2一台SERVER因文件类型打印设备出错引起该SERVER的内存全部耗尽,引起它和挂在它上的CLIENT的任何操作均特别缓慢,这可通过任务管理器看到DEVEXE进程消耗掉大量内存。该问题通过删除文件类型打印设备和重新组态后恢复正常。3两台大屏和工程师室的CLIENT因声音程序没有正确安装,当有报警时会引起进程CHANGEEXE调用后不能自动退出,大量的CHANGEEXE堆积消耗直至耗尽内存,当内存耗尽后,其操作极其缓慢(俗称死机)。重新安装声音程序后恢复正常。此外操作员站在运行中出现的死机现象还有二种一种是鼠标能正常工作,但控制指令发不出,全部或部分控制画面不会刷新或无法切换到另外的控制画面。这种现象往往是由于CRT上控制画面打开过多,操作过于频繁引起,处理方法为用鼠标打开VMS系统下拉式菜单,RESET应用程序,10分钟后系统一般就能恢复正常。另一种是全部控制画面都不会刷新,键盘和鼠标均不能正常工作。这种现象往往是由操作员站的VMS操作系统故障引起。此时关掉OIS电源,检查各部分连接情况后再重新上电。如果不能正常启动,则需要重装VMS操作系统;如果故障诊断为硬件故障,则需更换相应的硬件。(4)总线通讯故障有台机组的DEH系统在准备做安全通道试验时,发现通道选择按钮无法进入,且系统自动从“高级”切到“基本级”运行,热控人员检查发现GSE柜内的所有输入/输出卡CSEA/CSEL的故障灯亮,经复归GSE柜的REG卡后,CSEA/CSEL的故障灯灭,但系统在重启“高级”时,维护屏不能进入到正常的操作画面呈死机状态。根据报警信息分析,故障原因是系统存在总线通讯故障及节点故障引起。由于阿尔斯通DEH系统无冗余配置,当时无法处理,后在机组调停时,通过对基本级上的REG卡复位,系统恢复了正常。(5)软件组态错误引起有台机组进行1中压调门试验时,强制关闭中间变量IV1RCO信号,引起14中压调门关闭,负荷从198MW降到34MW,再热器压力从204MP升到40MPA,再热器安全门动作。故障原因是厂家的DEH组态,未按运行方式进行,流量变量本应分别赋给IV1RCOIV4RCO,实际组态是先赋给IV1RCO,再通过IV1RCO分别赋给IV2RCOIV4RCO。因此当强制IV1RCO0时,所有调门都关闭,修改组态文件后故障消除。25电源系统故障案例分析DCS的电源系统,通常采用11冗余方式(一路由机组的大UPS供电,另一路由电厂的保安电源供电),任何一路电源的故障不会影响相应过程控制单元内模件及现场I/O模件的正常工作。但在实际运行中,子系统及过程控制单元柜内电源系统出现的故障仍为数不少,其典型主要有(1)电源模件故障电源模件有电源监视模件、系统电源模件和现场电源模件3种。现场电源模件通常在端子板上配有熔丝作为保护,因此故障率较低。而前二种模件的故障情况相对较多1)系统电源模件主要提供各不同等级的直流系统电压和I/O模件电压。该模件因现场信号瞬间接地导致电源过流而引起损坏的因素较大。因此故障主要检查和处理相应现场I/O信号的接地问题,更换损坏模件。如有台机组负荷520MW正常运行时MFT,首出原因“汽机跳闸“。CRT画面显示二台循泵跳闸,备用盘上循泵出口阀86信号报警。5分钟后运行巡检人员就地告知循泵A、B实际在运行,开关室循泵电流指示大幅晃动且A大于B。进一步检查机组PLC诊断画面,发现控制循泵A、B的二路冗余通讯均显示“出错”。43分钟后巡检人员发现出口阀开度小就地紧急停运循泵A、B。事后查明A、B两路冗余通讯中断失去的原因,是为通讯卡提供电源支持的电源模件故障而使该系统失电,中断了与PLC主机的通讯,导致运行循泵A、B状态失去,凝汽器保护动作,机组MFT。更换电源模件后通讯恢复正常。事故后热工制定的主要反事故措施,是将两台循泵的电流信号由PLC改至DCS的CRT显示,消除通信失去时循泵运行状态无法判断的缺陷;增加运行泵跳闸关其出口阀硬逻辑(一台泵运行,一台泵跳闸且其出口阀开度30度,延时15秒跳运行泵硬逻辑;一台泵运行,一台泵跳闸且其出口阀开度0度,逆转速动作延时30秒跳运行泵硬逻辑);修改凝汽器保护实现方式。2)电源监视模件故障引起电源监视模件插在冗余电源的中间,用于监视整个控制站电源系统的各种状态,当系统供电电压低于规定值时,它具有切断电源的功能,以免损坏模件。另外它还提供报警输出触点,用于接入硬报警系统。在实际使用中,电源监视模件因监视机箱温度的2个热敏电阻可靠性差和模件与机架之间接触不良等原因而故障率较高。此外其低电压切断电源的功能也会导致机组误跳闸,如有台机组满负荷运行,BTG盘出现“CCS控制模件故障”报警,运行人员发现部分CCS操作框显示白色,部分参数失去,且对应过程控制站的所有模件显示白色,6S后机组MFT,首出原因为“引风机跳闸”。约2分钟后CRT画面显示恢复正常。当时检查系统未发现任何异常(模件无任何故障痕迹,过程控制站的通讯卡切换试验正常)。机组重新启动并网运行也未发现任何问题。事后与厂家技术人员一起专题分析讨论,并利用其它机组小修机会对控制系统模拟试验验证后,认为事件原因是由于该过程控制站的系统供电电压瞬间低于规定值时,其电源监视模件设置的低电压保护功能作用切断了电源,引起控制站的系统电源和24VDC、5VDC或15VDC的瞬间失去,导致该控制站的所有模件停止工作(现象与曾发生过的24VDC接地造成机组停机事件相似),使送、引风机调节机构的控制信号为0,送风机动叶关闭(气动执行机构),引风机的电动执行机构开度保持不变(保位功能),导致炉膛压力低,机组MFT。(2)电源系统连接处接触不良此类故障比较典型的有1)电源系统底板上5VDC电压通常测量值在510520VDC之间,但运行中测量各柜内进模件的电压很多在5V以下,少数跌至476VDC左右,引起部分I/O卡不能正常工作。经查原因是电源底板至电源母线间连接电缆的多芯铜线与线鼻子之间,表面上接触比较紧,实际上因铜线表面氧化接触电阻增加,引起电缆温度升高,压降增加。在机组检修中通过对所有5VDC电缆铜线与线鼻子之间的焊锡处理,问题得到解决。2)MACSDCS运行中曾在两个月的运行中发生2M801工作状态显示故障而更换了13台主控单元,但其中的多数离线上电测试时却能正常启动到工作状态,经查原因是原主控5V电源,因线损和插头耗损而导致电压偏低;通过更换主控间的冗余电缆为预制电缆;现场主控单元更换为2M801ED01,提升主控工作电源单元电压至525V后基本恢复正常。3)有台机组负荷135MW时,给水调门和给水旁路门关小,汽包水位急速下降引发MFT。事后查明原因是给水调门、给水旁路门的端子板件电源插件因接触不良,指令回路的24V电源时断时续,导致给水调门及给水旁路门在短时内关下,汽包水位急速下降导致MFT。4)有台机组停炉前,运行将汽机控制从滑压切至定压后,发现DCS上汽机调门仍全开,主汽压力4260KPA,SIP上显示汽机压力下降为1800KPA,汽机主保护未动作,手动拍机。故障原因系汽机系统与DCS、汽机显示屏通讯卡件BOX1电源接触点虚焊、接触不好,引起通讯故障,使DCS与汽机显示屏重要数据显示不正常,运行因汽机重要参数失准手动拍机。经对BOX1电源接触点重新焊接后通讯恢复。5)循泵正常运行中曾发出2UPS失电报警,20分钟后对应的3、4循泵跳闸。由于运行人员处理及时,未造成严重后果。热工人员对就地进行检查发现2UPS输入电源插头松动,导致2UPS失电报警。进行专门试验结果表明,循泵跳闸原因是UPS输入电源失去后又恢复的过程中,引起PLC输入信号抖动误发跳闸信号。(3)UPS功能失效有台机组呼叫系统的喇叭有杂音,通信班人员关掉该系统的主机电源查原因并处理。重新开启该主机电源时,呼叫系统杂音消失,但集控室右侧CRT画面显示全部失去,同时MFT信号发出。经查原因是由于呼叫系统主机电源接至该机组主UPS,通讯人员在带载合开关后,给该机组主UPS电源造成一定扰动,使其电压瞬间低于195V,导致DCS各子系统后备UPS启动,但由于BCS系统、历史数据库等子系统的后备UPS失去带负荷能力(事故后试验确定),造成这些系统失电,所有制粉系统跳闸,机组由于“失燃料”而MFT。(4)电源开关质量引起电源开关故障也曾引起机组多次MFT,如有台机组的发电机定冷水和给水系统离线,汽泵自行从“自动”跳到“手动”状态;在MEH上重新投入锅炉自动后,汽泵无法增加流量。1分钟后锅炉因汽包水位低MFT动作。故障原因经查是DCS给水过程控制站二只电源开关均烧毁,造成该站失电,导致给水系统离线,无法正常向汽泵发控制信号,最终锅炉因汽包水位低MFT动作。26SOE信号准确性问题处理一旦机组发生MFT或跳机时,运行人员首先凭着SOE信号发生的先后顺序来进行设备故障的判断。因此SOE记录信号的准确性,对快速分析查找出机组设备故障原因有着很重要的作用。这方面曾碰到过的问题有(1)SOE信号失准由于设计等原因,基建接受过来的机组,SOE信号往往存在着一些问题(如SOE系统的信号分辨力达不到指标要求却因无测试仪器测试而无法证实,信号源不是直接取自现场,描述与实际不符,有些信号未组态等等),导致SOE信号不能精确反映设备的实际动作情况。有台机组MFT时,光字牌报警“全炉膛灭火”,检查DCS中每层的3/4火检无火条件瞬间成立,但SOE却未捉捕到“全炉膛灭火”信号。另一台机组MFT故障,根据运行反映,首次故障信号显示“全炉膛灭火”,同时有“DCS电源故障”报警,但SOE中却未记录到DCS电源故障信号。这使得SOE系统在事故分析中的作用下降,增加了查明事故原因的难度。为此我省各电厂组织对SOE系统进行全面核对、整理和完善,尽量做到SOE信号都取自现场,消除SOE系统存在的问题。同时我们专门开发了SOE信号分辨力测试仪,经浙江省计量测试院测试合格后,对全省所属机组SOE系统分辨力进行全部测试,掌握了我省DCS的SOE系统分辨力指标不大于1MS的有四家,接近1MS的有二家,4MS的有一家。(2)SOE报告内容凌乱某电厂两台30万机组的INFI90分散控制系统,每次机组跳闸时生成的多份SOE报告内容凌乱,启动前总是生成不必要的SOE报告。经过1)调整SEM执行块参数,把触发事件后最大事件数及触发事件后时间周期均适当增大。2)调整DSOEPOINT清单,把每个通道的SIMPLETRIGGER由原来的BOTH改为0TO1,RECORDABLEEVENT。3)重新下装SEM组态后,问题得到了解决。(3)SOE报表上出现多个点具有相同的时间标志对于INFI90分散控制系统,可能的原因与处理方法是1)某个SET或SED模件被拔出后在插入或更换,导致该子模件上的所有点被重新扫描并且把所有状态为1的点(此时这些点均有相同的跳闸时间)上报给SEM。2)某个MFP主模件的SOE缓冲区设置太小产生溢出,这种情况下,MFP将会执行内部处理而复位SOE,导致其下属的所有SET或SED子模件中,所有状态为1的点(这些点均有相同跳闸时间)上报给了SEM模件。处理方法是调整缓冲区的大小(其值由FC241的S2决定,一般情况下调整为100)。3)SEM收到某个MFP的事件的时间与事件发生的时间之差大于设定的最大等待时间由FC243的S5决定,则SEM将会发一个指令让对应的MFP执行SOE复位,MFP重新扫描其下属的所有SOE点,且将所有状态为1的点(这些点均有相同的跳闸时间)上报给SEM,。在环路负荷比较重的情况下(比如两套机组通过中央环公用一套SEM模件),可适当加大S5值,但最好不要超过60秒。27控制系统接线原因控制系统接线松动、错误而引起机组故障的案例较多,有时此类故障原因很难查明。此类故障虽与控制系统本身质量无关,但直接影响机组的安全运行,如(1)接线松动引起有台机组负荷125MW,汽包水位自动调节正常,突然给水泵转速下降,执行机构开度从64关至5左右,同时由于给水泵模拟量手站输出与给水泵液偶执行机构偏差大(大于10自动跳出)给水自动调节跳至手动,最低转速至1780RPM,汽包水位低低MFT动作。原因经查是因为给水泵液偶执行机构与DCS的输出通道信号不匹配,在其之间加装的信号隔离器,因24VDC供电电源接线松动失电引起。紧固接线后系统恢复正常。事故后对信号隔离器进行了冗余供电。(2)接线错误引起某2机组出力300MW时,2B汽泵跳闸无跳闸原因首出、无大屏音响报警,机组RB动作,2E磨联锁跳闸,电泵自启,机组被迫降负荷。由于仅有ETS出口继电器动作记录,无2B小机跳闸首出和事故报警,且故障后的检查试验系统都正常,当时原因未查明。后机组检修复役前再次发生误动时,全面检查小机现场紧急跳闸按钮前接的是电源地线,跳闸按钮后至PLC,而PLC后的电缆接的是220V电源火线,拆除跳闸按钮后至PLC的电缆,误动现象消除,由此查明故障原因是是跳闸按钮后至PLC的电缆发生接地,引起紧急跳闸系统误动跳小机。(3)接头松动引起一台机组备用盘硬报警窗处多次出现“主机EHC油泵2B跳闸”和“开式泵2A跳闸”等信号误报警,通过CRT画面检查发现PLC的A路部分I/O柜通讯时好时坏,进一步检查发现机侧PLC的3A、4、5A和6的4个就地I/O柜二路通讯同时时好时坏,与此同时机组MFT动作,首出原因为汽机跳闸。原因是通讯母线B路在PLC4柜内接头和PLC5、PLC4柜本身的通讯分支接头有轻微松动,通过一系列的紧固后通讯恢复正常。针对接线和接头松动原因引起的故障,我省在基建安装调试和机组检修过程中,通过将手松拉接线以以确认接线是否可靠的方法,列入质量验收内容,提高了接线质量,减少了因接线质量引起的机组误动。同时有关电厂制定了热工控设备通讯电缆随机组检修紧固制度,完善控制逻辑,提高了系统的可靠性。28控制系统可靠性与其它专业的关系需要指出的是MFT和ETS保护误动作的次数,与有关部门的配合、运行人员对事故的处理能力密切相关,类似的故障有的转危为安,有的导致机组停机。一些异常工况出现或辅机保护动作,若运行操作得当,本可以避免MFT动作(如有台机组因为给煤机煤量反馈信号瞬时至零,30秒后逻辑联锁磨煤机热风隔离挡板关闭,引起一次风流量急降和出口风温持续下跌,热风调节挡板自动持续开至100,冷风调节挡板由于前馈回路的作用而持续关小,使得一次风流量持续下降。但由于热风隔离挡板有卡涩,关到位信号未及时发出,使得一次风流量小至造成磨煤机中的煤粉积蓄,第5分钟时运行减少了约10的煤量,约6分钟后热风隔离挡板突然关到位,引起一次风流量的再度急剧下降,之后按设计连锁逻辑,冷风隔离挡板至全开,使得一次风流量迅速增大,并将磨煤机C中的蓄煤喷向炉膛,造成锅炉燃烧产生局部小爆燃,引风机自动失控于这种异常情况,在三个波的扰动后(约1分钟),炉膛压力低低MFT。当时MFT前7分钟的异常工况运行过程中,只要停运该台磨煤机就可避免MFT故障的发生)。此外有关部门与热工良好的配合,可减少或加速一些误动隐患的消除;因此要减少机组停组次数,除热工需在提高设备可靠性和自身因素方面努力外,还需要热工和机务的协调配合和有效工作,达到对热工自动化设备的全方位管理。需要运行人员做好事故预想,完善相关事故操作指导,提高监盘和事故处理能力。3提高热工自动化系统可靠性的建议随着热工系统覆盖机、电、炉运行的所有参数,监控功能和范围的不断扩大以及机组运行特点的改变和DCS技术的广泛应用,热控自动化设备已由原先的配角地位转变为决定机组安全经济运行的主导因素,其任一环节出现问题,都有导致热控装置部分功能失效或引发系统故障,机组跳闸、甚至损坏主设备的可能。因此如何通过科学的基础管理,确保所监控的参数准确、系统运行可靠是热工安全生产工作中的首要任务。在收集、总结、吸收同仁们自动化设备运行检修、管理经验和保护误动误动原因分析的基础上,结合热工监督工作实践,对提高热工保护系统可靠性提出以下建议,供参考31完善热工自动化系统(1)解决操作员站电源冗余问题过程控制单元柜的电源系统均冗余配置,但所有操作员站的电源通常都接自本机组的大UPS,不提供冗余配置。如果大UPS电压波动,将可能引起所有操作员站死机而不得不紧急停运机组,但由于死机后所有信号都失去监视,停机也并非易事。为避免此类问题发生,建议将每台机组的部份操作员站与另一台机组的大UPS交叉供电,以保证当本机大UPS电压波动时,仍有2台OIS在正常运行。(2)对硬件的冗余配置情况进行全面核查,重要保护信号尽可能采取三取二方式,消除同参数的多信号处理和互为备用设备的控制回路未分模件、分电缆或分电源(对互为备用的设备)现象,减少一模件故障引起保护系统误动的隐患。(3)做好软报警信号的整理一台600MW机组有近万个软报警点,这些软报警点往往未分级处理,存在许多描述错误,报警值设置不符设计,导致操作画面上不断出现大量误报警,使运行人员疲倦于报警信号,从而无法及时发现设备异常情况,也无法通过软报警去发现、分析问题。为此组织对软报警点的核对清理,整理并修改数据库里软报警量程和上、下限报警值;通过数据库和在装软件逻辑的比较,矫正和修改错误描述,删除操作员站里重复和没有必要的软报警点,对所有软报警重新进行分组、分级,采用不同的颜色并开通操作员站声音报警,进行报警信号的综合应用研究,使软报警在运行人员监盘中发挥作用。(4)合理设置进入保护联锁系统的模拟量定值信号故障诊断功能的处理,如信号变化速率诊断处理功能的利用,可减少因接线松动、干扰信号或设备故障引起的信号突变导致系统故障的发生,未设置的应增加设置。(5)继续做好热工设备电源回路的可靠性检查工作,对重要的保护装置及DCS、DEH系统,定期做好电源切换试验工作,减少或避免由于电源系统问题引起机组跳机等情况发生。(6)加强对测量设备现场安装位置和测量管路敷设的检查,消除不满足规程要求隐患,避免管路积水和附加的测量误差,导致机组运行异常工况的再次发生。(7)加强对电缆防损、和敷设途径的防火、防高温情况检查,不符要求处要及时整改,尤其是燃机机组,要避免因烟道漏气烧焦电缆,导致跳机故障的发生。(8)电缆绝缘下降、接线不规范(松动、毛刺等)、通讯电缆接头松动、信号线拆除后未及时恢复等,引起热工系统异常情况的屡次发生,表明随着机组运行时间的延伸,电缆原先紧固的接头和接线,可能会因气候、氧化等因素而引起松动,电缆绝缘可能会因老化而下降。为避免此类故障的发生,各电厂应将热工重要系统电缆的绝缘测量、电缆接线和通讯电缆接头紧固、消除接线外露现象等,列入机组检修的热工常规检修项目中,并进行抽查验收,对所有接线用手松拉,确认接线紧固,消除接线松动而引发保护系统误动的隐患。(9)开展热工保护、连锁信号取样点可靠性、保护逻辑条件及定值合理性的全面梳理评估工作,经过论证确认,进行必要的整改,(如给泵过量程信号设计为开再循环门的,可能会引起系统异常,应进行修改)。完善机组的硬软报

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论