华为基站故障处理实例_第1页
华为基站故障处理实例_第2页
华为基站故障处理实例_第3页
华为基站故障处理实例_第4页
华为基站故障处理实例_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、5.2.3华为基站故障处理实例1. 天馈连接鸳鸯线导致扩容载频后话务量减小现象描述:反映某312 基站第二小区话务量减小,该站话务量减小是从扩容后,原来是一个载频,采用一个CDU ,扩容后加了一块载频,同时将CDU 更换为EDU ,至此话务量急剧下降,连续3 天话务量不足原来的1/4 ,用户怀疑是覆盖范围减小。告警信息:在告警台中观察不到任何关于该基站的告警,单板指示灯和运行状态均正常。原因分析:由于用户增加了一块载频,该基站下的四块载频变为五块,但是PSU 单板只用两块,所以初步分析可能由以下原因造成话务量减小:1 PSU 单板不够用,由于每两块TRX 需要一个PSU ,所以有可能是这个原因

2、所致;2 新更换的EDU 有问题;3 扩容时连接跳线时接头没有连接牢靠,造成驻波比过大;4 小区的天馈连接错误。处理过程:现场检查数据,没有任何问题,观察话统,发现的确从扩容后话务量就一直维持在1ERL 左右,没有异常告警。到达现场后加入一块PSU 板,通过话统对该小区进行测量报告数量的测量,发现很少,话务量没有提高,将 1 、2 小区的EDU 更换,现象依旧,仔细检查TRX 和EDU 之间的连线,也没有错误,又检查天馈连线,发现第二小区的EDU 的第二个发射端口TX/RX_ANTB 错误的连接到第一小区天线的发端口,这样以来,第二小区的BCCH 和TCH 是通过不同的天线发出去的,造成可能指

3、配信道所在的载频信号很弱,进而发生切换或掉话,切分集接收也不正确,所以造成该小区吸收不了话务量。将小区天线重新连接,二小区的话务量立刻提升了。建议与总结:扩容,更换硬件时一定要信心连接线缆,避免连成鸳鸯线,交叉线,如果连接错误通常不会产生告警,故障比较隐蔽,同时会造成一些切换,掉话,话务量上不去的现象。2. 数据配置不当导致BTS3006A 在市电掉后出现非主BCCH 载频退服现象描述:某基站业务信道可用率突然下降,严重影响了考核指标。告警信息:市电掉告警,PSU 保护,扩展C3 。原因分析:由于TCH 可用率(% =TCH 可用数目/ (1800/1900 小区TCH 配置数目+900/85

4、0 小区TCH 配置数目所以到局里采集TCH 性能测量分析,发现有几个基站在7 :30 左右小区TCH 可用数目比实际配置的数据少了8 个,该基站配置为S2/2 ,也就是少了一个载频的TCH 信道。查看相应的历史告警,发现该基站在7 :30 左右上报了市电掉,PSU 保护,扩展C3 等告警,初步定位为该基站在市电掉后非主BCCH 退服,但是局方配置的是800AH 的蓄电池,应该够我们基站正常工作了。造成非主BCCH 退服的原因有:1 TRX 驻波过大,造成TRX 关功放(TCH 载频可能性较小;2 人工闭塞TRX ;3 TRX 硬件故障;4 数据配置不当。处理过程:1 告警台查看小区历史告警,

5、没有驻波告警,只有基站市电掉告警;2 维护台查看基站单板工作状态,此时市电已有,所有工作状态正常,为解闭状态,与硬件上应该没有什么关系;3 怀疑数据配置问题,检查数据配置,发现每块载频的设备属性中都有一个可关闭的选项,该选项用于控制BSC 在基站掉电进入蓄电池供电模式时是否自动关闭此载频的功放以省电;4 把非主BCCH 载频的可关闭选项去掉,基站在市电掉后非主BCCH 载频靠蓄电池供电工作正常。建议与总结:由于BTS3006A 是室外型基站,会上报市电掉告警,系统根据上报的市电掉告警和载频设备属性的可关闭配置,判断是否关闭该载频。3. 门磁告警风扇告警直流欠压问题处理现象描述:某BTS312

6、基站,配置为S3/2/1 ,4 块PSU ,一块PMU ,告警台提示PMU 门磁告警、风扇告警、直流欠压,PMU 单板ALM 指示灯显示红色常亮,其它单板指示灯正常,业务正常。告警信息:PMU 门磁告警、风扇告警、直流欠压。原因分析:门磁告警可能的原因:1 机柜被打开;2 蓄电池柜门被打开;3 门磁传感器损坏或传感器连接电缆故障。风扇告警可能的原因:1 风扇故障;2 风扇与PMU 背板PWB 连接故障。直流欠压告警可能原因:1 直流输出(即母排电压低于22.5V ;2 电源模块故障或负载过重。处理过程:首先,检查门磁传感器损坏或传感器连接电缆,正常。然后更换风扇,风扇告警依旧,排除是风扇故障;

7、将风扇与PWB 板连接的端子短接,风扇告警依然没有消除,排除风扇与PMU 背板PWB 连接故障。测量母排电压为26V 。能引起这三种告警可能的原因一一排除,于是怀疑是PMU 单板故障,更换PMU 单板后,故障依旧,于是决定更换PMU 、PSU 单板的背板PWB 尝试一下,断站更换PWB 板,基站重新上电初始化后,PMU 门磁告警、风扇告警、直流欠压告警全部消失。建议与总结:PWB 板故障、PWB 与CMB 的连线或CBUS 总线故障都有可能引起PMU 单板告警,我们在处理时要具体问题具体分析。另外电源背板故障还能导致PMU 出现“机柜浸水”和“机柜烟雾”误告警。4. 环境告警接头导致CDU 单

8、板通信告警现象描述:某基站雷击后基站中断,更换TRX 后基站可以正常工作,但出现 2 小区两块CDU 有单板通信告警。该基站为BTS312 基站,站型为S(1/2/0 。使用扩展告警上报停电告警和环境告警。告警信息:小区两块CDU 有单板通信告警。现场更换 2 小区两块CDU ,加电后,发现所有CDU 、PMU 、PSU 都单板通信告警。原因分析:一般单板通信告警问题产生的主要原因有:1 、如果是某一块单板通信告警,可能是单板故障或与总线连接处有问题,可以更换单板和拔插单板。2 、如果是几块单板通信告警,可能原因有:1 TMU 、TDU 损坏;2 某一单板故障或某一端口异常造成总线吊死;3 总

9、线故障;4 机柜顶部匹配头故障;5 数据配置和实际不一致;6 机柜拨码开关不对。本基站故障为由于雷击后扩展告警端口异常,造成总线吊死,导致CDU 单板通信告警。处理过程: 1 、因为椐用户介绍,该基站遭雷击,因此首先怀疑CDU 单板故障,现场更换 2 小区两块CDU ,加电后,发现所有CDU 、PMU 、PSU 都单板通信告警;2 、此时判断问题可能和总线有关,TMU 板更换后,故障依旧。打开后门观察TDU ,运行灯正常,本着先简后繁的原则没有立即更换TDU ,怀疑是CDU 面板上CBUS 插头短路,取掉所有CDU 的CBUS 插头,拔出PMU 板,故障依旧;3 、将CDU 和PMU 恢复,拔

10、掉机柜顶部DCF 匹配头,故障依旧。最后拔掉停电告警接头和环境告警接头,所有通信告警消失;4 、重新接上扩展告警,没有告警产生,故障排除。建议与总结:现场处理基站单板通信故障时最好结合原理分析各种可能性,按照先简后繁操作。5. 传输地和基站地存在压差导致传输不稳现象描述:某基站没有任何告警,但是传输不稳,时断时续,时好时坏,BSC 侧BIE 灯有时亮,有时一秒闪,有时候又灭。传输好的时候,通过远端维护台查询基站单板状态,反应明显迟缓;传输不好的时候,基站不断初始化,但总是无法完成,显示通信超时。告警信息:无。原因分析:传输地跟基站地之间存在压差,会导致传输严重不稳,基站无法正常工作。处理过程:

11、首先怀疑传输问题,对BSC 、BTS 自环,无误;然后怀疑是基站问题,更换了所有有关的板子,故障依旧。这样,排除了基站本身的故障,定位问题在传输上。再次对BSC 、BTS 自环,结果时好时坏,用传输误码仪测误码,发现基站侧传输线自环后,观察20 分钟,没有误码,但是一旦接上基站,误码率很大。问题比较奇怪。根据实际情况和故障现象,最后测量了传输地跟基站地之间的电阻,大约为15 左右欧姆,这样造成两地之间存在了一个将近8 伏的压差。将传输地与基站地短接起来。一切恢复正常。6. TRX 与TMU 版本不一致导致基站GPRS 业务无法进行现象描述:在基站覆盖区域手机语音业务正常,但GPRS 业务无法进

12、行。告警信息:无告警。原因分析:1 、在PCU 中未设置小区数据,没有开通小区的GPRS 业务;2 、在BSC 数据配置中,没有配置小区静态和动态的PDCH 信道;3 、基站的各单板单板版本不一致,导致基站工作不正常,影响数据业务;4 、手机没有开通GPRS 业务,或不支持GPRS 业务。处理过程:1 、确认用户手机支持并已开通GPRS 业务;2 、在PCU 维护台上查看小区数据,已配置GPRS 业务数据,小区状态正常;3 、在BSC 维护台上查看小区数据,确认小区配置了至少一条静态的PDCH 信道;4 、在基站维护台上查看基站数据,发现TRX 与TMU 版本不一致,给TRX 升级后业务正常。

13、建议与总结:这个问题其实是可以避免的。只是由于我们在数据设定时没有按照基站升级规范把这个站的自动激活开关打开,使得基站的TMU 和TRX 版本保持一致。现在回头思考一下,为我们在以后的工作中敲响警钟,任何一个小的操作失误都可以给客户带来损失!7. TDU 问题导致312 基站的TMU45 扩展告警不能上传现象描述:某局反映某312 基站停电告警不能上传,在现场反复做停电告警测试,都没有上报告警。告警信息:无。原因分析:1 、告警数据(电平定义字设定错误;2 、该路扩展告警在TDU 上的管脚接错;3 、告警线不通;4 、配电柜的干节点吸合器不能正常工作;5 、TDU 故障。处理过程:1 、首先检

14、查告警数据设定,定义为低电平告警。与基站版本(04.1130 匹配;2 、现场检查告警线的焊接,接在20 和27 两个管脚是正确的;3 、用万用表测量告警线的是否导通,正常;4 、将告警线的干节点端子接到配电柜的对应端子上,进行停电告警测试,断开市电后,告警线上电压为0 ,市电供电时,告警线有5V 的高电平,说明配电柜能够正常判断市电的供给情况;5 、取下机顶的DB37 告警插头,测量TDU 的20 和27 管脚,发现只有2.4V 的模拟电压,问题就出在这里了。正常情况下,该端子应该有5V 的模拟电压,2.4V 的模拟电压是不能将停电告警上报给BSC 告警台的。骤进行更换TDU 处理。更换后测

15、量TDU 的两个管脚,有5V 的模拟量。进行停电测试,告警正常上报,问题解决。建议与总结:遇到难以定位的问题,找出问题的主要方面,列出可能的原因。按照由易到难的顺序,逐一进行排除。直至问题解决。8. PSU 插框故障导致BTS3006A 误报蓄电池熔丝断告警现象描述:某局新开BTS3006A 基站,一周过后基站上报蓄电池熔丝断告警。告警信息:蓄电池熔丝断告警。原因分析:因为BTS3006A 基站配置了外置蓄电池,接线通路是蓄电池-蓄电池熔丝-EMI -PSU(BAT-LOAD -基站负载。在熔丝的后端采用一根电缆来采集电压信息,当电压低于6V 的时候就上报蓄电池熔丝断告警,从上报告警信息的角度

16、来看有两种可能:1 、蓄电池熔丝坏;2 、在市电掉电的情况下,蓄电池放电到保护状态;3 、蓄电池到熔丝处的动力电缆故障;4 、告警线故障或告警感应器故障。处理过程:1 、拆开熔丝腔前盖,检查信号线和电池电源线连接正常;2 、查询站点交流电压230V ,直流电压27.1 ,负载电流19.8 ,电池电流0.6A ,为正常状态;3 、断掉交流,直接让蓄电池供电,测试直流电压为27.1V ,在PMU 显示屏上查看负载电流19.8A ,蓄电池供电正常;4 、去掉熔丝,将熔丝告警采集线直接接到背板的LOAD 处,PMU 仍然上报熔丝断告警;5 、由于告警线是由PMU 背板到插框里面,无法打开PMU 插框,

17、于是更换插框;6 、更换插框,故障解决。9. BTS312 基站遭受雷击导致断站现象描述:客户反馈有一个基站在前天出现打雷后中站,无法维护,业务不能进行。告警信息:基站在断站前出现TMU 时钟告警,然后就报LAPD_OML 故障告警。原因分析:据用户和维护人员放映的情况,断站前晚发生打雷闪电,因此初步分析可能产生这种情况的原因是雷击导致单板硬件故障。处理过程:1 、TMU 备板到位,实施更换;2 、更换TMU 后,BSC 和基站通信正常;3 、此时基站上报 TRX 通信告警, TRX 主时钟告警, TRX 处理器运行告警,帧和时隙告警以 及三路环境告警(远程门控告警,交流停电告警和空调室外机防

18、盗告警); 4 、由于现场没有 TRX 备板,所以没有更换 TRX 备板; 5 、因为和时钟有关的是 TMU 和 TDU 两块单板,所以在刚更换了 TMU 的情况下定位 TDU 单 板故障; 6 、 TDU 备板到位,现场工程师到站点实施更换; 7 、更换 TDU 后,整个基站恢复正常工作,有两个 TRX 正常,还有一个 TRX 有问题; 8 、把好的 TRX 和有问题的 TRX 更换,但是有问题的 TRX 还是没起来,推断该 TRX 硬件故 障,需要申请备板更换。 建议与总结:雷击分析,通过在基站现场的考察和分析,引入基站的线有四种, 1 ,天线溃线, 2 , 传输线, 3 ,电源线, 4

19、,环境监控。通过三个基站的现场观察,问题具有普遍性,都是由于现场简易 环境监控器和华为 BTS 的连接是直接的,并无任何防雷装置,考虑到该基站地势较高,很容易遭受雷击, 在未加任何防雷措施情况下,通过环境监控系统的感应雷击信号将直接造成与之连接的 TDU 、 TRX 单 板损坏。眉山是个多雷区建议在尽快把环境监控器和 BTS 之间尽快安装防雷器。基站环境监控仪通过一 根通信线缆连接到 BTS3X 基站机顶的 EAC 端口,实现通信。为了保护基站,通信线连到基站上时必须 先经过 EAC 信号避雷器或者防护头。 10BTS3006A 时钟选择拨码开关设置错误导致 TRX 反复加载 现象描述:某地新

20、上一套 BTS3006A 室外型宏基站,安装完毕、传输调通、数据配置完全正确并且 按照正常流程加电后, TMU 板指示灯正常,但 TRX 载频板反复加载数据,并且都不成功,操作维护终 端可看到 TRX 单板软件加载进度指示条反复出现, TRX 无法正常工作。 告警信息: TRX 主时钟告警; TRX 单板通信告警; TRX 时钟严重告警; TRX 处理器运行告 警。 原因分析:由于此现象是所有 TRX 同时出现,故排除 TRX 单板故障,问题可能出在数据和时钟 总线上,现场更换了一块 TMU 单板,问题依旧, TMU 单板拨码开关均设置正确,再通过告警基本定位 问题在时钟总线上。处理过程:由于

21、 3006A 没有设置 TDU 单板,现场查询到在机柜 TCB 背板上有一 组位置序号为 S7 的八位拨码开关, 名称为基站时钟选择开关, 按照指导正常情况下应该将 S7 的 1 4 位设置为全 ON , 5 8 位任意,全 ON 的意思为 TMU 产生的时钟不经过 TCU 驱动直接送给 TRX ,现场检查开关设置,发现 S7 八位开关全部设为 OFF ,将拨码开关拨到全 ON 后故障消失,载 频板加载数据正常,开通后拨测一切正常,此拨码开关的位置比较隐蔽,在 TMU 板和 TCU 板之间的一 个假面板正背后的背板上,背板上此开关名称为 clock select 。最终确认 TRX 反复加载的

22、问题出在时钟 选择拨码开关的设置有误上。 11BTS3006A TCB 拨码开关设置不当导致基站误报热交换器故障 告警现象描述:某局 BTS3006A 出现载频反复加载情况,告警台显示时钟异常,更换 TCU ,故障 依旧,更换 TCB ,时钟告警消失,但是同时出现了热交换器故障告警。 告警信息:告警名称:热交换器故障告警; 告警解释: 1 、热交换器工作异常; 2 、热交换器无交流; 3 、热交换器无直流; 4 、交流缺相; 告警处理: 1 、检测热交换器工作状况; 2 、检查交流输入情况; 3 、检查直流输入情况。 原因分析:到达现场,观察热交换器的运行状态,风机运行正常,指示灯为绿灯慢闪,

23、红灯处于熄 灭状态,表示热交换器处于正常工作状态。用 HEXTest 调试软件跟踪热交换器数据,也无异常产生。打 开后门,检查线缆也无异常。初步定位该告警为误告警。 处理过程: 1 、观察热交换器的运行指示灯,测试热交换器的交直流情况,工作正常; 2 、用 HEXTest 调试软件跟踪热交换器数据,也无异常产生; 3 、用表测试热交换器与 TMU 的通信电缆,结果正常; 4 、打开后门检查线缆连接情况,正常; 5 、检查 TCB 拨码设置,发现 S1 (设置基站类型的拨码位), S6 (蓄电池类型、机柜类型标 志与 CBUS1 偏置设置开关) 设置错误, 更改为正确的拨码: S1 的 BTS_

24、ID3- BTS_ID0 对应 ON/ OFF/ OFF/ ON;S6 全 ON ,热交换器故障告警消失。 建议与总结:拨码设置非常重要,拨码错误就会导致机柜类型识别错误,从而出现一些无关的告警。 12BTS3002C 蓄电池充电电流过大导致一体化工作箱 UPS 输入空开自动跳闸故障的处理 现象描述: BTS3002C 基站为村通工程新建的华为基站, 某 客户维护人员反映该站市电停电频繁且 每次停电时间较长(电池电量放完),每次来电后基站无法自动恢复供电。 告警信息:市电掉电的相关告警;基站断站的相关告警。 原因分析:经和 UPS 及蓄电池厂家工程师现场检测分析,原因是由于每次停电电池电量已基本放 完, UPS 启动时电池充电电流较大(客户自己配备的 200Ah 蓄电池,放完电之后瞬时理论充电电流约 10A )、加上负载电流等启动的瞬间电流超过了一体化工作箱所配置空开 2 (接 UPS 输入)的过流阀 值 10A ,每次 UPS 启动时该空开就自动跳闸,从而使 UPS 输入电源无法自动恢复。 处理过程: 1 、从 OMC 告警台

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论