1、日常维护案例介绍 目录目录业务类故障处理业务类故障处理设备类故障处理设备类故障处理 传输类传输类设备类故障处理设备类故障处理 射频类射频类设备类故障处理设备类故障处理 硬件更换类硬件更换类传输类故障传输类故障处理传输类故障处理类别类别 常见问题现象常见问题现象传输类传输类典型问典型问题题 信令终端/吞吐量异常上层应用链路不通(、)冲突、路由错误等导致业务异常 错误、异常导致链路不通 光纤/光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通 传输类故障传输故障处理思路传输故障处理思路l总体思路:分层总体思路:分层/逐段排查定位逐段排查定位l分层法:根据协议层,逐层定位,定位出实际
2、故障点;分层法:根据协议层,逐层定位,定位出实际故障点;l逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐段定位;段定位;l具体排查项:具体排查项:l物理层故障排查物理层故障排查l层故障排查层故障排查l异常处理异常处理l异常处理异常处理l问题定界指导:问题定界指导:传输类故障传输故障逐层排查方法简介传输故障逐层排查方法简介协议层 常见问题现象L5信令终端/吞吐量异常L4上层应用链路不通(、)L3冲突、路由错误等导致业务异常 L2错误、异常导致链路不通 L1光纤/光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通 排查方法应
3、用场景通断检测检测传输路径排查、探测环回检测S12链路质量 路由排查排查方法应用场景 表项查询与优先级映射抓包维护通道类故障维护通道类故障处理维护通道类故障处理 eNodeB站点2、自动发现U2000 Config Config Config中心机房网站1.1、提取版本包1.2、组织配置数据1.4、打开开站工具、上传数据、启动开站上报4、调测下发1、安装上电3、自动配置 限制和约束:在开站之前,必须:硬件安装完毕,U2000调测完毕,与U2000之间的传输正常;的软件版本必须从网站上取得,并且已经上传到U2000。1.3、导出开站列表自发现失败典型故障自发现失败故障处理自发现失败故障处理【实现
4、原理】1、为了避免广播包冲击U2000,引入路由器进行,转化为单播报文。2、过程目的是实现的的建立。即获取、路由等。2、上电后,4步完成过程。常见问题需分析具体消息中的取值 流程:流程:该流程分四步:该流程分四步:1 1)基站在检测到可用的链路后,广播基站在检测到可用的链路后,广播 报报文,以查找可用的文,以查找可用的U2000;U2000;2 2)U2000 U2000进行匹配,如果匹配成功,进行匹配,如果匹配成功,U2000U2000会发送会发送 报文给报文给L3L3交换机,并携带分配的地交换机,并携带分配的地址等信息,以响应址等信息,以响应;3 3)收到收到 后,判断是否正确,如果正确,
5、后,判断是否正确,如果正确,则停止探测过程。并发送则停止探测过程。并发送 广播报文,向广播报文,向U2000U2000服务器发起确认信息服务器发起确认信息;4 4)U2000 U2000同样需要进行匹配判断。确认信同样需要进行匹配判断。确认信息正确后发送息正确后发送 报文给报文给,基站收到基站收到 报文,进报文,进行匹配,匹配成功后,分配的地址等信息生行匹配,匹配成功后,分配的地址等信息生效,并生成效,并生成 和相关路由信息。和相关路由信息。维护通道类故障自发现失败故障处理自发现失败故障处理问题描述问题描述某局点,在站点安装完成并加电后,使用某局点,在站点安装完成并加电后,使用U2000U20
6、00进行自开站,发现某站点在发送报文后,进行自开站,发现某站点在发送报文后,在配置管理中一直未出现上报的报文。在配置管理中一直未出现上报的报文。问题原因问题原因在在U2000U2000抓包看,已收到上报报文,但在上报的中未携带抓包看,已收到上报报文,但在上报的中未携带5454字段,因此导致该站的报文字段,因此导致该站的报文被被U2000U2000抛弃。抛弃。同时,在基站侧镜像抓包后证明基站发送的报文已携带同时,在基站侧镜像抓包后证明基站发送的报文已携带5454字段。字段。结论:结论:修改了报文,丢弃了修改了报文,丢弃了5454字段。字段。维护通道类故障自学习失败故障处理自学习失败故障处理问题描
7、述问题描述W W市市T T运营商工程在开站过程中四个报文都是正常的运营商工程在开站过程中四个报文都是正常的,从从U2000U2000上可以看到已经下发消息上可以看到已经下发消息到基站到基站,且基站也收到且基站也收到U2000U2000发送的消息发送的消息,但是消息之后又重复四个报文但是消息之后又重复四个报文,导致基站操作导致基站操作维护链路一直不能建立维护链路一直不能建立1、首先进行现象确认,过程正常,而通道建立失败,可能是由于过程中下发的配置有误或者是传输侧配置有误。2、其次进行配置核查,结合现象核查下发的配置,下发的主要配置如图所示:核查后发现配置参考与规划相同。3、再次进行传输侧相关参数
8、核查,主要是与通道相关的配置,如,网关,核查后发现配置与规划不一致,修改表中基站的,重新导入中,重新导出开站数据和开站列表。开站正常。处理过程处理过程维护通道类故障自学习失败故障处理自学习失败故障处理自学习:自学习:在在U2000U2000上创建调测任务后,上创建调测任务后,U2000U2000周期性向基站发送通道建立请求。该报文的源地址周期性向基站发送通道建立请求。该报文的源地址为为U2000 U2000 地址,目的地址为基站的地址,目的地址为基站的 地址。此数据包会被发送至基站侧的地址。此数据包会被发送至基站侧的L3L3路由器上,路由器上,如果如果L3L3路由器上无对应此报文目的地址及路由
9、器上无对应此报文目的地址及 的表项,的表项,L3L3设备就会广播报文,此时基站则设备就会广播报文,此时基站则会接收到此报文,并从报文中取出正确的信息同时进行保存。会接收到此报文,并从报文中取出正确的信息同时进行保存。重点:基站学习到的是重点:基站学习到的是 L2 L2上配置的上配置的1、四个报文中从基站上报的和报文中的都是从 L2上学习到的,所以基站所发的这两个报文能正常到达U2000,而U2000也可以把和报文发送到基站;2、U2000给基站下发消息后,基站会把从U2000上配置的操作维护、和路由在基站侧生效;在建立操作维护之前基站会使用U2000 消息中的和 L2上配置的进行对比,如果一致
10、会建立操作维护链路;如果不一致则把从消息中获取到的,路由及全部失效,重新启动流程 案例根因:案例根因:传输类案例传输引起的开站失败案例传输引起的开站失败案例问题现象问题现象某局点,在进行开站时,发现从某局点,在进行开站时,发现从U2000U2000上上看,每次开站时都是进行到看,每次开站时都是进行到99%99%时,失时,失败。败。排查步骤排查步骤1 1、首先进行现象确认,从、首先进行现象确认,从U2000U2000开站界开站界面上可以看到基站已完成了版本下载面上可以看到基站已完成了版本下载、配置下载,在进行激活配置后等待、配置下载,在进行激活配置后等待站点重新启动完成时超时。站点重新启动完成时
11、超时。2 2、其次进行配置核查,版本能够下载成、其次进行配置核查,版本能够下载成功,说明无误,、和路由没有问题,功,说明无误,、和路由没有问题,复位后建立失败,可能原因是版本和复位后建立失败,可能原因是版本和配置文件激活失败,或激活成功后通配置文件激活失败,或激活成功后通道建立失败。核查结果版本与配置文道建立失败。核查结果版本与配置文件匹配,没有问题,端口模式路由配件匹配,没有问题,端口模式路由配置均无误。置均无误。3 3、再次进行传输侧相关参数核查,发现、再次进行传输侧相关参数核查,发现的端口协商模块为强制(实际要求为的端口协商模块为强制(实际要求为自适应),改为自适应后,开站成功自适应),
12、改为自适应后,开站成功。eNB路由器)M2000下载软件下载配置激活配置激活软件基站复位重启复位后,U2000以新配置登陆站点此处失败 目录目录业务类故障处理业务类故障处理设备类故障处理设备类故障处理 传输类传输类设备类故障处理设备类故障处理 射频类射频类设备类故障处理设备类故障处理 硬件更换类硬件更换类射频类故障射频类故障处理射频类故障处理123外部干扰互调驻波接口电调天线故障射频类故障故障处理故障处理过低不平衡过高理论值带宽20M-98-9715M-99-9810M-101-1005M-104-1033M-106-1051.4M-110-1091通道衰减值检查互调干扰检测2方法1方法21、
13、记录空载时的值;2、通过 加载模拟负载;3、在U2000跟踪差值是否大于4。1、通过 进行反向互调干扰检测;过低告警门限为过低告警门限为-114空载下的计算方法如下:-174+10*,其中为带宽,单位为,为射频模块的噪声系数,通常为2-2.5左右,举例:2.6G 2T2R,5小区带宽,那么空载下的参考值大小174+10*(5*106)+2.5104.5。过高:过高:标准要求不超正常值标准要求不超正常值6;因此;因此20M:92,15M:933频谱扫描射频类故障故障处理故障处理先按要求进行后台单站测试,加载和不加载的时候差值大于等于4的定义为内部干扰(工程质量问题和互调问题),需安排站处理恢复;
14、如果值高于-92,排除测试方法、驻波、射频通道告警等问题后,就可以认为“疑似存在外部干扰”,需要网优人员上站扫频;如果客户扫频扫不出干扰,作为重点问题,由客户及网优,产品人员一起上站去排查处理;如扫频扫出干扰,处理干扰问题;异常情况异常情况现象现象产生的主要可能原因产生的主要可能原因过低过低主(分)集长时间低于-114左右或出差过低告警天馈各个接头接触不好,天馈、功放故障过高过高主(分)集长时间高于-92或在一定时间内高于-92开关和跳线错误,天馈驻波、硬件故障、接头进水、系统工作不正常和互调、外部干扰主分集差异过大主分集差异过大主(分)集两者间长时间或在一定时间内相差6以上或出现接收不平衡告
15、警天馈驻波、天线安装问题、硬件故障、外部干扰备注:主分集均偏高且基本一致,优先考虑外部干扰问题;主分集只有一个偏高,且相差较大,优先考虑互调问题。射频类故障互调问题处理互调问题处理 目前商用的互调测试仪都只能测试天馈系统的互调大小目前商用的互调测试仪都只能测试天馈系统的互调大小,无法定位出互调故障点的位置,在这种情况下,业界,无法定位出互调故障点的位置,在这种情况下,业界最成熟也是广泛采用的互调故障点定位方法是最成熟也是广泛采用的互调故障点定位方法是“分段排分段排查法查法”。或者使用。或者使用“替换法替换法”,逐段馈线检查替换。,逐段馈线检查替换。“分段排查法分段排查法”如下图所示:如下图所示
16、:“分段排查法分段排查法”的意思就是:依次把左图的的意思就是:依次把左图的4个地方断开,接入低互调负载,添加下行模个地方断开,接入低互调负载,添加下行模拟负载,观察是否抬升,以判断互调干扰的拟负载,观察是否抬升,以判断互调干扰的引入点。引入点。例如:断开例如:断开1,接入低互调负载,添加下行模,接入低互调负载,添加下行模拟负载,无变化,说明载频模块;断开拟负载,无变化,说明载频模块;断开2,接,接入低互调负载,添加下行模拟负载,显著抬入低互调负载,添加下行模拟负载,显著抬升,说明下跳线是引入互调干扰的故障点,升,说明下跳线是引入互调干扰的故障点,依次类推。依次类推。或者使用或者使用“替换法替换
17、法”,逐段馈线检查替换。,逐段馈线检查替换。射频类故障电调天线故障处理电调基本原理电调天线故障处理电调基本原理远程电调天线()由天线、远端控制单元()和()控制线缆组成。见图1两种连接方式:和射频类故障电调天线故障处理配置步骤电调天线故障处理配置步骤电调天线调测过程,通过网管远程控制:电调天线调测过程,通过网管远程控制:第一步:设置供电开关第一步:设置供电开关 (直接给供电方式)、(直接给供电方式)、(使用或塔放给供电方式)(使用或塔放给供电方式)第二步:扫描设备第二步:扫描设备 第三步:添加设备第三步:添加设备 第四步:配置电调天线与的对应关系第四步:配置电调天线与的对应关系 第五步:加载天
18、线配置数据文件第五步:加载天线配置数据文件 第六步:校准天线第六步:校准天线 第七步:设置天线下倾角第七步:设置天线下倾角 第八步:查询天线下倾角第八步:查询天线下倾角 射频类故障电调天线故障处理常见电调故障电调天线故障处理常见电调故障告警名称告警名称告警原理告警原理告警促发来告警促发来源源一般原因一般原因备注备注电调天线马达故障告警基站下发角度校准或角度调整命令,检查到马达故障(内部检查)后上报告警给基站,基站收到告警信息后上报马达检测失败、马达不在位,马达永久堵转、马达转动时力矩不足或内部老化、马达转不动。的电压供电不足会导致马达驱动力不足。线接触不良(线未拧紧等)或线过长,馈线馈线松动、
19、过长都可能导致供电不足。电调天线数据丢失告警在电调校准或调整下倾角时,读取不到配置文件,上报告警给基站未上传配置文件或者内部数据文件读取不到一般解决方案:重新上传配置文件,如果重新上传文件还是有该告警,说明内部存储损坏,需要更换电调天线未校准告警在调整角度时,如果未检测到已校准标识(写到自己的存储里面),上报该告警给基站新安装的配置文件没有进行校准或已校准的标识丢失加载的配置文件与不匹配,软件异常,或安装不工艺导致射频单元电流异常告警 检测外接天馈设备的工作电流值异常,基站上报该告警。1)过流告警的可能问题:使用的合路器对直流短路、过流告警门限设置不当、多芯线制作不合格、怀疑设备故障导致。2)
20、欠流告警的可能问题:无设备却打开了供电开关、天馈上有,非华为供电线缆连接松动首先排查后台门限是否设置合理 天线设备维护链路异常告警检测与已配置的的握手关系,如果无法检测到心跳帧就上报告警。检测与已配置的的握手关系中断与之间链路异常,无法通讯电调天线运行数据异常告警基站周期查询的实际下倾角值和基站配置文件中保持的下倾角值不一致,基站上报告警。基站可以设置两者之间的误差范围配置文件更新,下倾角变化或电调因为动力因素产生下倾角变化解决方案:重新校准天线后,重新设置下倾角角度射频类故障驻波故障处理驻波故障处理1、驻波告警门限查询 根据工程质量设置告警门限,供日后在线检测驻波。工程质量驻波=1.5,告警
21、门限设置为2.0.2、离线驻波测试 在线驻波测试有一定误差,通常验收时采用离线检测。执行STR VSWRTEST测试,该测试会中断业务。3、上站排查 首先检查RRU和天馈各个组件之间的连接是否有松动或断开现象。检查RRU和天馈的频段是否一致 使用SiteMaster的DFT测试驻波故障点射频类故障接口故障处理接口故障处理CPRI协议接口定义CPRI接口CPRI接口光模块光纤的单双模不一致;两端设备较近时使用了距离过大的光模块;光模块故障(对端发送光功率过大)光纤接头或光模块安装松动,或光模块老化。光纤接头不洁净,存在灰尘等异物。光模块的型号(单模/多模、速率、距离)不匹配。光纤线路存在弯折、挤
22、压或老化,或光纤线路过长导致光信号出现较大衰减;光口接收无信号还可能是没有光纤有断点、对端未连接或单板硬件故障;CPRI光口故障的可能原因射频类故障射频类故障处理案例射频类故障处理案例-华为基站光路异常分析华为基站光路异常分析目前基站基本采用3900方式组网,因此的光路故障是我们日常维护中最经常遇到的问题之一,这类故障常见的告警包括:小区不可用告警光模块收发异常告警(物理层)接口异常告警(链路层)光模块/电接口不在位告警 光接口性能恶化告警射频单元光模块收发异常告警(物理层)射频单元接口异常告警(链路层)射频单元光模块/电接口不在位告警射频单元光接口性能恶化告警射频单元光模块故障告警射频单元维
23、护链路异常告警射频单元硬件故障告警告警类别那么多,吓死人了!射频类故障射频类故障处理案例射频类故障处理案例-华为基站光路异常分析华为基站光路异常分析其实,没有那么复杂,光路涉及的设备就那么几个,你说能复杂到哪去呢,是吧!下面我们来分析看看。和尾纤直连和中间转接光路(和尾纤接架)处理方式:处理方式:后台查询后台查询1 1、通知后台查询光模块的收发光功率是否正常;、通知后台查询光模块的收发光功率是否正常;2 2、如果没有中断,查询光模块的收发光功率是否正常;、如果没有中断,查询光模块的收发光功率是否正常;通过后台的光功率查询,可以初步判断故障原因是光衰过大还是链路中断。通过后台的光功率查询,可以初
24、步判断故障原因是光衰过大还是链路中断。射频类故障射频类故障处理案例射频类故障处理案例-华为基站光路异常分析华为基站光路异常分析现场排查(建议携带:光功率计、光模块、短尾纤),做以下操现场排查(建议携带:光功率计、光模块、短尾纤),做以下操作前可以先查看光模块规格是否正确、拔插光模块、尾纤,查看作前可以先查看光模块规格是否正确、拔插光模块、尾纤,查看尾纤头是否有尘灰等,以下尾纤头是否有尘灰等,以下4 4个步骤,基本可以完成故障的排查和个步骤,基本可以完成故障的排查和处理,其实挺简单的吧?所以不要在检查前随意就换了光模块或处理,其实挺简单的吧?所以不要在检查前随意就换了光模块或者哦:者哦:1 1、
25、用尾纤在光口环回,和后台确认的光模块收发光是否正常,如、用尾纤在光口环回,和后台确认的光模块收发光是否正常,如果正常可以排除端口和光模块问题,否则请按顺序更换光模块、果正常可以排除端口和光模块问题,否则请按顺序更换光模块、端口、单板直到环回光模块收发光正常;端口、单板直到环回光模块收发光正常;2 2、在侧用光功率计测量过来的光功率是否正常,如果不正常,检、在侧用光功率计测量过来的光功率是否正常,如果不正常,检查下一步;查下一步;3 3、在测量发出的光功率,如果正常,请检查光路,如果不正常,、在测量发出的光功率,如果正常,请检查光路,如果不正常,请按顺序更换光模块、端口、直至发出的光功率正常;请
26、按顺序更换光模块、端口、直至发出的光功率正常;4 4、在处测量过来的光功率,如果不正常,请检查光路;如果正常,、在处测量过来的光功率,如果不正常,请检查光路;如果正常,请按顺序更换光模块、端口、直至正常;请按顺序更换光模块、端口、直至正常;射频类故障射频类故障处理案例射频类故障处理案例-1-1问题现象:上报26529 射频单元驻波告警(重要)与29243小区服务能力下降告警问题分析:如果驻波告警后处理开关打开,上报重要级别射频单元驻波告警,将关闭驻波告警对应的发射通道,触发小区服务能力下降告警,此时先处理驻波告警如果未打开驻波告警后处理开关,则两个告警分别排查。问题处理步骤1.查询驻波告警门限
27、,确认门限配置正确(,默认驻波门限2.0,驻波后处理门限3.0)。2.离线驻波测试,确认驻波检测的结果确实高,输入小区的下行中心频率,避免天馈组件中存在频段不匹配的组件(如合路器等),导致测试的结果错误。3.上站排查,发现驻波异常的通道天馈线缆断开,重新连接好后测试驻波恢复。射频类故障射频类故障处理案例射频类故障处理案例-2-2问题描述:上报26521 射频单元接收通道过低告警问题处理步骤:确认是否存在26532 射频单元硬件故障告警,如果存在按告警帮助处理。不存在。2.排查接收通道衰减配置,如果有塔放,塔放是否正常工作。没有使用塔放,且通道衰减为0,没有问题。3.复位射频单元,复位后不恢复,
28、带备件上站排查。4.交换射频单元正常与异常通道的天馈连接。交换后射频单元未随天馈转移。5.更换射频单元后恢复,待返板分析。射频类故障射频类故障处理案例射频类故障处理案例-3-3问题描述:上报29243小区服务能力下降告警问题分析:1.配置与单板实际支持规格不符:小区配置的“小区发送和接收模式”大于实际支持的规格:例如配置2T4R小区,实际只能支持2T2R。实际支持的规格可以通过查询电子标签确认。2.小区配置的“小区发送和接收模式”大于实际支持的规格:例如配置2T4R小区,实际只能支持2T2R。实际支持的规格可以通过产品文档硬件描述确认;3.如果是小区,由于配置错误或不可用导致配置的“小区扇区设
29、备数量”与实际可用的扇区设备数量不一致修改“小区扇区设备数量”与实际一致,或解决不可用问题。:0,;。4带宽不足 查询当前协商到的线速率,将该速率与实际配置所需的速率进行对比,如果小于实际配置所需速率(不压缩场景下,2015M2T2R 接口带宽需求为2.5,2015M 2T4R 接口带宽需求为4.9,具体计算可参考2013年:接口速率如何计算),则根据“最大速率能力”部分的描述判断是侧的光模块还是侧的光模块速率过低导致,同时可以通过 确认光模块的详细信息,如果光模块速率正确,但是协商到的速率小于两侧光模块的速率,则有可能是链路其它故障导致。射频类故障射频类故障处理案例射频类故障处理案例-3-3
30、5.射频单元发射通道或接收通道关闭查看是否存在26259-射频单元驻波告警、26545-射频单元发射通道手动关闭告警、26532-射频单元硬件故障告警、26538-射频单元时钟异常告警、26524-射频单元功放过流告警,如果存在先排除告警。注意:在射频单元驻波告警后处理开关关闭(通过 查询)时,不会因为驻波大于驻波比告警后处理门限(默认值3)关闭发射通道,故此时不会导致小区服务能力下降告警。6链路异常查看是否存在26230 光模块异常告警、26232光模块收发异常告警、26233光接口性能恶化告警、26234 接口异常告警、26503-射频单元光模块收发异常告警、26504-射频单元接口异常、
31、26506-射频单元光接口性能恶化告警,如果存在先排除告警。问题处理步骤:确认小区配置实际单板规格是否支持,小区配置2T4R,3632,3单板。未压缩时,2T4R 20M小区需要4.9G 速率,查看协商结果。从线速率上确认,速率不足导致小区服务能力下降。或 查询光模块支持的速率,确认为侧使用了2.5G光模块,更换光模块告警恢复。射频类故障射频类故障处理案例射频类故障处理案例-4-4问题描述:出现“电调天线马达故障告警”和“电调天线未校准告警”华为双频六端口天线替换原C网天线并安装华为3638,C网天线的先级联到天线的上,然后将通过电缆连接到3638。通过网管对站点3个小区进行电调数据加载,总显
32、示校准失败,多次校准后出现3个小区侧电调马达永久堵转现象。问题分析:1、马达硬件故障;2、的电压供电不足会导致马达驱动力不足。线接触不良(线未拧紧等)或线过长,馈线馈线松动、过长都可能导致供电不足3、加载的配置文件与不匹配;射频类故障射频类故障处理案例射频类故障处理案例-4-4问题处理步骤:1、加载电调数据,显示校准失败,通过 查看端口电流值,均显示正常范围。2、扫描电调天线,并不存在序列号错误的现象。3、删除电调数据,复位天线设备,复位,重新加载数据,仍显示电调未校准。4、需上站处理了?但是3个小区都出现马达堵转硬件故障的几率很小,则怀疑加载电调数据时绑定序列号可能出现侧和C网侧混淆;则删除
33、数据,将每个小区电调序列号侧和C网侧互换,重新加载电调数据,加载成功 目录目录业务类故障处理业务类故障处理设备类故障处理设备类故障处理 传输类传输类设备类故障处理设备类故障处理 射频类射频类设备类故障处理设备类故障处理 硬件更换类硬件更换类U2000 U2000 的板故障恢复指导书的板故障恢复指导书在现实网络运维中,基站单板故障不可避免,网络没有了基站控制器,其运行配置全部储存在基站上,因此更换主控板时,需要完全更新数据。华为网管集成了对数据进行管理。通过 区实时同步网元配置的功能,可以实现不需要重新开站而只需要利用已保存的数据完成快速建站,达到更换主控板前的站点状态。需要在现场更换单板前完成
34、13步骤工作,否则网管数据可能会被新更换单板数据覆盖;1、删除即插即用中原来的基站数据(注意记录基站号);2、进入区打开区,导出目标站点的“即插即用数据”;3、校验完成后,进入“即插即用”界面;点击进行重新开站;4、更换主控板;待开站正常结束;5、检查数据配置是否与之前相同,及基站各项状态是否正常;目录目录业务类故障处理业务类故障处理设备类故障处理设备类故障处理 传输类传输类设备类故障处理设备类故障处理 射频类射频类设备类故障处理设备类故障处理 硬件更换类硬件更换类业务类故障处理案例业务类故障处理案例1 1 问题描述问题描述某某 站点下只能接入一个终端,第二个终端无法连接上。后来更换多个终端,
35、发现有的可站点下只能接入一个终端,第二个终端无法连接上。后来更换多个终端,发现有的可以接入,有的则不行以接入,有的则不行告警信息:无告警信息:无版本:版本:V100R008C01240问题分析:问题分析:1.1.用户接入类问题,首先排查终端问题,是否只涉及某一类终端。其次确认失败时用户接入类问题,首先排查终端问题,是否只涉及某一类终端。其次确认失败时现象,是否网络无响应,还是已接入无法做业务。现象,是否网络无响应,还是已接入无法做业务。2.2.接入失败,要通过信令确认在哪一个阶段被拒绝,是阶段还是阶段。接入失败,要通过信令确认在哪一个阶段被拒绝,是阶段还是阶段。系统中的承载如下图所示业务类故障
36、处理案例业务类故障处理案例1 1问题处理步骤:问题处理步骤:1.1.通过跟踪可以看到会给回复通过跟踪可以看到会给回复S1S1消息后,等待了消息后,等待了5252秒给又发送了释放请求,原因为传秒给又发送了释放请求,原因为传输资源不可用。输资源不可用。2.S1携带的地址如下,解析后为10.100.34.6813.查看告警情况测试时间段28号告警上报情况是正常的。到10.100.34.68无异常告警业务类故障处理案例业务类故障处理案例1 14,从统计可以看到90%的掉话都是由于,导致阶段掉话。这个错误值的含义是重建,重配置资源失败。5.查看 日志,选取了多次失败记录看,都指向不同的对端,有10.10
37、0.34.12/10.100.34.65/10.100.34.34等等,如下图只是一个举例,说明并不是某一条链路存在问题,所有链路都有问题。再看对应释放时间点的日志,看到有的 超时记录,以及明显的 的记录,说明是链路故障导致对端没有回.6.检查传输链路,对所有对端进行测试,500字节20次包大部分都能通,1500字节基本不能通,调整到1472能通,1473字节不通,说明传输存在瓶颈,设置的值不满足我们的要求。要求传输更改值或者更换传输链路。7.由于当前使用异厂家传输,修改未协调成功。修改到华为传输下,1500字节能通。业务测试正常。业务类故障处理案例业务类故障处理案例1 1 案例中故障却未上报
38、告警,故障是否有检测机制,是否会上报告警案例中故障却未上报告警,故障是否有检测机制,是否会上报告警?如果打开了静态检测(如果打开了静态检测(),会通过),会通过 报文检测业务通道:报文检测业务通道:检测机制根据配置 来定的,默认是20s一次,连续3次才上报告警。:查询配置信息帧超时时长(毫秒)=20000帧超时次数=3差分服务码=0静态检测开关=使能静态检测:1分钟检测一轮,1分钟定时器超时后,在所有上发送 检测报文。收到应答,检测正常结束。检测不通,等待“帧超时时长”(设置,默认5秒)后,发送下一个报文,一共发送“帧超时次数”(设置,默认3次),超时后上报“故障告警”(方式)或“用户面承载链
39、路故障告警”(方式)。动态检测:只检测有用户承载的,检测机制与静态相同,检测到故障后不上报告警,会释放对应上的承载用户。接入类故障接入类常见故障处理接入类常见故障处理1.当出现终端无信号情况时,首先检查小区是否正常开工,排查基站侧告警;2.2.小区正常后,仍无法搜到网络,则确认终端是否支持对应频段、模式;3.3.终端发起流程后,未发起鉴权就被拒绝,一般原因为终端在侧的开户数据存在异常,需要协调配合定位;4.4.终端与双向鉴权失败,导致终端被拒绝接入,一般原因为写卡的、与开户的、不一致,该问题需要配合解决;5.5.当安全模式流程通过后,终端接入失败分为两种情况:6.a.基站侧发送消息,此时终端不
40、会收到下发的 消息;这种情况只能通过基站侧S1跟踪,观察失败原因;常见问题为不可用导致;7.b.下发 消息,此时常见原因为终端接入的(由配置),与侧配置的不符。业务类故障处理案例业务类故障处理案例2 2终端设置问题导致被叫异常终端设置问题导致被叫异常 问题描述问题描述 终端注册终端注册4G4G网络,放置到信号好的区域,做被叫经常感知不到,有时候可以接到,网络,放置到信号好的区域,做被叫经常感知不到,有时候可以接到,主叫侧收到被叫用户忙的录音通知。被叫查看手机时看到有未接来电提醒。主叫侧收到被叫用户忙的录音通知。被叫查看手机时看到有未接来电提醒。问题处理步骤:问题处理步骤:1 1、相同的终端现场
41、测试没有复现问题,因此怀疑终端个体问题。、相同的终端现场测试没有复现问题,因此怀疑终端个体问题。从目前来看,这部分投诉都是来自从海外归来的用户。从目前来看,这部分投诉都是来自从海外归来的用户。2 2、海外用户由于时差的问题,经常使用手机设置勿扰模式:设置、海外用户由于时差的问题,经常使用手机设置勿扰模式:设置勿扰模式手动启用或者设定时间,功能启用,屏幕锁定时的勿扰模式手动启用或者设定时间,功能启用,屏幕锁定时的来电和提醒将被设为静音,并且状态栏中将出现月亮图标。来电和提醒将被设为静音,并且状态栏中将出现月亮图标。经过测试勿扰模式导致的现象是:经过测试勿扰模式导致的现象是:1 1、设置勿扰模式的
42、手机屏幕未锁定时,来电均能够接收到;、设置勿扰模式的手机屏幕未锁定时,来电均能够接收到;2 2、手机屏幕锁定时,做被叫第一个来电是无法接通的,、手机屏幕锁定时,做被叫第一个来电是无法接通的,“主叫侧主叫侧反馈被叫正在通话中反馈被叫正在通话中”,打开被叫后看到未接来电提醒;,打开被叫后看到未接来电提醒;3 3、手机屏幕锁定时,同一个号码三分钟内第二次来电可以接通(、手机屏幕锁定时,同一个号码三分钟内第二次来电可以接通(终端侧设置);终端侧设置);所有的投诉现象都是这个设置导致,将勿扰模式关闭后,测试正所有的投诉现象都是这个设置导致,将勿扰模式关闭后,测试正常。常。【问题现象】某局点切换测试,终端
43、从红星家具城站移动到模范马路站时,信号不断降低,但是始终没有触发切换;【问题分析】1.配置检查 从基站配置文件看,已经打开“同频切换开关”,A3事 件门限设置合理,满足切换区域的要求;2.信令分析 观察日志:基站收到终端上报的 消息,并发起了S1 流程,但是收到了 返回的S1 消息;观察失败原因值为“-”业务类故障处理案例业务类故障处理案例3 3邻区配置错误导致切换失败邻区配置错误导致切换失败 41【问题分析】检查 消息中信元,发现其携带的 中的为 4117 检查目标站配置发现,该站点实际TAC为6236【问题结论】修改后,切换正常邻区配置错误导致切换失败邻区配置错误导致切换失败切换类故障切换
44、原理概述与常见故障切换原理概述与常见故障切换的过程就是终端在移动过程中与网络连接交互发生变化的过程,简单的图示如下图:LTE系统的整个切换过程完全由网络侧(eNB)控制,所以eNB需要监测UE所处的无线质量环境,这个过程是通过eNB下发测量控制让UE在满足一定条件时上报测量报告来实现的:触发:当前我司eNB是采用A3事件触发同频切换,主要通过A2、A4事件来触发异频切换切换:eNB下发切换命令给UE,UE收到切换命令后,中断与源小区的交互,按切换到目标小区判断是否存在切换,通常以信令为判断依据,在终端侧,以发出触发切换的测量报告为开始,以切换完成消息为结束。切换成功时,从UE侧观察表现为UE从一个源小区到一个新的小区(可从PCI变化来观察)进行正常业务交互。如果切换失败,则大多表现为掉话、RRC重建等现象。常见切换问题:邻区漏配、切换不及时、弱覆盖等导致切换失败。切换失败有很多种原因,通常表现在S1,UU等接口的信令交互出现信令丢失,所以切换问题的首要定位方法是比对标准流程看是哪里信令缺失了。源侧信令目标侧信令协作共赢电信华为