广州花草茶价格中心

LTE网优内功心法

网优人归乡计划 2019-07-10 16:27:08



天下功夫,内力为本,招数为末。欲练上乘内功,需搬运真气,让内息通行经脉。网优之内功心法,无非打通各大信令流程。如能滚瓜烂熟,且独辟蹊径,逆练经脉,则犹如网优之北冥神功,天下武功无不为我所用,天下故障无不为我所化。本秘籍虽为菊花派所创,然而天下内功都是一般,举一反三而已。

1 接入问题定位优化方法


1.1 接入流程及问题表现


1.1.1 接入流程


接入流程可以分为四个步骤:

1)随机接入

2)RRC连接建立

3)鉴权

4)E-RAB建立

接入问题的主要表现也体现在这四个步骤上。





1.1.2 随机接入失败


随机接入失败的常见原因

1)ENB侧参数配置问题

2)UE侧参数配置问题

3)信道环境影响

4)核心网侧配置问题


备注:由于随机接入是L2的过程,在ENB侧没有明显的特征表现,需要结合UE侧的log来进行观察与判断




1.1.3 RRC连接建立失败


RRC连接建立的话统统计


1)【A点】

指标L.RRC.ConnReq.Att加1,不统计重发的次数


2)【C点】

指标L.RRC.ConnReq.Succ加1,不统计重发的次数




RRC建立连接失败在ENB侧的表现如下:

1)RRC_CONNECTION_CMP没有收到

2)ENB回复RRC_CONNECTION_REJECT



1.1.4 鉴权流程失败


这里所说的鉴权流程指的是在S1口上,ENB发起UE_INITIAL_MESSAGE到收到核心网侧发送的INITIAL_UE_context_Setup_REQ这之间的所有流程交互:



该流程存在问题导致接入失败的几个现象

1)UE与核心网直传消息空口交互丢失(ENB侧来看是对应的上行直传消息没有收到)

2)核心网直接发送释放命令

3)核心网不响应或者响应过慢






1.1.4 E-RAB建立失败


E-RAB建立的话统统计





1)【A点】

如图中A点所示,当eNodeB收到来自MME的E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息时E-RAB建立尝试次数累加


2)【B点】

如图中B点所示,当eNodeB收到来自MME的E-RAB SETUP RESPONSE或者INITIAL CONTEXT SETUP RESPONSE消息时E-RAB建立成功次数累加


E-RAB建立失败在空口信令的表现


1)空口安全交互,UE回复FAIL

2)空口安全交互,UE未回复CMP

3)空口DRB建立重配,UE未回复CMP

4)空口UE能力查询,UE未回复






E-RAB建立失败S1口信令表现(空口信令交互正常)


1)核心网异常

2)无线资源申请失败

3)GTPU资源申请失败





1.2 问题定位、解决方法


接入失败问题定位规定动作



1.2.1 问题定位:第一板斧


话统分析


1)通过话统分析可以区分RRC建立失败或者E-RAB建立失败的TOP小区和统计TOP时间段


2)通过话统分析可以区分RRC建立失败是因为空口原因导致还是由于小区资源问题导致。



3)通过话统分析可以统计E-RAB建立过程,由于空口安全交互,UE回复FAIL导致建立失败的次数,该现象为UE和核心网交互失败导致,需要联合UE和CN共同定位。



1.2.2 问题定位:第二板斧


CHR日志分析


通过CHR日志分析可以获取RRC建立失败或者是E-RAB建立失败的top用户的TMSI。



1.2.3 问题定位:第三板斧


跟踪


1)标口跟踪:通过话统统计出top小区和top时间段后,在对应的小区和时间段开启标口跟踪,查看接入流程走到哪一步失败。


2)IFTS跟踪:在对应的小区和时间段开启IFTS跟踪,确认接入失败用户的链路质量状况。


3)启动单用户全网跟踪:通过TOP用户的TMSI在核心网侧获取其IMSI,然后启动该用户的全网跟踪。


1.2.4 问题解决方法


传输及核心网问题

从跟踪分析流程,如果属于核心网问题,需要联合核心网侧人员共同定位解决


ERAN侧异常

1)空口异常:上行受限、下行受限、覆盖空洞、干扰过大

2)基站异常:一般属于产品问题,需要相关产品日志进行分析定位


UE侧问题

如果统计显示一直是某个用户接入有问题,而该小区其他用户一直正常,该终端异常的可能性较大,需要通过获取的IMSI信息回溯,实地复现定位解决。


问题解决方法:上下行不平衡和覆盖空洞


无论是上下行不平衡还是覆盖空洞,均表现为链路质量较差


1)上行链路较差的表现就是RB缩到最小,上行MCS选择0阶,PHR已经在0db以下,而且上行BLER较大不收敛,CRC校验解错的概率较高。


2)下行链路较差的表现为UE上报CQI较差或者网络侧HARQ收到大量来自UE侧反馈的DTX和NACK


3)上行受限指的是上行较差而下行还可以;下行受限指的是上行还可以而下行较差;覆盖空洞指的是上下行链路均已较差。




对于上行受限可采用如下办法解决:

1)增加基站,减小下行小区覆盖距离

2)增加塔放,增加上行信号补偿

3)减小导频功率,减小下行小区覆盖距离

4)增加天线数,增强上行信号增益


对于下行受限可采用如下办法解决:

1)增加基站,减小下行小区覆盖距离

2)增大导频功率,增加下行小区覆盖距离

3)天线拉远,增强边缘覆盖


对于覆盖空洞

增加基站,增强覆盖。


2 切换问题定位优化方法


2.1 切换流程及问题表现


2.1.1 切换原理及信令流程


切换的过程就是终端在移动过程中与网络连接交互发生变化的过程:



LTE系统的整个切换过程完全由网络侧(eNB)控制,所以eNB需要监测UE所处的无线质量环境,这个过程是通过eNB下发测量控制让UE在满足一定条件时上报测量报告来实现的:


1)触发:当前我司eNB是采用A3事件触发同频切换,通过A2、A4事件来触发异频切换


2)切换:eNB下发切换命令给UE,UE收到切换命令后,中断与源小区的交互,按命令切换



2.1.2 切换失败


判断是否切换,通常以信令为判断依据,在终端侧,以发出触发切换的测量报告为开始,以切换完成消息为结束;


切换成功时,从UE侧观察表现为UE从一个源小区到一个新的小区(可从PCI变化来观察)进行正常业务交互;


Q1:测量报告丢失现象


UE侧发出测量报告后,但没有收到切换命令,在UE侧和eNB的现象分别如下:




Q2:切换命令丢失现象:


UE侧发出测量报告后,eNB收到测量报告,并下发切换命令,但UE侧没有收到;


UE侧看到的现象与切换测量报告丢失一样;从eNB侧看,则是收到测量报告下发切换命令后,在目标小区没有收到切换完成消息;




Q3:目标小区接入失败现象:


UE侧发出测量报告后,eNB收到测量报告,并下发切换命令,UE收到切换命令后,在目标小区发起接入,但目标侧没有收到切换完成消息,在UE侧和eNB的现象分别如下:




2.2 问题定位、解决方法


2.2.1 切换问题定位规定动作




设备状态检查

1)查询基站、小区告警,保证没有与切换相关的严重告警(如X2配置链路断开、RRU告警等)

2)检查测试终端是否能正常使用,是否支持异频、异系统重选、切换功能


参数核查

1)确认切换开关状态

2)确认邻区配置,确认邻区关系、X2接口配置、传输配置

3)确认切换参数,比如切换门限,幅度迟滞,时间迟滞等

4)确认是否存在PCI冲突告警


切换失败TOP站邻区漏配检查

地理位置、网络规划角度,确认是否邻区漏配,并实施相应操作


2.2.2 切换问题的定位、解决方法


TOP1:邻区漏配核查:


从网络侧跟踪UU口和终端侧Uu口跟踪结合判断:


1)网络侧:同一用户(CALL ID)连续上报测量报告但没有下发切换命令,检查X2或S1跟踪中分别也没有HANDOVER REQUST及S1AP_HANDOVER_REQUIRED,则很可能是漏配的小区(通过查询配置确认);


2)终端侧:随着UE移动服务小区RSRP越来越差,SINR越来越差,而邻区RSRP越来越好,上报测量报告,没有收到切换命令;




TOP2:切换不及时:


当邻区无线质量满足切换门限时,服务小区的RSRP突然陡降:




1)修改服务小区与邻区的偏置CellIndividualOffset来提前切换

2)修改服务小区的延迟触发时间IntraFreqHoA3TimeToTrig来提前切换(建议配置为40ms到200ms之间的一个值,如80ms)

3)调整切换门限参数IntraFreqHoA3Hyst、 IntraFreqHoA3Offset来提前切换(此操作用得很少)


TOP2:弱覆盖:


从终端侧判断:

当邻区无线质量满足切换门限时,服务小区和邻区的RSRP都十分弱;



从网络侧判断:

从网络侧跟踪的UU口消息中,触发切换的A3测量报告记录的源小区、目标小区RSRP都很低,当测量报告中携带的服务小区RSRP值小于-110dBm时,可以认为处于信号质量微弱的区域,此时容易出现切换失败,需要调整覆盖;


弱覆盖的解决方法:

1)调整天线方向角、倾角:当下行先受限时,可以通过调整天线(如减小下倾角)补充远点的下行覆盖;

2)增加塔放、基站:当上行先受限时,可以通过增加塔放、增加小区(基站或接远RRU)的方式增强上行覆盖;


TOP3:乒乓切换:



乒乓切换的解决方法

1)相对调整两小区的CIO值,抵制乒乓切换;

2)当前默认使用同频切换门限为2dB,从前面整理出来的乒乓区域RSRP相对值来看,最大RSRP差距为4dB,所以设置CIO为-3dB,可以防止乒乓;



TOP3:干扰


干扰的表现

在RSRP比较好的情况下,吞吐率不如预期、容易出现切换失败甚至掉话等多种现象;



干扰的解决方法

找出干扰原因,去除干扰源


3 掉话问题定位优化方法


3.1 掉话流程及问题表现


3.1.1 LTE网络掉话定义


话统掉话定义

当eNodeB收到来自MME的E-RAB RELEASE COMMAND( UE CONTEXT RELEASE COMMAND)消息,或eNodeB向MME发送E-RAB RELEASE INDICATION( UE CONTEXT RELEASE REQUEST )消息,且释放原因不为“Normal Release”,“User Inactivity”,“Partial Handover”,“Handover triggered”,“successful-handover”,“cs-fallback-triggered”时统计该指标。如果E-RAB RELEASE COMMAND消息中要求同时释放多个E-RAB,则相应指标按各个业务的QCI分别进行累加。



3.2 问题定位、解决方法


3.2.1 掉话排查基本步骤



首先需要在话统侧获取全网的掉话率指标以及趋势,掉话率趋势分析至少需要1~2周左右的数据,如果全网掉话率指标突然偏高,一般执行步骤:


1)是否全网问题:

对MME及eNB侧进行告警排查(传输,设备等告警)、观察期间是否实施版本升级


2)是否存在Top小区:

●小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多而且掉话率高的Top小区

●对Top小区进行参数核查、告警检查等

●对引起掉话的Top原因进行定位分析


3)若是共性问题,将优化结果复制到全网


3.2.1 掉话问题定位、解决方法


Top1:参数对比


随机抽取部分站点的脚本与基线参数进行核对,对不一致的参数进行分析;


Top2:告警核查


1)是否存在传输告警:观察S1传输是否出现问题;

2)是否存在设备告警:观察eNB侧是否存在告警;

3)检查系统是否升级、打补丁等动作;


Top3:Top小区筛查


1)将小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多且掉话率高的Top小区;

2)通常取每天掉话率高于平均指标的Top5小区进行分析,确定掉话的主要原因;


3.2.2 Top小区分析流程



1)获取小区级话统的掉话率指标及趋势,掉话率趋势分析至少1~2周左右的数据:


●如果小区的掉话率指标突然偏高,需要检查eNB侧是否存在该小区相关的告警信息,检测该小区所属eNB的告警,确认该小区是否出现故障等信息;

●常见的告警如RRU相关的告警,通道相关的告警,传输相关的告警,基带板相关的告警等;


2)分析CHR数据,获取导致掉话的各种原因的比例,按照比例从高到低的顺序分别针对不同的原因进行定位,并对各Top原因进行分析处理;


3)判断是否存在OM操作导致的站点复位,重启等导致的掉话;


4)检测是否有Top用户存在,如果有,需要对Top用户的log进行详细分析;


5)如果无法通过CHR数据定位解决的问题,需要通过抓取该Top小区内eNB侧的IFTS跟踪;


6)如果无法进一步深入分析,在需要使用测试终端进行复现,并抓取UE侧的log及内部打印信息进一步定位;


3.2.3 CHR原因统计


取每天的Top5站点通过InsightSharp对CHR数据进行分析,找到影响每个Top小区掉话率的主要原因:



3.2.4 CHR常见释放原因




3.2.5 Top用户排查


Top用户的确定


1)Top用户的判断主要是依据终端接入时上报的TMSI进行判定,华为核心网TMSI分配的机制是对于同一个IMSI用户,TMSI的右起第5位进行随机赋值,即某用户的TMSI中只有*指示的8bits位置发生变化,就是同一个用户,C0 6* 00 05;


2)TMSI可以通过CHR数据分析获取:



3.2.6 Top用户log分析



Step1:分析是否存在同频邻小区漏配或者错配导致的掉话;

Step2:分析是否存在弱覆盖导致的掉话;

Step3:分析是否由于切换来不及导致的掉话;

Step4:分析是否导频污染引起的掉话:

Step5:分析是否存在上行干扰导致的掉话:


如果掉话原因不是步骤1~5所述的原因,则很有可能是非RF原因导致的掉话,需要结合IFTS信息进一步定位;


如果是异常导致的掉话,则需要结合一键式日志、TTI跟踪等信息进行异常定位。


3.2.7 Top用户隔离定位


输入数据

1)eNB IFTS跟踪

2)UE TTI跟踪

3)UE侧路测log

4)eNB表口log

6)一键式日志

7)CHR日志



3.2.8 Top用户掉话分析四步曲


Step1:标口流程分析谁主动发起释放


1)eNB主动发起释放

eNB主动向核心网发起释放请求,收到核心网下发的释放命令后释放用户RRCConnRel、并向核心网反馈释放完成


2)核心网主动发起释放

eNB收到核心网下发的释放命令,释放用户RRCConnRel、并向核心网反馈释放完成


Step2:通过S1释放请求/命令中的释放原因值隔离掉话原因

1)无线侧原因触发释放

2)传输原因触发释放

3)NAS原因触发释放

4)协议原因触发释放

5)其他混合原因触发释放


Step3:CHR分析详细释放原因


Step4:复现问题抓取IFTS跟踪、UE侧Log,深度定位掉话根因


4 相关工具和信息获取方式


消息跟踪工具:



数据分析工具:





“切换测量控制”及“切换测量报告”消息的确认:



切换命令”消息的确认:

用消息查看软件,打开UU接口“切换测量报告”消息后面的一条RRCConnectionReconfiguration消息,便可打开消息查看其详细内容,以UE侧跟踪的消息为例:



重建请求消息发送“小区”的确认:

重建请求消息是发往哪个小区的,在网络侧通过跟踪文件比较容易确认,在UE侧可用消息查看软件查看UE侧UU接口“RRC_CONN_REESTAB_REQ”消息前的RRC_SIB_TYPE1消息,双击打开消息查看其详细内容

更多阅读:

影响LTE吞吐率的基本因素

十分钟教你看懂信令

LTE重要指标CQI分析

LTE-CA测试方案

《网优人归乡计划》-0506免费在线测评成绩公布!

NB-IoT技术详解

《网优日记之“好人坏人”》

大变天!《量子物理简说》给人类物理界、思想界带来超级风暴!

VoLTE注册流程详解-速度收藏!

携号转网要铺开了?谁会最受伤?是中国移动么?这有份数据告诉你

LTE关于掉话常用参数修改

一个故事形象表现,为什么通信项目难做

Copyright © 广州花草茶价格中心@2017