NSA场景手机占用5G无法上网
现象描述
现场NSA场景,小米10 5G终端芯片骁龙765处理器占用FDD1800锚点无法上网,关闭5G开关后能够正常上网。天机没出现,MATE偶尔会出现一两次,小米终端出现的概率很高,10次能出现约3到4次,需要排查问题原因。
现场版本信息:
  • 网管版本:R18 16.20.10
  • 基站版本:5.35.20.20P43
  • 设备型号:A9631 S26
问题分析
  1. 建议现场复现问题,并采集相关数据:
  • 反馈锚点站一键信息采集+nr的配置文件xml格式。
  • 网元复现问题记录:UElog(mdm或dlf格式)、锚点侧跟踪基于IMSI的log采集、NR离线信令跟踪、抓数,dps抓包(记录UEIP地址及问题时间点)。
    图1  复现问题记录
  • dps容器抓包方法:
    进入dps容器,然后输入以下命令开始抓包:
    dps_cap_start_manual 3,150,600,2000,200,“dps”;
    该命令抓取600秒的报文,需要前后方密切配合,输入命令后,立即开始测试;
    抓包文件获取方法:在对应基站的vsw目录下:/mnt/ssd/1/share/collect/dpscapdefault 将名称为“dps”的抓包文件,即刚才抓到的包,发回来即可。
  1. 现场反馈相关数据(由于终端为客户手机,无终端信令)及终端IP信息如图2图3所示。
    图2  终端相关数据1
    图3  终端相关数据2
  1. 在现场的dps抓包中过滤终端的IP信息,没有看到相关IP的数据。
  1. 进一步分析现场反馈的IMSIlog采集信息,正好现场NAS信令没有加密,可以看到给终端分配的IP地址信息,如图4所示。
    图4  IMSIlog采集信息
  1. 在dps抓包中过滤几个IP地址,其中有前3个IP的包,如图5中绿色和黄色行。
    图5  dps抓包过滤
  1. 进一步分析dps抓包,发现一个IP是通的,两个IP不通。
    终端分配10.239.108.23这个IP时(对应分配的SGW的地址为100.77.191.164),上下行IP包都有,正常如图6图7所示。
    图6  上下行IP包
    图7  抓包信息10.239.108.23
  1. 终端分配另外两个IP时不通,如图8所示。
    图8  另外两个IP抓包信息
  2. 终端IP:10.196.67.246(对应SGW地址100.77.191.20),只有上行GNB发送的终端的IP包,没有SGW回来的IP包,如图9所示。
    图9  抓包信息10.196.67.246
  1. 终端IP:10.248.202.196(对应SGW地址100.77.191.34),只有上行GNB发送的终端的IP包,没有SGW回来的IP包,如图10所示。
    图10  抓包信息10.248.202.196
解决方案
基于以上分析,是由于某些SGW地址不通,导致终端占用5G时无法上网,需要上端传输或核心网处理。
效果总结
本案例是由于某些SGW地址不通,导致终端占用5G时无法上网。在分析外场问题时,如果外场NAS未加密时,可以利用解码工具或wireshark,解码attach accept消息,获取终端IP。
在分析IP包时,可以利用wireshark的统计->conversation功能,对IP包有一个大概的汇总分析,为进一步分析提供排查思路,如图11所示。
图11  conversation