核心网问题导致EPSFB连续失败
现象描述
当采用基于切换方式的EPS FB拉网测试时,发现呼叫成功率在85%左右。分析信令发现,如果UE出现一次5G到4G切换失败,后续就会接连多次出现呼叫失败,联合核心网抓取log对问题进行了定位。
在被叫UE出现5G到4G切换执行失败后,UE进入到Idle状态。再次进行语音呼叫,会反复出现失败,一直无法恢复,直到PDU Session重新建立才能恢复,如图1所示。
图1  相关信令
问题分析
前后台信令分析
  1. 基站消息分析:切换失败,基站释放了NG口和UE context,UE进入到Idle状态,如图2所示。
    图2  基站消息
    UE侧看到主被叫的SIP流程均Cancel了。如图3所示(图3的上面部分是主叫,下面部分是被叫)。
    图3  SIP流程Cancel
  2. 空口消息:新的呼叫主叫UE切换到4G,建立QCI1正常。如图4所示。
    图4  空口消息
    而新的呼叫被叫UE未收到PDU Session Modification。
    在被叫呼叫的时间段,UE侧收到Invite,发出了100 TRYING和183 SESSION PROGRESS。如图5所示。
    图5  UE侧消息
  3. 对应基站侧数据看,基站未收到核心网下发的PDU Session修改。如图6所示。
    图6  基站侧数据
SEQ信令分析
  1. 在网管SEQ跟踪了测试UE的信令进行复现,复现结果具体如下:
    2020-07-08 14:35:19.067 被叫UE(话单:460020562230300,被叫号码13429446454)收到了 P-SCSF下发的invite消息。如图7所示。
    图7  INVITE消息
    随后,IMS返回了100 TRYING消息和183 SESSION PROGRESS消息。如图8所示。
    图8  trying消息和session progress消息
    但是核心网一直没有反馈后续的PDU Session Modification消息到UE,直到14:35:25.325,P-SCSF下发了CANCEL消息到UE。如图9所示。
    图9  CANCEL消息
解决方案
联系核心网协同排查故障,核心网抓包后确认是5GC的Bug导致,升级核心网版本后问题解决。