一、概述
從VoLTE開始LTE流程變得更加復(fù)雜;首先,原來的雙層網(wǎng)絡(luò)結(jié)構(gòu)被新加入的IMS域搞得異常復(fù)雜;其次,21個(gè)網(wǎng)元和38個(gè)接口使多數(shù)人都是過目即忘;此外,多業(yè)務(wù)混合并發(fā)、QoS得到應(yīng)用、專用承載不定時(shí)地做建立、修改和釋放操作。
在VOLTE網(wǎng)絡(luò)中由于專用承載的頻繁管理操作、SIP消息傳遞丟失、重發(fā)和高延遲,以及相互之間千絲萬縷的聯(lián)系,相互之間缺乏相關(guān)控制機(jī)制(如同步、交互)導(dǎo)致了一系列極為錯(cuò)綜復(fù)雜網(wǎng)絡(luò)異,F(xiàn)象,這些給日常分析帶來許多困難。
VoLTE網(wǎng)絡(luò)的通信機(jī)制是來自4個(gè)標(biāo)準(zhǔn)化組織組合的產(chǎn)物,它們分別是:1.3GPP的23系列規(guī)范;2SIP/RTP/DIAMETER/IPSec取自IETF的RFC;3.VoLTE Profile和RCS取自GSMA的IR;4.Video code取自ITU-T的H.264。
目前網(wǎng)絡(luò)中的異常事件主要與這些標(biāo)準(zhǔn)之間的兼容性相關(guān);本文以切換與承載管理沖突形成的異常事件為樣本,分析VoLTE網(wǎng)絡(luò)中的異常事件。
二、切換與專用承載管理流程沖突導(dǎo)致的異常事件
1、切換與專用承載建立流程沖突導(dǎo)致(SIP消息503)
通常用戶撥打電話具有隨機(jī)性,網(wǎng)絡(luò)無法準(zhǔn)確預(yù)估專用承載建立的時(shí)間點(diǎn)。當(dāng)專用承載建立請(qǐng)求在源小區(qū)(eNB-A)發(fā)出RRC Connection Reconfigure和MME收到S1 pathswitch request之間到達(dá)時(shí),源小區(qū)會(huì)認(rèn)為UE已切出,源基站除了緩存用戶的用戶面數(shù)據(jù)外,不應(yīng)再處理該UE的(切換)消息,以原因值“未知的eNB UE S1APID”的方式拒絕專用承載建立請(qǐng)求,最終SBC會(huì)下發(fā)
503錯(cuò)誤。
圖1 專用承載建立與空口切換流程沖突
如上圖所示:該問題的解決辦法是要使MME能再次向切換的目標(biāo)小區(qū)(eNB-B)發(fā)專用承載建立請(qǐng)求,即在目標(biāo)小區(qū)上發(fā)Path Switch Rquest ACK之后再發(fā)ERAB Setup Request。
目前一般是通過升級(jí)SGW來解決該問題;但是升級(jí)之后可能會(huì)出現(xiàn)新問題下面討論的問題。
2、切換與專用承載釋放流程沖突導(dǎo)致的異常事件
切換與專用承載釋放流程沖突在專用承載建立、修改和釋放階段都可能概率性發(fā)生,在建立和修改階段一般會(huì)伴隨出現(xiàn)503錯(cuò)誤,導(dǎo)致未接通;
在釋放階段,如果出現(xiàn)該問題則有可能會(huì)出現(xiàn)一種死循環(huán),QCI1專用承載一直無法釋放,除非人工干預(yù)(關(guān)機(jī)重啟或飛行模式切換),否則可能永遠(yuǎn)無法做主被叫。
圖2 專用承載無法釋放,無法做主被叫,頻繁出現(xiàn)481,487和488錯(cuò)誤
被掛(叫)側(cè)(UE-B)出現(xiàn)RRC重建,沒有及時(shí)接收到SIP消息,但S-CSCF先觸發(fā)500(Server Internal Error),并清理了主掛側(cè)的QCI專用承載和會(huì)話;但S-CSCF未同步清理被掛側(cè),直到SIP重傳超時(shí)后,通過408(Request Timeout)清理IMS域會(huì)話;被掛終端每隔4秒重復(fù)BYE消息,而SBC認(rèn)為會(huì)話已結(jié)束,回復(fù)481(Call/Transaction Does Not Exist),未觸發(fā)MME啟動(dòng)專用承載釋放流程,同時(shí)終端沒有其他途徑通知MME啟動(dòng)專用承載釋放流程,因此QCI1專用承載一直吊死,后續(xù)通話無法進(jìn)行。
在測(cè)試中切換是導(dǎo)致QCI1專用承載無法釋放的原因之一,還有很多其他的可能,為避免上述這種極端的情況出現(xiàn),目前給出的建議是:SBC無論在收到或發(fā)出BYE消息之后,不要等待BYE200消息的確認(rèn),無條件啟動(dòng)會(huì)話清理和專用承載釋放流程。
3、SGW升級(jí)后連續(xù)下發(fā)S1AP消息導(dǎo)致的異常
為了解決本節(jié)第1點(diǎn)的問題,現(xiàn)網(wǎng)中通過對(duì)SGW升級(jí)來使MME能向目標(biāo)小區(qū)重發(fā)專用承載建立請(qǐng)求(ERAB Setup Request),但該消息的發(fā)送時(shí)機(jī)不當(dāng)仍然會(huì)導(dǎo)致產(chǎn)生一些異常。
(1) ERAB Setup Request消息在PathSwitch Request ACK之前抵達(dá)
圖3 ERAB Setup Request消息在PathSwitch Request ACK之前抵達(dá)
目標(biāo)eNB(eNB-B)尚未完成S1承載的切換,因此會(huì)以cause值“unspecified”響應(yīng)建立請(qǐng)求,專用承載建立失敗,SBC將下發(fā)503錯(cuò)誤。該現(xiàn)象說明SGW的處理機(jī)制存在一定問題,必須在Path Switch Request ACK之后再重發(fā)專用承載建立請(qǐng)求。
(2)ERAB Setup Request在Path Switch Request ACK之后1ms左右達(dá)到;
而eNB未響應(yīng)專用承載建立請(qǐng)求
圖4 專用承載建立請(qǐng)求消息丟失
根據(jù)3GPP規(guī)范和中國(guó)移動(dòng)的技術(shù)白皮書,S1/X2切換目標(biāo)側(cè)執(zhí)行階段,基站必須先響應(yīng)切換執(zhí)行,然后再處理專用承載管理。由于eNB沒有緩存該消息,導(dǎo)致沒有響應(yīng)專用承載建立請(qǐng)求。
目前給出的解決辦法:是對(duì)eNB做參數(shù)調(diào)整或升級(jí),使其能夠緩存ERAB管理消息 (erabsetup/ erab modify/ erab release )。
(3)eNB異常處理NAS消息,eNB響應(yīng)了S1承載刪除請(qǐng)求,但沒有將NAS消息進(jìn)一步傳遞給UE,導(dǎo)致UE的上下文出現(xiàn)異常; eNB發(fā)現(xiàn)上下文異常時(shí),將請(qǐng)求MME清理UE上下文并釋放RRC Connection。
圖5 空口QCI1 DRB未釋放
本例現(xiàn)象發(fā)生在業(yè)務(wù)釋放階段,在SBC滿足第2點(diǎn)改造要求的情況下,對(duì)業(yè)務(wù)體驗(yàn)不會(huì)有明顯影響。如果eNB不及時(shí)清理,或者SBC不及時(shí)清理,就有可能出現(xiàn)上述第2點(diǎn)的死循環(huán)現(xiàn)象。
4、Gx和Rx流程異常導(dǎo)致的專用承載建立失敗
PRCF的Gx和Rx接口采用Diameter信令,基于L-DRA路由,由于L-DRA的緩沖時(shí)延或者路由迂回都可能導(dǎo)致Gx鏈路時(shí)延大,RAR未及時(shí)發(fā)送到PGW;同時(shí)因X2/S1切換 SGW向PGW請(qǐng)求修改專用承載。根據(jù)協(xié)議規(guī)定,PGW會(huì)繼續(xù)SGW-initiated bearer modification procedure而reject RAR(result code: DIAMETER_OUT_OF_SPACE)。該問題與第1點(diǎn)類似,也是專用承載建立與切換流程沖突造成的專用承載建立失敗,同樣會(huì)觸發(fā)503錯(cuò)誤,該類問題發(fā)生
在EPC域內(nèi)。
圖6專用承載建立與EPC切換流程沖突
三、VOLTE流程異常事件總結(jié)
在VOLTE網(wǎng)絡(luò)中業(yè)務(wù)流程涉及多個(gè)通信規(guī)范和標(biāo)準(zhǔn),目前的異常事件主要集中在專用承載建立、修改和釋放過程;主要集中在以下三方面:
1.專用承載建立與流程沖突:主叫會(huì)收到503,終端主動(dòng)轉(zhuǎn)CSFB;被叫會(huì)發(fā)出580,然后收到Cancel由網(wǎng)絡(luò)發(fā)CS paging轉(zhuǎn)CSFB。
2.專用承載修改與流程沖突:空口的專用承載修改一般在主叫側(cè)發(fā)生,終端會(huì)發(fā)出Canel,主動(dòng)轉(zhuǎn)CSFB。
3.專用承載釋放與流程沖突:若SBC未及時(shí)觸發(fā)專用承載清理,或者eNB丟失S1AP消息,有很可能出現(xiàn)死鎖現(xiàn)象,導(dǎo)致無法主被叫,特別是在被掛側(cè);若SBC已升級(jí)(收到BYE消息立即清理)且MME由S1AP消息重發(fā)機(jī)制,則目前的問題主要集中在基站上。
針對(duì)以上問題,路測(cè)儀表統(tǒng)計(jì)為掉話,但不影響客戶感知;可以向用戶提出申請(qǐng)?jiān)诮y(tǒng)計(jì)中剔除。
[[i] 本帖最后由 ranhj 于 2016-12-8 09:41 編輯 [/i]]