目錄
1 概述
2 切換問題定位思路
3 切換失敗問題
3.1 UE發(fā)多條測量報告仍沒有收到切換命令
3.2 切換過程隨機(jī)接入失敗
3.3 測量報告丟失
3.4 切換命令丟失
3.5 下行信道質(zhì)量差導(dǎo)致發(fā)送preamble達(dá)最大次數(shù)仍未收到RAR
3.6 eNB下發(fā)RRC信令等待UE反饋,不處理切換命令
3.7 X2_IPPATH配置錯誤導(dǎo)致切換失敗為例進(jìn)行分析
3.8 X2切換,源側(cè)發(fā)出切換請求,沒有收到切換響應(yīng)
3.9 X2切換,目標(biāo)側(cè)發(fā)送S1AP_PATH_SWITCH_REQ未收到響應(yīng)
3.10 X2切換準(zhǔn)備時間過長錯過最佳切換時間
3.11 S_RSRP、N_RSRP都比較高的站內(nèi)切換,用較小的HO_TTT(64ms),可以在信號惡化之前及時進(jìn)行切換
3.12 切換門限改小后乒乓切換次數(shù)增多,但是由于切換更加及時,切換失敗次數(shù)減少
1 概述
無線通訊的最大特點(diǎn)在于其移動性控制,對于終端在不同小區(qū)間的移動,網(wǎng)絡(luò)側(cè)需要實(shí)時監(jiān)測UE并控制在適當(dāng)時刻命令UE做跨小區(qū)的切換,以保持其業(yè)務(wù)連續(xù)性。
在切換的過程中,終端與網(wǎng)絡(luò)側(cè)相互配合完成切換信令交互,盡快恢復(fù)業(yè)務(wù),在LTE系統(tǒng)中,此切換過程是硬切換,業(yè)務(wù)在切換過程中是中斷的,為了不影響用戶業(yè)務(wù),切換過程需要保證切換成功率、切換中斷時延、切換吞吐率三個重要指標(biāo),其中最重要的是切換成功率,如果切換出現(xiàn)失敗,將嚴(yán)重影響用戶感受,切換中斷時延和切換吞吐率也會不同程度地影響用戶感受。對于網(wǎng)絡(luò)中可能出現(xiàn)的切換問題,本文根據(jù)當(dāng)前積累的LTE系統(tǒng)內(nèi)切換問題定位經(jīng)驗(yàn),給出相應(yīng)的問題隔離定位指導(dǎo),以優(yōu)化相應(yīng)的網(wǎng)絡(luò)指標(biāo)。
2 切換問題定位思路
切換信令失敗和切換用戶面中斷時延問題的定位思路圖分別如下:
圖1 切換信令失敗問題分析思路圖
圖2 切換用戶面時延問題分析思路圖
分析方法對應(yīng)表
3 切換失敗問題
3.1 UE發(fā)多條測量報告仍沒有收到切換命令
在ANR開關(guān)關(guān)閉時,如果不配置鄰區(qū)關(guān)系,不能進(jìn)行切換。
首先確認(rèn)eNB側(cè)配置是否有問題,是否是鄰區(qū)漏配。例如,UE要從小區(qū)A往小區(qū)B切換,發(fā)送了切換測量報告;此時,若小區(qū)A沒有配置小區(qū)B為鄰區(qū),即使收到切換測量報告也不會處理,不下發(fā)切換命令,導(dǎo)致切換失;此時,如果UE繼續(xù)往遠(yuǎn)離服務(wù)小區(qū)的方向移動,信號越來越差會導(dǎo)致掉話。
查看是否鄰區(qū)漏配,有如下方法:
LST EUTRANEXTERNALCELL(查詢外部小區(qū))
LST EUTRANINTRAFREQNCELL(查詢同頻鄰區(qū))
3.2 切換過程隨機(jī)接入失敗
暫且不考慮信道質(zhì)量差導(dǎo)致的隨機(jī)接入失敗,我們首先查看相關(guān)的參數(shù)配置是否合理。隨機(jī)接入性能與小區(qū)半徑配置有關(guān)系。如果UE在目標(biāo)小區(qū)最大接入半徑范圍之外的地方發(fā)起隨機(jī)接入,很可能出現(xiàn)preamble與RAR不匹配的問題,導(dǎo)致隨機(jī)接入失敗。隨機(jī)接入失敗的原因是UE側(cè)發(fā)送Preamble經(jīng)過無線信道傳輸時延后到達(dá)eNB較晚,導(dǎo)致eNodeB按照正常的接收窗去解Preamble時解成了上一個Preamble ID,導(dǎo)致發(fā)送的RAR和preamble不匹配。
出現(xiàn)這種問題時,華為測試終端的OMT上會有如下打。
如果小區(qū)覆蓋范圍較大(比如郊區(qū)),切換點(diǎn)離目標(biāo)小區(qū)距離大于目標(biāo)小區(qū)實(shí)際配置的小區(qū)半徑,會出現(xiàn)隨機(jī)接入失敗導(dǎo)致切換失敗?梢赃m當(dāng)增大目標(biāo)小區(qū)半徑,使得用戶實(shí)際位置在小區(qū)半徑之內(nèi)。
3.3 測量報告丟失
首先判斷測量報告丟失是否為上行信道質(zhì)量差導(dǎo)致,可以通過上面4點(diǎn)進(jìn)行分析。
下面給出下行加載場景下下行信道質(zhì)量差導(dǎo)致切換測量報告發(fā)不出去的案例:
現(xiàn)網(wǎng)路測一輪出現(xiàn)8次測量報告丟失,每次的S_RSRP均在-115dBm以內(nèi),在其它小區(qū)上行空載的情況下(即上行沒有干擾),-115dBm以內(nèi)不會出現(xiàn)上行受限。因此,不應(yīng)該是上行信道質(zhì)量差導(dǎo)致的測量報告丟失。
現(xiàn)網(wǎng)路測一輪出現(xiàn)8次測量報告丟失,每次下行信道質(zhì)量較差,SINR為負(fù)值,處于解調(diào)門限附近、IBLER不收斂;DL_Grant偏低,下行最大能力灌包的情況下,UE解到的DL_Grant應(yīng)該為1000(999),DL_Grant偏低說明PDCCH解調(diào)有問題;同時,UL_Grant偏低說明很可能是PDCCH解調(diào)問題導(dǎo)致UE解到的UL_Grant減少、上行調(diào)度不足。
分析相應(yīng)點(diǎn)的UL_Grant:
01:45:06.296 PCI56->PCI65
02:08:11.796 PCI264->PCI295
從UE層間消息分析:發(fā)送測量報告時,SR達(dá)到最大重傳次數(shù)觸發(fā)隨機(jī)接入ID_RRC_MAC_RA_IND;且SR觸發(fā)的隨機(jī)接入失敗,啟動RRC隨機(jī)接入。SR達(dá)到最大重傳次數(shù)說明UE在發(fā)送測量報告時沒有解到上行調(diào)度。
綜合以上分析,eNB未收到測量報告不是因?yàn)樯闲行诺蕾|(zhì)量差導(dǎo)致的上行信令丟失,而是下行加載場景下,下行信道質(zhì)量惡劣,UE解調(diào)PDCCH出錯,沒有解到上行調(diào)度導(dǎo)致測量報告沒有發(fā)出去;是下行信道質(zhì)量差導(dǎo)致的上行信令丟失。
同時,我們做了相應(yīng)的測試來驗(yàn)證我們的結(jié)論:打開上行預(yù)調(diào)度后,測量報告發(fā)不出去的次數(shù)明顯減少。
3.4 切換命令丟失
以50%Load_woICIC路測數(shù)據(jù)為例:
23:45:59.062PCI48->PCI50 UE未收到切換命令
該切換點(diǎn)鄰區(qū)信號陡升6dB,對服務(wù)小區(qū)造成很大的干擾;下行SINR很低(-5dB),UE不能正確解調(diào)切換命令。
可通過調(diào)整天線、兩個小區(qū)的CIO使提前切換來解決。
3.5 下行信道質(zhì)量差導(dǎo)致發(fā)送preamble達(dá)最大次數(shù)仍未收到RAR
首先分析切換點(diǎn)的信道情況:
從路測數(shù)據(jù)統(tǒng)計(jì)看,100%加載場景出現(xiàn)了12次切換完成eNB沒有收到的情況。各切換點(diǎn)S_RSRP都比較高,在上行空載的情況下,不會出現(xiàn)上行受限。分析下行信道質(zhì)量,SINR比較低(均為負(fù)值),且下行IBLER不收斂,說明下行100%加載場景下,下行干擾很大、信道質(zhì)量較差。
從OMT跟蹤打印看,UE發(fā)送preamble達(dá)最大次數(shù)仍沒有收到RAR,如圖:
下圖為100%Load_woICIC、100%Load_ICIC場景隨機(jī)接入失敗點(diǎn),與目標(biāo)站的距離均小于1km。cluster6小區(qū)覆蓋范圍較小,配置的Ncs_Index=2(相應(yīng)的最大接入半徑為2.15km),不影響隨機(jī)接入性能。
綜合以上分析,路測數(shù)據(jù)下行加載場景下的切換完成eNB未收到,是由于切換隨機(jī)接入失敗導(dǎo)致的。下行信道質(zhì)量差,導(dǎo)致UE沒有解到RAR;當(dāng)preamble達(dá)到最大重傳次數(shù)時,隨機(jī)接入失敗。
3.6 eNB下發(fā)RRC信令等待UE反饋,不處理切換命令
eNB下發(fā)了RRC信令(比如MIMO重配消息),因?yàn)橄滦行诺蕾|(zhì)量差,UE沒有解調(diào)出來。當(dāng)滿足切換條件時,UE上報測量報告,而eNB正在等待上一條RRC信令的反饋,因此,不處理測量報告。當(dāng)下發(fā)RRC信令達(dá)到2s后仍然收不到UE反饋,將其釋放,發(fā)送RRC_CONN_REL消息。如下圖:
eNB側(cè)跟蹤:
UE側(cè)跟蹤
3.7 X2_IPPATH配置錯誤導(dǎo)致切換失敗為例進(jìn)行分析
路測過程中,發(fā)現(xiàn)站點(diǎn)OSL355連續(xù)出現(xiàn)X2切換準(zhǔn)備失敗,如圖:
從切換準(zhǔn)備失敗的原因可以大致看出:傳輸資源不夠 或者 沒有配置IPPATH 或者 IPPATH中的鄰接點(diǎn)配置錯誤 導(dǎo)致,由于接入的用戶不多,因此應(yīng)該是IPPATH配置相關(guān)。
確認(rèn)方法:
1)從eCGI中可以確定基站ID為100123即OSL123基站,再根據(jù)上報的鄰區(qū)PCI為4的小區(qū)確認(rèn)是否屬于123基站,如果是則確定是123基站,如果不是則查看PCI為4小區(qū)所在的基站是哪些,逐個排查;
2)查看123基站的X2接口對應(yīng)的IPPATH是否配置,如果配置則確認(rèn)X2接口ID與IPPATH的鄰接點(diǎn)ID是否一致。
Step1: 查看目標(biāo)側(cè)基站相應(yīng)的SCTP鏈路號(X2SCTPLINKID);
LST SCTPLNK
Step2:根據(jù)SCTP鏈路號,查看相應(yīng)X2接口標(biāo)識(X2INTERFACEID)
LST X2INTERFACE;
Step3:根據(jù)X2接口標(biāo)識,查看相應(yīng)的IP配置是否正確。
LST IPPATH
經(jīng)過核查,發(fā)現(xiàn)OSL123雖然配置了與OSL355的X2接口,但是沒有配置相應(yīng)的IPPATH。導(dǎo)致OSL355向OSL123發(fā)送X2切換請求后,收到X2切換準(zhǔn)備失敗消息。配置X2_IPPATH后,切換OK。
3.8 X2切換,源側(cè)發(fā)出切換請求,沒有收到切換響應(yīng)
左圖為源側(cè)基站消息跟蹤;右圖為目的側(cè)基站消息跟蹤。
有時還會出現(xiàn)這樣的情況:由于源側(cè)收到HANDOVER_REQUEST_ACK較晚(秒級),延誤了最佳切換時機(jī),導(dǎo)致切換失敗。
3.9 X2切換,目標(biāo)側(cè)發(fā)送S1AP_PATH_SWITCH_REQ未收到響應(yīng)
目標(biāo)側(cè)發(fā)送S1AP_PATH_SWITCH_REQ未收到響應(yīng),導(dǎo)致此次切換失敗。同時,eNB不會處理后面上報的切換測量報告,導(dǎo)致新觸發(fā)的切換也失敗。
3.10 X2切換準(zhǔn)備時間過長錯過最佳切換時間
從Probe的測試數(shù)據(jù)中看到,UE在上報多次相同測量報告沒有收到切換命令。根據(jù)eNB側(cè)全網(wǎng)跟蹤信息分析發(fā)現(xiàn)這種情況下源側(cè)eNB發(fā)起X2切換請求。eNB切換X2準(zhǔn)備時間過了很長時間才收到切換請求響應(yīng);期間,目的側(cè)信號迅速衰減,最終目的側(cè)eNB沒有接收到切換完成消息、切換失敗。UE重建成功后,eNB發(fā)起對DRB的重配置消息時,UE沒有收到,eNB側(cè)RLC達(dá)到最大重傳次數(shù)直接釋放用戶。
UE切換失敗后發(fā)起重建,成功后由于沒有接收到DRB的重配置消息,再次發(fā)起重建,由于第一次重建eNB側(cè)RLC達(dá)到最大重傳次數(shù)釋放了用戶上下文,UE第二次重建被拒絕導(dǎo)致異常釋放。
PCI345小區(qū)RSRP覆蓋情況良好,在切換X2準(zhǔn)備期間,鄰區(qū)信號迅速衰減,導(dǎo)致UE隨機(jī)接入失敗,目的側(cè)沒有收到切換完成,切換失敗。X2準(zhǔn)備時間過長導(dǎo)致切換不及時錯過最佳切換時間,導(dǎo)致后續(xù)用戶重建掉話等情況。
【解決措施】
S1鏈路閃斷、傳輸受限等問題導(dǎo)致的切換失敗,通常是概率性出現(xiàn),難以定位分析;對路測切換性能有一定影響。
X2準(zhǔn)備時間過長從eNB側(cè)全網(wǎng)跟蹤上看X2信令傳輸浪費(fèi)了3s的時間。分析站點(diǎn)一鍵式日志時沒有發(fā)現(xiàn)X2鏈路故障的情況:底層SCTP鏈路發(fā)出消息后,如果在1s內(nèi)沒有收到數(shù)據(jù)包的ACK響應(yīng)就會發(fā)起數(shù)據(jù)包重傳,如果連續(xù)10次重傳失敗就會上報SCTP鏈路告警斷開SCTP。初步定位是由于X2信令重傳導(dǎo)致信令傳輸時延增大。經(jīng)過與客戶確認(rèn)發(fā)現(xiàn)客戶在近期調(diào)整傳輸網(wǎng)絡(luò),導(dǎo)致傳輸性能受到影響。
出現(xiàn)傳輸問題需要及時向客戶確認(rèn),以減少不必要問題定位。
3.11 S_RSRP、N_RSRP都比較高的站內(nèi)切換,用較小的HO_TTT(64ms),可以在信號惡化之前及時進(jìn)行切換
Test120100504 22:55:40.218 PCI48->PCI50 切換命令UE未收到
分析:
1、這次切換為站內(nèi)切換,切換點(diǎn)S_RSRP、N_RSRP都比較高;在下行加載場景下,目標(biāo)小區(qū)對原小區(qū)有較強(qiáng)的干擾。此時導(dǎo)頻SINR<0dB,DL_IBLER>20%,說明切換點(diǎn)下行信道質(zhì)量較差,導(dǎo)致切換命令丟失。
2、切換門限2dB,UE切換測量報告中N_RSRP-S_RSRP=3dB。這種S_RSRP、N_RSRP都比較高的站內(nèi)切換,在下行加擾場景下,切換點(diǎn)的下行信道質(zhì)量惡劣,需要提高切換觸發(fā)的及時性,在信道質(zhì)量急劇惡化之前完成切換。
3、為了提高切換及時性,將HO_TTT由128ms縮短至64ms。HO_TTT64ms的測試結(jié)果,在該點(diǎn)切換成功。
提高切換及時性后,上報切換測量報告點(diǎn)的信道質(zhì)量有所改善,SINR雖然也有顯著的減低,但仍然有2~3dB,大于解調(diào)門限;DL_IBLER 約15%,基本收斂于目標(biāo)值10%。下行信道質(zhì)量不是很差,保證了切換命令的正確解調(diào)。如下圖:
Test220100505 23:52:33.140PCI48->PCI50 切換成功(HO_TTT64ms)
Test320100505 01:06:09.937PCI48->PCI50 切換成功(HO_TTT64ms)
結(jié)論:
對于S_RSRP、N_RSRP都比較高的站內(nèi)切換,切換點(diǎn)信道質(zhì)量急劇惡化,需要提高切換的及時性。建議適當(dāng)改小切換門限(由3dB縮小為2dB),縮短切換觸發(fā)時間TTT(由128ms縮小為64ms)。
3.12 切換門限改小后乒乓切換次數(shù)增多,但是由于切換更加及時,切換失敗次數(shù)減少
在相同路線上進(jìn)行不同切換門限對比測試(2dB切換 vs 3dB切換),有如下結(jié)果:
1、3dB切換的路測數(shù)據(jù)中,統(tǒng)計(jì)的切換次數(shù)為103次;而2dB切換時的切換次數(shù)明顯增大(130次)。
2、2dB切換由于切換門限變小,更容易發(fā)生乒乓切換,從而切換次數(shù)變多。同時,切換門限減少也提高了切換的及時性,使得UE在下行信道質(zhì)量明顯惡化之前就觸發(fā)切換,提高了切換成功率。