中國聯(lián)通短信業(yè)務(wù)自2000年后呈幾何倍數(shù)增長,2003年短信量更是突破了500億條,僅2004年春節(jié)期間聯(lián)通短信發(fā)送量就超過20億條。短信平臺運行是否正常、穩(wěn)定直接關(guān)系到聯(lián)通用戶的切身利益,然而以往對短信平臺的監(jiān)控手段相對匱乏,常常須要手工操作和統(tǒng)計,存在著許多缺點,如:效率低、不直觀、不方便等等,嚴重影響了監(jiān)控效果。出于為廣大用戶利益著想和保障短信平臺安全的考慮,上海聯(lián)通增值業(yè)務(wù)部決定利用現(xiàn)有的接口數(shù)據(jù)開發(fā)短信監(jiān)控程序,以高效、直觀、方便的監(jiān)控界面對短信平臺全面的監(jiān)控,上海聯(lián)通首先在C網(wǎng)上實現(xiàn)了短信實時監(jiān)控系統(tǒng)的第一版本,以下對實現(xiàn)具體過程進行描述。
一、系統(tǒng)簡介
1. 短信平臺
短消息平臺完成移動通信網(wǎng)絡(luò)中用戶短消息的存儲轉(zhuǎn)發(fā)功能,同時提供外部短消息實體的接入和服務(wù)功能,還實現(xiàn)了CDMA網(wǎng)絡(luò)與GSM網(wǎng)絡(luò)的短消息互通、小區(qū)廣播等重要短消息功能,并且提供了多種對外接口,支持增值業(yè)務(wù)的開發(fā),其結(jié)構(gòu)如圖1所示。
圖1上海聯(lián)通短消息平臺
其中,業(yè)務(wù)處理部件是整個系統(tǒng)功能的核心,包括業(yè)務(wù)服務(wù)器和數(shù)據(jù)庫系統(tǒng)。業(yè)務(wù)處理部件采用TCP/IP協(xié)議與信令網(wǎng)關(guān)、SMPP網(wǎng)關(guān)和操作維護等模塊進行通信。在Windows操作系統(tǒng)、SQLServer客戶端軟件的支持下,可運行多種應(yīng)用軟件,完成MAP信令處理、短消息業(yè)務(wù)處理、數(shù)據(jù)存儲訪問、版本管理和告警管理等功能,實現(xiàn)短消息中心的系統(tǒng)功能。
SMPP網(wǎng)關(guān)采用PC服務(wù)器的結(jié)構(gòu)。它可以通過SMPP(V3.3)協(xié)議與GSM已有的短消息中心相連,通過SMPP(V3.4)或者SMPP(V3.3)協(xié)議與CDMA已有的短消息中心相連,實現(xiàn)兩網(wǎng)互通。SMPP網(wǎng)關(guān)將各類ESME同時與GSM短消息中心和CDMA短消息中心連在一起,實現(xiàn)增值業(yè)務(wù)的共享。
操作維護部件包括操作維護服務(wù)器OMM、計費服務(wù)器、業(yè)務(wù)受理臺和操作維護臺。業(yè)務(wù)受理臺以一定的權(quán)限管理數(shù)據(jù)庫中的用戶數(shù)據(jù),進行用戶增加、刪除、業(yè)務(wù)登記、修改等操作。操作維護臺通過應(yīng)用服務(wù)器實現(xiàn)系統(tǒng)的操作與維護,包括:數(shù)據(jù)配置、業(yè)務(wù)觀察、信令跟蹤、性能測量、故障跟蹤與定位、系統(tǒng)監(jiān)測與告警、計費、小區(qū)廣播控制等。
2. 監(jiān)控系統(tǒng)
短信監(jiān)控系統(tǒng)是為加強上海分公司對短信實時監(jiān)控、幫助值維人員及時發(fā)現(xiàn)問題、協(xié)助管理人員分析故障原因而開發(fā)的監(jiān)控系統(tǒng)。
監(jiān)控系統(tǒng)需要對短信平臺中業(yè)務(wù)服務(wù)器、信令網(wǎng)關(guān)、SMPP網(wǎng)關(guān)等進行實時監(jiān)控,對每一臺服務(wù)器采集所需數(shù)據(jù)并分析處理,最終給監(jiān)控人員提供圖形化的監(jiān)控界面。根據(jù)用戶的需求實現(xiàn)所需各種數(shù)據(jù)的圖形化顯示,能直觀地反映歷史同期的情況、能進行每日統(tǒng)計、能查詢?nèi)魏我粋時間點的相關(guān)數(shù)據(jù)、通信中斷時產(chǎn)生告警等。
監(jiān)控系統(tǒng)力求給監(jiān)控人員方便快捷的途徑去管理監(jiān)控和維護短信平臺。
二、需求分析
1. 數(shù)據(jù)源的要求
目前衡量短信平臺是否工作正常的數(shù)據(jù)需要有以下幾個方面。
。1)短消息中心的CPU、內(nèi)存占用率;
(2)CDMA->GSM和GSM->CDMA的消息流量;
。3)CDMA->移動和移動->CDMA的消息流量;
。4)BHSM、業(yè)務(wù)量;
。5)MT成功次數(shù)、MT成功率、MO成功次數(shù)、MO成功率;
(6)到SCP的業(yè)務(wù)量;
。7)短消息隊列等待數(shù)量等。
2. 監(jiān)控終端的功能需求
為了更有效、更直觀地監(jiān)控短信平臺是否工作正常,監(jiān)控界面要求使用圖形化界面,實時自動更新數(shù)據(jù),具有以下功能:對各項數(shù)據(jù)分別產(chǎn)生日圖、周圖、月圖、年圖從而能直觀地反映歷史同期的情況;能對某些數(shù)據(jù)如:業(yè)務(wù)量、MT/MO成功率等指標進行每日統(tǒng)計;能查詢?nèi)魏我粋時間點的相關(guān)數(shù)據(jù);通信中斷時產(chǎn)生和記錄告警并能方便地進行查詢等。
3. 其它需求
。1)能夠在機房或者辦公室等不同地點進行監(jiān)控;
(2)盡可能地充分利用現(xiàn)有設(shè)備和資源;
(3)不能影響短信平臺的安全性和穩(wěn)定性。
三、系統(tǒng)設(shè)計
通過需求分析,可以將該監(jiān)控系統(tǒng)劃分為數(shù)據(jù)采集和終端界面顯示兩大部分。
1. 數(shù)據(jù)采集
考慮到監(jiān)控終端軟件可能會在多個不同地方同時采集同一數(shù)據(jù)從而對短信平臺造成不必要的負荷,同時也考慮到應(yīng)充分利用現(xiàn)有設(shè)備,所以決定采用現(xiàn)有的OMM(操作維護系統(tǒng)服務(wù)器)統(tǒng)一進行數(shù)據(jù)采集、監(jiān)控終端從該服務(wù)器獲取數(shù)據(jù)的方式來實現(xiàn)數(shù)據(jù)的采集。
OMM是現(xiàn)有系統(tǒng)中用于操作維護短信平臺的后臺服務(wù)器,本身就具有一定的數(shù)據(jù)采集功能。其性能統(tǒng)計模塊負責將各業(yè)務(wù)前臺模塊中的性能統(tǒng)計代理進程所采集、傳送的性能統(tǒng)計數(shù)據(jù)實時存入性能統(tǒng)計數(shù)據(jù)庫SQLServer中,因此監(jiān)控終端軟件的數(shù)據(jù)源是基于OMM服務(wù)器的。
2. 監(jiān)控終端軟件的設(shè)計
根據(jù)需求分析,監(jiān)控終端需要實現(xiàn)以下幾個功能模塊。
。1)對各項數(shù)據(jù)分別畫出1天內(nèi)的曲線圖,并實時更新數(shù)據(jù)。
。2)顯示相應(yīng)的日圖、周圖、月圖、年圖,并求出相應(yīng)的最高值、最低值、均值。
。3)查詢詳細數(shù)據(jù)按『詳細』按鈕能顯示相應(yīng)的時間范圍內(nèi)的詳細記錄。
。4)根據(jù)用戶選擇的日期范圍對每日的主要指標進行統(tǒng)計。
(5)當無法鏈接統(tǒng)計服務(wù)器OMM或者其數(shù)據(jù)庫時將產(chǎn)生告警,并在主窗口底部顯示。
四、結(jié)束語
經(jīng)過實際一段時間的運行,本短信實時監(jiān)控系統(tǒng)運行穩(wěn)定,監(jiān)控、管理、維護方便,極大地縮短了障礙的發(fā)現(xiàn)和處理歷時,同時還便于分析問題、解決問題,將短信平臺故障隱患滅于萌芽狀態(tài),保障平臺設(shè)備更加穩(wěn)定、可靠地運行。
本實時監(jiān)控系統(tǒng)功能完善、操作方便、安全穩(wěn)定,上報的數(shù)據(jù)真實可靠,符合聯(lián)通提高運行維護信息化的要求,滿足維護規(guī)程關(guān)于系統(tǒng)監(jiān)控、障礙處理的要求,對日常維護工作以及遠程監(jiān)控的有極大的幫助,同時提高了值維人員的工作效率。
----《通信世界》