分散應用集中管理的網(wǎng)絡結構,在管理網(wǎng)絡時較為靈活,卻給網(wǎng)絡故障的發(fā)現(xiàn)和分析帶來巨大的困難。所以,必要的實時監(jiān)測網(wǎng)絡性能及主干流量,可為我們發(fā)現(xiàn)問題提供有效地分析故障的依據(jù),成為網(wǎng)絡監(jiān)測系統(tǒng)的重要一環(huán)。
近年來網(wǎng)絡的發(fā)展非常迅速,不斷采用的新網(wǎng)絡技術對網(wǎng)絡維護提出了越來越高的要求。分散應用集中管理的網(wǎng)絡模式,以其應用靈活、管理方便統(tǒng)一而被眾多的網(wǎng)絡管理者所采用。而這種分散應用集中管理的網(wǎng)絡結構,卻給網(wǎng)絡故障的發(fā)現(xiàn)和分析帶來了巨大的困難。交換機、路由器以及VLAN技術的廣泛使用,使網(wǎng)絡流量變得越來越分散,普通的測試方法僅適用于共享網(wǎng)絡的測試,而對于全交換網(wǎng)絡只能是管中窺豹。采用何種手段,才可對網(wǎng)絡骨干進行實時的監(jiān)測呢?
網(wǎng)絡維護主要手段
目前,大部分網(wǎng)管中心的網(wǎng)絡維護手段主要有三類:網(wǎng)管軟件、協(xié)議分析儀、便攜式網(wǎng)絡測試儀。盡管這些工具在網(wǎng)絡維護過程中都有著很大作用,但是它們各自在功能上又都有所不足。
網(wǎng)管軟件的使用必須依賴于數(shù)據(jù)源提供的統(tǒng)計數(shù)據(jù),網(wǎng)絡中具有可網(wǎng)管功能的設備(如交換機、路由器)充當了這一角色。在此情況下,網(wǎng)管所能獲得的流量信息的多少將直接受這些設備的制約。獲得流量信息越多的設備價格越貴,同時過多的信息采集將大大影響這些設備的性能,而導致網(wǎng)絡的性能下降。
協(xié)議分析儀雖然能提供強大的協(xié)議分析功能,但是它分析內容的準確度和豐富程度則依賴于所能采集到的數(shù)據(jù)量,而如何能方便準確地采集網(wǎng)絡流量,尤其是主干流量,是當前協(xié)議分析儀所面臨的主要問題。
網(wǎng)絡骨干實時監(jiān)測分布方案圖
便攜式網(wǎng)絡測試儀受功能所限,僅能對底層的常見故障進行分析,適用于現(xiàn)場解決實際故障,對于復雜的網(wǎng)絡監(jiān)控,功能薄弱。
型號 | 說明 |
opv-pe/plus | fluke協(xié)議聽診器協(xié)議分析軟件專家版/tr(含專家分析&遠程控制&流量生成功能) |
opv-la | fluke分布式全雙工協(xié)議分析儀硬件(千兆/百兆、光纖雙絞線接口) |
ftap-8x | fluke 8端口光纖測試接口盒(ftap-8m為多模,ftap-8s為單模) |
tap-12 | fluke 12端口雙絞線rj-45測試接口盒 |
如此看來,這些維護手段對于網(wǎng)絡主干鏈路流量乃至整體性能都不能進行長期、深層和直接的監(jiān)測。如此一來,網(wǎng)絡的管理就出現(xiàn)了一個真空,而很多潛在的網(wǎng)絡故障也許就隱藏其中。傳統(tǒng)的測試技術已不能滿足復雜網(wǎng)絡的測試需求,千兆網(wǎng)絡的廣泛應用亦使得很多測試設備失去用武之地。
實時監(jiān)測性能與流量
在這樣的網(wǎng)絡環(huán)境下,當網(wǎng)絡發(fā)生問題時,現(xiàn)有的故障維護手段和方法都不能在不中斷網(wǎng)絡運行的前提下接入測試。網(wǎng)管系統(tǒng)由于先天的能力不足,不能獲得滿意的測試效果,并且,為保證關鍵網(wǎng)絡設備的性能不受影響,也不能過多地增加監(jiān)測能力,因此通過網(wǎng)管軟件進行網(wǎng)絡骨干的實時分析和故障分析,就顯得功能較低,網(wǎng)絡管理者有可能因此失去正確的判斷力。所以,必要的實時監(jiān)測網(wǎng)絡性能及主干流量會為我們發(fā)現(xiàn)問題提供有效的分析故障的依據(jù),而且這種對網(wǎng)絡主干性能的主動監(jiān)測也必然有機地銜接網(wǎng)管系統(tǒng)和現(xiàn)場故障診斷設備而成為網(wǎng)絡監(jiān)測系統(tǒng)的重要一環(huán),這也充分體現(xiàn)了預防為主的原則。
網(wǎng)管人員通過對網(wǎng)絡骨干進行集中的實時監(jiān)測可以做到:在中心機房或其他地方(遠程)直接獲得網(wǎng)絡主干、關鍵設備的實時流量情況。所有測試可在不中斷網(wǎng)絡及網(wǎng)絡設備運行的情況下進行 。能夠對流量進行深層的流量分析,包括捕獲包解碼,幫助管理者了解各種應用占用網(wǎng)絡帶寬的比例。所有統(tǒng)計信息的獲得不依賴于任何現(xiàn)有的網(wǎng)絡設備,很大程度上減少了網(wǎng)絡設備的負載。對于發(fā)現(xiàn)的故障進行分析,為進一步調用故障診斷工具進行現(xiàn)場故障排除提供幫助。
那么,使用什么樣高效便捷的手段實現(xiàn)對大型網(wǎng)絡骨干及關鍵設備進行實時的監(jiān)測并進行深層次的流量分析呢?
分析方案
我們?yōu)檫@種網(wǎng)絡骨干的監(jiān)測分析提供了基于Fluke網(wǎng)絡測試儀器的解決方案。這套方案的重點在于提供了分布式實時監(jiān)測與集中式控制管理的能力。方案中使用的設備如表所示。
基于這套方案可以實現(xiàn):協(xié)議分析儀專用硬件數(shù)據(jù)采集器OPV-LA可以直接接入網(wǎng)絡主干進行測試,獲得真實的流量信息,并且不會影響網(wǎng)絡的正常運行;可以提供網(wǎng)絡骨干的統(tǒng)計數(shù)據(jù)和詳實的測試報告;可以通過協(xié)議分析軟件遠程遙控硬件數(shù)據(jù)采集器進行流量分析,從而實現(xiàn)真正意義上的集中管理;提供深層流量分析,得到高層應用協(xié)議的統(tǒng)計數(shù)據(jù),如各層協(xié)議應用比例、點對點的通訊流量統(tǒng)計等。測試設備軟件管理和硬件控制靈活結合。TPA的引入提高了測試設備端口利用率,減少測試設備投資。
在實際的網(wǎng)絡環(huán)境中,可將測試設備接在主干鏈路中或者關鍵的服務器、路由器處,和網(wǎng)絡無縫地融合在一起而成為網(wǎng)絡的一部分。靈活分散的監(jiān)測和集中控制管理的結合成為本方案的一大特點,基于硬件的準確的數(shù)據(jù)采集和遠程監(jiān)控分析是本方案的基礎。
摘自《中國計算機報》2002.22