對網(wǎng)絡(luò)行為進行測量和分析

陳剛 鮑劍洋 丁穎


  網(wǎng)絡(luò)系統(tǒng)與人體系統(tǒng)一樣,會生病,會出現(xiàn)各種故障。因此,我們需要了解網(wǎng)絡(luò)的運行環(huán)境、網(wǎng)絡(luò)應(yīng)用和服務(wù)的實際工作狀況,為應(yīng)用和技術(shù)的改進提供參考,以此提高網(wǎng)絡(luò)服務(wù)和應(yīng)用的效率和效果。




  隨著網(wǎng)絡(luò)技術(shù)的日新月異,網(wǎng)絡(luò)的性能也不斷提高,用戶和網(wǎng)絡(luò)應(yīng)用逐漸增多。然而,這種擴張使網(wǎng)絡(luò)在可擴展、安全、服務(wù)質(zhì)量和創(chuàng)新性的應(yīng)用等方面也面臨新的挑戰(zhàn)。目前,與網(wǎng)絡(luò)的蓬勃發(fā)展不相符的是,對網(wǎng)絡(luò)運行的客觀規(guī)律的研究還缺乏系統(tǒng)的概念和方法,因此無法對網(wǎng)絡(luò)性能和功能的改善提供可量化的依據(jù)。




  究竟如何為網(wǎng)絡(luò)“把脈”呢?目前,可以通過對網(wǎng)絡(luò)行為進行測量和分析的手段,去了解網(wǎng)絡(luò)運行環(huán)境的網(wǎng)絡(luò)應(yīng)用和服務(wù)的實際工作狀況,為應(yīng)用和技術(shù)的改進提供參考,從而提高網(wǎng)絡(luò)服務(wù)和應(yīng)用的效率和效果。




  掌握了網(wǎng)絡(luò)規(guī)律和運行情況,就能夠幫助ISP或ASP根據(jù)網(wǎng)絡(luò)的性能更好地為用戶提供服務(wù); 了解網(wǎng)絡(luò)系統(tǒng)存在的不足和問題,就可以及時了解和排除網(wǎng)絡(luò)設(shè)備或軟件出現(xiàn)的故障,例如,對路由病理的研究等。




  本文介紹網(wǎng)絡(luò)測量方法和主動測量的數(shù)據(jù)分析方法。



1.網(wǎng)絡(luò)測量方法




  網(wǎng)絡(luò)測量方法主要分為兩種:被動測量和主動測量。




  被動測量和主動測量的區(qū)別在于,前者是被動地在網(wǎng)絡(luò)上接收流經(jīng)的數(shù)據(jù)包,而不會對網(wǎng)絡(luò)造成任何的負載;后者則是主動地向?qū)Ψ桨l(fā)出測試數(shù)據(jù)包,根據(jù)數(shù)據(jù)包在網(wǎng)絡(luò)上的傳輸情況來判斷網(wǎng)絡(luò)的性能。被動測量提供了單獨連接或者節(jié)點的性能描述,而主動測量則是針對位于一條路徑上的幾個連接和節(jié)點的性能。




  被動測量組件包括了報文sniffer工具、邊緣路由器所生成的流級別的流量統(tǒng)計表,以及另外一臺用于查詢路由信息的空閑的頂級路由器。




  主動測量組件則包括了由那些被置于主路由器中心的測量機器組成的網(wǎng)絡(luò)。這些機器交換測試流量,并收集全天的丟包率、延遲和連通性統(tǒng)計。然后將這些測量數(shù)據(jù)存入一個高性能數(shù)據(jù)倉庫。這些數(shù)據(jù)可以被用于流量工程、性能調(diào)試、網(wǎng)絡(luò)操作和以性能為目的所進行的測試。




  被動測量方法的實現(xiàn)相對簡單,在此不做更多介紹。




  而主動測量方法因為要涉及到測試位置的選取、測量機器的安置、數(shù)據(jù)采集的選擇、高性能數(shù)據(jù)倉庫的設(shè)計、數(shù)據(jù)挖掘和各性能參數(shù)的關(guān)聯(lián)等數(shù)據(jù)分析過程,以及最終結(jié)論的定義,所以實施起來相對復(fù)雜。




2.主動測量




  主動測量數(shù)據(jù)分析技術(shù)是由AMP(Active Measurement Project)組織提出的數(shù)據(jù)分析方法,其目標(biāo)是對主動測量數(shù)據(jù)提供基本的了解和分析,并利用這些數(shù)據(jù)對網(wǎng)絡(luò)的連通性有更好的理解。




  主動測量是基于RTT測量,而不是對單程延遲的測量。因為RTT測量更易于實現(xiàn),而且不會依賴外部設(shè)備去同步兩臺監(jiān)視器的時間。另外,有的測量方法是使用全球定位系統(tǒng)(GPS)接收器來同步主機的時間。但是這些系統(tǒng)過于昂貴而且難于安裝,并且獲得的額外信息也很有限,因此并不普及。




  具體來說, RTT測量是通過類似Ping的程序,每隔一定時間進行一次。該程序?qū)γ颗_主機發(fā)送ICMP響應(yīng)包,然后等待ICMP的回應(yīng)包,記錄每個站點的測量延遲。




  發(fā)現(xiàn)或者診斷一個站點故障的最好方法之一就是,查看RTT圖標(biāo)的起伏狀況。這些起伏表明了路由或者配置上的變化所引起兩個站點間RTT的改變情況。



  另外一點,就是要查看丟包率。如果一個站點的丟包率過高,那么它可能出現(xiàn)硬件損壞,這種分析是非;镜。如果要對一個站點的性能有進一步理解,就要通過比較它同其他站點的連通性來獲得。




  比如,你的日常鏈路出現(xiàn)的擁塞是否也同樣出現(xiàn)在其他站點上?你的連接回程時間是多少?它們是否相當(dāng)好或者在你的本地網(wǎng)絡(luò)出現(xiàn)某些問題導(dǎo)致RTT不穩(wěn)定?另外,還需要查看擁塞曲線的形狀:它們是否平滑?它們是否比其他站點的擁塞更大?如果圖中顯示擁塞曲線,那么它是如何影響你的流量的?




  通常我們認為,高性能網(wǎng)絡(luò)應(yīng)當(dāng)具備低RTT值和不太顯著的擁塞曲線。需要檢查的一個環(huán)節(jié)是TCP堆棧內(nèi)的TCP窗口尺寸,它會對在這些網(wǎng)絡(luò)上進行高速通信的可行性產(chǎn)生極大影響。再有,你還應(yīng)考慮到,在周五中午,日常連接同vBNS連接有多大的區(qū)別?




摘自《計算機世界》
   

微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息