基于網(wǎng)絡回溯分析技術的SCADA系統(tǒng)故障診斷

相關專題: 網(wǎng)絡 在線 技術

案例場景

某排水集團在線業(yè)務區(qū)的SCADA系統(tǒng)需要從DMZ區(qū)的I/O Server上采集數(shù)據(jù),SCADA系統(tǒng)使用某些IP能夠正常從I/O Server采集數(shù)據(jù),但是另一部分IP則不能正常的從I/O Server上采集數(shù)據(jù),提示異常并且斷開連接。

例如:10.2.103.8為SCADA系統(tǒng)的IP地址,能夠正常的從10.2.0.51和10.2.0.52的I/O Server上采集數(shù)據(jù),但是將SCADA系統(tǒng)的IP改為:10.2.103.10,則不能正常從10.2.0.51和10.2.0.52的I/O Server上采集數(shù)據(jù)。

案例分析

網(wǎng)絡拓撲圖(簡化)

下圖為簡化拓撲圖,我們展示SCADA系統(tǒng)和I/O Server之間的通訊鏈路,分別在靠近SCADA系統(tǒng)和I/O Server的接入交換機上采用端口鏡像的方式旁路部署科來網(wǎng)絡回溯分析系統(tǒng),采集SCADA系統(tǒng)和I/O Server之間的通訊數(shù)據(jù)包。

圖 1 網(wǎng)絡拓撲圖

故障排查

我們從DMZ區(qū)的交互機和在線業(yè)務區(qū)交互機上同時采集通訊數(shù)據(jù),進行對比分析,來看看具體是什么原因造成了業(yè)務系統(tǒng)的故障。

DMZ區(qū)交換機數(shù)據(jù)

在DMZ區(qū)交換機數(shù)據(jù)中可以看到TCP會話中10.2.103.10向10.2.0.52發(fā)送了大量的RST(復位)數(shù)據(jù)包,如下圖2所示。這些連接被這些復位數(shù)據(jù)包釋放掉了,但是為什么會存在這么多的復位數(shù)據(jù)包?又是誰發(fā)送了這些數(shù)據(jù)包?

圖 2 DMZ區(qū)捕獲到的TCP會話

通過查看科來網(wǎng)絡回溯分析系統(tǒng)的交易時序圖,可以發(fā)現(xiàn)復位數(shù)據(jù)包的TTL(生存時間)值是127。而正常時傳輸?shù)臄?shù)據(jù),可以看到TTL(生存時間)值為61,和異常時明顯不同,說明復位數(shù)據(jù)包并不是從10.2.103.10發(fā)出來的,而是有個中間設備發(fā)送了復位數(shù)據(jù)包中斷了正常的應用會話。

正常會話的TTLTTL值為61,而異常復位數(shù)據(jù)包的TTLTTL值為127。結合該集團的拓撲圖來看,正常會話發(fā)送初始TTLTTL值為64,經(jīng)過2臺防火墻和1臺核心交換機后抓取到的TTLTTL值為61,而異常復位數(shù)據(jù)包初始TTLTTL值為128,只經(jīng)過了DMZ區(qū)連接的防火墻,TTLTTL值減為127,說明復位數(shù)據(jù)包極有可能是某上網(wǎng)行為管理設備發(fā)送的。

在線業(yè)務區(qū)交換機數(shù)據(jù)

我們在在線業(yè)務區(qū)交換機上抓取數(shù)據(jù),找到同一個TCP會話。如下圖3所示:

圖 3 在線業(yè)務區(qū)捕獲到的TCP會話

可以看到該會話中同樣存在了大量的復位數(shù)據(jù)包,但與DMZ區(qū)不同的是,復位數(shù)據(jù)包是由10.2.0.52發(fā)送的。

同樣查看科來網(wǎng)絡回溯分析系統(tǒng)的交易時序圖,可以看到復位數(shù)據(jù)包的TTL(生存時間)值是126。而正常時傳輸?shù)臄?shù)據(jù),可以看到TTL(生存時間)值為125,和異常時明顯不同,同樣說明了復位數(shù)據(jù)包并不是從10.2.0.52發(fā)出來的,而是有個中間設備發(fā)送了復位數(shù)據(jù)包中斷了正常的應用會話。

正常會話的TTL值為125,而異常復位數(shù)據(jù)包的TTL值為126。結合該集團的拓撲圖來看,正常會話發(fā)送初始TTL值為128,經(jīng)過2臺防火墻和1臺核心交換機后抓取到的TTL值為125,而異常復位數(shù)據(jù)包初始TTL值為128,抓取到的TTL值卻為126,說明數(shù)據(jù)包只經(jīng)過了核心交換機和在線業(yè)務區(qū)區(qū)連接的防火墻,說明復位數(shù)據(jù)包極有可能是某上網(wǎng)行為管理設備發(fā)送的。

結論及處理結果

結合DMZ區(qū)與在線業(yè)務區(qū)捕獲的數(shù)據(jù)包分析來看,在正常的通訊過程中DMZ區(qū)與在線業(yè)務區(qū)之間的設備發(fā)送了RST(復位)數(shù)據(jù)包,釋放了正常的會話,造成了SCADA系統(tǒng)不能正常從DMZ區(qū)的I/O Server上提取數(shù)據(jù)。根據(jù)數(shù)據(jù)包的解碼分析,可以確定發(fā)送異常復位數(shù)據(jù)包的設備為某上網(wǎng)行為管理設備,通過對該設備策略的修改,10.2.103.10能夠正常的從I/O Server上提取數(shù)據(jù),未發(fā)生異常情況。

來源:廠商供稿


掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網(wǎng)絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復“LTBPS”免費領取《《中國聯(lián)通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網(wǎng)白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統(tǒng)架構1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息