一、前言
與MPLS技術(shù)相關(guān)的分支很多,例如MPLSRouting、L3VPN、L2VPN、MPLS Multi-cast、MPLS QoS等;其中的某些應(yīng)用和技術(shù),如基于RFC 2547 bis的L3 VPN,在國內(nèi)外多家ISP已經(jīng)成功應(yīng)用并大量部署,但是其它的技術(shù)和應(yīng)用如組播和QoS正處在發(fā)展和成熟時期,另外也有些技術(shù)如MPLS TE已經(jīng)基本成熟,在國外被部分運(yùn)營商接受和采納,而在國內(nèi)幾乎還沒有應(yīng)用。
就網(wǎng)絡(luò)流量工程而言,在MPLS技術(shù)出現(xiàn)之前,網(wǎng)絡(luò)管理員就已經(jīng)可以通過其他方式初步實現(xiàn)了,主要是通過調(diào)整IGP鏈路的Metric或者采用多個IGP平面來疏導(dǎo)不同POP之間的流量。MPLSTE帶來的好處是克服了傳統(tǒng)調(diào)整Metric方式的不足,這些不足包括:對IGPMetric的調(diào)整不像MPLSTE是站在全局角度綜合考慮網(wǎng)絡(luò)流量流向矩陣,對每條鏈路Metric的局部調(diào)整會影響整個網(wǎng)絡(luò)的流量變化,即牽一發(fā)而動全身;而且這種對局部鏈路的調(diào)整帶來的對全網(wǎng)變化可能是無法預(yù)知的,解決了這條鏈路的流量,卻帶來其他鏈路的擁塞,有“按下葫蘆浮起瓢”般的感覺;此外對IGP Metric的調(diào)整沒有有效的方法根據(jù)流量的來源控制傳送路徑,而只能根據(jù)它的去向;最后一點,調(diào)整Metric方式配置復(fù)雜,容易引起路由環(huán)路。
當(dāng)然,基于MPLS的流量工程在給了人們一個新的選擇的同時也是有代價的。這一選擇同其他任何新技術(shù)一樣,會迫使人們學(xué)習(xí)新的操作方式,打破傳統(tǒng)經(jīng)驗和思維按新的理論來配置網(wǎng)絡(luò)以實現(xiàn)流量調(diào)節(jié)。
另外,在引入MPLSTE時,需要清醒地認(rèn)識到,任何技術(shù)都不是萬能的,它可以解決一些關(guān)鍵問題,但是不能解決所有問題。每個運(yùn)營商都會針對自身的網(wǎng)絡(luò)情況,業(yè)務(wù)特點對是否采用各種新技術(shù)以及每種新技術(shù)帶來的代價之間進(jìn)行取舍。
二、TE功能描述
首先介紹一下MPLSTE的總體功能:
1. 提高、優(yōu)化帶寬利用率,延緩對帶寬的擴(kuò)容;
2. 可實現(xiàn)不同于傳統(tǒng)IGP Metric方式對帶寬、流量、流向、負(fù)載分擔(dān)實現(xiàn)控制,避免基于IGP Metric實施負(fù)載分擔(dān)會出現(xiàn)的針孔效應(yīng);
3. 可應(yīng)對突發(fā)事件、網(wǎng)絡(luò)鏈路/節(jié)點故障導(dǎo)致拓?fù)渥兓斐傻牧髁啃赂窬郑?br />
4. 對網(wǎng)絡(luò)流量矩陣進(jìn)行詳細(xì)測量,及時了解帶寬需求和網(wǎng)絡(luò)資源狀況,指導(dǎo)網(wǎng)絡(luò)規(guī)劃和鏈路升級;
5. 基于TE的FRR可提供50ms級別的物理鏈路、設(shè)備節(jié)點保護(hù);
6. 端到端TE LSP Tunnel本身也可提供快速保護(hù)。
在具體實施和部署TE時,由于不同的TE功能實現(xiàn)機(jī)制上存在差異和矛盾,因此很難在一個網(wǎng)絡(luò)中同時提供全部功能,需要對TE及FRR分類進(jìn)行詳細(xì)了解,才能制定符合運(yùn)營商網(wǎng)絡(luò)實際需求的TE部署策略。
三、戰(zhàn)術(shù)式TE--NativeIP網(wǎng)絡(luò)環(huán)境下的TE
如果運(yùn)營商的IP骨干網(wǎng)平時沒有啟用MPLS,屬于一個“RowIP”或“NativeIP”網(wǎng)絡(luò),在這種網(wǎng)絡(luò)結(jié)構(gòu)中我們可以采用“戰(zhàn)術(shù)TE”實現(xiàn)流量工程。所謂戰(zhàn)術(shù)式就是在需要的時候臨時配置,動態(tài)啟用RSVP信令,采用CSPF計算TE路徑,通過RSVP建立LSP。一旦TE的使命結(jié)束,再拆除TE隧道。這種TE主要解決網(wǎng)絡(luò)鏈路利用率不均衡的問題,直接的利益是可以延緩網(wǎng)絡(luò)帶寬擴(kuò)容,或者給帶寬升級留出充足的時間。
在“NativeIP”情況下,我們通常只能利用到TE提高帶寬利用率這一優(yōu)勢,對網(wǎng)絡(luò)流量流向矩陣的測量和統(tǒng)計,基本上還是需要通過其他方式解決,如Netflow、TMS或CEFAccounting等。因為戰(zhàn)術(shù)式TE都是在網(wǎng)絡(luò)的局部實施,沒有對全網(wǎng)所有路由器間的流量進(jìn)行采樣,因此很難準(zhǔn)確統(tǒng)計真實的網(wǎng)絡(luò)流量。
“NativeIP”網(wǎng)絡(luò)下我們無法實現(xiàn)基于TE技術(shù)的快速重路由FRR來實現(xiàn)50ms級別的鏈路、節(jié)點故障恢復(fù)。
四、戰(zhàn)略式TE—適合各種網(wǎng)絡(luò)環(huán)境下的TE
1.戰(zhàn)略式TE簡介
戰(zhàn)略式TE就是預(yù)先配置好RSVP信令、計算好TE路徑、并已經(jīng)預(yù)先建立的TE隧道。從實施的范圍角度它還可以細(xì)分為局部式、全局式兩種。
局部式通常在網(wǎng)絡(luò)核心POP節(jié)點之間實現(xiàn),因為網(wǎng)絡(luò)核心是全網(wǎng)流量交匯中心,對核心實施TE可以在盡可能小地配置工作量下,盡可能大地提供TE功能。運(yùn)營商在實施局部戰(zhàn)略式TE中,外圍通常為NativeIP或LDPEnabledIP,前者主要是沒有在全網(wǎng)啟用MPLS技術(shù)的運(yùn)營商采用,后者主要是在全網(wǎng)提供MPLS VPN業(yè)務(wù)(2547 bis)的運(yùn)營商采用。對于后者,需要注意穿越核心TE Domain的LDP LSP需要在TE Domain內(nèi)部實現(xiàn)IP Over RSVP功能,才能保證端到端PE之間的LDP LSP互通,從而實現(xiàn)端到端VPN業(yè)務(wù)。
全局戰(zhàn)略式TE就是在全網(wǎng)所有路由器上配置實現(xiàn)RSVPTE,這是TE最理想的部屬方式,可以實現(xiàn)TE的所有功能。此方式存在N方效應(yīng),擴(kuò)展性很差。而且一旦全網(wǎng)新增任何一個節(jié)點甚至新增任何一臺路由器,全網(wǎng)都需要重新配置新增的TELSP。據(jù)了解,在網(wǎng)絡(luò)中所有路由器上配置TE實現(xiàn)Fullmesh TE LSP 隧道的運(yùn)營商幾乎沒有,可能擴(kuò)展性是其主要制約。
無論局部式還是全局式TE,由于其預(yù)先配置的特性,可以實現(xiàn)TE的一個很具優(yōu)勢的功能—快速重路由FRR。
2.FRR簡介
FRR的具體實現(xiàn)隨廠家不同而不同,主要存在兩大方式:Facility和Detour。
Facility基于標(biāo)記堆棧技術(shù),可實現(xiàn)1:N的保護(hù),主要實現(xiàn)對鏈路的保護(hù),對節(jié)點進(jìn)行保護(hù)需要額外的配置;Detour基于每一條TELSP單獨進(jìn)行保護(hù),可同時實現(xiàn)對鏈路和節(jié)點的保護(hù),但是由于其只能提供1:1方式,其擴(kuò)展性不如Facility。由Facility方式延伸而產(chǎn)生的保護(hù)是“一跳式”保護(hù),這在實際網(wǎng)絡(luò)中已經(jīng)有大量部署,是TEFRR應(yīng)用最多的方式。在目前WDM系統(tǒng)沒有實現(xiàn)對波長保護(hù)的情況下一跳式FRR的作用就顯得更為重要。
一跳式FRR保護(hù)原理如下:
假設(shè)北京、上海兩個POP,分別由兩臺路由器構(gòu)成。其POP內(nèi)部、POP之間以及P到PE的連接方式見圖1。
圖1POP內(nèi)部、POP之間以及P到PE的連接方式圖
在北京、上海兩個POP節(jié)點的四個路由器之間配置FullmeshTE隧道,在北京、上海兩個節(jié)點之間的廣域網(wǎng)鏈路上配置Facility方式的FRR保護(hù),提供廣域網(wǎng)鏈路一跳式保護(hù)。以P2-P3之間的流量流向作為參考,P2路由器為本地修復(fù)點(PLR),P3路由器為匯合點(MP)。
此范例在TEDomain內(nèi)為FullmeshTE隧道,沒有LDP信令存在,所有LDP鄰接關(guān)系都是通過端到端TE隧道進(jìn)行封裝和承載的。當(dāng)北京、上海兩個核心節(jié)點之間的廣域網(wǎng)鏈路發(fā)生故障,原先通過這條故障鏈路的端到端TE LSP會被FRR機(jī)制提供保護(hù),隧道的首端(Headend)和尾端(Tailend)不會把這條隧道看作是“Down”了,因此LDP鄰接關(guān)系繼續(xù)建立并維持。
發(fā)生在核心節(jié)點所構(gòu)成的TEDomain內(nèi)部的鏈路故障,會引起IGP收斂,但是TEDomain內(nèi)沒有LDP信令的存在,因此不會引起網(wǎng)絡(luò)核心的LDP收斂。
TEDomain內(nèi)的IGP收斂,對ISP網(wǎng)絡(luò)外圍的LDP來說是透明的,不會引起網(wǎng)絡(luò)外圍LDP收斂,因為跨越核心TEDomain的LDP鄰接建立在TELSP隧道上,而隧道通過FRR機(jī)制被實施了保護(hù)。
當(dāng)然,網(wǎng)絡(luò)外圍的路由器通過接收到的IS-ISLSPFlooding可以判斷網(wǎng)絡(luò)核心拓?fù)浒l(fā)生了變化(在TE隧道沒有配置Forwarding adjacency參數(shù)的情況下),在IGP收斂結(jié)束后,在源端會對數(shù)據(jù)按照收斂后的路徑進(jìn)行轉(zhuǎn)發(fā)。
在具體采用何種FRR,提供何種保護(hù)的探討中,仍然需要根據(jù)運(yùn)營商網(wǎng)絡(luò)的具體配置和網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計。例如在北京和上海POP內(nèi)部還可以同時啟用RSVP和LDP信令,RSVP用于備份隧道的建立,LDP用于網(wǎng)絡(luò)正常狀態(tài)下在同一個POP內(nèi)部不同路由器之間建立LDPLSP。
3.FRR的其他特性和約束
同TE一樣,運(yùn)營商部屬FRR時,在利用其優(yōu)勢的同時還需要了解其局限。
(1) FRR是臨時措施,一旦FRR生效,保護(hù)隧道所在的物理路徑帶寬利用率會上升,為了確保備份TE隧道途徑的物理路徑中原有流量和保護(hù)流量的QoS,仍然需要輕載(Over Provisioning)來保障。FRR的保護(hù)機(jī)制決定了它的臨時性,保護(hù)鏈路在起到流量迂回作用時,與其他正常鏈路共爭帶寬,為了避免此時的網(wǎng)絡(luò)擁塞導(dǎo)致性能下降,因此要求網(wǎng)絡(luò)正常情況下,鏈路的帶寬利用率不能過高,低于50%為宜;
。2) FRR保護(hù)鏈路只在很短的時間內(nèi)有效,之后系統(tǒng)會分別進(jìn)行IGP收斂和首端LSP重優(yōu)化,采用make before break機(jī)制,并采用顯式共享來進(jìn)一步降低對帶寬的占用,如果為備份隧道預(yù)留帶寬不僅浪費(fèi)網(wǎng)絡(luò)資源,還會影像其他正常TE LSP的最優(yōu)路徑計算。因此不建議為FRR的保護(hù)鏈路提供預(yù)留帶寬;
。3) 經(jīng)測試,F(xiàn)RR可以提供50ms級別的故障恢復(fù),但是故障檢測的時間是關(guān)鍵,如果故障檢測耗時增加,F(xiàn)RR保護(hù)時間會相應(yīng)增加;
。4) FRR只在局部范圍起作用,當(dāng)鏈路或節(jié)點故障發(fā)生在TE Domain之外,系統(tǒng)的故障恢復(fù)需要IGP收斂實現(xiàn);
。5) 根據(jù)理論依據(jù)和配置試驗,F(xiàn)RR的節(jié)點保護(hù)可擴(kuò)展性低,而且目前節(jié)點設(shè)備的可靠性遠(yuǎn)遠(yuǎn)高于鏈路,因此不建議提供節(jié)點保護(hù);
。6) 部署TE需考慮設(shè)備兼容性,建議在TE Domain內(nèi)采用同一廠家設(shè)備。雖然各個廠家都聲稱與主流設(shè)備可實現(xiàn)TE及FRR兼容,但根據(jù)測試結(jié)果和以往經(jīng)驗,在某些特性上的具體實現(xiàn)上仍有細(xì)微差別,需要不斷調(diào)整各廠家設(shè)備的配置參數(shù),達(dá)到最佳的協(xié)調(diào)狀態(tài),這在網(wǎng)絡(luò)運(yùn)行初期缺乏TE維護(hù)經(jīng)驗的情況下較難實現(xiàn),容易導(dǎo)致網(wǎng)絡(luò)性能不穩(wěn)定。此外不同廠家設(shè)備在配合實現(xiàn)FRR時的保護(hù)恢復(fù)時間會延長,經(jīng)實際測試,不同廠家設(shè)備位于隧道中不同位置(PLR或MP)也會對FRR性能帶來影響。