SDN概念的誕生已經(jīng)有十多個年頭,從近年來SDN技術發(fā)展與應用部署情況來看,數(shù)據(jù)中心領域技術發(fā)展成熟較早并迅速得到廣泛應用,而國內大型互聯(lián)網(wǎng)公司和運營商廣域網(wǎng)領域相對發(fā)展要慢一些,究其原因還是由廣域網(wǎng)的網(wǎng)絡實際情況決定的。
數(shù)據(jù)中心場景業(yè)務流量相對簡單,主要是東西向流量的和南北向流量,相關數(shù)據(jù)中心SDN架構解決方案主要面向解決和處理好Overlay隧道層面流量的打通和調度。而廣域網(wǎng)場景業(yè)務流量相對復雜,裸IP流量、MPLS-VPN業(yè)務流量、EVPN流量,往往疊加到一起,同時還要考慮到廣域網(wǎng)的互聯(lián)互通情況中多互聯(lián)互通出口流量的優(yōu)化和調度。
從網(wǎng)絡規(guī)模和網(wǎng)絡設備層面考慮,數(shù)據(jù)中心相對廣域網(wǎng)是個小范圍區(qū)域網(wǎng)絡,在單個數(shù)據(jù)中心資源池新建時,完全可以直接采用較為成熟的SDN架構,單一資源池或者一個資源的一個POD內直接采用單廠家方案,不同的資源池之間或者同一個資源池的不同POD間通過標準的SDN北向接口實現(xiàn)異常家解耦。而廣域網(wǎng)是個覆蓋范圍廣大的網(wǎng)絡,運營商級廣域網(wǎng)單個AS域就可以有上千臺路由器的規(guī)模,網(wǎng)絡架構雖然一直向扁平化方向發(fā)展,但是遠沒有數(shù)據(jù)中心Spine-Leaf架構那么規(guī)整。廣域網(wǎng)建設時為避免單廠家綁定,往往是異廠家設備混合組網(wǎng),因此廣域網(wǎng)SDN架構需要控制器直接去控制不同廠家的設備,無法簡單的應用單廠家的SDN解決方案。
基于以上原因,廣域網(wǎng)SDN應用和部署相對滯后。廣域網(wǎng)的SDN架構升級和部署,要考慮業(yè)務流量的平滑過渡,不能推倒重建,所以廣域網(wǎng)SDN架構設計和部署往往是要分階段地去實現(xiàn),從最迫切的需求入手,合理安排設備的升級節(jié)奏,逐步地引入和完善相關SDN功能。
2.廣域網(wǎng)SDN應用部署與演進的三個階段
第一階段,先從提升業(yè)務開通效率入手,解決最迫切的客戶業(yè)務自動開通需求,實現(xiàn)網(wǎng)絡的自動化配置能力。通過部署SDN控制器,實現(xiàn)配置命令通過Netconf接口或其他方式自動下發(fā)。對于有業(yè)務需求的節(jié)點,可以先更換或者升級這些節(jié)點的PE設備,實現(xiàn)SR-BE功能,使業(yè)務流量基于SR-BE去承載,有條件的可以兼顧實現(xiàn)基于松散路徑模式的SR-TE功能,這一階段也可以同時實現(xiàn)基于BGP-LS或其他協(xié)議的拓撲生成與呈現(xiàn)。
第二階段,隨著設備的逐步升級,SR功能的全網(wǎng)具備,以及SDN南向接口協(xié)議標準化演進和更廣泛的廠家設備支持,逐步實現(xiàn)基于SR-TE的差異化服務和業(yè)務流量路徑調優(yōu)功能,實現(xiàn)基于Telemetry的秒級信息采集,實現(xiàn)SDN控制器對網(wǎng)絡狀態(tài)和網(wǎng)絡資源全面的管理掌控。同時可以同步探索和實現(xiàn)部份網(wǎng)絡智能化功能,比如網(wǎng)絡流量模擬和網(wǎng)絡故障模擬,從而對網(wǎng)絡規(guī)劃、網(wǎng)絡優(yōu)化升級、網(wǎng)絡設備和架構調整提供更好的模擬分析和決策參考。
第三階段,基于SDN能力實現(xiàn)更高層次的網(wǎng)絡智能化。未來的IBN(Intent-based Network)或IDN (Intent-Driven Network),都要以SDN能力為基礎去演進和實現(xiàn)。
目前運營商的廣域網(wǎng)SDN部署基本都在第一階段已經(jīng)部份實現(xiàn),正在向第二階段演進的過程中。大型互聯(lián)網(wǎng)公司因為業(yè)務的需求更強烈,整體研發(fā)能力強,同時網(wǎng)絡規(guī)模又比運營商相對較小,因此廣域網(wǎng)SDN部署和應用相比運營商要更完善和超前。
3.廣域網(wǎng)SDN功能
如果只介紹廣域網(wǎng)SDN架構,會比較公式化。為了使大家更好的理解廣域網(wǎng)SDN,先談一談廣域網(wǎng)SDN的功能,理解了部署廣域網(wǎng)SDN是為了要實現(xiàn)那些功能,回過頭來再去看廣域網(wǎng)SDN架構以及廣域網(wǎng)SDN所涉及的接口協(xié)議,可能會理解的更加深入一些。
談到SDN控制器的功能,就不得不先分析下SDN控制器和傳統(tǒng)網(wǎng)管的關系。普遍的認為傳統(tǒng)的網(wǎng)管側重于設備和網(wǎng)絡狀態(tài)監(jiān)控管理,而SDN控制器側重于網(wǎng)絡資源管理和網(wǎng)絡轉發(fā)控制。資源管理和網(wǎng)絡設備硬件狀態(tài)的管理、網(wǎng)絡拓撲的管理,是分不開的,資源管理以設備狀態(tài)和網(wǎng)絡拓撲管理為基礎,而SDN控制器的控制功能是以全面掌握網(wǎng)絡資源和信息為基礎的,可以這么說SDN控制器需要繼承一部分傳統(tǒng)網(wǎng)管的能力或者要以傳統(tǒng)網(wǎng)管的能力為基礎來實現(xiàn)上層的功能,因此我覺得未來控制器和網(wǎng)管會走向合并和統(tǒng)一。
在傳統(tǒng)網(wǎng)管的監(jiān)控和管理能力之外,SDN控制器要實現(xiàn)資源的實時管控、業(yè)務的自動下發(fā)、路由分析、網(wǎng)絡仿真、差異化服務、流量調度等功能。下面對個人理解的廣域網(wǎng)SDN應該具備的功能進行梳理與介紹。
3.1.網(wǎng)絡監(jiān)測和數(shù)據(jù)呈現(xiàn)
能通過BGP-LS或其他協(xié)議獲取網(wǎng)絡拓撲,支持以BGP-LS收集SR-MPLS、SRv6等信息,能通過Telemetry實現(xiàn)秒級的網(wǎng)絡數(shù)據(jù)監(jiān)測上報,或者至少能通過SNMP實現(xiàn)全網(wǎng)監(jiān)測數(shù)據(jù)的周期采集。可以通過TWAMP或其他協(xié)議實現(xiàn)網(wǎng)絡質量監(jiān)控。
基于數(shù)據(jù)的采集和分析,可以呈現(xiàn)網(wǎng)絡的物理拓撲和邏輯拓撲,可以呈現(xiàn)相關數(shù)據(jù)信息和狀態(tài)信息,比如可以呈現(xiàn)各鏈路網(wǎng)絡流量情況及變化趨勢曲線圖,并根據(jù)一定的閾值設定對端口流量利用率進行監(jiān)控和告警。
3.2.業(yè)務配置自動下發(fā)與管理
SDN控制器能通過Netconf接口或其他方式實現(xiàn)下發(fā)MPLS-VPN、EVPN等業(yè)務配置,能夠監(jiān)測網(wǎng)絡內已有配置并同步到控制器,具備資源和配置參數(shù)沖突監(jiān)測功能,能對網(wǎng)絡配置參數(shù)和網(wǎng)絡資源全局統(tǒng)一分配管理。
3.3.SR隧道下發(fā)與管理
能夠創(chuàng)建、修改或者刪除SR-TE Tunnel。能夠通過PCEP或其他協(xié)議實現(xiàn)SR-TE Tunnel的托管和下發(fā)。可以設置隧道的Hot-Standby路徑或者Ti-LFA保護。
能夠創(chuàng)建、修改或刪除SR Policy和SRv6 Policy隧道,支持SR Policy和SRv6 Policy隧道Color、Candidate Path等參數(shù)的設置。
SDN控制器能夠支持以圖形化的方式呈現(xiàn)SR隧道路徑、流量、告警等信息,便于網(wǎng)絡管理員對隧道狀態(tài)和隧道所承載業(yè)務流量進行觀測與管理。
3.4.SR隧道路徑計算功能
一般提到通過SDN實現(xiàn)差異化服務和業(yè)務流量路徑靈活調優(yōu)等能力,都是以隧道路徑的計算、控制和下發(fā)能力為基礎的。隧道路徑計算功能主要包含以下幾個方面。
多重約束條件計算路徑
路徑計算時可以基于多重約束條件計算路徑,可以支持帶寬、時延、跳數(shù)限制、顯示路徑等約束條件。其中顯示路徑約束條件又分為顯示路徑包含(隧道必須嚴格或松散地經(jīng)過有序指定的鏈路或節(jié)點)和顯示路徑排除(隧道必須不能經(jīng)過指定的鏈路或節(jié)點)。
基于特定選路策略進行選路
根據(jù)約束條件計算路徑后可能有多條備選路徑,支持基于鏈路可用度最優(yōu)、鏈路剩余帶寬最大、Cost最小、時延最小等選路策略進行選路。
主備路徑分離
支持隧道主備路徑分離(SR-TE Tunnel或SR Policy),主備路徑盡量完全不共路或者少共路。也可以通過TI-LFA的方式實現(xiàn)隧道路徑的保護。
跨AS域隧道路徑計算(有多個AS域的超大網(wǎng)絡場景)
能實現(xiàn)跨AS域E2E路徑計算。支持基于收集的跨域拓撲,根據(jù)隧道約束條件進行E2E路徑計算,并將計算的路徑下發(fā)到轉發(fā)器。AS域內隧道和跨AS域隧道可以共存。
目前跨AS域場景的隧道計算和管理依然是廣域網(wǎng)SDN的一個難題,在進行域內路徑和域間路徑的拼接時,域內路徑最優(yōu)和域間路徑最優(yōu)要綜合考慮和衡量,整體比較復雜。
3.5.裸IP流量調度
在MPLS-VPN的業(yè)務場景,MPLS-VPN業(yè)務流量直接Over在SR 隧道上,通過更改或者優(yōu)化隧道路徑,就可以實現(xiàn)業(yè)務流量的差異化服務和路徑調優(yōu)。
在裸IP流量場景,要能實現(xiàn)將裸IP業(yè)務流量導入到隧道當中,從而實現(xiàn)裸IP流量的調優(yōu)。可以基于源IP、目的IP、源AS、目的AS、BGP路由Community等參數(shù)來抓取裸IP流量,并通過PBR方式導入到隧道當中。當然SR Policy場景下流量的導入會方便很多。
3.6.路由分析功能
能在網(wǎng)絡拓撲中可視化呈現(xiàn)IGP路由狀態(tài)信息,可以獲取并呈現(xiàn)IGP路由告警,包括IGP Peer Up、Down告警、IGP前綴路由撤銷和IGP路由Flapping等告警。
能通過BMP實現(xiàn)BGP路由信息采集,能在拓撲中可視化呈現(xiàn)BGP路由協(xié)議狀態(tài),包括Peer信息、AS發(fā)布路由等信息;對網(wǎng)絡中設備BGP運行狀態(tài)進行實時監(jiān)控,包括Peer的狀態(tài),路由新增、撤銷、更新事件。能提供BGP路由的分析與預警,包括公網(wǎng)BGP路由及BGP VPN路由。
3.7.網(wǎng)絡仿真
網(wǎng)絡故障仿真
能實現(xiàn)基于鏈路或者設備故障的網(wǎng)絡流量預測,并支持基于預測結果的網(wǎng)絡流量仿真。在網(wǎng)絡正常狀態(tài)下,能對特定設備或者鏈路故障時的網(wǎng)絡狀態(tài)進行模擬,輸出模擬仿真后的網(wǎng)絡狀態(tài)結果,包括模擬后的網(wǎng)絡資源和鏈路利用率,各鏈路承載的業(yè)務信息,以及重要業(yè)務流量的承載劣化情況等。便于網(wǎng)絡管理員對可能出現(xiàn)的網(wǎng)絡故障進行影響分析,并更有針對性地準備網(wǎng)絡故障預案。
網(wǎng)絡流量仿真
能實現(xiàn)流量突發(fā)場景的仿真,比如對重大熱點事件、電商促銷等流量突發(fā)場景進行仿真,根據(jù)導入的流量突發(fā)模型模擬流量突發(fā)后網(wǎng)絡承載情況,包括鏈路的擁塞情況,網(wǎng)絡資源和設備的負載情況。為網(wǎng)絡管理員制定疏導方案提供更有借鑒意義和直觀的參考。
4.廣域網(wǎng)SDN架構設計
4.1.單一管理域或AS域SDN架構設計
對于多廠家設備混合組網(wǎng)的廣域網(wǎng)SDN架構,理想的方案當然是單一控制器通過標準的南向接口去控制不同廠家的設備,但是現(xiàn)實情況是目前不同廠家的南向接口沒有實現(xiàn)全部的標準化,尤其設備配置Netconf的Yang模型,不同廠家還主要是以私有實現(xiàn)為主,所以SDN控制器在某些南向接口協(xié)議上就不得不去適配不同廠家私有接口。整體的廣域網(wǎng)SDN架構如下圖。
圖1.廣域網(wǎng)SDN架構
接口1、接口2、接口3為廠家的私有Netconf接口,SDN控制器通過適配廠家的私有Netconf接口去下發(fā)業(yè)務和設備配置。未來隨著技術的發(fā)展,如果能實現(xiàn)SDN南向Netconf接口的全面標準化和解耦,這三個接口可以統(tǒng)一為一個標準接口。此外需要說明的是,某些標準化程度不高,需要控制器去適配廠家私有實現(xiàn)的協(xié)議,也可以放入到接口1、接口2和接口3中,比如Telemetry。
接口4是一組協(xié)議,目前主要應用的有如下SDN南向接協(xié)議。
- PCEP,用于實現(xiàn)SR-TE Tunnel的托管、路徑下發(fā)和狀態(tài)上報;
- SNMP,讀取設備信息,如接口流量、隧道流量,通過SNMP Trap接收設備的告警信息;
- Telemetry,信息采集,如接口和隧道流量采集,性能數(shù)據(jù)采集,Telemetry比SNMP效率更高,可以實現(xiàn)秒級的信息采集,可以更好的實時監(jiān)控網(wǎng)絡設備和資源狀態(tài);
- BMP,BGP運行狀態(tài)采集,包括對等體關系的建立與解除、路由信息刷新等;
- BGP-LS,控制器通過BGP-LS收集拓撲信息、SR-MPLS信息,SRv6信息、鏈路時延等信息;
- BGP Flowspec,控制器通過下發(fā)攜帶流量匹配條件和流量匹配后執(zhí)行動作的BGP Flowspec路由,實現(xiàn)流量調優(yōu);
- BGP SR Policy/BGP SRv6 Policy,控制器通過BGP下發(fā)SR Policy信息,其中包含endpoint、color、candidate path信息,實現(xiàn)對隧道路徑、隧道負載等情況的控制;
- Netstream/Netflow/IPFIX:流量采樣,用于流量分析。在流量調優(yōu)和其他網(wǎng)絡調整前,都需要以流量分析結果作為參考;
- TWAMP,雙向主動測量協(xié)議,可以探測鏈路的時延、抖動、丟包率。
4.2.跨域SDN架構
某些大型網(wǎng)絡經(jīng)營者擁有多個獨立AS域的網(wǎng)絡,大部分網(wǎng)絡業(yè)務域內配置開通,但是也有部份業(yè)務需要跨域開通,例如運營商跨省網(wǎng)和骨干網(wǎng)的業(yè)務開通與流量調度。在跨域的場景下,可以通過業(yè)務編排層實現(xiàn)跨域的業(yè)務開通。但編排層是和業(yè)務和應用強關聯(lián)的,不具備直接的網(wǎng)絡管理能力,如果要實現(xiàn)承載業(yè)務流量的隧道路徑跨域計算和跨域端到端流量調度,就需要具備強大的網(wǎng)絡管理能力。我個人還是傾向于認為這個協(xié)同跨域業(yè)務開通的編排層如果被開發(fā)具備強大的網(wǎng)絡管理能力(跨域隧道路徑計算和跨域流量調度),應該叫超級控制器會更貼切些。
圖2.跨域廣域網(wǎng)SDN架構
當然網(wǎng)絡架構是為網(wǎng)絡需求服務的,以力求完備的架構和功能實現(xiàn)為出發(fā)點而不是以迫切的網(wǎng)絡需求為出發(fā)點去規(guī)劃和建設網(wǎng)絡,背離了網(wǎng)絡發(fā)展和演進的原則。廣域網(wǎng)SDN架構演進也是如此,以需求為導向,盡量在滿足需求的情況下去輕量化部署網(wǎng)絡SDN架構。比如經(jīng)常討論到的在廣域網(wǎng)SDN架構中,普遍認為差異化服務和流量調優(yōu)要以隧道路徑計算、隧道路徑優(yōu)化為基礎去實現(xiàn)。我覺得基于隧道路徑計算、優(yōu)化的功能實現(xiàn)差異化服務和流量調優(yōu)肯定是需要支持的,對于重點客戶的精確化服務能力的實現(xiàn)也是有意義的。但是面對大量客戶成千上萬的業(yè)務流量和承載隧道,調整起來會非常復雜,對控制器的要求會非常高,部署起來的困難可想而知。所以我覺得不管域內還是域間的差異化服務還是要以QOS能力為基礎去實現(xiàn),端到端給重要客戶的業(yè)務流量配置高優(yōu)先級,確保高優(yōu)先級業(yè)務流量在網(wǎng)絡承載能力不足、網(wǎng)絡擁塞時被優(yōu)先轉發(fā)。所以,在沒有明確的跨域隧道路徑調優(yōu)需求的場景下,完全不用開發(fā)超級控制器層,而只開發(fā)面向業(yè)務開通的編排層就可以,當然涉及到跨域業(yè)務開通時邊界設備的配置對接,當然也要編排層協(xié)調分配一定的網(wǎng)絡配置參數(shù)給到兩個域的不同控制器。
4.3.SDN控制器高可靠部署架構
SDN控制器作為整個網(wǎng)絡的大腦,高可靠部署非常重要。在單一的控制器內部,要通過集群或主備方式實現(xiàn)服務級高可靠保護,服務模塊單節(jié)點故障時,SDN控制器功能不受影響。
同時要實現(xiàn)SDN控制器的異地災備部署,在兩個不同的物理位置分別部署主、備控制器,主備控制器間數(shù)據(jù)進行實時同步。主備控制器可以快速切換,主備切換時,原有業(yè)務不中斷。
圖3.廣域網(wǎng)SDN控制器高可靠架構
5.總結
升級SDN架構,是網(wǎng)絡智能化演進的基礎,是廣域網(wǎng)網(wǎng)絡升級的必然途徑和必選項。但受限于廣域網(wǎng)多廠家混合組網(wǎng)的現(xiàn)狀,廣域網(wǎng)SDN架構升級是一個逐步升級和功能完善的過程,網(wǎng)絡運營者可以根據(jù)各自實際的網(wǎng)絡和業(yè)務情況去逐步推進SDN架構的部署與功能演進。
審核編輯:郭婷
評論
查看更多