云計算旨在靈活、有彈性地為企業提供附加價值。中國移動(CMCC)是中國最大的電信運營商和云服務提供商之一,正是通過其 Bigcloud 公共云產品提供這一服務。
Bigcloud 為關鍵任務應用程序提供 PaaS 和 SaaS 服務,以滿足企業云和混合云解決方案的需求。中國移動深知企業想要在實時在線的數字世界中保持競爭力就必須依賴其網絡和通信基礎設施。
當他們開始遇到對其云原生服務的巨大需求時,中國移動通過開放虛擬交換機 (OVS – Open vSwitch)實現網絡抽象和虛擬化,以自動化并獲得對其網絡的動態網絡控制,幫助他們滿足不斷增長的需求。
然而,由于東西向網絡流量的增加,維持網絡性能成為一項嚴峻的挑戰。
圖 1 。 Bigcloud 網絡解決方案。
識別網絡挑戰
隨著云服務的大量采用,中國移動在其虛擬化環境方面獲得了巨大的增長。這種虛擬化的擴展在其數據中心內的服務器之間產生了東西向流量的爆炸式增長。
由于網絡流量的增加,他們還看到了網絡擁塞的增加,導致更多的抖動和延遲,并阻礙了整體網絡吞吐量和應用程序性能。這導致了有效帶寬不足,他們無法跟上業務高峰時間的大量網絡流量。
在中國移動調查這些挑戰的原因時,他們確定這些問題的根源來自開放式交換機(OVS)的四個主要方面:
由于服務器 CPU 同時處理應用程序和網絡請求, 用于 VXLAN 封裝和解封規則處理的 vSwitch 交換效率低下。
由于在用戶空間、內核空間和內存之間頻繁進行上下文切換,導致基于內核的 vSwitch 轉發性能不佳,從而產生數據復制開銷。
基于 DPDK 的 vSwitch 轉發造成了對服務器 CPU 資源的爭搶,這些資源本已受到嚴格的限制。
由于過度的數據包丟失、抖動和延遲導致吞吐量降低, vSwitch 流規則能力有限。
這些挑戰成為了瓶頸,阻礙了應用程序以盡可能低的延遲獲得所需的高網絡流量吞吐量。
雖然 OVS 允許在主機之間以及外部世界之間轉發數據包和流規則,但它是 CPU 密集型的,并通過消耗本應用于客戶應用程序的 CPU 內核來影響系統性能,這將阻礙充分利用可用帶寬。
中國移動希望確保網絡應用程序的響應時間保持在較低水平,交付的帶寬保持一致,并且能夠滿足峰值需求。
圖 2 。 中國移動想要在其 BigCloud 的vSwitch Forwarding 上
同時支持 OVS 和 OVS-DPDK, 但在這方面面臨挑戰。
中國移動與這一領域的兩位專家,NVIDIA 和諾基亞合作,他們共同提供了一種高效的軟件定義網絡(SDN)解決方案。該解決方案結合了 NVIDIA ConnectX SmartNIC 和 NVIDIA BlueField DPU(數據處理器)在卸載、性能和效率方面的技術,以及 Nuage Networks 虛擬化服務平臺(VSP)的靈活性、彈性和自動化。
NVIDIA 和 Nuage 共同卸載了與 OVS 相關的計算密集型數據包處理操作,并釋放了昂貴的計算資源,以便它們可以運行應用程序而不是 SDN 任務。
SmartNIC 和 DPU 賦能的加速網絡
NVIDIA ConnectX 系列智能網卡和 BlueField 系列 DPU 提供 NVIDIA 加速交換和數據包處理(ASAP 2)技術,該技術在網卡(NIC)硬件內運行 OVS 數據平面,同時保持 OVS 控制平面完整性和對應用程序的完全透明性。
ASAP2 有兩種模式。在第一種模式中,硬件數據平面構建在 SR-IOV 虛擬功能(VF)之上,以便每個網絡 VF 可以直接連接到其對應的虛擬機(VM) 。
另一種模式是通過虛擬數據路徑加速(vDPA)進行 VirtIO 加速。VirtIO 允許虛擬機對硬件設備(如網卡)進行本地訪問,而 vDPA 通過使用稱之為 Virtqueue 的設備隊列來在網絡設備和標準 VirtIO 驅動程序之間構建的 OVS 數據平面,并與 VM 建立連接。這實現了虛擬機和加速網絡之間的無縫集成,控制平面在主機上進行管理,而 VirtIO 數據平面則由智能網卡進行硬件加速。
圖 3 。 vDPA 使用智能網卡硬件來卸載和加速每個虛擬機的流量。
Nuage Networks SDN 與
NVIDIA vDPA 技術的無縫集成
Nuage Networks 通過其虛擬化服務平臺(VSP)對本解決方案做出貢獻。VSP 執行虛擬路由和交換,是基于開放虛擬交換機的分布式轉發模塊,用作網絡服務的虛擬端點。VSP 立即識別計算環境中的任何變化,觸發網絡連接和配置中基于策略的即時響應,以確保應用程序性能。
Nuage Networks 的 VSP 使用 VXLAN 等隧道協議將原始有效負載封裝為覆蓋 SDN 解決方案。
由于標準網卡不識別新的數據包頭格式,傳統上所有數據包操作都必須由 CPU 執行,這可能會使 CPU 負擔過重,并導致網絡輸入/輸出(I/O)性能顯著下降,尤其是隨著服務器輸入/輸出速度的增加。
因此,Overlay 網絡處理需要被卸載到一個特定用于 I / O 的硬件適配器上,該適配器可以處理 VXLAN ,如 ConnectX 或 BlueField ,以減少 CPU 壓力。
vDPA 的性能優勢
圖 4 。 在軟件中運行 OVS-DPDK 和 ASAP2 vDPA 硬件加速的性能對比。
中國移動決定采用 VirtIO 解決方案以實現最大的兼容性,他們希望能夠根據使用情況選擇純 OVS 或 OVS DPDK 。Nuage Network 和 NVIDIA 攜手合作,為中國移動的公共云提供了一個敏捷、可擴展、硬件加速的 SDN 解決方案,并支持兩種類型的網絡虛擬化。
使用 Nuage Networks VSP 和 NVIDIA 硬件加速 vDPA 的聯合解決方案顯著提高了性能。與單獨在軟件中運行 OVS-DPDK 相比,網絡吞吐量增加了 1.5 倍,數據包轉發速度加快了 3 倍,Apache 基準測試每秒支持的請求數增加了 7 倍。
-
交換機
+關注
關注
21文章
2622瀏覽量
99259 -
中國移動
+關注
關注
22文章
5531瀏覽量
70922 -
應用程序
+關注
關注
37文章
3243瀏覽量
57601
原文標題:在中國移動 Bigcloud 上加速云原生應用
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論