Vivisecting Mobility Management in 5G Cellular Networks
Ahmad Hassan (University of Minnesota - Twin Cities), Shuowei Jin (University of Michigan), Arvind Narayanan (University of Minnesota), Ruiyang Zhu (University of Michigan), Anlan Zhang, Wei Ye (University of Minnesota), Jason Carpenter (University of Minnesota - Twin Cities), Z. Morley Mao (University of Michigan and Google), Zhi-Li Zhang, Feng Qian (University of Minnesota - Twin Cities)
摘要
隨著5G支持不同的頻帶和不同的發(fā)布模式(如SA和NSA),移動管理,特別是切換處理,變得非常復(fù)雜。度量研究展示了高頻切換將導(dǎo)致5G吞吐量的震蕩,甚至服務(wù)不可用。為此,作者建立一個數(shù)據(jù)集,基于此提出幾點分析結(jié)論,最后設(shè)計了一個預(yù)測系統(tǒng)Prognos來提升5G應(yīng)用的QoE。作者發(fā)布了研究的相關(guān)材料。 ? ?
背景
當(dāng)前,4G和5G共存,5G支持不同頻帶、5G的cell更加密集,這些條件導(dǎo)致移動切換變得十分復(fù)雜。然而,高頻的移動切換將導(dǎo)致嚴重的性能下降。
因此,理解當(dāng)前的5G移動切換和實踐十分重要。
然而,度量真實的移動切換面臨如下挑戰(zhàn):
在有限的資源和預(yù)算下,如何研究多種5G架構(gòu)(SA和NSA)、頻率帶寬、運營商?
如何安排不同層的數(shù)據(jù)收集任務(wù)?
如何精確測量移動切換在用戶設(shè)備上的能量消耗情況? ?
? 為了克服這些挑戰(zhàn),實現(xiàn)如下測量平臺: ? 1. 多個5G手機,可以訪問美國3個主要的運營商,作者使用2種設(shè)備:Samsung Galaxy S21 Ultra 5G/SM-G998U (S21U) 和 Samsung Galaxy S20 Ultra 5G/SM-G988U (S20U)。其中,S21U設(shè)備3個,S20U設(shè)備1個。 ? 2. 在unroot手機上的用戶軟件,可以捕獲移動相關(guān)的信息。從智能手機獲取低層信息需要獲取Diag(diagnostic interface)的訪問,它需要特殊的許可證和工具。作者使用Accuver XCAL來讀取Qualcomm Diag,可以收集到物理蜂窩ID等信息。 ? 3. 專業(yè)的度量工具來收集蜂窩控制平面事件。作者拓展了5G Tracker功能,實現(xiàn)了捕獲商業(yè)5G管理的關(guān)鍵信息:物理蜂窩ID,移動切換和頻率帶寬。以上的信息從Android 11的5G API中抽取。作者使用Android TeelephonyManager的onDisplayInfoChanged() API來識別頻率帶寬。 ? ?4. 用外部充電寶的物理電源監(jiān)視器來精確度量用戶設(shè)備的電源消耗對于電量消耗的計量,作者使用Monsoon Power Monitor來完成。? ?
分析與結(jié)論
作者使用這些技術(shù)來收集數(shù)據(jù),并進行了分析: ? 1. 5G的移動切換如何影響應(yīng)用?5G移動切換嚴重影響應(yīng)用的用戶體驗,比4G更嚴重;利用NSA 5G的雙模式的5G能緩解移動切換的負面作用。 ? 2. 5G移動切換的關(guān)鍵特性是什么?從3個方面考察移動切換:頻率、持續(xù)時間和用戶設(shè)備能量消耗;NSA的5G切換頻率更高;NSA的5G毫米波上切換頻率更高;NSA的移動切換平均需要167ms完成。移動切換的準(zhǔn)備階段占據(jù)很長時間,原因是5G的復(fù)雜性和技術(shù)的不成熟性。5G的移動切換下的能量消耗是4G的10倍,和移動切換的次數(shù)是正相關(guān)的。 ? 3. 5G切換對運營商的啟發(fā)是什么?5G蜂窩網(wǎng)的收斂范圍和移動切換是緊密相關(guān)的;NSA 5G切換不支持基站間的直接切換,導(dǎo)致5G-4G-5G切換,惡化了性能;4G和5G基站在同一個通信塔時,切換時間時長較短。 ? 4. 我們可以預(yù)測5G的切換來提升應(yīng)用程序的QoE嗎?作者提出Prognos。它利用觀測到的信號強度,用戶設(shè)備的度量報告和過去的切換來預(yù)測未來的切換和他們的類型。Prognos包括兩層預(yù)測流水線。它首先預(yù)測未來的信號強度,然后學(xué)習(xí)基站的切換邏輯。和單一模型相比,解耦的兩層預(yù)測方法降低了模型復(fù)雜度,提升了精度。Prognos包括3個組件:report predictor module考慮移動配置和信號強度質(zhì)量來預(yù)測measurement reports,decision learner module通過利用序列模式挖掘來學(xué)習(xí)特定運營商的切換策略,handover predictor module使用預(yù)測的measurement reports序列和學(xué)習(xí)的切換策略來預(yù)測切換的類型。其中,decision learner module學(xué)習(xí)運營商最新的切換邏輯。這個模塊的輸入是連續(xù)的measurement reports流和切換的命令。作者切分輸入流為多個階段,每個階段包括measurement reports,后面緊跟一個切換命令。切換決定的目標(biāo)是學(xué)習(xí)最新的切換烈性的模式。作者使用基于序列的模式挖掘:作者修改了prefixSpan算法實現(xiàn)在線學(xué)習(xí)。在每個階段結(jié)尾,這個學(xué)習(xí)算法如果觀察到舊序列就增加支持,如果遇到新序列就添加pattern。算法對比pattern的新鮮程度和設(shè)定的閾值來決定是否丟棄該pattern,保證了學(xué)習(xí)到的pattern沒有急劇增長。評估結(jié)果顯示,Prognos的F1-Score在0.92-0.94,超越了之前的方法1.9x-3.8x。在16K全景視頻流中,Prognos比默認的吞吐量預(yù)測算法提升了34.6%-58.6%的延遲時間;在實時測定體積視頻流中,Prognos增加了15.1%-36.2%的內(nèi)容質(zhì)量。 ?
個人觀點
當(dāng)前5G切換需要考慮多種因素,例如4G和5G、SA和NSA等。 ? 作者通過采集大量數(shù)據(jù)并分析,得出幾條經(jīng)驗性的結(jié)論,并提出一個預(yù)測方法。然而,本人認為,該工作有2點需要考慮: ?
時效性強。5G的部署和改進還在進行,這意味著作者花費大量力氣采集的數(shù)據(jù)可能未來3年就不再適用,因此從時間維度來看影響有限。
預(yù)測模塊平凡。這里的方法只是對現(xiàn)有工作的簡單改進,貢獻有限。
Understanding 5G performance for real-world services: a content provider's perspective
Xinjie Yuan,? Mingzhou Wu,? Zhi Wang (Tsinghua University),? Yifei Zhu (Shanghai Jiao Tong University),? Ming Ma,? Junjian Guo (Kuaishou),? Zhi-Li Zhang (University of Minnesota – Twin Cities),? Wenwu Zhu (Tsinghua University)
背景
近年來5G無論是基站數(shù)量還是用戶都獲得了很大的增長,僅中國就建設(shè)了115萬 5G基站。根據(jù)Cisco年度互聯(lián)網(wǎng)報告,截止2023年底 5G 連接的總帶寬會提高13倍, 到2027年, 5G 會占據(jù) 49% 的移動訂閱總量。過去對于5G的測量研究主要集中于NSA 5G(非獨立接入5G 依靠 4G 網(wǎng)絡(luò)設(shè)施來提供更快的速度和更高的數(shù)據(jù)帶寬), 本文主要研究SA(獨立接入) 5G, 且從內(nèi)容提供者(CP:content provider)的視角出發(fā),探究增加使用5G連接對于QoS/QoE的提升效果,以及為實現(xiàn)5G的最佳性能所需采取的配置策略。
概述
本文主要研究2300萬快手用戶在1年時間跨度內(nèi)的流量數(shù)據(jù)。主要面臨的挑戰(zhàn)如下:1.很多網(wǎng)絡(luò)中測量指標(biāo)并不能幫助我們學(xué)習(xí)到其中5G流量的度量。2.測量中有很多的隨機變量,如用戶設(shè)備類別和編碼方式。3.需要最小化數(shù)據(jù)收集對網(wǎng)絡(luò)的影響。4.參與網(wǎng)絡(luò)的第三方系統(tǒng)會對數(shù)據(jù)測量產(chǎn)生影響。 ? 為此,作者混合了主動與被動數(shù)據(jù)收集的方法以處理不同設(shè)備和OS的區(qū)別,以及私有域方法來應(yīng)對第三方運營商的影響。 ? 其中被動的數(shù)據(jù)采集是指用戶的統(tǒng)計數(shù)據(jù)和狀態(tài)信息以時間窗口為單位(10s)被發(fā)送到日志服務(wù)器上。在記錄時延時,由于用戶操作系統(tǒng)和設(shè)備的不同,本文沒有采取應(yīng)用的startup delay,而是使用了連接的建立時延(如RTMP連接時延)作為測量指標(biāo)。而主動的數(shù)據(jù)采集是指作者通過 traceroute進行的一些網(wǎng)絡(luò)核心架構(gòu)研究,這些研究能夠揭示運營商網(wǎng)絡(luò)中的部分特性。 ? 最后作者提出了一個試驗性的針對5G的緩沖策略,主要實現(xiàn)是當(dāng)發(fā)生rebuff情況時,則減少用戶最少緩沖時間;否則以β 的步長遞增緩沖時間。
總結(jié)
實驗顯示SA 5G 能夠提供更短的應(yīng)用層面時延, 例如:對于廣播能夠減少 ~60% 的 鏈接建立時延,且相對于4G能夠減少67~89% 的總傳輸時延, 提供更高的下載速度. 除此之外實驗顯示SA 5G 相對于 NSA 5G 有更好的性能.除此之外,5G對于 Horizontal Handovers(用戶從一個基站切換到另一個基站的服務(wù)區(qū)更加敏感),當(dāng)用戶數(shù)量增加時SA 5G 的下載速度可能會降低。 ? 最后作者還提供了一些不同于conventional wisdom的發(fā)現(xiàn),例如使用5G不一定會比4G更加耗能;SA 5G 的用戶會 “更接近于”(經(jīng)過的路由跳數(shù)更少)核心網(wǎng)絡(luò). 然而這種“接近”并不一定意味著與服務(wù)端交互的RTT會更短。 ?
個人觀點
本文對于5G網(wǎng)絡(luò)的多項指標(biāo)進行了詳盡的測量,具有相當(dāng)?shù)墓ぷ髁?。對于?shù)據(jù)收集中的挑戰(zhàn),采用了passive data collection以及 private field insersion。本文的測量結(jié)果總體上肯定了SA 5G在4G基礎(chǔ)上的性能提升,并且對于NSA 5G 先前的一些conventional wisdom進行了辯證的否定,推進了對于有關(guān)領(lǐng)域的認知。 ? 同時基于這些認知,本文提出了一種支持5G的視頻緩沖策略,在快手900萬用戶的測試中平均減少了7% 的緩沖時間,體現(xiàn)了對于實際應(yīng)用的指導(dǎo)作用。
Mobile Access Bandwidth in Practice: Measurement, Analysis, and Implications
Xinlei Yang, Hao Lin, Zhenhua Li (Tsinghua University), Feng Qian (University of Minnesota - Twin Cities), Xingyao Li, Zhiming He, Xudong Wu, Xianlong Wang, Yunhao Liu (Tsinghua University), Tianyin Xu (University of Illinois at Urbana-Champaign)
本篇文章系統(tǒng)調(diào)研了中國用戶的移動網(wǎng)絡(luò)接入帶寬,發(fā)現(xiàn)了一些令人驚訝的事實,并揭示了該現(xiàn)象背后的深層原因。此外,本文還提出了一種快速輕量的帶寬測試技術(shù),顯著降低了測試時間和運維成本。本篇文章是清華大學(xué)李振華老師團隊與杭州友聲科技公司的合作研究,合作單位還有明尼蘇達大學(xué)和伊利諾伊大學(xué)厄巴納-香檳分校。
背景
近年來,移動接入技術(shù)取得了重大的進展,例如最新的5G和WiFi 6E技術(shù),分別可以達到20Gbps和9.6Gbps的接入帶寬。雖然這些新興無線技術(shù)正在全球范圍內(nèi)被積極、廣泛地部署,但是大規(guī)模的帶寬測試結(jié)果顯示,截至2021年底,美國的5G帶寬中值僅為135Mbps,中國的5G帶寬中值僅為304Mbps,且美國和中國的WiFi帶寬中值僅為137Mbps和153 Mbps。由此觀之,在實際場景下這些新興技術(shù)的部署與使用并沒有充分造福普通移動終端用戶。 ? 理解上述現(xiàn)象的背后深層次原因是優(yōu)化當(dāng)今移動網(wǎng)絡(luò)的第一步。然而,受限于移動網(wǎng)絡(luò)協(xié)議棧的復(fù)雜性、異構(gòu)移動生態(tài)系統(tǒng)的龐雜性以及大規(guī)模高效測量手段的匱乏,現(xiàn)有對移動網(wǎng)絡(luò)的測量研究通常存在測量規(guī)模局限或分析深度不足的問題,嚴重阻礙了我們對當(dāng)今移動網(wǎng)絡(luò)的深入理解。
設(shè)計
本篇文章的調(diào)研工作是基于一個名為UUSpeedTest(BTS-APP)的安卓帶寬測速應(yīng)用完成的,該軟件擁有約1700萬的用戶(主要在中國),以及每天約有20萬的測試請求。在保護用戶隱私的前提下,作者團隊通過使用BTS-APP輕量級的持續(xù)收集帶寬測試數(shù)據(jù),實現(xiàn)了超大規(guī)模的網(wǎng)絡(luò)測量。其中,作者對BTS-APP進行了兩方面的改進,一方面是通過捕獲物理層和鏈路層協(xié)議數(shù)據(jù),實現(xiàn)了細粒度的網(wǎng)絡(luò)測量與分析;另一方面是提出了一種基于UDP的猝發(fā)式快速帶寬測試技術(shù),減少測試時間與運維成本。下面,分為調(diào)研結(jié)果分析和帶寬測試技術(shù)改進兩部分對文章進行介紹。
調(diào)研結(jié)果分析
經(jīng)過4個月的數(shù)據(jù)采集,總共接收到了約354萬個用戶的2363萬條帶寬測試請求,且99.7%的測試請求來源于中國,包含了WiFi、3G、4G、5G四種不同的測試類型。此外,文章還參考了BTS-APP其他時段的數(shù)據(jù)報告,用于分析其他時間段的數(shù)據(jù)。 ? 整體上看,調(diào)研結(jié)果體現(xiàn)了一下幾個特征(結(jié)果見下圖) ? 1. ?? 蜂窩網(wǎng)絡(luò)(包括4G和5G網(wǎng)絡(luò))的接入帶寬不但沒有隨著5G規(guī)模部署而提升,反而出現(xiàn)了下降情況,其主要是由過度激進的4G->5G頻譜資源重耕導(dǎo)致的。 ? 2. ?? 城市地區(qū)的蜂窩網(wǎng)絡(luò)接入帶寬高于鄉(xiāng)村地區(qū),主要是因為基礎(chǔ)設(shè)施部署密度不同; ? 3. ?? 軟硬件方面,安卓系統(tǒng)版本會影響移動設(shè)備的接入帶寬,且版本越高往往帶寬越高,這是由于更高版本的系統(tǒng)對無線管理模塊做出了相當(dāng)大的改進;當(dāng)?shù)投藱C型和高端機型搭載相同的安卓系統(tǒng)版本時,其接入帶寬通常不會表現(xiàn)出明顯差異; ? 4. ?? 運營商方面,由于4G基礎(chǔ)設(shè)施部署都比較成熟,不同運營商的4G網(wǎng)絡(luò)平均接入帶寬非常接近;中國廣電(ISP4)的5G網(wǎng)絡(luò)帶寬顯著低于其他三個運營商,這是因為他將5G部署于較低的頻段;中國電信(ISP3)則使用了更具優(yōu)勢的頻段達到了相對更高的帶寬。
? 對于4G網(wǎng)絡(luò),文章分為網(wǎng)絡(luò)頻譜資源特征、頻譜資源重耕、LTE-Advanced技術(shù)部署三個方面對調(diào)研結(jié)果進行了分析(結(jié)果見下圖) ? 1. ?對于不同的移動網(wǎng)絡(luò)頻譜資源,數(shù)據(jù)表明4G網(wǎng)絡(luò)使用的頻段越高,通常網(wǎng)絡(luò)帶寬越高。但存在一個高頻段的帶寬較低,這是因為這個頻段主要在鄉(xiāng)村地區(qū)使用,基礎(chǔ)設(shè)施部署比較分散。 ? 2. ?由于高頻段能夠提供更高的接入帶寬,一些高頻段頻譜資源因此被重耕給5G網(wǎng)絡(luò)使用。這導(dǎo)致了4G網(wǎng)絡(luò)整體接入帶寬的下降。 ? 3. ?數(shù)據(jù)顯示,6.8%的4G網(wǎng)絡(luò)帶寬測試結(jié)果超過了300Mbps,與如今商用5G網(wǎng)絡(luò)的接入帶寬相當(dāng)。進一步研究發(fā)現(xiàn)其大部分的測試地點在城市主干路上,這些地點采用了一些LTE-Advanced技術(shù)用于改善網(wǎng)絡(luò)。 ?
? 對于5G網(wǎng)絡(luò),文章分為頻譜資源重耕、單日流量模式、信號強度三個方面對調(diào)研結(jié)果進行了分析(結(jié)果見下圖) ? 1. ?? 目前,總共有5個5G頻段,其中有3個是來自4G網(wǎng)絡(luò)的重耕頻段,數(shù)據(jù)顯示重耕頻段帶寬一般低于其他5G專用頻段。不過在重耕頻段中,N41頻段具有相比未重耕頻段更高的帶寬,這是因為4G的B41頻段中的高頻部分被劃分為了N41??偟膩碚f,頻譜資源重耕也是導(dǎo)致5G帶寬下降的一個重要原因。 ? 2. ?? 對于單日內(nèi)的不同時間段,往往使用人數(shù)比較多的時間段平均接入帶寬比較低。不過,當(dāng)用戶數(shù)量相當(dāng)時,部分晚上時段的平均接入帶寬明顯低于白天時段。這是由于5G基站使用了節(jié)能策略,會在21時至次日9時針對部分5G基站啟用“睡眠模式”來減少5G基站的功耗。 ? 3. ?? 數(shù)據(jù)顯示,信號強度并不一定正比于接入帶寬。作者通過分析發(fā)現(xiàn)信號強的地方,往往使用人數(shù)比較多,基站部署部署較為密集,容易存在存在基站間信號干擾、負載均衡、越區(qū)切換的問題導(dǎo)致帶寬下降。
? 對于WiFi網(wǎng)絡(luò),數(shù)據(jù)顯示隨著WiFi技術(shù)的飛速發(fā)展(4->5->6),WiFi網(wǎng)絡(luò)的平均接入帶寬卻幾乎停滯不前。其中WiFi 5相比WiFi 4技術(shù)得到的提升,主要是來源于5GHz頻段的使用。此外,數(shù)據(jù)可以推斷出64%的WiFi用戶仍在使用200Mbps的有線帶寬接入。因此,實際場景下發(fā)展緩慢的固定寬帶成為了WiFi 5和WiFi 6的達到高接入帶寬的最大阻礙。 ? 總的來說,從數(shù)據(jù)結(jié)果可以看到,雖然新興技術(shù)(5G和WiFi 6)確實可以達到較高的帶寬,但目前用戶主要使用的仍然是傳統(tǒng)技術(shù)(4G和 WiFi 4/5),且4G和5G技術(shù)之間存在資源競爭,導(dǎo)致產(chǎn)生了一定的帶寬下降。因此,作者倡導(dǎo)使用更有效的重耕技術(shù),促進更好的資源利用,以及擴大LTE-Advanced技術(shù)的使用,以具有高成本效益的方式改進LTE基礎(chǔ)設(shè)施的部署。此外,作者還呼吁用戶保持理性,應(yīng)該了解5G的實際性能以及系統(tǒng)版本對帶寬的重要性。 ? 帶寬測試技術(shù)改進:目前,主流的帶寬測速軟件采用的是一種泛洪式帶寬探測技術(shù),然而該技術(shù)會受到TCP慢啟動機制的影響,在慢啟動過程中的收集的帶寬數(shù)據(jù)對于估算用戶接入帶寬是無效的。并且且這些數(shù)據(jù)如果沒有被正確過濾,將會嚴重影響的測試結(jié)果的準(zhǔn)確性。雖然部分先前工作已經(jīng)提出了一些解決方法,但測試開銷和準(zhǔn)確性仍然會收到TCP慢啟動機制的影響。 ? 調(diào)研數(shù)據(jù)顯示,不同的無線接入技術(shù)的接入帶寬分布符合獨立的多模態(tài)高斯分布?;谠撚^察,作者提出了一種新的帶寬測試技術(shù)Swiftest,通過使用概率模型指導(dǎo)帶寬探測的初始數(shù)據(jù)速率的選擇,從而避免 TCP 慢啟動中的長時間加速。此外,為了在大規(guī)模場景下實現(xiàn)上述設(shè)計,Swiftest將傳輸協(xié)議從 TCP 更改為 UDP。 ? 經(jīng)過一個月的線上測試,Swiftest相比BTS-APP可以使用更快的速度以及更小的網(wǎng)絡(luò)容量完成精確的帶寬測試(結(jié)果見下圖)。
此外,Swiftest還與其他最先進的帶寬測試技術(shù)進行了比較,結(jié)果顯示無論是在效率、網(wǎng)絡(luò)容量使用還是準(zhǔn)確性方面,都是Swiftest最優(yōu)(結(jié)果見下圖)。
?
個人觀點
本篇文章具有非常強的現(xiàn)實意義,其通過完整的調(diào)研發(fā)現(xiàn)了一些驚訝的事實,例如近年來4G,5G,WiFi網(wǎng)絡(luò)的平均接入帶寬不但沒有隨著無線技術(shù)的飛速發(fā)展與基礎(chǔ)設(shè)施的全面升級而上升,反而出現(xiàn)了停滯不前甚至下降的現(xiàn)象。針對這一反?,F(xiàn)象,作者通過大規(guī)模測量分析,診斷出其背后的深層次原因,并提出了一系列可能的改進方案。同時,利用上述測量分析結(jié)果,本文還提出了一個輕量快速的帶寬測試方案,可以提升測試效率與節(jié)約運維成本。通過線上大規(guī)模測試與在受控環(huán)境中的基準(zhǔn)實驗,本文證明了Swiftest相比于行業(yè)主流帶寬測量系統(tǒng)的巨大優(yōu)勢。在線上大規(guī)模實驗驗證帶寬測試準(zhǔn)確性時,使用BTS-APP的測試結(jié)果作為基準(zhǔn)??紤]到BTS-APP也存在一定程度上的準(zhǔn)確性問題,一個可能的改進方向是進一步精細化地驗證Swiftest在廣泛場景下的測試精度。
SEED: A SIM-Based Solution to 5G Failures
Jinghao Zhao, Zhaowei Tan, Yifei Xu, Zhehui Zhang, Songwu Lu(University of California, Los Angeles)
這篇文章來自加利福尼亞大學(xué)洛杉磯分校團隊的研究者。它為5G故障診斷和處理提出了一種基于SIM的新型解決方案——SEED。
背景
隨著5G移動網(wǎng)絡(luò)的不斷推出,故障正在成為常態(tài)。如果無人看管,它們會影響移動用戶體驗和應(yīng)用程序的正常執(zhí)行。而現(xiàn)有的5G故障解決方案在設(shè)備上采用基于調(diào)制解調(diào)器的方案或者以操作系統(tǒng)為中心的方法,但這些方案只能進行粗粒度的診斷,并不適用于復(fù)雜的5G故障情況。因此,本文為5G故障診斷和處理提供了一種基于SIM的新型解決方案——SEED。它通過利用當(dāng)前標(biāo)準(zhǔn)化的5G錯誤代碼和決策樹/在線學(xué)習(xí)算法來推斷故障的原因,然后進一步采取相應(yīng)的多層重置操作(重置協(xié)議操作、刷新過時的配置、重新加載配置文件等)。
設(shè)計
SEED整體系統(tǒng)圖如下:
首先,SIM 接收來自應(yīng)用程序 (1a) 和網(wǎng)絡(luò) (1b) 的故障報告。故障報告包括網(wǎng)絡(luò)側(cè)診斷等故障線索、更新配置的說明、設(shè)備側(cè)故障詳情(無連接、DNS/UDP故障等)。有了這些線索,SIM 將執(zhí)行本地診斷,做出處理決策,并在設(shè)備 (2a) 或網(wǎng)絡(luò) (2b) 處觸發(fā)恢復(fù)操作。SEED 在其基于 SIM 的設(shè)計中解決了三個問題: ? SIM 如何以低開銷查明故障?研究者確保該解決方案在資源受限的 SIM 硬件上是可行的。為此,SEED 將標(biāo)準(zhǔn)化故障原因與來自基礎(chǔ)架構(gòu)的最新配置以及來自設(shè)備的操作系統(tǒng)/應(yīng)用程序故障報告相結(jié)合。SEED 通過有限的 SIM 處理和存儲進一步執(zhí)行細粒度的故障診斷。? ? SIM 如何處理不同階段出現(xiàn)的各種故障?研究者通過多層重置開發(fā)簡單快速的故障恢復(fù)。SIM 可以在沒有 root 訪問權(quán)限的商業(yè)現(xiàn)成設(shè)備上執(zhí)行配置文件重新加載、配置更新和故障通知。它進一步支持使用 root 權(quán)限更快地重置控制/數(shù)據(jù)平面。 ? ?當(dāng)數(shù)據(jù)平面出現(xiàn)故障時,SIM 如何與基礎(chǔ)設(shè)施協(xié)作?SIM 從基礎(chǔ)設(shè)施中獲取信息以進行細粒度的診斷和處理。研究者利用現(xiàn)有的信令消息來傳輸診斷信息,從而確保在控制/數(shù)據(jù)平面管理或數(shù)據(jù)傳遞失敗時進行運行時 SIM 網(wǎng)絡(luò)信息交換。 ?
性能實驗
經(jīng)實驗測試,SEED相較于傳統(tǒng)的5G故障檢測方案,能夠在更短的時間內(nèi)對故障進行檢測和處理,并且不會降低傳統(tǒng)SIM卡的安全性。
總結(jié)
在5G中,故障已成為常態(tài),而當(dāng)前的解決方案不診斷錯誤原因,而是使用盲目的順序重試方法來處理故障。因此,本文描述了SEED的設(shè)計、實施和評估,這是一種基于SIM的新型5G故障診斷和處理的解決方案。SEED 利用標(biāo)準(zhǔn)化 5G 信令消息攜帶的可用錯誤代碼進行根本原因推斷。它通過一種簡單的、特定于領(lǐng)域的機器學(xué)習(xí)算法進一步增強了診斷能力。一旦推斷出故障原因,SEED 就會采取自適應(yīng)的多層重置/重做操作(重置協(xié)議操作、刷新過時的配置、重新加載配置文件等)。
個人觀點
本文的亮點不僅在于提出了一種新型的5G故障診斷和處理的解決方案,而且在設(shè)計過程中采用了運營商的觀點。研究者認為運營商處于 5G 故障管理解決方案的最佳位置。當(dāng) 5G 用戶通過運營商激活他們的設(shè)備時,SEED 的組件可以很容易地安裝到他們身上。按照目前運營商的做法,可以輕松完成軟件更新。
L25GC: A Low Latency 5G Core Network based on High-Performance NFV Platforms
Vivek Jain (University of California, Riverside), Hao-Tse Chu? (National Yang Ming Chiao Tung University), Shixiong Qi (University of California, Riverside), Chia-An Lee (National Yang Ming Chiao Tung University), Hung-Cheng Chang (National Yang Ming Chiao Tung University), Cheng-Ying Hsieh (National Yang Ming Chiao Tung University), K. K. Ramakrishnan (University of California, Riverside), Jyh-Cheng Chen (National Yang Ming Chiao Tung University)
背景
為了讓用戶使用蜂窩網(wǎng)絡(luò)的延遲更低,需要改進接入和packet core部分,最近的工作使得用戶與基站的連接這一部分的延遲變成ms級別,蜂窩網(wǎng)絡(luò)的性能主要依賴5GC性能的提升。構(gòu)成4G core的硬件核心組件需要復(fù)雜的協(xié)議保持組件之間的一致性,但是會引入很多的延遲開銷。5G將蜂窩組件實施為基于軟件的實現(xiàn),但是5G core之間的控制平面程序與4G core很相似,仍會有很多的延遲開銷。此外,蜂窩網(wǎng)絡(luò)的NF(網(wǎng)絡(luò)功能)之間采用http通信(可以使得模塊之間解耦合),但TCP處理和消息隊列化會帶來額外的開銷。與此同時,轉(zhuǎn)發(fā)規(guī)則由列表實現(xiàn),對列表的實現(xiàn)采用簡單的線性搜索實現(xiàn),開銷很大。為了使得軟件化蜂窩核心具有更好的靈活性以及更高的性能,論文提出了L25GC。 ?
設(shè)計
L25GC是基于NFV的,在free5GC的基礎(chǔ)之上建立的,支持靈活性和高性能的蜂窩核。在數(shù)據(jù)面和控制面都可以達到性能提升,但可以和3GPP標(biāo)準(zhǔn)兼容。 ? 具體來說,L25GC基于nfv平臺將數(shù)據(jù)平面和控制平面的nf整合到同一個節(jié)點上,保留單獨實施每個nf的靈活性,整合之后可以減少NF之間的通信開銷。在此基礎(chǔ)上,作者使用基于共享內(nèi)存的零拷貝機制替換NF之間基于內(nèi)核的通信通道,重建基于服務(wù)的接口、N4接口以及5GC數(shù)據(jù)平面,去除了額外的序列化處理,實現(xiàn)了不同網(wǎng)絡(luò)功能之間通信的低延遲。該論文還實現(xiàn)了智能緩沖,將數(shù)據(jù)包緩沖到空閑的用戶設(shè)備,以此優(yōu)化切換過程,減少額外的菊花鏈路由。此外,傳統(tǒng)的方法將轉(zhuǎn)發(fā)規(guī)則用列表實現(xiàn),對列表的實現(xiàn)采用簡單的線性搜索實現(xiàn),開銷很大。為了應(yīng)對數(shù)據(jù)包檢測規(guī)則不斷增長,作者比較了線性搜索、元組空間搜索和PartitionSort分類器,并選擇了性能最好的PartitionSort分類器。由此,論文實現(xiàn)了更好的數(shù)據(jù)平面吞吐量。與此同時,在出現(xiàn)故障時,用戶需要重新連接并重新開始,影響正在進行的數(shù)據(jù)連接。論文作者通過運行在空閑時不消耗任何CPU的輕量級CPU副本來緩解5GC的NF故障恢復(fù)的延遲。論文借鑒了前人的工作,復(fù)制5G NF的狀態(tài),確保一致性,避免了3GPP指定的UE重新連接過程。 ?
性能實驗
作者將L25GC與free5GC做性能對比。評估結(jié)果顯示單個信息交換延遲提高了13倍,整體事件完成時間減少了51%。與free5GC相比,在尋呼和切換事件期間,數(shù)據(jù)包延遲減少了約2倍。與free5GC相比,即使是簡單的網(wǎng)頁(包含許多大圖像)加載時間也提高了 12.5%,從而直接改善了用戶QoE。L25GC中的數(shù)據(jù)轉(zhuǎn)發(fā)可以在10Gbps鏈路上以線速運行64字節(jié)數(shù)據(jù)包流量,比free5GC基于內(nèi)核的轉(zhuǎn)發(fā)高27倍。 ?
總結(jié)
作者在free5GC的基礎(chǔ)之上,建立了基于NFV的,支持靈活性和高性能的蜂窩核L25GC。在數(shù)據(jù)面和控制面都可以達到性能提升,但可以和3GPP標(biāo)準(zhǔn)兼容。論文使用共享內(nèi)存,構(gòu)建了一個高效,低延遲的5GC服務(wù),該服務(wù)保留了基于微服務(wù)的設(shè)計模式的優(yōu)勢,消除單個微服務(wù)之間由于接口產(chǎn)生的開銷。 ?
個人觀點
本文基于NFV設(shè)計了L25GC,使用共享內(nèi)存的方法,減少了NF之間的通信開銷,性能評估效果良好,并且代碼已經(jīng)開源,可以供他人學(xué)習(xí)。美中不足的是,L25GC當(dāng)前只支持有限的用戶會話,使其不能進一步運用到實際場景中。
編輯:黃飛
?
評論
查看更多