1 引言
隨著大數(shù)據(jù)時(shí)代的迅猛發(fā)展,人們對(duì)LBS(Location Based Services,基于位置服務(wù))的需求也快速增長(zhǎng),無線定位技術(shù)逐步得到重視,位置服務(wù)已經(jīng)成為一種熱門的技術(shù)。輔助GPS(AGPS)定位技術(shù)結(jié)合了GPS定位和蜂窩基站定位的優(yōu)勢(shì),借助蜂窩網(wǎng)絡(luò)的數(shù)據(jù)傳輸功能,可以快速精準(zhǔn)地定位,在移動(dòng)設(shè)備尤其是手機(jī)終端中被廣泛使用。運(yùn)營(yíng)商通過更新4G網(wǎng)絡(luò)主設(shè)備網(wǎng)管,即新增輔助GPS和異網(wǎng)檢測(cè)功能,實(shí)現(xiàn)了基站MR(Measurement Report,測(cè)量報(bào)告)數(shù)據(jù)版本升級(jí)。在新的數(shù)據(jù)源中不僅能夠獲取到精確的GPS地理信息,同時(shí)異網(wǎng)檢測(cè)功能也可以針對(duì)其他運(yùn)營(yíng)商網(wǎng)絡(luò)覆蓋強(qiáng)度進(jìn)行周期測(cè)量,從而解決了當(dāng)前MR應(yīng)用過程中定位精度不足和只能評(píng)估本網(wǎng)絡(luò)覆蓋情況的局限。通過本次研究,可以有效拓展MR的分析能力,針對(duì)三網(wǎng)(中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通)的覆蓋情況進(jìn)行對(duì)比分析。
本文通過對(duì)輔助GPS數(shù)據(jù)的挖掘分析,預(yù)測(cè)出運(yùn)營(yíng)商的基站覆蓋中心點(diǎn),可以實(shí)現(xiàn)運(yùn)營(yíng)商之間的網(wǎng)絡(luò)可持續(xù)化對(duì)比,為解決傳統(tǒng)三網(wǎng)對(duì)比測(cè)試樣本不充足、對(duì)比不全面的問題提供一種有效解決方案。
2 運(yùn)營(yíng)商基站覆蓋中心點(diǎn)預(yù)測(cè)
以基站采集到的終端測(cè)量報(bào)告作為數(shù)據(jù)源,并將數(shù)據(jù)源按頻點(diǎn)和PCI(Physical CellIdentifier,物理小區(qū)標(biāo)識(shí))進(jìn)行分組,對(duì)分組后的每組數(shù)據(jù)用Mean-Shift(偏移均值向量算法)算法做首次密度聚類[3-4],找到局部最優(yōu)的基站覆蓋中心點(diǎn)。結(jié)合專業(yè)的業(yè)務(wù)背景知識(shí),對(duì)局部基站覆蓋中心點(diǎn)用DBSCAN算法做二次聚類,找到全局最優(yōu)的基站覆蓋中心點(diǎn)[5-8]。最后用本網(wǎng)的主覆蓋小區(qū)來驗(yàn)證所預(yù)測(cè)出來的基站覆蓋中心點(diǎn)的正確性。具體流程如圖1所示:
圖1 運(yùn)營(yíng)商基站覆蓋中心點(diǎn)預(yù)測(cè)流程
2.1 數(shù)據(jù)源提取及清洗
本模型采用中國(guó)電信全省MR的輔助GPS相關(guān)數(shù)據(jù),主要包括:各運(yùn)營(yíng)商的頻點(diǎn)、PCI、用戶個(gè)人上報(bào)的百度經(jīng)緯度、地市、中國(guó)電信主服務(wù)小區(qū)百度經(jīng)緯度等屬性,并對(duì)每條記錄中的異常數(shù)據(jù)、無效數(shù)據(jù)進(jìn)行了清洗。為減少鄰區(qū)等干擾因素影響模型的準(zhǔn)確度,本模型只提取了室外且相距主服務(wù)小區(qū)1 km以內(nèi)的MR記錄。
2.2 Mean-Shift算法聚類過程
Mean-Shift算法是一個(gè)迭代的過程。對(duì)于d維空間的N個(gè)樣本點(diǎn),首先隨機(jī)選擇一個(gè)點(diǎn),并以這個(gè)點(diǎn)為圓心、以R為半徑做一個(gè)d維的高維球,落在這個(gè)球內(nèi)的所有樣本點(diǎn)和圓心都會(huì)產(chǎn)生一個(gè)向量,每個(gè)向量都以圓心為起點(diǎn)、以球內(nèi)的樣本點(diǎn)為終點(diǎn),計(jì)算出球內(nèi)所有向量的和,最終得出Mean-Shift向量。再以Mean-Shift向量的終點(diǎn)為圓心重復(fù)上述步驟。由同起點(diǎn)向量求和法則可知,Mean-shift向量最終將收斂到概率密度最大的區(qū)域[9]。Mean-Shift向量的基本形式如下:
(1)
其中,x為空間中任意一點(diǎn);D表示在N個(gè)樣本點(diǎn)xi中有D個(gè)點(diǎn)落在SD區(qū)域中。
Mean-Shift算法的偽代碼思想如下:
(1)隨機(jī)選擇一點(diǎn)為中心點(diǎn),固定一個(gè)窗口,計(jì)算出Mean-Shift向量;
(2)判斷是否達(dá)到收斂,若收斂則終止,否則執(zhí)行第(3)步;
(3)以Mean-Shift向量的終點(diǎn)為新的中心,重復(fù)上述步驟[10]。
由于獲取到的用戶輔助GPS數(shù)據(jù)呈現(xiàn)出無規(guī)律分布,因此采用基于概率密度的Mean-Shift算法進(jìn)行聚類分析。該算法忽略了數(shù)據(jù)源中的異常值,每次只對(duì)窗口內(nèi)局部數(shù)據(jù)進(jìn)行計(jì)算,計(jì)算完成后再移動(dòng)窗口。
本模型首先以中國(guó)電信的數(shù)據(jù)做訓(xùn)練集,以頻點(diǎn)和PCI作為分組條件,分別把具有相同頻點(diǎn)和PCI的個(gè)人上報(bào)百度經(jīng)緯度進(jìn)行聚類。經(jīng)過多次模型訓(xùn)練并結(jié)合業(yè)務(wù)實(shí)際,本模型最終設(shè)置的Mean-Shift窗寬系數(shù)為0.02,聚類得到多個(gè)同一頻點(diǎn)和PCI下多個(gè)基站覆蓋中心經(jīng)緯度。預(yù)測(cè)中國(guó)電信室外的基站覆蓋中心點(diǎn)有159 284個(gè),將預(yù)測(cè)出來的覆蓋中心點(diǎn)經(jīng)緯度與中國(guó)電信MR數(shù)據(jù)本身提供的小區(qū)百度經(jīng)緯度在百度地圖上作距離對(duì)比。結(jié)果表明,對(duì)于廣州市區(qū)統(tǒng)計(jì)出基站覆蓋中心點(diǎn)有80.3%落在主覆蓋小區(qū)對(duì)應(yīng)方向角附近150 m以內(nèi),但在同一頻點(diǎn)和PCI下有部分預(yù)測(cè)的基站覆蓋中心點(diǎn)相距較近。結(jié)合專業(yè)的業(yè)務(wù)知識(shí),運(yùn)用區(qū)域聚類算法DBSCAN進(jìn)行二次聚類,將屬于同頻點(diǎn)同PCI且相距較近的基站覆蓋中心點(diǎn)聚為一個(gè)新中心點(diǎn)。
2.3 DBSCAN二次聚類過程
DBSCAN是一種基于高密度連通區(qū)域的聚類算法,能夠?qū)⒕哂凶銐蚋呙芏鹊膮^(qū)域劃分為簇。該算法需要兩個(gè)核心的參數(shù):一個(gè)參數(shù)是半徑,表示以給定點(diǎn)P為中心的圓形鄰域的范圍;另一個(gè)參數(shù)是以點(diǎn)P為中心的鄰域內(nèi)最少點(diǎn)的數(shù)量[11]。
基于本模型需求和專業(yè)的業(yè)務(wù)知識(shí),模型設(shè)置的半徑為200 m,鄰域內(nèi)最少點(diǎn)數(shù)量設(shè)置為1,從而可以將具有相同頻點(diǎn)和PCI且距離較近的基站覆蓋中心點(diǎn)聚類成一個(gè)新的中心點(diǎn)。將基站覆蓋中心點(diǎn)經(jīng)緯度與中國(guó)電信MR數(shù)據(jù)提供的小區(qū)經(jīng)緯度作距離核對(duì),該模型預(yù)測(cè)出中國(guó)電信室外共有155 244個(gè)基站覆蓋中心點(diǎn)。對(duì)于廣州市區(qū)統(tǒng)計(jì)出基站覆蓋中心點(diǎn)有83.6%落在主覆蓋小區(qū)對(duì)應(yīng)方向角附近150 m以內(nèi),符合實(shí)際業(yè)務(wù)規(guī)則。
DBSCAN算法的偽代碼思想如下:
(1)選取鄰域半徑為200 m,鄰域內(nèi)最少點(diǎn)數(shù)為1;
(2)隨機(jī)選取一點(diǎn)為中心點(diǎn),計(jì)算相同頻點(diǎn)和PCI下的主覆蓋小區(qū)中心點(diǎn)的距離,若滿足條件,則加入該鄰域,并以新加入的點(diǎn)為中心判斷其余點(diǎn)是否滿足條件,直到遍歷完所有點(diǎn),計(jì)算出該鄰域新的中心點(diǎn),并把屬于該鄰域的點(diǎn)從原數(shù)據(jù)中刪除;
(3)從剩余的點(diǎn)中隨機(jī)選取一點(diǎn)為新的中心,重復(fù)第(2)步直到原數(shù)據(jù)中所有點(diǎn)都被重新歸類完畢為止。
3 運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比分析
通過上述模型,采用相同的方法可以預(yù)測(cè)出異網(wǎng)基站覆蓋中心點(diǎn)的位置及其數(shù)量,預(yù)測(cè)出運(yùn)營(yíng)商A室外有231 948個(gè)基站覆蓋中心點(diǎn)、運(yùn)營(yíng)商B室外有92 668個(gè)基站覆蓋中心點(diǎn)。將三家運(yùn)營(yíng)商的基站覆蓋中心點(diǎn)預(yù)測(cè)結(jié)果顯示在百度地圖上,以廣州兩個(gè)區(qū)域Ⅰ、Ⅱ?yàn)槔唧w如圖2和圖3所示:
圖2 區(qū)域Ⅰ運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比
圖3 區(qū)域Ⅱ運(yùn)營(yíng)商基站覆蓋中心點(diǎn)對(duì)比
其中,扇形表示運(yùn)營(yíng)商真實(shí)的主覆蓋小區(qū)所在的位置;圓形表示用模型預(yù)測(cè)出來的基站覆蓋中心點(diǎn)所在的位置;黃色表示運(yùn)營(yíng)商A、藍(lán)色表示運(yùn)營(yíng)商B、紅色表示運(yùn)營(yíng)商C。
從圖2和圖3可以看出,預(yù)測(cè)得到的基站覆蓋中心點(diǎn)跟真實(shí)的小區(qū)相距較近,能夠直觀地描繪出三家運(yùn)營(yíng)商的覆蓋區(qū)域及覆蓋密度。通過這種直觀的比較,不僅可以掌握異網(wǎng)的大致網(wǎng)絡(luò)分布,而且也易于了解哪些區(qū)域是本網(wǎng)盲區(qū)、哪些區(qū)域需要加強(qiáng)覆蓋,為網(wǎng)絡(luò)建設(shè)規(guī)劃和智慧網(wǎng)優(yōu)提供強(qiáng)有力的支撐。
4 結(jié)束語
本文通過對(duì)MR數(shù)據(jù)的挖掘分析,預(yù)測(cè)出運(yùn)營(yíng)商的基站覆蓋中心點(diǎn),可以全面掌握運(yùn)營(yíng)商主覆蓋小區(qū)的大致分布和覆蓋密度,為全面評(píng)估網(wǎng)絡(luò)覆蓋程度提供有力支撐,也為掌握異網(wǎng)的網(wǎng)絡(luò)規(guī)劃和發(fā)展規(guī)模提供理論依據(jù)。后續(xù)將對(duì)全集團(tuán)的MR數(shù)據(jù)做相同的挖掘分析,為全集團(tuán)的網(wǎng)絡(luò)規(guī)劃、智慧網(wǎng)優(yōu)、優(yōu)化布局提供全方位智能化分析方法,進(jìn)一步提升網(wǎng)絡(luò)資源投放效率。
責(zé)任編輯:gt
-
運(yùn)營(yíng)商
+關(guān)注
關(guān)注
4文章
2392瀏覽量
44377 -
gps
+關(guān)注
關(guān)注
22文章
2884瀏覽量
166038 -
中國(guó)移動(dòng)
+關(guān)注
關(guān)注
22文章
5531瀏覽量
70925
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論