密度偏倚抽樣的局部距離異常檢測算法
大小:1.20 MB 人氣: 2017-12-25 需要積分:1
異常檢測是數據挖掘的重要研究領域,當前基于距離或者最近鄰概念的異常數據檢測方法,在進行海量高維數據異常檢測時,存在運算時間過長的問題.許多改進的異常檢測方法雖然提高了算法運算效率,然而檢測效果欠佳.基于此,提出一種基于密度偏倚抽樣的局部距離異常檢測算法,首先利用基于密度偏倚的概率抽樣方法對所需檢測的數據集合進行概率抽樣,之后對抽樣數據利用基于局部距離的局部異常檢測方法,對抽樣集合進行局部異常系數計算,得到的異常系數既是抽樣數據的局部異常系數,又是數據集的近似全局異常系數.然后對得到的每個數據點的局部異常系數進行排序,異常系數值越大的數據點越可能是異常點.實驗結果表明,與已有的算法相比,該算法具有更高的檢測精確度和更少的運算時間,并且該算法對各種維度和數據規模的數據都具有很好的檢測效果,可擴展性強。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%