一種統計屬性約簡的定義
大小:1.08 MB 人氣: 2017-12-25 需要積分:2
標簽:約簡算法(6850)
傳統的屬性約簡由于其時間復雜度和空間復雜度過高,幾乎無法應用到大規模的數據集中.將隨機抽樣引入傳統的模糊粗糙集中,使得屬性約簡的效率大幅度提升.首先,在統計下近似的基礎上提出一種統計屬性約簡的定義.這里的約簡不是原有意義上的約簡。而是保持基于統計下近似定義的統計辨識度不變的屬性子集,然后。采用抽樣的方法計算統計辨識度的樣本估計值,基于此估計值可以對統計屬性重要性進行排序,從而可以設計一種快速的適用于大規模數據的序約簡算法.由于隨機抽樣集以及統計近似概念的引入,該算法從時間和空間上均降低了約簡的計算復雜度,同時又保持了數據集中信息含量幾乎不變.最后,數值實驗將基于隨機抽樣的序約簡算法和兩種傳統的屬性約簡算法從以下3個方面進行了對比:計算屬性約簡時間消耗、計算屬性約簡空間消耗、約簡效果.對比實驗驗證了基于隨機抽樣的序約簡算法在時間與空間上的優勢.
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%