資料介紹
提出了一種多密度網格聚類算法GDD。該算法主要采用密度閾值遞減的多階段聚類技術提取不同密
度的聚類,使用邊界點處理技術提高聚類精度,同時對聚類結果進行了人工干預。GDD 算法只要求
對數據集進行一遍掃描。實驗表明,該算法可擴展性好,能處理任意形狀和大小的聚類,能夠很好
的識別出孤立點或噪聲,在處理多密度聚類方面有很好的精度。
關鍵詞:密度閾值遞減;多階段聚類;邊界點提取
聚類是數據挖掘中的一種重要技術,它的目標是將數據集分成若干個子集,同一個子集
中的對象是相似的,不同子集中的對象不相似。在幾何方面,聚類是在整個數據集中確定由
稀疏區域分開的密集區域。由于其無指導學習能力,聚類算法能在數據集中發現隱藏的數據模式,所以對聚類算法的研究一直很活躍。基于相似性已經有很多聚類算法,這些聚類算法大體上可分為基于劃分的聚類算法、基于密度的聚類算法、基于層次的聚類算法和基于網格的聚類算法等。其中基于網格的聚類算法由于只考慮網格單元而不是考慮每個點,它的計算效率比較高。基于網格的聚類算法認為:當網格劃分的比較細時,每個網格內的點可看作是相似的。但是對多密度的數據集,這些算法很難得到滿意的聚類結果。本文的主要目的就是利用網格技術解決對多密度數據集的聚類。
聚類分析所使用的數據集中,各個類的密集往往不盡相同,甚至差別很大。大多數現有
的聚類算法都是致力于如何發現任意形狀和大小的類,但很難有效的處理密度差別較大的數據集。能夠處理多密度數據集的聚類算法有Chameleon[1]、共享近鄰SNN 算法[2]、多階段等密度線算法[3]等。
Chameleon 算法可以用來處理多密度的數據集,但當數據集較大時其算法的時間復雜度
太高。共享近鄰SNN 算法的主要思想是:對于數據集中每個點,找出距離其最近的K 個鄰近點,形成一個集合。然后考慮數據集中的任意兩個點,若對應于這兩個點的K 個鄰近點集合交集部分的點數超過一個閾值,則將這兩個點歸于一類。SNN 算法的優點是可以對不同密度和形狀的數據集進行聚類,缺點是在多密度聚類和處理孤立點或噪聲方面精度都不高(見圖1(a)和圖2(a))。多階段等密度線算法采用多階段的方式,利用等密度線的思想對數據集進行聚類,它的缺點是不能有效地分離出多個類。文獻[2]給出了SNN 算法和一些現有的聚類算法的比較結果,結果表明SNN 算法表現出了較好的性能。本文只給出GDD 算法和SNN 算法聚類結果的比較,從比較結果可以看出GDD 算法在多密度聚類、孤立點或噪聲處理方面顯示出了很高的精度。
現有的聚類算法大都忽視了聚類過程中的人工參與,很難在聚類過程中充分利用專家
關于領域的知識指導聚類過程,所以得不到滿意的聚類結果。在GDD 算法中,對聚類結果就進行了人工干預。
度的聚類,使用邊界點處理技術提高聚類精度,同時對聚類結果進行了人工干預。GDD 算法只要求
對數據集進行一遍掃描。實驗表明,該算法可擴展性好,能處理任意形狀和大小的聚類,能夠很好
的識別出孤立點或噪聲,在處理多密度聚類方面有很好的精度。
關鍵詞:密度閾值遞減;多階段聚類;邊界點提取
聚類是數據挖掘中的一種重要技術,它的目標是將數據集分成若干個子集,同一個子集
中的對象是相似的,不同子集中的對象不相似。在幾何方面,聚類是在整個數據集中確定由
稀疏區域分開的密集區域。由于其無指導學習能力,聚類算法能在數據集中發現隱藏的數據模式,所以對聚類算法的研究一直很活躍。基于相似性已經有很多聚類算法,這些聚類算法大體上可分為基于劃分的聚類算法、基于密度的聚類算法、基于層次的聚類算法和基于網格的聚類算法等。其中基于網格的聚類算法由于只考慮網格單元而不是考慮每個點,它的計算效率比較高。基于網格的聚類算法認為:當網格劃分的比較細時,每個網格內的點可看作是相似的。但是對多密度的數據集,這些算法很難得到滿意的聚類結果。本文的主要目的就是利用網格技術解決對多密度數據集的聚類。
聚類分析所使用的數據集中,各個類的密集往往不盡相同,甚至差別很大。大多數現有
的聚類算法都是致力于如何發現任意形狀和大小的類,但很難有效的處理密度差別較大的數據集。能夠處理多密度數據集的聚類算法有Chameleon[1]、共享近鄰SNN 算法[2]、多階段等密度線算法[3]等。
Chameleon 算法可以用來處理多密度的數據集,但當數據集較大時其算法的時間復雜度
太高。共享近鄰SNN 算法的主要思想是:對于數據集中每個點,找出距離其最近的K 個鄰近點,形成一個集合。然后考慮數據集中的任意兩個點,若對應于這兩個點的K 個鄰近點集合交集部分的點數超過一個閾值,則將這兩個點歸于一類。SNN 算法的優點是可以對不同密度和形狀的數據集進行聚類,缺點是在多密度聚類和處理孤立點或噪聲方面精度都不高(見圖1(a)和圖2(a))。多階段等密度線算法采用多階段的方式,利用等密度線的思想對數據集進行聚類,它的缺點是不能有效地分離出多個類。文獻[2]給出了SNN 算法和一些現有的聚類算法的比較結果,結果表明SNN 算法表現出了較好的性能。本文只給出GDD 算法和SNN 算法聚類結果的比較,從比較結果可以看出GDD 算法在多密度聚類、孤立點或噪聲處理方面顯示出了很高的精度。
現有的聚類算法大都忽視了聚類過程中的人工參與,很難在聚類過程中充分利用專家
關于領域的知識指導聚類過程,所以得不到滿意的聚類結果。在GDD 算法中,對聚類結果就進行了人工干預。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 基于群組和密度的大規模軌跡聚類算法 2次下載
- 基于網格多密度聚類的古建筑圖像特征匹配方法 3次下載
- 一種基于自然最近鄰的密度峰值聚類算法 12次下載
- 基于MapReduce和加權網絡信息熵的DBWGIE-MR算法 11次下載
- 一種自適應的關聯融合聚類算法 13次下載
- 基于核誘導的不完整多視覺聚類算法KIMV 5次下載
- 可檢測出租車載客的軌跡聚類算法 13次下載
- 如何使用拉普拉斯中心性和密度峰值進行無參數聚類算法的研究 12次下載
- 如何融合密度峰值進行高斯混合模型聚類算法概述 2次下載
- 如何使用多維網格空間進行改進K-means聚類算法資料概述 1次下載
- 聚類算法及聚類融合算法研究 33次下載
- 基于網格的帶有參考參數的聚類算法
- 基于搜索機制密度聚類的支持向量預選取算法
- 基于模糊聚類思想的網格獨立任務調度算法
- 基于不均勻密度的自動聚類算法
- 使用輪廓分數提升時間序列聚類的表現 398次閱讀
- 一文弄懂數據挖掘的十大算法,數據挖掘算法原理講解 912次閱讀
- 如何在 Python 中安裝和使用頂級聚類算法 472次閱讀
- 代碼實現密度聚類DBSCAN 593次閱讀
- 10種頂流聚類算法Python實現(附完整代碼) 1259次閱讀
- 10種聚類介紹和Python代碼 2850次閱讀
- 基于距離的聚類算法K-means的設計實現 2088次閱讀
- 淺析四類機器學習在自動駕駛中的應用 5329次閱讀
- 關于TD Learning算法的分析 1829次閱讀
- Python無監督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述 3w次閱讀
- 機器學習中五種常用的聚類算法 3.8w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設計 7212次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5208次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實例 1.5w次閱讀
下載排行
本周
- 1HFSS電磁仿真設計應用詳解PDF電子教程免費下載
- 24.30 MB | 126次下載 | 1 積分
- 2H橋中的電流感測
- 545.39KB | 7次下載 | 免費
- 3雷達的基本分類方法
- 1.25 MB | 4次下載 | 4 積分
- 4I3C–下一代串行通信接口
- 608.47KB | 3次下載 | 免費
- 5電感技術講解
- 827.73 KB | 2次下載 | 免費
- 6從 MSP430? MCU 到 MSPM0 MCU 的遷移指南
- 1.17MB | 2次下載 | 免費
- 7有源低通濾波器設計應用說明
- 1.12MB | 2次下載 | 免費
- 8RA-Eco-RA2E1-48PIN-V1.0開發板資料
- 35.59 MB | 2次下載 | 免費
本月
- 12024年工控與通信行業上游發展趨勢和熱點解讀
- 2.61 MB | 763次下載 | 免費
- 2HFSS電磁仿真設計應用詳解PDF電子教程免費下載
- 24.30 MB | 126次下載 | 1 積分
- 3繼電保護原理
- 2.80 MB | 36次下載 | 免費
- 4正激、反激、推挽、全橋、半橋區別和特點
- 0.91 MB | 32次下載 | 1 積分
- 5labview實現DBC在界面加載配置
- 0.57 MB | 21次下載 | 5 積分
- 6在設計中使用MOSFET瞬態熱阻抗曲線
- 1.57MB | 15次下載 | 免費
- 7GBT 4706.1-2024家用和類似用途電器的安全第1部分:通用要求
- 7.43 MB | 13次下載 | 免費
- 8PADS-3D庫文件
- 2.70 MB | 10次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935113次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420061次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233084次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191360次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183329次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81578次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73804次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65985次下載 | 10 積分
評論
查看更多