資料介紹
研究了當前幾種時興的頻集挖掘算法(Apriori,DF,F(xiàn)P-growth 和DCI)及其技術(shù)特點,并對其分類和界定適用范圍。對其算法復雜性及時空執(zhí)行效率等性能指標進行了定性和定量的綜合分析。研究的結(jié)果對于在各種應用環(huán)境下的
關(guān)聯(lián)挖掘系統(tǒng)的設(shè)計具有參考價值。
關(guān)鍵詞: 頻集挖掘; Apriori; DF; FP-growth; DCI
種頻集挖掘算法及其特點
2.1 Apriori 算法
A priori算法是目前最為著名也是應用最為廣泛的一種算法,并且目前許多算法都是在A priori的基礎(chǔ)上優(yōu)化和改進而來的。A priori算法核心思想是:首先掃描一遍數(shù)據(jù)庫D ,產(chǎn)生頻繁1 項集L 1,然后產(chǎn)生頻繁2 項集L 2,直到有某個r 值使得L r 為空,這時算法停止。在第k 次循環(huán)過程中,首先產(chǎn)生候選k-項集的集合C k,C k 中的每一個項集是對2 個只有一個項不同的屬于L k-1 的頻集做一個(k - 2) 連接產(chǎn)生的。C k 是用來產(chǎn)生頻集的候選集,為了決定C k 中的元素是否頻繁,必須掃描數(shù)據(jù)庫D 計算其支持度,因此頻集L k 是C k 的一個子集[1]。C k 中的每個元素需進行驗證來決定其是否加入L k ,這里的驗證過程是算法性能的一個瓶頸。A priori算法的不足之處在于:1)可能產(chǎn)生大量的候選集。例如,當長度為1 的頻集有104 個的時候,長度為2 的候選集個數(shù)將會超過107;2)如果要生成一個很長的規(guī)則時,要產(chǎn)生的中間元素也是巨量的。
2.2 DF 算法
D F 算法其實是A priori的一種改進算法,最重要的區(qū)別在于其采用了深度優(yōu)先的方法,這也正是其稱之為D F(D epth F irst)的原因。D F 算法采用了層次樹(trie)來存儲頻繁項集。因為任何一個頻繁集的子集也是頻繁的,所以trie 很適合用來存儲頻繁項集。D F 算法執(zhí)行如下操作[2]:掃描一遍數(shù)據(jù)庫;計算各個項的支持度;并將頻繁項按支持度排序;在主存中建立trie,trie 從根到葉子的每一條路徑代表一個唯一的頻繁項集;最后,算法輸出trie 中的所有路徑,即所有的頻繁項集。
關(guān)聯(lián)挖掘系統(tǒng)的設(shè)計具有參考價值。
關(guān)鍵詞: 頻集挖掘; Apriori; DF; FP-growth; DCI
種頻集挖掘算法及其特點
2.1 Apriori 算法
A priori算法是目前最為著名也是應用最為廣泛的一種算法,并且目前許多算法都是在A priori的基礎(chǔ)上優(yōu)化和改進而來的。A priori算法核心思想是:首先掃描一遍數(shù)據(jù)庫D ,產(chǎn)生頻繁1 項集L 1,然后產(chǎn)生頻繁2 項集L 2,直到有某個r 值使得L r 為空,這時算法停止。在第k 次循環(huán)過程中,首先產(chǎn)生候選k-項集的集合C k,C k 中的每一個項集是對2 個只有一個項不同的屬于L k-1 的頻集做一個(k - 2) 連接產(chǎn)生的。C k 是用來產(chǎn)生頻集的候選集,為了決定C k 中的元素是否頻繁,必須掃描數(shù)據(jù)庫D 計算其支持度,因此頻集L k 是C k 的一個子集[1]。C k 中的每個元素需進行驗證來決定其是否加入L k ,這里的驗證過程是算法性能的一個瓶頸。A priori算法的不足之處在于:1)可能產(chǎn)生大量的候選集。例如,當長度為1 的頻集有104 個的時候,長度為2 的候選集個數(shù)將會超過107;2)如果要生成一個很長的規(guī)則時,要產(chǎn)生的中間元素也是巨量的。
2.2 DF 算法
D F 算法其實是A priori的一種改進算法,最重要的區(qū)別在于其采用了深度優(yōu)先的方法,這也正是其稱之為D F(D epth F irst)的原因。D F 算法采用了層次樹(trie)來存儲頻繁項集。因為任何一個頻繁集的子集也是頻繁的,所以trie 很適合用來存儲頻繁項集。D F 算法執(zhí)行如下操作[2]:掃描一遍數(shù)據(jù)庫;計算各個項的支持度;并將頻繁項按支持度排序;在主存中建立trie,trie 從根到葉子的每一條路徑代表一個唯一的頻繁項集;最后,算法輸出trie 中的所有路徑,即所有的頻繁項集。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 權(quán)重模糊粗糙集的改進規(guī)則挖掘算法 4次下載
- 數(shù)據(jù)挖掘原理與算法 5次下載
- 如何使用閾值自適應憶阻器Hopfield神經(jīng)網(wǎng)絡(luò)進行關(guān)聯(lián)規(guī)則挖掘算法 5次下載
- 如何使用DiffNodeset結(jié)構(gòu)進行最大頻繁項集挖掘算法概述 6次下載
- 頻繁項集高效挖掘算法研究劉芝怡 0次下載
- 基于MapReduce和矩陣的頻繁項集挖掘算法 4次下載
- 數(shù)據(jù)挖掘Apriori算法的改進 17次下載
- 時興頻集挖掘算法的辨析
- 分類規(guī)則挖掘算法綜述
- 基于矩陣偽投影策略的頻繁項集挖掘方法
- 基于集合枚舉樹的最小預測集挖掘算法
- 基于灰色關(guān)聯(lián)分析的孤立點挖掘算法
- 一種新的模糊加權(quán)關(guān)聯(lián)規(guī)則挖掘算法
- 基于矩陣的關(guān)聯(lián)規(guī)則挖掘算法
- 水平分布數(shù)據(jù)集的隱私保護關(guān)聯(lián)挖掘算法
- 基于Python實現(xiàn)隨機森林算法 1017次閱讀
- 一文弄懂數(shù)據(jù)挖掘的十大算法,數(shù)據(jù)挖掘算法原理講解 912次閱讀
- middlebury數(shù)據(jù)集是什么 2029次閱讀
- 代碼實例及詳細資料帶你入門Python數(shù)據(jù)挖掘與機器學習 3241次閱讀
- 數(shù)據(jù)挖掘算法:決策樹算法如何學習及分裂剪枝 5628次閱讀
- 從五個方面讓你了解人工智能算法中的Apriori 2297次閱讀
- 十大經(jīng)典數(shù)據(jù)挖掘算法—Apriori 3620次閱讀
- 數(shù)據(jù)挖掘Apriori算法報告 5175次閱讀
- 關(guān)聯(lián)規(guī)則挖掘——Apriori算法的基本原理以及改進 9325次閱讀
- Apriori算法詳解 2.1w次閱讀
- Matlab關(guān)于Apriori算法設(shè)計 5032次閱讀
- 簡介Apriori算法并解析該算法的具體策略和步驟,給出Python實現(xiàn)代碼 5732次閱讀
- 怎么學習數(shù)據(jù)挖掘_如何系統(tǒng)地學習數(shù)據(jù)挖掘 4725次閱讀
- 什么叫數(shù)據(jù)挖掘_數(shù)據(jù)挖掘技術(shù)解析 1.9w次閱讀
- 基于GT4的聚類分析算法研究 973次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1489次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 91次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 9次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關(guān)電源設(shè)計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30319次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關(guān)電源設(shè)計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233045次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多