4.大數據分析及挖掘技術
大數據分析技術改進已有數據挖掘和機器學習技術;開發數據網絡挖掘、特異群組挖掘、圖挖掘等新型數據挖掘技術;突破基于對象的數據連接、相似性連接等大數據融合技術,突破用戶興趣分折,網絡行為分析、情感語義分析等面向領域的大數挖掘技術。
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中提取隱含在其中的、人們事先不知道的、潛在有用的信息和知識的過程。數據挖掘涉及的技術方法很多,有多種分類法。
根據挖掘任務可分為分類或預測模型發現、數據總結、聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常和趨勢發現等。
根據挖掘對象可分為關系數據庫、面向對象數據庫、空間數據庫、時態數據庫、文本數據源、多媒體數據庫、異質數據庫、遺產數據庫及環球網Web。
根據挖掘方法,可粗分為機器學習方法、統計方法、神經網絡方法和數據庫方法。機器學習,可細分為歸納學習方法(決策樹、規則歸納等)、基于范例學習、遺傳算法等。統計方法,可細分為回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費歇爾判別、非參數判別等)、聚類分析(系統聚類、動態聚類等)、探索性分析(主元分析法、相關分析法等)等。神經網絡方法,可細分為前向神經網絡(BP算法等)、自組織神經網絡(自組織特征映射、競爭學習等)等。數據庫方法主要是多維數據分析或OLAP方法,還有面向屬性的歸納方法。
-
大數據
+關注
關注
64文章
8864瀏覽量
137310
發布評論請先 登錄
相關推薦
評論