大數據(big data),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低的四大特征。
一般認為,大數據主要具有以下4個方面的典型特征,即大量(Volume)、多樣(Variety)、高速(Velocity)和價值(Value),即所謂的4V。
1. Volume(大量),大數據的特征首先就是數據規模大。隨著互聯網、物聯網、移動互聯技術的發展,人和事物的所有軌跡都可以被記錄下來,數據呈現出爆發性增長。
2. Variety(多樣)。數據來源的廣泛性,決定了數據形式的多樣性。大數據可以分為三類,一是結構化數據,如財務系統數據、信息管理系統數據、醫療系統數據等,其特點是數據間因果關系強;一是非結構化的數據,如視頻、圖片、音頻等,其特點是數據間沒有因果關系;三是半結構化數據,如HTML文檔、郵件、網頁等,其特點是數據間的因果關系弱。有統計顯示,目前結構化數據占據整個互聯網數據量的75%以上,而產生價值的大數據,往往是這些非結構化數據。
3.Velocity(高速),數據的增長速度和處理速度是大數據高速性的重要體現。與以往的報紙、書信等傳統數據載體生產傳播方式不同,在大數據時代,大數據的交換和傳播主要是通過互聯網和云計算等方式實現的,其生產和傳播數據的速度是非常迅速的。另外,大數據還要求處理數據的響應速度要快,例如,上億條數據的分析必須在幾秒內完成。數據的輸人、處理與丟棄必須立刻見效,幾乎無延遲。
4.Value(價值),大數據的核心特征是價值,其實價值密度的高低和數據總量的大小是成反比的,即數據價值密度越高數據總量越小,數據價值密度越低數據總量越大。任何有價值的信息的提取依托的就是海量的基礎數據。當然目前大數據背景下有個未解決的問題,如何通過強大的機器算法更迅速地在海量數據中完成數據的價值提純。
本文整合自:傳智教育、php中文網
審核編輯:符乾江
-
物聯網
+關注
關注
2903文章
44275瀏覽量
371266 -
大數據
+關注
關注
64文章
8863瀏覽量
137299
發布評論請先 登錄
相關推薦
評論