資料介紹
每天數十億字節的數據收集下,了解大數據的復雜內涵非常重要。為了幫助你了解這一領域,我們從最近的大數據指南中編輯了一個列表,列出了最重要的相關術語和定義。
你認為我們還應該添加哪些術語?請在評論中告訴我們。
A
算法:給予AI、神經網絡或其他機器的一組規則,以幫助其自己學習;分類、聚類、推薦和回歸是四種最常用的算法類型。
Apache Flink:一個開源的流數據處理框架。用Java和Scala編寫,用作分布式流數據流引擎。
Apache Hadoop:開源工具,使用MapReduce處理和存儲跨機器的大型分布式數據集。
Apache Kafka:一種分布式流式傳輸平臺,通過提高吞吐量、內置分區、復制、延遲和可靠性來改進傳統的消息代理。
Apache NiFi:一種開源Java服務器,可以以可擴展、可插拔、開放的方式實現系統間數據流的自動化。NiFi由國家安全局(NSA)開源。
Apache Spark:在Apache Hadoop、Mesos或云端運行的開源大數據處理引擎。
B
大數據:大量數據的通用術語。大數據的數據具有高速、多樣化、海量的特征。
Blob存儲:一種Azure服務,將非結構化數據存儲在云中作為blob或對象。
商業智能:可視化和分析商業數據的過程,以便采取可行且明智的決策。
C
集群:共享特定特征的數據子集,也指幾臺機器共同解決同一問題。
約束應用協議(COAP):有限資源設備的一種互聯網應用協議,可以轉換成HTTP。
D
數據工程:收集、存儲、處理數據,以便數據科學家查詢。
數據流管理:采集原始設備數據的專門過程,同時管理成千上萬生產者和消費者的流量。然后執行基本數據豐富、流分析、聚合、拆分、模式轉換、格式轉換等初級步驟,為進一步業務處理做數據準備。
數據治理:管理數據湖中數據的可獲得性、可使用性、完整性和安全性的過程。
數據整合:組合不同來源數據并為用戶提供統一視圖的過程。
數據湖:一種以原始格式保存原始數據的存儲庫。
數據挖掘:通過檢查和分析大型數據庫來生成新信息的做法。
數據實現:將變量嚴格定義為可衡量因素的過程。
數據準備:收集、清理、整合數據到一個文件或數據表中,主要用于分析。
數據處理:機器檢索、變換、分析或分類信息的過程。
數據科學:探索可重復的流程和方法,從而從數據中獲取知識的領域。
數據沼澤:沒有適當治理的數據湖就會變成數據沼澤。
數據驗證:檢查數據集以確保所有數據在處理之前是整潔、正確和有用的。
數據倉庫:各種來源的大量數據,用于幫助公司做出明智的決策。
設備層:依據所處的環境和性能特征,來發送數據流的傳感器、執行器、智能手機、網關和工業設備的整個范圍。
G
GPU加速數據庫:攝取流數據所需的數據庫。
圖形分析:組合和可視化一組數據中不同數據點之間的關系的方法。
H
Hadoop:用于處理和存儲大數據的編程框架,特別是在分布式計算環境中。
I
攝取:從任意數量不同的來源中攝取流數據。
M
MapReduce:一種數據處理模型,在Map階段過濾和排序數據,然后對該數據執行功能并在Reduce階段輸出。
Munging:將數據從原始格式手動轉換或映射到便于使用的格式。
N
正態分布:代表大量隨機變量概率的常用圖,隨著數據集變大,這些變量接近正態。也稱為高斯分布或鐘形曲線。
規范化:將數據組織到表中的過程,使得數據庫的使用結果始終是明確且按計劃進行的。
P
解析:將數據(如字符串)分割成更小的部分進行分析。
持久存儲:創建數據進程結束后,保存數據在一個不變地點(如磁盤)。
Python:一種強調代碼可讀性的通用編程語言,以便程序員使用較少的代碼來表達概念。
R
R:一種主要用于數據可視化和預測分析的開源語言。
實時流處理:通過并行使用機器分析數據序列的模型,但功能有所減少。
關系數據庫管理系統(RDBMS):一種基于共享屬性(稱為關系)分組的管理、捕獲和分析數據的系統。
彈性分布式數據集:Apache Spark提取數據的主要方式,數據以一種可容錯方式存儲在多臺機器上。
S
碎片:數據庫的單獨分區。
智能數據:一種格式化的數碼信息,可以在發送到下游分析平臺進行進一步數據整合和分析之前在采集點進行操作。
流處理:數據的實時處理。數據被連續、并發和記錄處理。
結構化數據:具有高度組織的信息。
T
分類:根據預先確定的系統對數據進行分類,結果目錄用于提供易于訪問和檢索的概念框架。
遙測:遠程采集有關對象的信息(例如從汽車、智能手機、醫療設備或物聯網設備)。
轉換:將數據從一種格式轉換為另一種格式。
U
非結構化數據:不具有預定義數據模型或未以預定義方式組織的數據。
V
可視化:分析數據并以可讀、圖形格式(如圖表)進行表達的過程。
Z
區域:數據湖中的特定區域,服務于特定目的。
- ABB 變頻器參數設定一覽表 5次下載
- 鐵氧體磁珠的基礎知識一覽資料下載
- 嵌入式的硬件構架一覽資料下載
- 人臉識別技術流程一覽資料下載
- 各類電容的特性及失效分析一覽資料下載
- SKYLAB 現有WiFi模塊一覽表 10次下載
- 世界各國家(地區)電壓、插頭規格一覽表 46次下載
- 電動汽車最新熱門電池技術一覽 0次下載
- 電機及驅動產品規格型號一覽表 13次下載
- 指令處理時間/步數一覽
- 全系列KVM解決方案規格參數一覽表
- 一般繼電器 (Relay)一覽表
- 世界各國和地電壓一覽表
- FBs PLC應用指令一覽表
- 出差報告資料表一覽表
- 大數據技術是干嘛的 大數據核心技術有哪些 2288次閱讀
- STM32供電方案一覽 4621次閱讀
- Ubuntu 23.04新特性一覽 698次閱讀
- 什么才是真正的大數據 關于大數據的幾個特性 2815次閱讀
- 互聯網大數據和物聯網大數據到底有什么不同之處 5990次閱讀
- 大數據是什么_大數據技術和應用的現狀與前景 2.3w次閱讀
- 什么是大數據分析?大數據分析的含義與目前形式 1.6w次閱讀
- 解讀大數據的定義及運行與分析 2635次閱讀
- 為什么要降維?降維技術一覽 1.8w次閱讀
- 25個基本大數據術語,幫助你溫故知新 3108次閱讀
- 覆銅板生產廠家排名_覆銅板概念股一覽 7w次閱讀
- 福祿克萬用表型號及選型一覽(福祿克萬用表使用方法詳解) 8w次閱讀
- 人機交互概念股龍頭有哪些_人機交互概念股龍頭一覽 1w次閱讀
- 國內有哪些大數據公司_最新中國大數據公司排名 5.3w次閱讀
- 最新大數據概念股龍頭_大數據概念龍頭股有哪些 4.3w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 92次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7藍牙設備在嵌入式領域的廣泛應用
- 0.63 MB | 3次下載 | 免費
- 89天練會電子電路識圖
- 5.91 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233045次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多