精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

還在數據中臺與傳統大數據平臺之間傻傻分不清?

工業互聯網前線 ? 來源:大數據DT ? 作者:彭鋒 宋文欣 孫浩 ? 2021-10-12 17:16 ? 次閱讀

作者:彭鋒 宋文欣 孫浩峰

來源:大數據DT(ID:hzdashuju),本文經授權轉載

導讀:我們可以這樣理解,傳統大數據平臺和數據倉庫是數據中臺的數據來源,建設數據中臺是為了更好地服務于業務部門。

圖1-1顯示了信息化系統、數據倉庫、傳統大數據平臺、數據中臺之間的關系,其中的箭頭表示數據的主要流向。

數據中臺與傳統大數據平臺到底有什么區別?為了敘述方便,我們先給出傳統大數據平臺的架構。

大數據基礎能力層:Hadoop、Spark、Hive、HBase、Flume、Sqoop、Kafka、 Elasticsearch等。

在大數據組件上搭建的 ETL流水線,包括數據分析、機器學習程序。

數據治理系統。

數據倉庫系統。

數據可視化系統。

可以看到,這些是傳統大數據平臺的核心功能。在很多大數據項目里,只要把這些系統搭起來,每天可以生成業務報表(包括實時大屏),就算大數據平臺搭建成功了。

但數據中臺應該是大數據平臺的一個超集。我們認為,在大數據平臺的基礎之上,數據中臺還應該提供下面的系統功能。

1. 全局的數據應用資產管理

這里所說的數據應用資產管理包括整個生態系統中的數據和應用。傳統的數據資產管理絕大部分只包括關系型數據庫中的資產(包括Hive),而一個數據中臺應該管理所有結構化、非結構化的數據資產,以及使用這些數據資產的應用。

如果傳統的數據資產管理提供的是數據目錄,那么數據中臺提供的應該是擴展的數據及應用目錄。要避免重復造輪子,首先要知道系統中有哪些輪子,因此維護一個系統中數據及數據應用的列表是很關鍵的。

2. 全局的數據治理機制

與傳統的數據治理不一樣,數據中臺必須提供針對全局的數據治理工具和機制。傳統數據倉庫中的數據建模和數據治理大多針對一個特定部門的業務,部分原因是全局數據建模和治理周期太長,由于存在部門之間的協調問題,往往難度很大。

數據中臺提供的數據治理機制必須允許各個業務部門自主迭代,但前提是要有全局一致的標準。阿里提出的OneID強調全局統一的對象ID(例如用戶ID),就屬于這個機制。

3. 自助的、多租戶的數據應用開發及發布

現有的絕大部分大數據平臺要求使用者具備一定的編程能力。數據中臺強調的是為業務部門賦能,而業務人員需要有一個自助的、可適應不同水平和能力要求的開發平臺。這個開發平臺要能夠保證數據隔離和資源隔離,這樣任何一個使用系統的人都不用擔心自己會對系統造成損害。

4. 數據應用運維

用戶應該可以很方便地將自己開發的數據應用自助發布到生產系統中,而無須經過專門的數據團隊。因為我們需要共享這些應用及其產生的數據,所以需要有類似于CI/CD的專門系統來管理應用的代碼質量和進行版本控制。

在數據應用運行過程中產生的數據也需要全程監控,以保證數據的完整性、正確性和實時性。

5. 數據應用集成

應該可以隨時集成新的數據應用。新的大數據應用、人工智能工具不斷涌現,我們的系統應該能夠隨時支持這些新應用。如果數據中臺不能支持這些應用,各個業務部門可能又會打造自己的小集群,造成新的數據孤島及應用孤島。

6. 數據即服務,模型即服務

數據分析的結果,不管是統計分析的結果,還是機器學習生成的模型,應該能夠很快地使用無代碼的方式發布,并供全機構使用。

7. 數據能力共享管理

大部分數據能力應當具有完善的共享管理機制、方便安全的共享機制以及靈活的反饋機制。最后決定數據如何使用的是獨立的個人,他們需要一套獲取信息的機制,因此在機構內部必須要有這樣的共享機制,才能真正讓數據用起來。

8. 完善的運營指標

數據中臺強調的是可衡量的數據價值,因此,對于數據在系統中的使用方式、被使用的頻率、最后產生的效果,必須要有一定的運營指標,才能驗證數據的價值和數據中臺項目的效率。

綜合上面的討論,除了阿里巴巴提出的OneID、OneModel、OneService之外,我們認為數據中臺還應該滿足以下兩個要求。

1. TotalPlatform

所有中臺數據及相關的應用應該在統一平臺中統一管理。如果有數據存儲在中臺管理不到的地方,或者有人在中臺未知的情況下使用數據,我們就無法真正實現對數據的全局管理。這要求數據中臺能快速支持新的數據格式和數據應用,便于數據工具的共享,而無須建立一個分離的系統。

2. TotalInsight

數據中臺應該能夠理解并管理系統中數據的流動,提供數據價值的定量衡量,明確各個部門的花費和產出。整個中臺的運營是有序可控的,而不是一個黑盒子,用戶可以輕松理解全局的數據資產和能力,從系統中快速實現數據變現。

如圖1-3所示,數據中臺可以說是按照一定的規范要求建設的數據能力平臺,在數據倉庫、大數據平臺、數據服務、數據應用的建設中實現了符合OneID、OneModel、OneService的數據層。

這個數據層,加上在其上建立的業務能力層以及運營這個數據中臺需要的TotalPlatform、TotalInsight,形成我們看到的數據中臺。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據中心
    +關注

    關注

    16

    文章

    4686

    瀏覽量

    71954
  • 人工智能
    +關注

    關注

    1791

    文章

    46853

    瀏覽量

    237551
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132407
  • 數據分析
    +關注

    關注

    2

    文章

    1427

    瀏覽量

    34013
  • 大數據
    +關注

    關注

    64

    文章

    8863

    瀏覽量

    137295

原文標題:數據中臺與傳統大數據平臺有什么區別?終于有人講明白了

文章出處:【微信號:IndustryIOT,微信公眾號:工業互聯網前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    物聯數據是什么意思?AI+IOT物聯網平臺解決方案

    物聯數據是什么意思?AI+IOT物聯網平臺解決方案
    的頭像 發表于 11-25 10:37 ?64次閱讀
    物聯<b class='flag-5'>數據</b><b class='flag-5'>中</b><b class='flag-5'>臺</b>是什么意思?AI+IOT物聯網<b class='flag-5'>中</b><b class='flag-5'>臺</b><b class='flag-5'>平臺</b>解決方案

    IOT物聯網:開啟智慧生活新篇章 物聯網平臺系統,構建智慧城市數據生態 智慧城鎮、物聯網、數據

    IOT物聯網:開啟智慧生活新篇章 物聯網平臺系統,構建智慧城市數據生態 智慧城鎮、物聯網、數據
    的頭像 發表于 11-18 14:49 ?151次閱讀

    機器學習在數據分析的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的
    的頭像 發表于 07-02 11:22 ?544次閱讀

    數據在制造業的應用及其轉型價值

    在數字化時代,制造業正面臨前所未有的挑戰與機遇。隨著大數據、云計算、物聯網等技術的發展,數據已經成為制造業企業轉型的重要驅動力。
    的頭像 發表于 05-17 17:20 ?442次閱讀

    數據數據倉庫、數據治理與主數據的定位與差異

    在數字化時代,大數據已經成為企業運營和決策的重要資產。為了更好地管理和利用這些數據數據
    的頭像 發表于 05-08 10:40 ?410次閱讀

    數據工具:企業數據管理的核心動力

    在數字經濟時代,數據工具已經成為各大企業提升效率、優化決策的核心動力。通過集成、分析和管理企業內外的各種數據
    的頭像 發表于 04-26 17:30 ?465次閱讀

    探索數據的力量:企業數據資產管理的未來

    隨著數字化時代的到來,"數據"這一概念逐漸為人所知,并迅速成為推動企業數據驅動轉型的重要基石。數據
    的頭像 發表于 04-10 16:21 ?271次閱讀

    傻傻分不清?射頻模擬信號源和矢量信號源的區別

    傻傻分不清?射頻模擬信號源和矢量信號源的區別? 射頻模擬信號源和矢量信號源是測試和測量領域中常見的兩種信號源。它們在信號產生原理、輸出信號特性、使用場景等方面有很大區別。本文將從原理、特性和應用場
    的頭像 發表于 01-19 15:54 ?5602次閱讀

    構建高效數據生態:數據庫、數據倉庫、數據湖、大數據平臺數據解析_光點科技

    在數字化的浪潮,一套高效的數據管理系統是企業競爭力的核心。從傳統數據庫到現代的數據
    的頭像 發表于 01-17 10:20 ?346次閱讀

    你還是分不清多進程和多線程嗎?一文搞懂!

    同時運行多個獨立的進程。每個進程都有自己獨立的內存空間,可以同時執行不同的任務。多進程之間通過進程間通信的方式進行數據交換。 優點: - 程序之間內存空間相互獨立,相互不會干擾。 -
    的頭像 發表于 12-19 16:07 ?540次閱讀

    如何保護校園大數據的安全性?#數據 #數據治理 #光點科技

    大數據
    光點科技
    發布于 :2023年12月15日 17:24:13

    [ElfBoard]是誰字和字節傻傻分不清楚?

    高電壓和低電壓,在數字電路,通常將高電壓視為 1 ,低電壓視為 0 ,因此我們信息存儲的最終形式是一連串 1 和 0 的組合。這種表達形式與我們在邏輯中經常使用 true 和 false 是類似
    發表于 12-12 13:13

    數據具體是怎么解決數據孤島的?

    在數字化時代,數據已成為企業的核心資產。然而,由于歷史遺留問題、部門壁壘等因素,很多企業面臨著“數據孤島”的問題。數據孤島是指在一個組織內,數據
    的頭像 發表于 11-27 15:51 ?572次閱讀

    參數在數據轉換器的應用

    電子發燒友網站提供《參數在數據轉換器的應用.pdf》資料免費下載
    發表于 11-27 11:46 ?0次下載
    參數<b class='flag-5'>在數據</b>轉換器<b class='flag-5'>中</b>的應用