短短三四年,湖倉一體便從新興概念躍升為大數據領域十大關鍵詞之一。
從燧人氏結繩記事到甲骨文的出土再到蔡倫造紙,種種歷史大事件告訴我們,在記錄、存儲、使用等數據相關的一系列操作上,中國有著深厚的經驗和積淀。
由于前兩次工業革命落后太多,導致在信息化時代國人即便奮力追趕,在數據的存儲、調用上,仍要向Oracle、IBM等國際巨頭看齊。
好在,數據在彼時沒有像今天這般重要。
如今,數字化轉型如火如荼,國家層面已將數據上升到第五類生產要素并出臺“數據二十條”。數據的重要性日益凸顯。
在此過程中,國人在數據方面的基因已覺醒,開始積極探索應用國產基礎軟件,助力身處數字化變革中的企業,實現數據價值的最大化。國產大數據基礎軟件,正在企業數字化轉型中扮演著越來越重要的角色……
1.數據驅動的更優解
毋庸置疑,隨著移動互聯網的普及和超高滲透率,我們已迎來了一個數據大爆炸的時代:結構化數據、半結構化數據以及非結構化數據的層出不窮,豐富了數據的應用場景,更增加了企業的存儲、管理難度。
另一方面,在“云大物移智”等數字化技術推動下,全球正掀起第四次工業革命,一次基于數據、基于AI的革命。
數據搖身一變,從靜靜待在HDD、SSD等介質里的被存儲對象,變成了寶貴的資產。國家借助數據要素發展數字經濟;企業借助數據,從流程驅動走向數據驅動,成為數智企業。
從被存儲對象到資產,數據的蛻變離不開技術的賦能。事實上,技術也一直賦能著數據,只不過在不同階段以不同的方式賦能:
PC互聯網年代,數據還是結構化數據的天下,企業更多借助結構化數據進行分析。為滿足企業敏捷的數據分析需求,基于聯機分析處理(OLAP)的數據倉庫(Data Warehouse)概念開始出現并迅速發展。
移動互聯網時代,在社交、視頻等平臺帶動下,XML文檔、圖片、音視頻等半結構化、非結構化數據呈指數級增長,數據湖(Data Lake)和數據倉庫并肩作戰,成為企業處理數據的另一項重要工具。
二者之所以“并肩作戰”而非替代,是因為數據湖雖然具備更好的開放性與靈活性,但其在OLAP方面的性能不足、數據的一致性和ACID能力缺失,使得其無法替代數據倉庫。
這對深處數字化變革中的企業而言,無疑是個棘手的問題:數據倉庫與數據湖的并存,帶來的是數據的割裂、高額的開發成本、維護成本。
那么,面向當下以及未來,有沒有一種更好的方式,能夠幫助企業更快地實現數據驅動?
答案呼之欲出:湖倉一體(Data Lakehouse)。
這個由Databricks在2019年提出的技術,很好地將數據倉庫的高性能、管理能力與數據湖的開放性和靈活性融合,實現了海量異構數據的統一存儲、計算、開發、管理和服務,從而幫助企業解決數據孤島、數據冗余,系統維護等問題。
極具優勢的湖倉一體技術,在短短三四年里便從一個新興概念成為大數據領域的重要發展趨勢,Databricks也憑此成為估值300多億美元的超級獨角獸。
眾多行業報告從前景、規模等市場層面闡述了湖倉一體的未來:信通院將湖倉一體列為《2023大數據十大關鍵詞》;
IDC 調研顯示,有 66.9%的企業了解湖倉一體架構,有 85%的企業正在部署或考慮評估升級湖倉一體架構。IDC在《中國人工智能與大數據技術圖譜,2022》中,將湖倉一體列為遞增型代表技術,其將在中長期持續提高、優化業務交付體驗,作為支撐智能產業發展的統一數據底座;
愛分析日前發布的《2022年中國湖倉一體平臺市場研究報告》顯示,2022年中國湖倉一體平臺軟件市場規模15.2億元;預計到2025年,這一數字有望達到97.6億元,2022-2025三年復合增長率高達86%。
2.走出更適合中國企業的湖倉一體之路
橫向對比國內外湖倉一體市場,盡管才剛剛興起,但中國企業已經和國外巨頭走出一條截然不同的路。
以Databricks為代表的國外湖倉一體巨頭,更注重湖倉一體架構的搭建和AI能力的引入。而數據的治理、應用等,則交給生態合作伙伴,以生態的方式為客戶提供全生命周期的數據服務。這在Salesforce、Workday等其他領域國外巨頭服務客戶時也常常能看到。
國內湖倉一體廠商更傾向于“端到端”服務,即通過平臺的方式,為客戶提供從數據的接入、開發、治理到數據資產的管理、運營全生命周期服務。事實上,這種平臺化的方式,不僅在湖倉一體領域運用,在中國其他企業應用軟件領域也廣泛適用。
這種平臺化的方式,也的確更適合中國企業的數字化轉型。相比歐美,中國企業的數字化能力參差不齊、場景更豐富且個性化需求多,外加國內服務商的產品或者工具開放性有限,所以平臺化更能夠幫助中國企業一步到位。
《2022年中國湖倉一體平臺市場研究報告》也表明,在國內,中國本土湖倉一體廠商更受市場歡迎。數據顯示,2022年中國湖倉一體平臺軟件市場規模達15.2 億元。其中,科杰科技市場份額占比 11.1%,位居第一,其次為華為云和星環科技,占比分別為9.5%和7.3%。
3.中國湖倉一體領導者的修煉手冊
短短三四十年間,中國科技伴隨中國經濟的騰飛而發生著翻天覆地的變化:從PC互聯網時代的追趕到移動互聯網時代的并肩再到數字化時代的領先。
將視野重新拉回湖倉一體,面對這個由國外巨頭率先進軍的領域,國內廠商又是如何在三四年內做到在中國湖倉一體市場中一枝獨秀的呢?
我們不妨透過科杰科技,這家中國湖倉一體市占率第一的廠商視角,找尋這個問題的答案。
毫無疑問,湖倉一體作為一款面向數智企業打造的數字化解決方案,技術的先進性應是基本條件。
科杰科技打造的湖倉一體數據智能平臺KeenData Lakehouse,運用了存算分離、ACID事務性、批流一體、Data Fabric(數據編織)、Data Virtualization(數據虛擬化)、Active Metadata Management、Data Mesh 、DataOps等業內最先進的技術。
諸如Data Fabric、Active Metadata Management、Data Mesh 等理念,目前在國內還處于起步階段,科杰科技卻已經將其引入產品中。
除此之外,在實現湖倉一體上,科杰科技在技術架構上選擇了更先進的湖倉融合方式,產品KeenData Lakehouse提供的多架構統一納管能力,幫助企業無需遷移數據倉庫和數據湖的歷史數據,最低成本地實現數據架構與引擎統一,降低架構復雜性的分析與成本,同時大幅度提升數據開發的效率。
在近期IDC發布的《湖倉一體數據平臺技術能力評估報告》中,KeenData Lakehouse憑借著領先的技術實力在報告中獲得推薦,成為行業備受推崇的湖倉一體大數據平臺之一,入選Gartner《2023 年中國數據、分析和人工智能技術成熟度曲線報告》可組合D&A標桿廠商。
產品完備性是其制勝的關鍵。數據從被存儲對象到資產化的過程,是一場異常復雜、長流程的蛻變,唯有連續、無斷點才能達成企業數據驅動的目標??平芸萍荚诩夹g的先進基礎之上,進一步打造了功能完善的數據產品。
KeenData Lakehouse湖倉一體數據智能平臺是一個數據底座產品矩陣,由十二個部分構成,分別涉及主數據的管理、數據標準、數據質量、數據指標、數據開發管理、實時計算、數據同步、數據科學以及數據標簽、數據服務和數據資產等數據全生命周期服務,覆蓋數據多架構統一納管、工程化能力、治理與工程能力相融合、集中式管制和分散式賦能等能力,全體系的大數據基礎軟件產品為大型組織的數據驅動建設內生的數據能力提供了基礎。
科杰科技湖倉一體數據智能平臺KeenData Lakehouse技術架構圖(圖片來源:愛分析)
無論是信息化還是數字化解決方案,其根本用途在于賦能業務增長、促進組織變革,所以如果產品僅僅停留在技術先進、功能完善層面,遠遠達不到企業數字化轉型的目標。
成熟的方法論以及豐富專業的落地實踐,恰恰是科杰科技的又一殺手锏??平芸萍荚谄浠A軟件平臺KeenData Lakehouse內融合其獨有的大型企業復雜場景下數字化轉型的最佳實踐理念,這是承載中大型企業構建內生數據能力的心臟。
科杰科技與每一個客戶深度合作,共同推進數字化轉型。據悉,科杰科技已幫助中國石化、中國一汽、中國聯通、國家電網、中金公司等行業頭部企業完成數據底座體系化建設,覆蓋政府、能源、金融、零售、工業等多個行業。
持續的貿易戰為行業的發展提供了助力,將國產化提到更高的高度??平芸萍己}一體數據智能平臺KeenData Lakehouse,通過自主研發創新,替代國外開源的數據庫和大數據產品。在修煉內功的同時,科杰科技也不斷與國內信創企業完成產品兼容性適配認證,目前已在基礎軟件、基礎硬件等信創生態體系上構建了全棧全場景的解決方案。
4.堅實的數據底座,加速AI大模型產業化
今年年初,以ChatGPT為代表的AIGC在全球范圍內掀起AI大模型浪潮。半年過去,AI大模型浪潮不僅沒有退去,反而愈演愈烈,除了互聯網大廠、云服務商、AI公司等各類玩家紛紛跟進,另一明顯趨勢便是AI大模型開始向B端滲透。
談及AI大模型,我們除了要看到其在最上層的應用場景,同樣需要看到其千億級的參數、超強的算力以及高質量、大規模、多樣化的數據。而AI大模型的To B,除了要在這些基礎之上,更要加入對高并發、高可靠性的支持,以及對行業、對業務場景的理解。
這對天生To B、天生與數據打交道的眾多湖倉一體廠商而言無疑是個機會,于科杰科技更是一個進一步擴大領先優勢的機遇。原因在于,科杰科技打造的KeenData Lakehouse湖倉一體數據智能平臺,完全涵蓋AI大模型對中間件基礎軟件要求的必備能力。
后續,科杰科技一方面將持續以數據底座的姿態,為AI大模型的落地提供數據基礎設施和數據能力的支撐,另一方面將把KeenData Lakehouse與服務各行業的Know-How深度耦合,在AI大模型落地基礎上加速產業化。
在數智化、國產化雙重大背景下,AI大模型唯有基于國產基礎軟件打造的數字底座實現產業化,從而提升個人以及企業的生產效率乃至社會的運轉效率,才能發揮其真正的價值,避免再次被“卡脖子”。中國也才能在AI驅動的第四次工業革命中、在數字經濟的競賽中拔得頭籌,這是以科杰科技為代表的國內大數據基礎軟件供應商以及全體科技工作者的責任。
-
數字化
+關注
關注
8文章
8615瀏覽量
61643 -
ChatGPT
+關注
關注
29文章
1548瀏覽量
7495 -
大模型
+關注
關注
2文章
2333瀏覽量
2489
原文標題:國產基礎軟件再創新賽道,湖倉一體成就百億市場|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論