雖然Jack馬先生總是口出驚人之語,但事實證明他說的話總是不斷被應驗。
2016年的“新零售”現在已經是公認的零售新篇章,而2014年的“人類正從IT時代走向DT時代”,也在逐漸變成現實——不管什么樣的企業,都習慣要“大數據”一下。
這其中,阿里自己往往成為“預言”的忠實擁躉,新零售跑馬圈地,現在大數據也要“搞個大新聞”。
不久前,阿里云在其峰會上發布了大數據服務產品“飛天大數據平臺”,從公開信息來看,該平臺被稱為“中國唯一自主研發的大數據計算引擎”,以及“全球集群規模最大的計算平臺”。
參數能力上,有諸如單一引擎支持10萬臺服務器組合計算、支持超600PB計算能力等。
今年6月以來,阿里在AI能力上頻頻對外界秀肌肉,連續獲得5個世界大賽第一(詳見相關報道),現在,阿里云高調發布“飛天大數據平臺”,在馬云口中的DT時代大干一把的野心擺上臺面。
大眾心中“商業”標簽濃厚的阿里,拉開遮蓋的幕布,開始把“技術”標簽顯露出來。
大數據技術之爭,為什么“商業”阿里卻率先冒出?
眾所周知,DT時代一定建立在云計算基礎之上。
但是,當大數據技術和服務成為云計算標配時,為什么“中國唯一自主研發”以及“全球集群規模最大”這些頭銜會落到一貫以“商業”姿態示人的阿里頭上?
這種“出人意料”,原因恰恰也出在“商業”兩個字上。
阿里云此次是“對外發布”飛天大數據平臺,在這之前,這款產品已經在阿里云內部實質運行和服務了十年之久(以前稱作MaxCompute平臺,也是現在飛天的核心)。
某種程度上,阿里在大數據技術上令人意外地“冒出”,既有主觀追趕DT時代的內在動機,也不能否認是被自己的“商業”發展所倒逼。
1、自身商業的業務膨脹所倒逼
阿里雖然是商業起家,但卻技術上最早遭受規模化帶來的技術壓力。
2008年淘寶網上已經有9800萬注冊會員,用戶一多就帶來數據存儲和計算的壓力,而這個數字還在持續暴增。
在全球范圍內,Google、AWS、微軟也面臨類似的問題,老的數據系統(例如Oracle、Greenplum、Hadoop等)都沒辦法適應暴增的數據需求(類似于馬車設計時沒辦法考慮到汽車的運載能力),各家都在研發自己的大數據技術。
而且,與搜索、社交不一樣,“商業”場景下的用戶與信息存儲更復雜,個人信息、消費信息、金融信息,甚至早期的推薦機制,都對大數據技術提出了更高的要求。
所以,這造成一個奇特的現象:“商業”做得越成功、標簽越濃厚,背地里“技術”就必須越深度。
我們今天看到阿里在商業上如日中天,已經是“技術沒有拖后腿”的結果。
而面對幾何級膨脹的商業需求能夠不拖后腿,這樣的技術拿出來對外開放時,獲得“中國唯一”、“全球最大”之類的成績似乎并不意外。
從2009年阿里云成立時,“飛天”就已經事實上開始起步。
從其發展軌跡來看,2013年8月突破同一個集群內5000臺服務器同時計算,2016年2月單集群突破10000臺,2019年多集群突破10萬臺,這樣的技術成長,從時間線來看與阿里的商業成長幾乎同頻。
阿里系旗下的支付寶芝麻信用分、淘寶商家的每日商鋪賬單、高德、優酷、阿里媽媽等的大數據業務都通過MaxCompute平臺進行,2018年雙11,單日處理超過600PB的數據,交易峰值平滑度過。
現在,阿里99%的計算和95%的存儲都由飛天支撐,其展示出來的技術成就始終與阿里的“商業”標簽緊密相連。
2、對外生態服務擴張所倒逼
阿里云在國內處在領先位置,服務大量大大小小的企業,這反過來像內部商業發展一樣倒逼阿里云在大數據技術有所突破,畢竟,現在人人都在談大數據。
例如,阿里云服務知名APP“墨跡天氣”,該產品要為4億用戶提供氣象預報服務,每天用戶查詢超過5億次,對數據調用和運算產生很大壓力,阿里云必須“跟上”客戶的腳步進行技術革新。
類似高數據需求的客戶還有很多。
此外,在過去幾年的智慧城市大戰中,阿里云搶先發車,在大本營浙江搞出許多明星項目。例如,其服務浙江“最多跑一次”政務體系建設,面臨老百姓辦事最密切相關的100個事項70多億條數據,大數據平臺沒有跟上是無法想象的。
云計算生態越龐大,這種底層技術就必須越走在前面。
3、“領頭羊企業”的頭銜所倒逼
一談中國有哪些知名互聯網科技企業,無非就是BAT等少數幾個公司,而從市值上看,阿里又處在領頭羊位置。
這是商業成功帶來的榮譽不假,但其實暗地里,從國家層面看,商業的成功最終一定要承擔技術的職責。
核心技術是國之重器,但誰來創新核心技術,責任只能落到這些商業上成功的企業頭上。
2018年3月,Forrester發布《2018年一季度云端數據倉庫》大數據服務榜單,阿里與AWS、Google、微軟進入全球一線陣營。
在全球范圍內,阿里無法永遠在“商業”標簽下存在和發展,中國從IT時代走向DT時代,阿里這樣的企業露出技術標簽是時代的必然。
全新的DT時代,大數據平臺如何參與競逐?
DT時代替換IT時代,在全新階段面前,核心的角逐場大數據平臺究竟要怎么玩,沒有經驗可供借鑒。
作為孤例,拆解阿里云飛天大數據平臺的一些做法,它們未必全面,但或可以作為行業參考。
1、“物”膨脹下的“DT系統”構建
DT時代,數據無非包括“人”和“物”兩個部分,過去10年,“人”(即用戶)的增長和沉淀已經基本完成,數據定格在高位。
下一步可以預見的是,未來10年IoT的全面發展,基于“物”的數據將迎來新的爆發,萬物互聯、萬物映射到數字世界,大數據將迎來新一波井噴。
所以,對大數據平臺服務而言,關注“物”數據的膨脹成為重中之重。
以阿里云“飛天大數據平臺”為例,目前該平臺支撐全國442個城市、超過1000項公共服務,而在杭州的典型應用“城市大腦”,需要在數分鐘內優化1300個核心路口、萬級交通配時的控制參數,此外,還需要處置110種交通警情。
這些,與大量交通IoT數據密切相關。海量物聯網終端數據匯總、分析與處理,“物”數據膨脹下事實上構建了一套“DT系統”(相對IT系統)。
此外,在工業領域,“物”數據的膨脹也十分明顯,以阿里云服務的協鑫光伏、天合光能等為例,大數據技術必須幫助這些企業完成上千個參數的最優搭配,提升制造的良品率,這是“物”數據的直接產業價值。
2、極致的“低延時”戰爭
5G不僅僅是速度快,更重要的是低延時。
低延時改變了數據傳輸和運算的邏輯,在包括工業在內的許多領域有著顛覆性價值,也為5G帶來了改造世界的無限可能。
但是,5G畢竟只是負責信息傳輸的技術,在數據存儲、調用、處理上,未來的5G還必須搭配與低延時“理念”一致的大數據技術服務,否則“孤掌難鳴”。
在此次阿里云峰會上,阿里巴巴集團CTO張建鋒用手機淘寶APP做了一個現場展示,用戶輸入一個搜索關鍵詞點擊之后,下拉屏幕將出現與之相關的內容。
張建鋒稱,“每個人的購物喜好和變化,可以在秒級之內被計算出來。”7億淘寶用戶的行為與運算由飛天支撐,實現實時化。
想象一下未來5G物聯網應用當中,當5G完成了極低延時的傳輸任務后,在需要大數據的部分,大數據技術無法用配合實現實時分析,最終總體響應能力沒有發生根本改變,那樣的變革很難創造顛覆性價值。
DT時代大數據技術的發展,必須與5G應用有相同的步調。
3、大數據普惠化倒逼“客戶體驗”
IT時代企業人人IT,同理,DT時代,企業也必將人人DT。
阿里云飛天一發布就強調對中小企業的服務,大量需求大數據而又缺乏技術基礎、近乎“小白”的中小企業在等著大平臺賦能。
而既然是小白,既然DT時代要實現大數據的普惠化,門檻盡可能低、企業信息系統改造盡可能平滑就成為實操落地的關鍵。
誰能讓中小企業零門檻擁抱DT,誰就占據時代的先機。
2019年1月,阿里首款大規模分布式科學計算引擎Mars開源,該產品基于MaxCompute,在技術實現上,官方宣稱“降低編程難度,兼容Numpy接口,無需修改代碼即可處理比原來規模大上萬倍的數據量”。
顯然,阿里云試圖讓大數據技術的開放變得和常規云服務產品部署一樣簡單,按照這個趨勢,無代碼部署也不是不可能。
DT競爭是組合拳,大數據平臺只是開始
在此次峰會上,阿里云提出“全面上云的拐點到了”,張建鋒還把企業上云劃分為企業基礎設施上云、大數據上云、云上中臺、云上智能四個階段。
對應地,阿里云發布了飛天云操作系統、飛天大數據平臺、阿里巴巴雙中臺和智聯網AIoT四個產品,一些媒體稱之為阿里云的“四張王牌”。
而事實上,阿里云一次發布包括大數據平臺在內的四款產品,涉及基礎機構、數據中臺、智能化等內容,本身就證明了DT時代的競爭是組合拳,大數據平臺是其中的構成部分。
也即,只有大數據平臺,撐不起DT時代的企業上云,在疊加的時代浪潮下,“客戶”們的需求往往是多元化的,要技術、要運營、要緊跟趨勢。
要想在DT時代有所建樹,不管是大型云計算平臺,還是中小云服務商,云基礎架構、大數據技術、管理中臺、AI、IoT等可賦能的技術能力都是“標配”。
正因為如此,當阿里云決意把大數據平臺開發出來,它就必須、不得不一次性推出云計算產品“全家桶”,只有這樣才能全方位滿足“客戶”們的需求,單一的大數據技術無法形成全面的技術和生態勢能。
當然,這也使得“商業”阿里更難以藏住“技術公司”標簽,未來,阿里技術的一面將露出得越來越多。
評論
查看更多