只有少數(shù)幾家公司能夠獲得大數(shù)據(jù)、人工智能和機器學(xué)習(xí)的能力,可以將其轉(zhuǎn)化為產(chǎn)品。這造成了數(shù)據(jù)擁有者和數(shù)據(jù)貧乏者之間不平等的鴻溝,以及大數(shù)據(jù)行業(yè)的寡頭壟斷。打破寡頭壟斷的最佳方式就是“用開放數(shù)據(jù)的海洋淹沒數(shù)據(jù)豎井”。
數(shù)據(jù)是現(xiàn)代商業(yè)的燃料,每個公司都需要很多數(shù)據(jù),但很少有人能負擔(dān)得起。
只有少數(shù)幾家公司能夠獲得大數(shù)據(jù)、人工智能和機器學(xué)習(xí)的能力,可以將其轉(zhuǎn)化為產(chǎn)品。這造成了數(shù)據(jù)擁有者和數(shù)據(jù)貧乏者之間不平等的鴻溝,以及大數(shù)據(jù)行業(yè)的寡頭壟斷(包括被稱為FANG的Facebook、Amazon、Netflix和Google)。扎克伯格、蓋茨、貝索斯等人已經(jīng)成為數(shù)據(jù)大亨,無異于石油大亨洛克菲勒。
兩個數(shù)據(jù)大亨的故事
雖然AI是貪婪的數(shù)據(jù)消費者,是依賴于大量的數(shù)據(jù)發(fā)展起來的,但大多數(shù)公司要么擁有大量潛在的數(shù)據(jù)卻沒有能使用這些數(shù)據(jù)的AI,要么有AI算法卻沒有足夠的數(shù)據(jù)。
這是為什么呢?主要是因為尋找擁有AI知識的人才的競爭十分激烈,成本也很昂貴,更別說AI專家。大型科技公司正以高昂的初始工資從大學(xué)直接招聘AI畢業(yè)生。成本有多高呢?舉個例子,前谷歌自動駕駛部門工程師Anthony Levandowski在離開谷歌的前一年,拿到了1.2億美元的工資和獎金。
另一方面,很多擁有AI知識的畢業(yè)生正在創(chuàng)辦自己的科技公司,但卻無法獲得開發(fā)產(chǎn)品所需的大量數(shù)據(jù)。
FANG公司已經(jīng)成為數(shù)據(jù)的OPEC(石油輸出國組織)了嗎?
在互聯(lián)網(wǎng)時代的初期,webgraph(一種網(wǎng)頁相互連接的圖)是開放的,拉里·佩奇和謝爾蓋·布林得以學(xué)習(xí)和創(chuàng)新,創(chuàng)建了谷歌公司。但從那時起,webgraph的重要性就逐漸減弱,取而代之的是社交圖(social graph)。
從60年代開始,social graph曾是一個人具有的人際網(wǎng)絡(luò)和人際關(guān)系的網(wǎng)絡(luò)效應(yīng)的寫照。
然而,F(xiàn)acebook擁有超過20億用戶,它重新定義了 social graph,成為了最具包容性的一個 social graph,并創(chuàng)建了一個指數(shù)級的將個人以及他們的朋友與企業(yè)、服務(wù)、社交活動、喜惡等等聯(lián)系在一起的網(wǎng)絡(luò)。而在數(shù)據(jù)經(jīng)濟中,這是企業(yè)所追求的。
盡管仍然很重要,但webgraph的主要價值來源是計算網(wǎng)站的PageRank;擁有用戶在線偏好和傾向的詳細數(shù)據(jù)就是數(shù)字廣告商的圣杯。
Facebook的social graph可以說已經(jīng)成為網(wǎng)絡(luò)上最賺錢的生態(tài)系統(tǒng),并且與其他數(shù)據(jù)寡頭(谷歌、亞馬遜、Netflix、微軟)一樣,它具有數(shù)據(jù)網(wǎng)絡(luò)效應(yīng),這種效應(yīng)發(fā)生在機器學(xué)習(xí)驅(qū)動的產(chǎn)品隨著用戶數(shù)據(jù)的增加而變得更智能時。這就在商業(yè)環(huán)境,尤其是數(shù)字廣告領(lǐng)域創(chuàng)造出一個贏家,使得其他人越來越難以參與競爭。
2015年,Google和Facebook在全球數(shù)字廣告支出中的比例達到40%。2016年第三季度,Google和Facebook占了美國數(shù)字廣告收入增長的99%——這是有史以來的最高的比例。2017年,它們占了美國數(shù)字廣告支出總額的63%以上。雖然Amazon和Snapchat的進入使得它們的增長速度放慢,但要打破這種數(shù)字雙寡頭壟斷局面將是非常困難的。
石油輸出國組織(OPEC)是一個由14個石油生產(chǎn)國組成的政府間組織,它們占全球石油產(chǎn)量的44%,占全球探明室友儲量的73%。這使得OPEC能對全球原油價格產(chǎn)生重要影響。
雖然沒有證據(jù)表明數(shù)據(jù)寡頭之間存在這種“卡特爾主義”,但Facebook和Google兩家公司占有如此大的市場份額和無限量的數(shù)據(jù)供應(yīng),它們將如何影響全球數(shù)字廣告的價格呢?
數(shù)據(jù)的護城河,湖泊和海洋
“護城河”(moat)是從巴菲特的投資理論中借用的一個術(shù)語,描述了公司周圍的經(jīng)濟防御層——無論是知識產(chǎn)權(quán)(IP),品牌還是員工——護城河讓公司能在同行業(yè)中優(yōu)于競爭對手。“數(shù)據(jù)護城河”(data moats)已成為互相競爭的科技公司之間保護知識產(chǎn)權(quán)的一種形式。
數(shù)據(jù)湖泊(Data lakes)是組織內(nèi)部所有部門輸入的原始數(shù)據(jù)池。這與組織內(nèi)部門間相隔離的數(shù)據(jù)是不同的,這些數(shù)據(jù)不會跨部門共享。因此,一個組織可能擁有大量有關(guān)個人客戶的數(shù)據(jù)(他們的社交習(xí)慣、購買習(xí)慣、溝通習(xí)慣等),但這些數(shù)據(jù)是分散的,難以編制成完整的個人檔案。
數(shù)據(jù)湖泊以本地格式保存大量的原始數(shù)據(jù)。與將數(shù)據(jù)存儲在文件或文件夾中的分層數(shù)據(jù)庫不同,數(shù)據(jù)湖使用平面架構(gòu)來存儲數(shù)據(jù)。因此,它在很大程度上是非結(jié)構(gòu)化的,是非關(guān)系型的(NoSQL)數(shù)據(jù),直到出現(xiàn)一個特定的問題需要使用數(shù)據(jù)查詢,才將其細化為相關(guān)的模式。
數(shù)據(jù)是一門大生意;大數(shù)據(jù)更是一筆巨大的業(yè)務(wù)。但是一個行星大小的數(shù)據(jù)庫怎么樣?對于廣告商和AI開發(fā)人員來說,這會成為圣杯嗎?
邁向數(shù)據(jù)海洋
海洋協(xié)議(Ocean Protocol)是一個去中心化的全球數(shù)據(jù)交換協(xié)議,旨在讓企業(yè)和個人可以通過本地海洋令牌購買和銷售數(shù)據(jù),其目的是解鎖大數(shù)據(jù),并向更多人開放AI開發(fā)。該項目背后的理念是,對集中式數(shù)據(jù)庫缺乏信任會阻止競爭者之間共享數(shù)據(jù)。
Ocean Protocol由BigchainDB的聯(lián)合創(chuàng)始人Trent McConaghy創(chuàng)立,Ocean是區(qū)塊鏈項目生態(tài)系統(tǒng)的一部分(見下圖),旨在將數(shù)據(jù)、計算能力和存儲去中心化和民主化,以縮小大型科技企業(yè)之間的差距。
在2016年,世界上已經(jīng)產(chǎn)生16ZB(16zettabytes或16,000,000,000,000,000,000,000字節(jié))的數(shù)據(jù),但實際上被分析的數(shù)據(jù)只有1%,而在這1%的數(shù)據(jù)中,只有少數(shù)公司有辦法優(yōu)化數(shù)據(jù)。
這些項目的最終目標(biāo)之一是讓人們重新控制和掌握數(shù)據(jù),而不是試圖讓數(shù)據(jù)大亨放棄數(shù)據(jù)。
民主化未來的數(shù)據(jù)經(jīng)濟
去中心化數(shù)據(jù)交換可以有哪些幫助?
醫(yī)療保健是可獲取外部數(shù)據(jù)的一個領(lǐng)域,并且將產(chǎn)生深遠的影響。例如,如果在大型數(shù)據(jù)集上進行測試,醫(yī)療藥物試驗對特定人群或性別的效力的偏差可能遠遠低于單一醫(yī)院或?qū)嶒炇宜塬@得的結(jié)果。
一項利用AI來獲得結(jié)論或為某種疾病研發(fā)有效產(chǎn)品的醫(yī)療項目需要1萬名患者的數(shù)據(jù),才能獲得較低的錯誤率,這對于單一醫(yī)院來說幾乎是不可能的。去中心化的數(shù)據(jù)市場的作用就在這里。
在測試任何軟件或算法時,保持低錯誤率是一個目標(biāo),而最簡單和最便宜的方法并不是要改進或編寫更復(fù)雜的算法,而是要在舊算法上運行大量數(shù)據(jù),或者如Trent McConaghy所描述的那樣:“ 用CSV文件替換Phds——這在2000年代使得錯誤率大大減少,有更多AI得以部署。“
自動駕駛汽車是另一個出錯率必須接近0的領(lǐng)域,因為我們要有足夠的信任才能把生命真正地交給計算機。據(jù)估計,需要5000億到1萬億英里的行駛距離,才能使AI模型足夠精確,能夠用于自動駕駛汽車的生產(chǎn)部署。
另外,Avdex是一種去中心化的航空數(shù)據(jù)交換。
“像Google和Facebook這樣的公司意識到,如果它們將這些數(shù)據(jù)存儲起來,就會產(chǎn)生數(shù)據(jù)網(wǎng)絡(luò)效應(yīng),”McConaghy說。 “它們有更多的數(shù)據(jù),這意味著更好的模型,這意味著更高的點擊率,帶來更多的錢。它們自稱AI公司,但其實是數(shù)據(jù)公司——是數(shù)據(jù)豎井。一旦擁有了數(shù)據(jù)豎井,企業(yè)就可以將用戶從他們自己的數(shù)據(jù)中分離出來,從而將他們從數(shù)字生活中隔離開來。AI催生了這些數(shù)據(jù)豎井。”
今天,在互聯(lián)網(wǎng)時代,大型科技公司的權(quán)力集中度無人能及;相比之下,微軟在90年代憑借IE瀏覽器達到統(tǒng)治地位而引發(fā)的反壟斷擔(dān)憂就相形見絀了。
雖然我們并不處于洛克菲勒的壟斷時代,但數(shù)據(jù)市場的集中度介于洛克菲勒壟斷和OPEC模式之間。 正如McConaghy所說,打破寡頭壟斷的最佳方式就是“用開放數(shù)據(jù)的海洋淹沒數(shù)據(jù)豎井”。
-
人工智能
+關(guān)注
關(guān)注
1791文章
46845瀏覽量
237535 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132405 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8863瀏覽量
137290
原文標(biāo)題:谷歌、Facebook已成數(shù)據(jù)寡頭,去中心化數(shù)據(jù)交換打破壟斷
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論