量子計(jì)算已接近商業(yè)化階段,有很大的潛力改變我們的世界。利用量子計(jì)算的獨(dú)特能力來(lái)解決特定類(lèi)型問(wèn)題的早期采用者,有可能在建立新型業(yè)務(wù)模式方面實(shí)現(xiàn)突破。富有遠(yuǎn)見(jiàn)卓識(shí)的企業(yè)已經(jīng)開(kāi)始調(diào)整戰(zhàn)略方向,為新興的量子計(jì)算生態(tài)系統(tǒng)做好準(zhǔn)備,成為“量子就緒型企業(yè)”。這些具有前瞻性思維的企業(yè)正在探索用于解決復(fù)雜業(yè)務(wù)問(wèn)題的用例和相關(guān)算法。
何為量子計(jì)算?
量子計(jì)算利用了自然科學(xué)中發(fā)現(xiàn)的量子力學(xué)定律,有潛力從根本上改變傳統(tǒng)的信息處理方式。量子行為的兩個(gè)特性,也就是疊加和糾纏,使量子計(jì)算機(jī)有能力解決目前的常規(guī)或傳統(tǒng)機(jī)器無(wú)能為力的問(wèn)題:
1、疊加。傳統(tǒng)計(jì)算機(jī)使用的是只包含“1”或“0”的二進(jìn)制位。而量子計(jì)算機(jī)則使用量子位,可以描述“1”、 “0”或者量子位的可能狀態(tài)的任意組合(稱(chēng)為“疊加”)。因此,具有 n 個(gè)量子位的量子計(jì)算機(jī)通過(guò)這些量子位彼此疊加,形成了 2n 種可能性。這使量子計(jì)算機(jī)具有指數(shù)級(jí)數(shù)量的狀態(tài),因此能夠比傳統(tǒng)計(jì)算機(jī)更有效地解決一些特定類(lèi)型的問(wèn)題。
2、糾纏。在量子世界,甚至相距光年的兩個(gè)量子位仍能以強(qiáng)相關(guān)的方式發(fā)揮作用。量子計(jì)算正是借助這種糾纏特性,利用量子位之間的相互依賴(lài)性破解問(wèn)題。
量子的疊加和糾纏特性使量子計(jì)算機(jī)能夠快速研究一系列可能性,以確定有助于推動(dòng)業(yè)務(wù)價(jià)值的最佳答案。由于未來(lái)的量子計(jì)算機(jī)在計(jì)算某些問(wèn)題時(shí),速度要比傳統(tǒng)計(jì)算機(jī)快上幾個(gè)指數(shù)級(jí)(見(jiàn)下圖),因此有望解決極為復(fù)雜的業(yè)務(wù)難題。盡管傳統(tǒng)計(jì)算機(jī)存在局限性,但在可以預(yù)見(jiàn)的未來(lái),量子計(jì)算機(jī)并不會(huì)完全取代它們的作用。相反,結(jié)合了量子與傳統(tǒng)架構(gòu)的混合型計(jì)算機(jī)有望浮出水面,將一部分難題“外包”給量子計(jì)算機(jī)。
比如說(shuō),要使傳統(tǒng)計(jì)算機(jī)的理論計(jì)算能力翻一番, 需要將晶體管數(shù)量增加一倍。要使量子計(jì)算機(jī)的理論計(jì)算能力翻倍,只需為某些應(yīng)用額外添加一個(gè)量子位即可。未來(lái)的量子處理器可模擬咖啡因分子 — 傳統(tǒng)計(jì)算機(jī)要想做到這一點(diǎn),個(gè)頭要比地球大上 10% 才行。近期內(nèi),量子計(jì)算機(jī)也許可以幫助設(shè)計(jì)一些新材料, 用于在將來(lái)創(chuàng)建更強(qiáng)大的量子計(jì)算機(jī)。
▲ 量子計(jì)算為運(yùn)算加速的潛力遠(yuǎn)遠(yuǎn)超過(guò)傳統(tǒng)計(jì)算機(jī)
量子計(jì)算有潛力徹底轉(zhuǎn)變某些行業(yè)。例如,鑒于傳統(tǒng)計(jì)算機(jī)無(wú)法精確求解方程,導(dǎo)致當(dāng)前的計(jì)算化學(xué)方法嚴(yán)重依賴(lài)于近似值。而量子算法有望在更長(zhǎng)的時(shí)間范圍內(nèi)進(jìn)行準(zhǔn)確的分子模擬,從而實(shí)現(xiàn)目前無(wú)法做到的精確建模。這有助于更快發(fā)現(xiàn)能夠挽救生命的藥物,并顯著縮短藥物開(kāi)發(fā)周期。
此外,量子計(jì)算還有望解決當(dāng)前令人束手無(wú)策的復(fù)雜的物流優(yōu)化問(wèn)題,從而實(shí)現(xiàn)可觀的成本節(jié)省,顯著減少碳排放。我們以量子計(jì)算幫助價(jià)值數(shù)萬(wàn)億美元的航運(yùn)業(yè)改善全球航線(xiàn)為例。即使量子計(jì)算只能將集裝箱利用率和運(yùn)輸量提高哪怕一點(diǎn)點(diǎn),也能為運(yùn)輸企業(yè)節(jié)省數(shù)億美元的成本。為了利用量子計(jì)算的優(yōu)勢(shì)獲得更多利潤(rùn),領(lǐng)先競(jìng)爭(zhēng)對(duì)手,前瞻性的企業(yè)已開(kāi)始培養(yǎng)專(zhuān)業(yè)能力,探索能給自己的行業(yè)帶來(lái)好處的用例。
量子優(yōu)勢(shì)迎來(lái)曙光
量子計(jì)算機(jī)能夠解決傳統(tǒng)計(jì)算機(jī)無(wú)能為力的一些業(yè)務(wù)問(wèn)題 — 我們通常將這種能力稱(chēng)之為“量子優(yōu)勢(shì)”,而實(shí)現(xiàn)這一優(yōu)勢(shì)的時(shí)刻離我們?cè)絹?lái)越近了。例如, “恒定深度”的量子電路已展現(xiàn)出遠(yuǎn)超傳統(tǒng)電路的優(yōu)勢(shì)。下圖說(shuō)明了面向特定業(yè)務(wù)用例的量子優(yōu)勢(shì)。確切地說(shuō),由于面向特定用例的量子優(yōu)勢(shì)尚不明確,因此,有關(guān)未來(lái)五年內(nèi)量子計(jì)算市場(chǎng)價(jià)值的預(yù)測(cè)也天差地別 — 從大約 5 億美元到 290 億美元不等。
▲量子用例的商業(yè)化
由于人們對(duì)這項(xiàng)新技術(shù)所能創(chuàng)造的商機(jī)充滿(mǎn)期待,導(dǎo)致量子計(jì)算生態(tài)系統(tǒng)呈現(xiàn)出加速發(fā)展態(tài)勢(shì)。初創(chuàng)企業(yè)不斷涌現(xiàn),研究機(jī)構(gòu)與技術(shù)提供商之間的合作層出不窮,大家都在希望將量子研究成果轉(zhuǎn)化為商用能力。開(kāi)發(fā)量子計(jì)算機(jī)的科技公司已經(jīng)開(kāi)始與企業(yè)合作,以確定潛在用例,開(kāi)發(fā)量子算法,并在真正的量子計(jì)算機(jī)上測(cè)試解決方案。隨著量子技術(shù)的商業(yè)合作如雨后春筍般不斷涌現(xiàn),第一批量子商業(yè)應(yīng)用指日可待。
為企業(yè)選擇合適的量子計(jì)算機(jī)
量子計(jì)算機(jī)各不相同,解決的問(wèn)題也各有偏重。從限制最多的類(lèi)型到最通用的類(lèi)型,量子計(jì)算機(jī)主要分為三類(lèi):量子退火、嘈雜中型量子(NISQ) 計(jì)算,以及容錯(cuò)型通用量子計(jì)算。
科學(xué)界普遍認(rèn)為,相較于傳統(tǒng)計(jì)算,量子退火法的提速效果并沒(méi)有多么明顯。此外,量子退火計(jì)算機(jī)最終也無(wú)法發(fā)展成為容錯(cuò)型通用量子計(jì)算機(jī)。 因此,量子退火計(jì)算機(jī)不能算作真正的量子計(jì)算機(jī)。
在短期內(nèi), NISQ 計(jì)算機(jī)最有可能創(chuàng)造業(yè)務(wù)優(yōu)勢(shì),并且業(yè)界已針對(duì)這種計(jì)算機(jī)調(diào)整了許多新的算法。此外,隨著 NISQ 計(jì)算機(jī)不斷擴(kuò)展,它們正朝著量子計(jì)算的終極目標(biāo)邁進(jìn) — 成為容錯(cuò)型通用量子計(jì)算機(jī),能夠處理重要的商業(yè)和科學(xué)問(wèn)題,而且計(jì)算速度通常比傳統(tǒng)計(jì)算機(jī)有指數(shù)級(jí)的提高。
為何需要立即開(kāi)始為量子計(jì)算做準(zhǔn)備?在技術(shù)力量和競(jìng)爭(zhēng)力量的雙重作用下,量子時(shí)代的到來(lái)要比你想象中早得多。若能立即開(kāi)始關(guān)注量子計(jì)算,企業(yè)就能占得先機(jī),拉開(kāi)與同行之間的距離。以下是企業(yè)應(yīng)該立即開(kāi)始備戰(zhàn)量子計(jì)算的三個(gè)理由:
1、量子計(jì)算機(jī)具有轉(zhuǎn)變行業(yè)價(jià)值鏈的潛力,特別是在化學(xué)、生物、醫(yī)療保健、材料科學(xué)、金融和人工智能 (AI) 等領(lǐng)域。
2、 由于量子計(jì)算的學(xué)習(xí)難度非常大,因此, “快速跟隨”的方法不僅花費(fèi)巨大,而且只會(huì)被先行者越拉越遠(yuǎn)。
3、 建立內(nèi)部“量子能力中心”需要一定時(shí)間。
量子計(jì)算機(jī)具有轉(zhuǎn)變行業(yè)價(jià)值鏈的潛力。量子計(jì)算機(jī)有潛力解決傳統(tǒng)計(jì)算機(jī)無(wú)能為力的超級(jí)復(fù)雜的問(wèn)題,因此有望轉(zhuǎn)變整個(gè)行業(yè)的面貌。未來(lái)的量子計(jì)算機(jī)有能力在化學(xué)、生物、醫(yī)療保健、金融、人工智能和材料科學(xué)等領(lǐng)域?qū)崿F(xiàn)產(chǎn)品突破,幫助富有戰(zhàn)略眼光、采用量子計(jì)算的企業(yè)快速搶占市場(chǎng)份額,提高盈利能力。因此,量子計(jì)算的問(wèn)題解決能力能夠徹底重新定義競(jìng)爭(zhēng)優(yōu)勢(shì),轉(zhuǎn)變企業(yè)運(yùn)營(yíng)模式和價(jià)值鏈,最終徹底顛覆整個(gè)行業(yè)。
例如,物流系統(tǒng)的優(yōu)化通常基于“中心輻射”型網(wǎng)絡(luò)模型。要在大規(guī)模物流網(wǎng)絡(luò)中,設(shè)計(jì)一條能夠滿(mǎn)足各種不同需求的點(diǎn)到點(diǎn)最優(yōu)路線(xiàn),是非常復(fù)雜的問(wèn)題,完全超出傳統(tǒng)超級(jí)計(jì)算機(jī)的能力范圍。即使對(duì)于只有幾百個(gè)集散地的物流網(wǎng)絡(luò),要逐一探索所有的可能性,傳統(tǒng)計(jì)算機(jī)也要花上數(shù)十億年的時(shí)間。而量子計(jì)算有能力顯著縮短這種探索所需的時(shí)間。
再例如,為了優(yōu)化航空公司的調(diào)度工作,量子計(jì)算可以創(chuàng)建專(zhuān)為在特定日期飛往數(shù)百個(gè)目的地的數(shù)千名乘客而量身定制的每日航班時(shí)刻表,從而幫助旅客縮短旅行時(shí)間、避免空中交通擁堵并降低航空燃油成本。如果企業(yè)能為物流網(wǎng)絡(luò)設(shè)計(jì)優(yōu)化工作開(kāi)發(fā)量子解決方案,那么,在物流作為關(guān)鍵成功因素的所有行業(yè),這樣的企業(yè)都能夠迅速成為市場(chǎng)領(lǐng)導(dǎo)者。
“快速跟隨”的方法不僅花費(fèi)巨大,而且只會(huì)被先行者越拉越遠(yuǎn)量子計(jì)算不同于線(xiàn)性或漸進(jìn)式的技術(shù)進(jìn)步, “快速跟隨”的方法不太可能奏效。原因有以下幾點(diǎn):
1、量子計(jì)算的學(xué)習(xí)難度非常大。
2、與“追趕”領(lǐng)先者相關(guān)的成本過(guò)高。
可以考慮以下用例:通過(guò)量子計(jì)算機(jī)為電子或運(yùn)輸行業(yè)設(shè)計(jì)比現(xiàn)有物質(zhì)更輕、更強(qiáng)韌的專(zhuān)用材料,而且與傳統(tǒng)計(jì)算機(jī)相比,解決問(wèn)題的速度呈指數(shù)級(jí)提升(見(jiàn)上圖)。這種革命性材料的加速發(fā)展可以幫助制造商在短時(shí)間把競(jìng)爭(zhēng)對(duì)手遠(yuǎn)遠(yuǎn)甩在身后。
借助量子技術(shù)成功上位的新晉市場(chǎng)領(lǐng)導(dǎo)者以既有知識(shí)為基礎(chǔ),學(xué)習(xí)難度相對(duì)較低,因此能夠更上一層樓,進(jìn)一步優(yōu)化其突破性的材料,以及發(fā)現(xiàn)專(zhuān)為其他應(yīng)用領(lǐng)域量身定制的新材料,不斷擴(kuò)大與競(jìng)爭(zhēng)對(duì)手的差距。雖然只是假設(shè),但這個(gè)示例卻生動(dòng)說(shuō)明了由于存在巨大的學(xué)習(xí)難度,使得所謂的“快速追隨者”極難趕上先行企業(yè),從而可能導(dǎo)致某些行業(yè)出現(xiàn)“贏者通吃”的情景。即便對(duì)于特定用例,快速追隨者有可能追上先行企業(yè),也需為此付出高昂的代價(jià),例如,培養(yǎng)內(nèi)部專(zhuān)業(yè)知識(shí),采購(gòu)最合適的基礎(chǔ)設(shè)施,投資與實(shí)力派企業(yè)建立合作關(guān)系和/或收購(gòu)具有相關(guān)能力的企業(yè)等。
建立內(nèi)部“量子能力中心”需要一定時(shí)間。盡管大多數(shù)企業(yè)現(xiàn)在都聽(tīng)說(shuō)過(guò)量子計(jì)算,但他們中有許多都因缺乏相關(guān)人才和專(zhuān)業(yè)知識(shí)而無(wú)法充分利用即將到來(lái)的業(yè)務(wù)轉(zhuǎn)型的優(yōu)勢(shì),而且獲得量子計(jì)算技術(shù)也并非易事。量子計(jì)算的人才供不應(yīng)求,高技能資源更是炙手可熱。
即使招聘到了合適的人才,也可能需要數(shù)年時(shí)間才能深入了解量子計(jì)算對(duì)特定業(yè)務(wù)的潛在影響。 最近發(fā)生的技術(shù)轉(zhuǎn)變,例如,為加速處理大數(shù)據(jù)工作負(fù)載而遷移到圖形處理器 (GPU) 的過(guò)程花了近十年時(shí)間,使得我們深深了解到,為采用新技術(shù)而培養(yǎng)專(zhuān)業(yè)能力是一個(gè)漫長(zhǎng)的過(guò)程。鑒于量子計(jì)算有潛力徹底轉(zhuǎn)變行業(yè), 能夠以指數(shù)級(jí)提升解決問(wèn)題的速度,再加上量子領(lǐng)域的專(zhuān)業(yè)人才難以獲得,因此,領(lǐng)先的企業(yè)應(yīng)考慮立即采取行動(dòng)。
把握量子優(yōu)勢(shì),助推企業(yè)前進(jìn)
量子計(jì)算的商業(yè)化對(duì)貴公司意味著什么?從中短期看,量子計(jì)算可在以下三個(gè)方面帶來(lái)商業(yè)利益:量子模擬、量子優(yōu)化和量子輔助機(jī)器學(xué)習(xí)。
▲NISQ量子計(jì)算的預(yù)期用途
量子優(yōu)化。解決優(yōu)化問(wèn)題需要從可能存在的諸多答案中找到最佳或“最優(yōu)”的解決方案。我們以制定包裹投遞時(shí)間表為例。從數(shù)學(xué)上講,在相鄰時(shí)段安排10 次包裹投遞可能有超過(guò) 360 萬(wàn)種選項(xiàng)。 9但是,根據(jù)收件人的時(shí)間要求、可能產(chǎn)生的延誤以及所運(yùn)貨物的保質(zhì)期等變量,哪個(gè)時(shí)間表才是最佳解決方案呢?即使應(yīng)用近似值技術(shù),可能的選項(xiàng)對(duì)傳統(tǒng)計(jì)算機(jī)而言仍然太多而無(wú)法處理。
因此,目前的傳統(tǒng)計(jì)算機(jī)采用大量的快捷方式來(lái)解決大規(guī)模的優(yōu)化問(wèn)題。遺憾的是,這些解決方案往往并不理想。可受益于量子優(yōu)化的企業(yè)包括:希望升級(jí)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的電信公司;希望優(yōu)化患者治療效果的醫(yī)療服務(wù)提供方;希望改善空中交通管制的政府機(jī)構(gòu);希望定制營(yíng)銷(xiāo)推薦的消費(fèi)品和零售企業(yè);希望加強(qiáng)風(fēng)險(xiǎn)優(yōu)化的金融服務(wù)公司;希望制定員工工作時(shí)間表的企業(yè);希望安排課程的大學(xué)院校。
雖然還沒(méi)有數(shù)學(xué)方法可以證明量子計(jì)算能夠以指數(shù)級(jí)提升優(yōu)化問(wèn)題的解決速度,但研究人員正努力通過(guò)啟發(fā)式方式來(lái)證明這一點(diǎn)。富有遠(yuǎn)見(jiàn)的企業(yè)已開(kāi)始探索如何利用量子計(jì)算來(lái)解決優(yōu)化問(wèn)題,以期超越競(jìng)爭(zhēng)對(duì)手。一旦量子優(yōu)勢(shì)在解決優(yōu)化問(wèn)題方面的能力得到確認(rèn),這些企業(yè)的遠(yuǎn)見(jiàn)卓識(shí)便會(huì)給他們帶來(lái)切實(shí)的回報(bào)。
量子增強(qiáng)型人工智能。量子計(jì)算可以探索傳統(tǒng)計(jì)算機(jī)無(wú)法處理的海量可能性,因此有助于提升人工智能的熟練度。事實(shí)上,人工智能與量子計(jì)算之間的共生關(guān)系已開(kāi)始在這兩個(gè)領(lǐng)域?qū)崿F(xiàn)良性循環(huán)。例如,量子算法可增強(qiáng)機(jī)器學(xué)習(xí)在數(shù)據(jù)聚類(lèi)領(lǐng)域的能力,而機(jī)器學(xué)習(xí)則可用于更好地理解量子系統(tǒng)。
基于量子的認(rèn)知計(jì)算機(jī)最終能夠滲透到幾乎所有行業(yè),主動(dòng)為專(zhuān)業(yè)人士提供高級(jí)決策支持;為員工提供針對(duì)性的響應(yīng)式培訓(xùn);為客戶(hù)提供專(zhuān)門(mén)定制的自適應(yīng)式供應(yīng)商關(guān)系。
通過(guò)五項(xiàng)戰(zhàn)略迎接量子的未來(lái)
▲ 通往量子未來(lái)之路
1.選擇量子精英團(tuán)隊(duì)
貴公司可能需要進(jìn)一步了解量子計(jì)算的預(yù)期收益。以下是入門(mén)方法:1、將企業(yè)內(nèi)的一些領(lǐng)軍專(zhuān)業(yè)人才指定為“量子精英”。2、為這些“量子精英”充電,幫助他們了解何為量子計(jì)算、對(duì)行業(yè)的潛在影響、競(jìng)爭(zhēng)對(duì)手的應(yīng)對(duì)方式以及貴公司的業(yè)務(wù)如何從中受益。3、要求“量子精英”定期向高層領(lǐng)導(dǎo)匯報(bào)工作,以便在整個(gè)企業(yè)中開(kāi)展量子計(jì)算教育,確保該計(jì)劃始終與戰(zhàn)略目標(biāo)保持一致。
2. 開(kāi)始確定量子計(jì)算用例和相關(guān)價(jià)值主張
待量子精英團(tuán)隊(duì)了解了量子計(jì)算的原理及其如何助您應(yīng)對(duì)業(yè)務(wù)挑戰(zhàn)和把握機(jī)遇之后,讓他們開(kāi)始確定貴公司可在哪些領(lǐng)域借助量子計(jì)算領(lǐng)先競(jìng)爭(zhēng)對(duì)手。
根據(jù)量子系統(tǒng)的獨(dú)特能力及其加速解決問(wèn)題的優(yōu)勢(shì)來(lái)評(píng)估機(jī)遇。要求量子精英團(tuán)隊(duì)監(jiān)控量子應(yīng)用的進(jìn)展,確定哪些用例可以更快地實(shí)現(xiàn)商業(yè)化。為確保量子探索與業(yè)務(wù)成果緊密聯(lián)系在一起,請(qǐng)選擇前景最光明的量子計(jì)算應(yīng)用,例如創(chuàng)建突破性產(chǎn)品和服務(wù)或者以全新方式優(yōu)化供應(yīng)鏈。
3.試用真正的量子系統(tǒng)
通過(guò)試用真正的量子計(jì)算機(jī),揭開(kāi)量子計(jì)算的神秘面紗。要求量子精英團(tuán)隊(duì)了解量子計(jì)算如何解決業(yè)務(wù)問(wèn)題,以及如何與現(xiàn)有工具互動(dòng)。單一量子解決方案并不能“包治百病”。量子精英團(tuán)隊(duì)?wèi)?yīng)專(zhuān)注于解決傳統(tǒng)計(jì)算機(jī)無(wú)法有效解決的最高優(yōu)先級(jí)用例。
4.繪制量子路線(xiàn)圖
繪制量子計(jì)算路線(xiàn)圖,包括可行的后續(xù)步驟,目的是解決可能會(huì)對(duì)企業(yè)參與競(jìng)爭(zhēng)以及獲得可持續(xù)業(yè)務(wù)優(yōu)勢(shì)產(chǎn)生巨大阻礙的問(wèn)題。為了加速備戰(zhàn)量子計(jì)算,應(yīng)考慮加入新出現(xiàn)的量子社區(qū)。這樣能夠幫助您更好地接觸了解技術(shù)基礎(chǔ)架構(gòu)、不斷發(fā)展的行業(yè)應(yīng)用,以及有助于增強(qiáng)特定量子應(yīng)用開(kāi)發(fā)能力的研究人員。
5.靈活敏捷地應(yīng)對(duì)未來(lái)量子格局的變化
量子計(jì)算在迅速發(fā)展。應(yīng)尋找有望成為行業(yè)標(biāo)準(zhǔn)并且推動(dòng)生態(tài)系統(tǒng)整合的技術(shù)和開(kāi)發(fā)工具包。應(yīng)認(rèn)識(shí)到,新的技術(shù)突破可能會(huì)促使企業(yè)調(diào)整量子開(kāi)發(fā)方法,包括更換生態(tài)系統(tǒng)合作伙伴。應(yīng)留意企業(yè)的量子計(jì)算需求如何與時(shí)俱進(jìn),特別是當(dāng)您進(jìn)一步深入地了解哪些業(yè)務(wù)問(wèn)題可從量子計(jì)算解決方案中獲得最大收益之后。
在信息時(shí)代,量子計(jì)算技術(shù)一旦突破,掌握這種能力的國(guó)家,會(huì)在經(jīng)濟(jì)、軍事、科研、安全等領(lǐng)域迅速建立全方位優(yōu)勢(shì)。所以,世界各國(guó)都在啟動(dòng)巨資積極投入研發(fā)量子計(jì)算技術(shù)。隨著技術(shù)的快速發(fā)展,現(xiàn)在我們已經(jīng)處在了量子計(jì)算機(jī)即將商業(yè)化的時(shí)間節(jié)點(diǎn),量子計(jì)算不僅是國(guó)家戰(zhàn)略,相關(guān)企業(yè)若能提早布局規(guī)劃量子計(jì)算技術(shù),未來(lái)注定能在“量子霸權(quán)”時(shí)代贏得先機(jī),脫穎而出。
看點(diǎn):邊緣計(jì)算市場(chǎng)規(guī)模將超萬(wàn)億,與云計(jì)算平分秋色。
隨著5G時(shí)代的日益臨近,實(shí)時(shí)、智能、安全、隱私這四大趨勢(shì)催生了邊緣計(jì)算與端智能的崛起。5G通信的超低時(shí)延與超高可靠要求,使得邊緣計(jì)算成為必然選擇。
據(jù)預(yù)測(cè),全球物聯(lián)網(wǎng)終端設(shè)備安裝數(shù)量有望在2019年達(dá)到256億臺(tái),2020年將有超過(guò)500億的終端與設(shè)備聯(lián)網(wǎng),邊緣計(jì)算市場(chǎng)規(guī)模將超萬(wàn)億,成為與云計(jì)算平分秋色的新興市場(chǎng)。
一、邊緣計(jì)算,5G時(shí)代的萬(wàn)億市場(chǎng)
邊緣計(jì)算(Edge Computing)是在靠近物或數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣側(cè),融合網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、應(yīng)用核心能力的分布式開(kāi)放平臺(tái),就近提供邊緣智能服務(wù)。
從邊緣計(jì)算聯(lián)盟(ECC)提出的模型架構(gòu)來(lái)看,邊緣計(jì)算主要由基礎(chǔ)計(jì)算能力與相應(yīng)的數(shù)據(jù)通信單元兩大部分所構(gòu)成。
隨著底層技術(shù)的進(jìn)步以及應(yīng)用的不斷豐富,近年來(lái)全球物聯(lián)網(wǎng)產(chǎn)業(yè)實(shí)現(xiàn)爆發(fā)式的增長(zhǎng),這也為邊緣計(jì)算提供了更多的場(chǎng)景。
參考數(shù)據(jù),全球物聯(lián)網(wǎng)終端設(shè)備安裝數(shù)量有望在2019年達(dá)到256億臺(tái),年復(fù)合增速高達(dá)21%。
國(guó)內(nèi)物聯(lián)網(wǎng)市場(chǎng)的增速更高,據(jù)預(yù)測(cè),2020年我國(guó)物聯(lián)網(wǎng)市場(chǎng)規(guī)模有望達(dá)到18300億元,年復(fù)合增速高達(dá)25%。
與此同時(shí),5G通信的超低時(shí)延與超高可靠要求,使得邊緣計(jì)算成為必然選擇。在5G移動(dòng)領(lǐng)域,移動(dòng)邊緣計(jì)算是ICT融合的大勢(shì)所趨,是5G網(wǎng)絡(luò)重構(gòu)的重要一環(huán)。
據(jù)表示,到2020年,將有超過(guò)500億的終端與設(shè)備聯(lián)網(wǎng),而有50%的物聯(lián)網(wǎng)網(wǎng)絡(luò)將面臨網(wǎng)絡(luò)帶寬的限制,40%的數(shù)據(jù)需要在網(wǎng)絡(luò)邊緣分析、處理與儲(chǔ)存。
因此,邊緣計(jì)算市場(chǎng)規(guī)模將超萬(wàn)億,成為與云計(jì)算平分秋色的新興市場(chǎng)。
二、5G時(shí)代“邊云協(xié)同”,服務(wù)器市場(chǎng)迎來(lái)巨大增量
雖然云計(jì)算中心具有強(qiáng)大的處理性能,但是邊緣計(jì)算不僅能夠克服云計(jì)算網(wǎng)絡(luò)帶寬與計(jì)算吞吐量的性能瓶頸,還能夠更實(shí)時(shí)地處理終端設(shè)備的海量“小數(shù)據(jù)”,并在保證終端的數(shù)據(jù)安全。
因此,在有了云計(jì)算的同時(shí),邊緣計(jì)算市場(chǎng)潛力依舊巨大。5G時(shí)代,將會(huì)是一個(gè)“邊+云”的“邊云協(xié)同”時(shí)代,邊緣計(jì)算與云計(jì)算各有所長(zhǎng)、協(xié)調(diào)配合。
作為5G商用的元年,國(guó)內(nèi)的三大運(yùn)營(yíng)商無(wú)疑都在加緊部署5G基礎(chǔ)設(shè)施,這其中就包括大量的基站設(shè)備。
但由于5G基站的密度大于傳統(tǒng)的4G基站,這也就意味著更大量的基礎(chǔ)設(shè)施投入。
與此同時(shí),相對(duì)于4G,5G定義了eMMB(更高數(shù)據(jù)速率)、URLLC(更低延遲和更可靠的鏈接)和mMTC(超大規(guī)模設(shè)備鏈接)等三大應(yīng)用場(chǎng)景。而這些場(chǎng)景化概念的引入無(wú)一不對(duì)基站的計(jì)算性能提出了更高的要求。
因此,5G基站背后的服務(wù)器市場(chǎng)不僅將迎來(lái)爆發(fā)性需求增長(zhǎng),其產(chǎn)品升級(jí)也是勢(shì)在必行的。
這一潛在的巨大市場(chǎng)需求也正是浪潮、曙光、華為等一系列設(shè)備制造商不遺余力推動(dòng)OTII標(biāo)準(zhǔn)迅速落地。
OTII,Open Telecom IT Infrastructure,開(kāi)放電信IT基礎(chǔ)設(shè)施,是ODCC組織下發(fā)展的一個(gè)針對(duì)通訊類(lèi)企業(yè)的服務(wù)器規(guī)格。它不僅與交換機(jī)等設(shè)備規(guī)格相同,并且很容易部署在基站附近的設(shè)備機(jī)架上,而且具備更好的耐熱、耐腐蝕、抗潮濕特性。
與通用服務(wù)器相比,邊緣計(jì)算服務(wù)器面向5G和邊緣計(jì)算等場(chǎng)景進(jìn)行針對(duì)性定制,能耗更低、溫度適應(yīng)性更寬、運(yùn)維管理更加方便。
2017年6月,中國(guó)移動(dòng)與中國(guó)電信、中國(guó)聯(lián)通、英特爾、浪潮等公司共同發(fā)布《OITT定制服務(wù)器參考設(shè)計(jì)和行動(dòng)計(jì)劃書(shū)》,形成運(yùn)營(yíng)商行業(yè)面向電信應(yīng)用的深度定制、開(kāi)放標(biāo)準(zhǔn)、統(tǒng)一規(guī)范的服務(wù)器技術(shù)方案及原型產(chǎn)品。
三、5G MEC近在咫尺,通信光模塊市場(chǎng)受益最大
1、吸取4G教訓(xùn)、全球統(tǒng)一標(biāo)準(zhǔn)
在4G網(wǎng)絡(luò)標(biāo)準(zhǔn)制定中,由于并沒(méi)有考慮把邊緣計(jì)算功能納入其中,導(dǎo)致出現(xiàn)大量“非標(biāo)”方案,運(yùn)營(yíng)商在實(shí)際部署時(shí)“異廠家設(shè)備不兼容”,網(wǎng)絡(luò)互相割裂等,常常需要進(jìn)行定制化的、特定的解決方案設(shè)計(jì),不僅提高了運(yùn)營(yíng)商成本,還造成網(wǎng)絡(luò)架構(gòu)不能滿(mǎn)足低時(shí)延、高帶寬、本地化等需求。
為了解決4G痛點(diǎn),早在5G研究初期,MEC(多接入邊緣計(jì)算,Multi-Acess Edge Computing)與NFV和SDN一同被標(biāo)準(zhǔn)組織5G PPP認(rèn)同為5G系統(tǒng)網(wǎng)絡(luò)重構(gòu)的一部分。2014年ETSI(歐洲電信標(biāo)準(zhǔn)協(xié)會(huì))就成立了MECISG(邊緣計(jì)算特別小組)。
在2018年,3GPP的第一個(gè)5G標(biāo)準(zhǔn)R-15已經(jīng)凍結(jié)。3GPP SA2在R15中定義了5G系統(tǒng)架構(gòu)和邊緣計(jì)算應(yīng)用,其中核心網(wǎng)部分功能下沉部署到網(wǎng)絡(luò)邊緣,RAN架構(gòu)也將發(fā)生較大改變。
預(yù)計(jì)2020年5G商用以后,MEC邊緣云的應(yīng)用將進(jìn)入百花齊放、百家爭(zhēng)鳴的開(kāi)放階段。
2、光模塊是5G物理層基礎(chǔ)單元,受益巨大
光模塊是5G網(wǎng)絡(luò)物理層的基礎(chǔ)構(gòu)成單元,廣泛應(yīng)用于無(wú)線(xiàn)及傳輸設(shè)備,其成本在系統(tǒng)設(shè)備中的占比不斷增高,部分設(shè)備中甚至超過(guò)50~70%,是5G低成本、廣覆蓋的關(guān)鍵要素。
從2G~4G,光模塊技術(shù)迅速迭代,逐步向高速率發(fā)展。
2000年初,2G、2.5G基站從銅纜向光纖光纜切換,光模塊從1.25GSFP向2.5GSFP模塊發(fā)展。2008~2009年3G基站光模塊速率躍升至6G。
標(biāo)準(zhǔn)組織3GPP提出新的5G接口標(biāo)準(zhǔn)eCPRI,如果采用eCPRI接口,前傳接口帶寬至少需要25G光模塊,但前傳25G和100G都會(huì)并存,以應(yīng)對(duì)5G三大應(yīng)用場(chǎng)景的需求。
另外,5G光芯片也將從6G/10G升級(jí)到25G的芯片模組,光模塊產(chǎn)業(yè)鏈?zhǔn)袌?chǎng)規(guī)模顯著變大。隨著速率的提高,光模塊制造工藝門(mén)口大幅提升,產(chǎn)品附加值將較4G有所提高,有利于具有深厚儲(chǔ)備的光模塊公司。
5G作為十年一遇的迭代升級(jí),將是光通信行業(yè)下一個(gè)爆發(fā)機(jī)會(huì)。
3、三大運(yùn)營(yíng)商積極布局5G MEC
5G時(shí)代,運(yùn)營(yíng)商將會(huì)采用通用數(shù)據(jù)中心云化的組網(wǎng)方式,以區(qū)域、本地和邊緣三層的數(shù)據(jù)中心為基礎(chǔ),來(lái)構(gòu)建整個(gè)云化網(wǎng)絡(luò)。同時(shí),5G邊緣計(jì)算促進(jìn)采集、控制類(lèi)業(yè)務(wù)將會(huì)帶來(lái)運(yùn)營(yíng)新的2B業(yè)務(wù)增量,包括精密工控、遠(yuǎn)程醫(yī)療、車(chē)聯(lián)網(wǎng)等。
對(duì)于運(yùn)營(yíng)商,5G MEC的部署價(jià)值巨大。
目前,中國(guó)聯(lián)通是三大運(yùn)營(yíng)商中規(guī)劃最明確的,中國(guó)聯(lián)通提出MEC邊緣云演進(jìn)路標(biāo)主要分四個(gè)階段,計(jì)劃在2025年實(shí)現(xiàn)100%云化部署。
而從2014年ETSI成立MECISG開(kāi)始,中國(guó)移動(dòng)就積極跟蹤并加入。2017年中國(guó)移動(dòng)發(fā)布MEC白皮書(shū)。目前,中國(guó)移動(dòng)已經(jīng)在10省20多個(gè)地市現(xiàn)網(wǎng)開(kāi)展多種MEC應(yīng)用試點(diǎn)。同時(shí)中國(guó)移動(dòng)要將MEC預(yù)制到5G中,為此將從標(biāo)準(zhǔn)、技術(shù)、產(chǎn)業(yè)等方面發(fā)力。
中國(guó)電信認(rèn)為工業(yè)互聯(lián)網(wǎng)是MEC的重要場(chǎng)景,5G MEC是運(yùn)營(yíng)商切入工業(yè)互聯(lián)網(wǎng)的重要技術(shù)手段。目前,中國(guó)電信進(jìn)行了一些MEC的探索,例如打造邊緣計(jì)算開(kāi)放平臺(tái)ECOP,構(gòu)建邊緣云網(wǎng)融合的網(wǎng)絡(luò)服務(wù)平臺(tái)及應(yīng)用使能環(huán)境,推進(jìn)邊緣業(yè)務(wù)應(yīng)用創(chuàng)新發(fā)展。
4、云數(shù)據(jù)中心資本開(kāi)支持續(xù)增長(zhǎng)
為了應(yīng)對(duì)大工作負(fù)載和低延遲需求,云數(shù)據(jù)中心正在遷移到“葉脊”架構(gòu)。
傳統(tǒng)大型云數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)為三層網(wǎng)絡(luò),主要采用縱向的傳輸方式。伴隨著虛擬化、云計(jì)算、超融合系統(tǒng)等應(yīng)用,使得東西向數(shù)據(jù)流成為主要流量。
原有的結(jié)構(gòu)難以應(yīng)對(duì)日益增長(zhǎng)的需求,因而“葉脊”拓?fù)浣Y(jié)構(gòu)開(kāi)始成為主流,這種結(jié)構(gòu)在傳統(tǒng)縱向傳輸?shù)幕A(chǔ)上增加對(duì)橫向傳輸?shù)闹巍?/p>
葉脊網(wǎng)絡(luò)結(jié)構(gòu)使得網(wǎng)絡(luò)規(guī)模變大、網(wǎng)絡(luò)扁平化、光纖覆蓋率提升,使得網(wǎng)絡(luò)需要更多的交換機(jī)、葉/脊交換機(jī)之間更快的傳輸速率,更需要更多橫向的流量接口實(shí)現(xiàn)(光模塊)。
葉脊架構(gòu)所需要的高端光模塊數(shù)量10倍于傳統(tǒng)三層架構(gòu)。帶來(lái)100G高速率光模塊市場(chǎng)容量大幅增加。
根據(jù)統(tǒng)計(jì),云數(shù)據(jù)中心內(nèi)網(wǎng)絡(luò)設(shè)備投資占整個(gè)云數(shù)據(jù)中心ICT投資的32%,僅次于服務(wù)器投資,光模塊是網(wǎng)絡(luò)設(shè)備間通信重要組成部分。
2019年200G和400G模塊有望放量。40G~200G光模塊市場(chǎng)規(guī)模將從2017年的79億美元增長(zhǎng)到2020年的139億美元。
同時(shí),數(shù)通100G光模塊市場(chǎng)規(guī)模也將從2017年34億美元增長(zhǎng)到2020年75億美元,復(fù)合增速達(dá)到30%。
四、邊緣計(jì)算典型應(yīng)用場(chǎng)景
5G時(shí)代將迎來(lái)一大批新興應(yīng)用場(chǎng)景,如自動(dòng)駕駛、安防前端智能化、工業(yè)控制、遠(yuǎn)程操控(如醫(yī)療手術(shù)等)等。它們由于需要低于10ms的網(wǎng)絡(luò)時(shí)延,因此邊緣計(jì)算的發(fā)展最迫切,也最需要。
1、自動(dòng)駕駛:車(chē)載平臺(tái)算力需求在20T以上
隨著汽車(chē)自動(dòng)駕駛程度的提高,汽車(chē)自身所產(chǎn)生的數(shù)據(jù)將越來(lái)越龐大。
據(jù)測(cè)算,假設(shè)一輛自動(dòng)駕駛汽車(chē)配臵了GPS、攝像頭、雷達(dá)和激光雷達(dá)等傳感器,則上述一輛自動(dòng)駕駛汽車(chē)每天將產(chǎn)生約4000GB待處理的傳感器數(shù)據(jù)。不夸張的講,自動(dòng)駕駛就是“四個(gè)輪子上的數(shù)據(jù)中心”。
高等級(jí)自動(dòng)駕駛的本質(zhì)是AI計(jì)算問(wèn)題,車(chē)載邊緣計(jì)算平臺(tái)的計(jì)算力需求至少在20T以上。
從最終實(shí)現(xiàn)功能來(lái)看,邊緣計(jì)算平臺(tái)在自動(dòng)駕駛中主要負(fù)責(zé)解決兩個(gè)主要的問(wèn)題。
1)處理輸入的信號(hào)(雷達(dá)、激光雷達(dá)、攝像頭等);
2)做出決策判斷、給出控制信號(hào)。
2、安防:國(guó)內(nèi)智能前端市場(chǎng)有望突破1500億
安防產(chǎn)業(yè)智能化升級(jí)是行業(yè)發(fā)展的大趨勢(shì),前段智能不僅能夠?yàn)楹蠖颂峁└哔|(zhì)量、初步結(jié)構(gòu)化的圖像數(shù)據(jù),還能極大地節(jié)省帶寬和后端計(jì)算資源。后端智能化產(chǎn)品的核心功能則是利用計(jì)算能力對(duì)視頻數(shù)據(jù)進(jìn)行結(jié)構(gòu)化分析。
從產(chǎn)業(yè)調(diào)研結(jié)果來(lái)看,2018年以來(lái),主流深度學(xué)習(xí)攝像頭芯片開(kāi)始成熟量產(chǎn),有效解決目前限制前端智能攝像頭放量的計(jì)算芯片瓶頸。
按照2021年智能攝像頭滲透率達(dá)到45%測(cè)算,預(yù)計(jì)國(guó)內(nèi)智能安防前端硬件產(chǎn)品空間在2021年預(yù)計(jì)將超過(guò)1500億元。
3、低時(shí)延工業(yè)級(jí)應(yīng)用:機(jī)器人、自動(dòng)化、無(wú)人機(jī)
工業(yè)高精度控制對(duì)時(shí)延和可靠性的敏感度極高,無(wú)論是中國(guó)、韓國(guó)和日本的運(yùn)營(yíng)商,都非常關(guān)注5G新業(yè)務(wù)中工業(yè)級(jí)客戶(hù)(2B)的價(jià)值。
這些行業(yè)市場(chǎng)包括運(yùn)輸、物流、能源/公共設(shè)施監(jiān)測(cè)、金融、醫(yī)療和農(nóng)業(yè)。實(shí)現(xiàn)工業(yè)國(guó)產(chǎn)自動(dòng)化、無(wú)線(xiàn)化和智能化,典型場(chǎng)景包括視頻監(jiān)控、機(jī)器人控制、自動(dòng)巡查安防等。
1)機(jī)器人控制:同步實(shí)時(shí)協(xié)作機(jī)器人要求小于1毫秒的網(wǎng)絡(luò)延遲。到2025年,預(yù)計(jì)全球狀態(tài)監(jiān)測(cè)連接將上升到8800萬(wàn),全球工業(yè)機(jī)器人的出貨量也將從36萬(wàn)臺(tái)增加到105萬(wàn)臺(tái)。
2)饋線(xiàn)自動(dòng)化:當(dāng)通信網(wǎng)絡(luò)的延遲小于10ms時(shí),饋線(xiàn)自動(dòng)化系統(tǒng)可以在100ms內(nèi)隔離故障區(qū)域,這將大幅度降低發(fā)電廠的能源浪費(fèi)。參考華為5G白皮書(shū),從2022年到2026年,預(yù)計(jì)5GIIoT的平均年復(fù)合增長(zhǎng)率(CAGR)將達(dá)到464%。
3)視頻監(jiān)控和無(wú)人機(jī)巡檢:配備無(wú)人機(jī)進(jìn)行基礎(chǔ)設(shè)施、電力線(xiàn)和環(huán)境的密集巡檢是一項(xiàng)新興業(yè)務(wù),LiDAR掃描所產(chǎn)生巨大的實(shí)時(shí)數(shù)據(jù)量將需要>200Mbps的傳輸帶寬。ABI Research的估計(jì),小型無(wú)人機(jī)市場(chǎng)將從2016年的53億美元迅速增長(zhǎng)到2026年的339億美元,包括來(lái)自軟件、硬件、服務(wù)和應(yīng)用服務(wù)的收入。
4、VR/AR游戲:實(shí)時(shí)反饋?zhàn)屧芕R/AR成為可能
現(xiàn)階段VR游戲體驗(yàn)不佳,本地重度游戲?yàn)橹鳎O(shè)備典型盤(pán)根錯(cuò)節(jié),用戶(hù)容易絆倒;聯(lián)網(wǎng)游戲時(shí)延至容易高達(dá)50ms,導(dǎo)致用戶(hù)眩暈問(wèn)題。
未來(lái)5G設(shè)備實(shí)現(xiàn)直接邊緣云端訪(fǎng)問(wèn),VR/AR時(shí)延問(wèn)題解決:實(shí)時(shí)CG類(lèi)云渲染VR/AR需要低于5ms的網(wǎng)絡(luò)時(shí)延和高達(dá)100Mbps至9.4Gbps的大帶寬。同時(shí),5G可以支持多用戶(hù)近距離連線(xiàn)。
云VR/AR將大大降低設(shè)備成本,從而提供人人都能負(fù)擔(dān)得起的價(jià)格。5G將顯著改善這些云服務(wù)的訪(fǎng)問(wèn)速度云市場(chǎng)以18%的速度快速增長(zhǎng)。
5、視頻云:遠(yuǎn)程醫(yī)療、4K/8K高清視頻
遠(yuǎn)程醫(yī)療依賴(lài)5G網(wǎng)絡(luò)的低延遲和高QoS保障特性,例如無(wú)線(xiàn)內(nèi)窺鏡和超聲波這樣的遠(yuǎn)程診斷依賴(lài)于設(shè)備終端和患者之間的交互。力反饋的敏感性決定低延遲網(wǎng)絡(luò)才能滿(mǎn)足要求。
其它應(yīng)用場(chǎng)景包括醫(yī)療機(jī)器人和醫(yī)療認(rèn)知計(jì)算,這些應(yīng)用對(duì)連接提出了不間斷保障的要求(如生物遙測(cè),基于VR的醫(yī)療培訓(xùn),救護(hù)車(chē)無(wú)人機(jī),生物信息的實(shí)時(shí)數(shù)據(jù)傳輸?shù)龋?/p>
ABI Research預(yù)測(cè),智慧醫(yī)療市場(chǎng)的投資預(yù)計(jì)將在2025年將超過(guò)2300億美元,智慧醫(yī)療市場(chǎng)將在2025年超過(guò)2300億美元。
同時(shí),5G的高速率特性將是用戶(hù)不僅能觀看當(dāng)下各類(lèi)視頻內(nèi)容,還將隨時(shí)隨地體驗(yàn)4K以上的超高清視頻。
參考英特爾的《5G娛樂(lè)經(jīng)濟(jì)報(bào)告》,預(yù)計(jì)未來(lái)10年內(nèi)5G用戶(hù)的月平均流量將有望增長(zhǎng)7倍,而其中90%將被視頻消耗,預(yù)計(jì)到2028年,僅憑消費(fèi)者在視頻、音樂(lè)和游戲上的支出就會(huì)增加近一倍,全球總體量將達(dá)到近1500億美元。
由于數(shù)據(jù)量大、實(shí)時(shí)性需求高、數(shù)據(jù)隱私保護(hù)等問(wèn)題,海量的物聯(lián)網(wǎng)設(shè)備對(duì)邊緣計(jì)算有著大量需求。隨著5G與AI芯片的崛起,邊緣計(jì)算已經(jīng)越來(lái)越成為當(dāng)下最熱門(mén)的話(huà)題之一,受到創(chuàng)投、設(shè)備、芯片等廠商的追捧。
如今線(xiàn)上的流量入口日益減少,并且價(jià)格高昂。未來(lái)人工智能的流量入口將分布在大大小小的比邊緣設(shè)備上,包括手機(jī)、攝像頭、傳感器、機(jī)器人等。端智能將會(huì)涵蓋我們生活中的方方面面,而這其中的很多領(lǐng)域巨頭都沒(méi)有完全覆蓋,是無(wú)數(shù)中小創(chuàng)企的絕佳機(jī)會(huì)。
看點(diǎn):AI時(shí)代,不懂點(diǎn)數(shù)據(jù)挖掘怎么掘金?
數(shù)據(jù)挖掘(Data Mining)是一門(mén)跨學(xué)科的計(jì)算機(jī)科學(xué)分支,它用人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)庫(kù)的交叉方法,在大規(guī)模數(shù)據(jù)中發(fā)現(xiàn)隱含模式,在零售、物流、旅游等行業(yè)有著廣泛應(yīng)用場(chǎng)景。
在數(shù)據(jù)爆炸的時(shí)代里,如何利用手中數(shù)據(jù)資源提高行業(yè)效率、提高行業(yè)質(zhì)量,成為了眾多企業(yè)決策者所關(guān)注的問(wèn)題,數(shù)據(jù)挖掘也逐漸成為當(dāng)下的熱門(mén)研究領(lǐng)域之一,受到了谷歌、亞馬遜、阿里、百度等科技巨頭的追捧。
一、數(shù)據(jù)挖掘與KDD
數(shù)據(jù)挖掘(Data Mining),是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性的數(shù)據(jù)和信息,并將其轉(zhuǎn)化為計(jì)算機(jī)可處理的結(jié)構(gòu)化表示。
目前數(shù)據(jù)挖掘的主要功能包括概念描述、關(guān)聯(lián)分析、分類(lèi)、聚類(lèi)和偏差檢測(cè)等,用于描述對(duì)象內(nèi)涵、概括對(duì)象特征、發(fā)現(xiàn)數(shù)據(jù)規(guī)律、檢測(cè)異常數(shù)據(jù)等。
一般來(lái)說(shuō),數(shù)據(jù)挖掘過(guò)程有五個(gè)步驟:確定挖掘目的、數(shù)據(jù)準(zhǔn)備、進(jìn)行數(shù)據(jù)挖掘、結(jié)果分析、知識(shí)的同化。
▲數(shù)據(jù)挖掘過(guò)程基本步驟
1、確定挖掘目的
認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)果是不可預(yù)測(cè)的,但要探索的問(wèn)題應(yīng)是有預(yù)見(jiàn)的。
2、數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備又分為三個(gè)階段:
1)數(shù)據(jù)的選擇:搜索所有與目標(biāo)對(duì)象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù);
2)數(shù)據(jù)的預(yù)處理:研究數(shù)據(jù)的質(zhì)量,為進(jìn)一步的分析做準(zhǔn)備,并確定將要進(jìn)行的挖掘操作的類(lèi)型;
3)數(shù)據(jù)的轉(zhuǎn)換:將數(shù)據(jù)轉(zhuǎn)換成一個(gè)分析模型。這個(gè)分析模型是針對(duì)挖掘算法建立的。建立一個(gè)真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵。
3、進(jìn)行數(shù)據(jù)挖掘
對(duì)得到的經(jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。
4、結(jié)果分析
解釋并評(píng)估結(jié)果,其使用的分析方法一般應(yīng)視數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù)。
5、知識(shí)的同化
將分析所得到的知識(shí)集成到所要應(yīng)用的地方去。
▲數(shù)據(jù)挖掘的分類(lèi)表
如上圖所示,數(shù)據(jù)挖掘有多種分類(lèi)方式,可以按照挖掘的數(shù)據(jù)庫(kù)類(lèi)型、挖掘的知識(shí)類(lèi)型、挖掘所用的技術(shù)類(lèi)型進(jìn)行分類(lèi)。
同時(shí),數(shù)據(jù)挖掘也可以按照行業(yè)應(yīng)用來(lái)進(jìn)行分類(lèi),比如生物醫(yī)學(xué)、交通、金融等行業(yè)都有其獨(dú)特的數(shù)據(jù)挖掘方法,不能做到用同一個(gè)數(shù)據(jù)挖掘技術(shù)應(yīng)用到各個(gè)行業(yè)領(lǐng)域。
數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)(KDD)的一個(gè)關(guān)鍵步驟。1989年8月,Gregory I. Piatetsky- Shapiro等人在美國(guó)底特律的國(guó)際人工智能聯(lián)合會(huì)議(IJCAI)上召開(kāi)了一個(gè)專(zhuān)題討論會(huì)(workshop),首次提出了知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)這一概念。
▲數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的過(guò)程之一
KDD涉及數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、模式識(shí)別、數(shù)據(jù)可視化、高性能計(jì)算、知識(shí)獲取、神經(jīng)網(wǎng)絡(luò)、信息檢索等眾多學(xué)科和技術(shù)的集成,再后來(lái)的30年間KDD逐漸形成了一個(gè)獨(dú)立、蓬勃發(fā)展的交叉研究領(lǐng)域。
早期比較有影響力的發(fā)現(xiàn)算法有:IBM的Rakesh Agrawal的關(guān)聯(lián)算法、UIUC大學(xué)韓家煒(Jiawei Han)教授等人的FP Tree算法、澳大利亞的John Ross Quinlan教授的分類(lèi)算法、密西根州立大學(xué)Erick Goodman的遺傳算法等等。
目前,數(shù)據(jù)挖掘已經(jīng)引起國(guó)際、國(guó)內(nèi)工業(yè)界的廣泛關(guān)注,IBM、谷歌、亞馬遜、微軟、Facebook、阿里巴巴、騰訊、百度等都在數(shù)據(jù)挖掘研究方面進(jìn)行了應(yīng)用與理論研究。
國(guó)際知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘大會(huì)(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,簡(jiǎn)稱(chēng)SIGKDD)是數(shù)據(jù)挖掘領(lǐng)域的頂級(jí)國(guó)際會(huì)議,由ACM的數(shù)據(jù)挖掘及知識(shí)發(fā)現(xiàn)專(zhuān)委會(huì)負(fù)責(zé)協(xié)調(diào)籌辦,會(huì)議內(nèi)容涵蓋數(shù)據(jù)挖掘的基礎(chǔ)理論、算法和實(shí)際應(yīng)用。
二、數(shù)據(jù)挖掘源于商業(yè)的直接需求
數(shù)據(jù)挖掘技術(shù)從一開(kāi)始就是面向應(yīng)用的,源于商業(yè)的直接需求。目前數(shù)據(jù)挖掘在零售、旅游、物流、醫(yī)學(xué)等領(lǐng)域都有所應(yīng)用,可以大大提高行業(yè)效率和行業(yè)質(zhì)量。
舉個(gè)例子,零售是數(shù)據(jù)挖掘的主要應(yīng)用領(lǐng)域之一。這是因?yàn)橛捎跅l形碼技術(shù)的發(fā)展使得前端收款機(jī)系統(tǒng)可以收集大量售貨、顧客購(gòu)買(mǎi)歷史記錄、貨物進(jìn)出狀況、消費(fèi)與服務(wù)記錄等數(shù)據(jù)。
數(shù)據(jù)挖掘技術(shù)有助于識(shí)別顧客購(gòu)買(mǎi)行為,發(fā)現(xiàn)顧客購(gòu)買(mǎi)模式和趨勢(shì),改進(jìn)服務(wù)質(zhì)量,取得更高的顧客保持力和滿(mǎn)意程度,減少零售業(yè)成本。
同時(shí),同一顧客在不同時(shí)期購(gòu)買(mǎi)的商品數(shù)據(jù)可以分組為序列,序列模式挖掘可用于分析顧客的消費(fèi)或忠誠(chéng)度的變化,據(jù)此對(duì)價(jià)格和商品的花樣加以調(diào)整和更新,以便留住老客戶(hù),吸引新客戶(hù)。
與此同時(shí),社交網(wǎng)絡(luò)也是數(shù)據(jù)挖掘研究中的熱門(mén)領(lǐng)域,比如新浪微博就是擁有海量數(shù)據(jù)的資訊平臺(tái)。
截止到2017年12月,新郎微博已擁有接近4億活躍用戶(hù),內(nèi)容存量超千億,“大V”的一舉一動(dòng)和社會(huì)熱點(diǎn)話(huà)題都會(huì)引起大量的評(píng)論與轉(zhuǎn)發(fā),掀起一股“數(shù)據(jù)風(fēng)暴”。
▲柯潔烏鎮(zhèn)大戰(zhàn)AlphaGo撼負(fù)后的微博熱議
微博上每個(gè)用戶(hù)的言論、轉(zhuǎn)發(fā)內(nèi)容等都蘊(yùn)藏著用戶(hù)個(gè)人的興趣、話(huà)題等信息,文字內(nèi)容本身的智能分析理解也是數(shù)據(jù)分析領(lǐng)域長(zhǎng)久以來(lái)孜孜不倦追求的目標(biāo)。
社會(huì)網(wǎng)絡(luò)中的聚類(lèi)被稱(chēng)為社區(qū)發(fā)現(xiàn),許多精心設(shè)計(jì)的高效算法可以很好地處理上億用戶(hù)的大規(guī)模網(wǎng)絡(luò)。
針對(duì)微博用戶(hù)的海量數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)描述性可以分析群體的年齡、性別比例、職業(yè)等;對(duì)于平均數(shù)、中位數(shù)、分位數(shù)、方差等統(tǒng)計(jì)指標(biāo)可以幫助我們粗略了解數(shù)據(jù)分布;回歸分析、方差分析等方法則可以解釋年齡、職業(yè)等因素是否會(huì)影響用戶(hù)對(duì)某熱門(mén)話(huà)題的關(guān)注程度。
此外,數(shù)據(jù)挖掘在旅游、物流、醫(yī)學(xué)等領(lǐng)域都有著廣泛的應(yīng)用場(chǎng)景。比如數(shù)據(jù)挖掘可以對(duì)旅游客流的趨向有著準(zhǔn)確的預(yù)知性,同時(shí)對(duì)于游客的喜好也有著直接性的掌握;從醫(yī)學(xué)數(shù)據(jù)中尋找潛在的關(guān)系或規(guī)律,可以獲得對(duì)病人進(jìn)行診斷、治療的有效知識(shí),增加對(duì)疾病預(yù)測(cè)的準(zhǔn)確性等。
三、人工智能與數(shù)據(jù)挖掘
數(shù)據(jù)挖掘從一個(gè)新的視角將數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、信息檢索技術(shù)、數(shù)據(jù)可視化和模式識(shí)別與人工智能等領(lǐng)域有機(jī)結(jié)合起來(lái),它組合了各個(gè)領(lǐng)域的優(yōu)點(diǎn),因而能從數(shù)據(jù)中挖掘到運(yùn)用其他傳統(tǒng)方法不能發(fā)現(xiàn)的有用知識(shí)。
一般來(lái)說(shuō),統(tǒng)計(jì)特征只能反映數(shù)據(jù)的極少量信息。簡(jiǎn)單的統(tǒng)計(jì)分析可以幫助我們了解數(shù)據(jù),如果希望對(duì)大數(shù)據(jù)進(jìn)行逐個(gè)地、更深層次地探索,總結(jié)出規(guī)律和模型,則需要更加智能的基于機(jī)器學(xué)習(xí)的數(shù)據(jù)分析方法。
所謂“機(jī)器學(xué)習(xí)”,是基于數(shù)據(jù)本身的,自動(dòng)構(gòu)建解決問(wèn)題的規(guī)則與方法。數(shù)據(jù)挖掘中既可以用到非監(jiān)督學(xué)習(xí)方法,也可以用到監(jiān)督學(xué)習(xí)方法。
1、非監(jiān)督學(xué)習(xí)
非監(jiān)督學(xué)習(xí)是建立在所有數(shù)據(jù)的標(biāo)簽,即所屬的類(lèi)別都是未知的情況下使用的分類(lèi)方法。對(duì)于特定的一組數(shù)據(jù),不知道這些數(shù)據(jù)應(yīng)該分為哪幾類(lèi),也不知道這些類(lèi)別本來(lái)應(yīng)該有怎樣的特征,只知道每個(gè)數(shù)據(jù)的特征向量。若按它們的相關(guān)程度分成很多類(lèi),最先想到的想法就是認(rèn)為特征空間中距離較近的向量之間也較為相關(guān),倘若一個(gè)元素只和其中某些元素比較接近,和另一些元素則相距較遠(yuǎn)。
這時(shí)候,我們就希望每一個(gè)類(lèi)有一個(gè)“中心”,“中心”也是特征向量空間中的向量,是所有那一類(lèi)的元素在向量空間上的重心,即他的每一維為所有包含在這一類(lèi)中的元素的那一維的平均值。如果每一類(lèi)都有這么一個(gè)“中心”,那么我們?cè)诜诸?lèi)數(shù)據(jù)時(shí),只需要看他離哪個(gè)“中心”的距離最近,就將他分到該類(lèi)即可,這也就是K-means算法的思路。
K-means算法,在1957年由Stuart Lloyd在貝爾實(shí)驗(yàn)室提出,最初用于解決連續(xù)的圖區(qū)域劃分問(wèn)題,1982年正式發(fā)表。1965年,E.W.Forgy發(fā)明了Lloyd-Forgy or。James MacQueen在1967年將其命名為K-means算法。
上圖是以隨機(jī)生成的數(shù)據(jù)點(diǎn)為例,k=3的K-means算法的迭代過(guò)程,其中五角星為聚類(lèi)中心,點(diǎn)的顏色是其類(lèi)別。在實(shí)際應(yīng)用中,為了獲得一個(gè)比較好的特征空間,使得“數(shù)據(jù)之間的相似性與他們?cè)谔卣骺臻g上的距離有關(guān),距離越近越相似”這句話(huà)盡可能成立,我們往往會(huì)構(gòu)建模型來(lái)把原數(shù)據(jù)變換到這么一個(gè)特征空間,然后使用K-means算法來(lái)進(jìn)行分類(lèi)。
2、監(jiān)督學(xué)習(xí)
不同于非監(jiān)督學(xué)習(xí),若已知一些數(shù)據(jù)上的真實(shí)分類(lèi)情況,現(xiàn)在要對(duì)新的未知的數(shù)據(jù)進(jìn)行分類(lèi)。這時(shí)候利用已知的分類(lèi)信息,可以得到一些更精確的分類(lèi)方法,這些就是監(jiān)督學(xué)習(xí)方法。
1)決策樹(shù)模型
所謂決策樹(shù),即是一種根據(jù)條件來(lái)進(jìn)行判斷的邏輯框架。其中,判斷的條件,即提出有區(qū)分性的問(wèn)題,以及對(duì)于不同的回答下一步的反映,以及最終的決策給出標(biāo)簽。
決策樹(shù)算法:
1.選取包含所有數(shù)據(jù)的全集為算法的初始集合A0:
2.對(duì)于當(dāng)前的集合A,計(jì)算所有可能的“問(wèn)題”在訓(xùn)練集上的F(A,D):
3.選擇F(A,D)最大的“問(wèn)題”,對(duì)數(shù)據(jù)進(jìn)行提問(wèn),將當(dāng)前的集合由“問(wèn)題”的不同回答,劃分為數(shù)個(gè)子集;
4.對(duì)每個(gè)子集,重復(fù)b、c,直到所有子集內(nèi)所有元素的類(lèi)別相同;
5.在實(shí)際應(yīng)用中,數(shù)據(jù)往往有很多特征,因此,“問(wèn)題”往往是選取數(shù)據(jù)的某一特征,而“回答”則是此特征對(duì)應(yīng)的值。
在決策樹(shù)中,效度函數(shù)F(A,D)的選擇非常重要。決策樹(shù)的發(fā)展歷史,也基本是圍繞著F(A,D)的優(yōu)化而展開(kāi)。
2)kNN算法
只知道每個(gè)數(shù)據(jù)在特征空間下的特征向量情況下,可以對(duì)數(shù)據(jù)采用無(wú)監(jiān)督分類(lèi)方法K-means。如果我們擁有了其中一部分?jǐn)?shù)據(jù)的標(biāo)簽,我們就可以利用這些標(biāo)簽進(jìn)行kNN分類(lèi)。
數(shù)據(jù)之間的相似性與他們?cè)谔卣骺臻g上的距離有關(guān)。距離越近越相似,越可能擁有相同的標(biāo)簽。
假設(shè)我們已經(jīng)有了很多既知道特征向量也知道具體標(biāo)簽的數(shù)據(jù)對(duì)于新的只知道特征向量卻不知道具體標(biāo)簽的數(shù)據(jù),我們可以選取離這個(gè)特征向量最近的k個(gè)已經(jīng)知道標(biāo)簽的數(shù)據(jù),然后選取他們中間最多的元素所屬于的那個(gè)標(biāo)簽,作為新數(shù)據(jù)的預(yù)測(cè)標(biāo)簽。也可以根據(jù)他們與新數(shù)據(jù)的特征向量之間的距離加權(quán)(如最近得5分,第二近得4分等),取權(quán)重總和最大的標(biāo)簽作為預(yù)測(cè)標(biāo)簽。
kNN算法不需要構(gòu)建模型或者訓(xùn)練,和K-means算法一樣,往往是和某個(gè)構(gòu)建特征空間的模型一起使用。
此外,還有回歸分類(lèi)、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯分類(lèi)等等。
四、巨頭們的數(shù)據(jù)挖掘之路
在當(dāng)下,數(shù)據(jù)挖掘也逐漸成為當(dāng)下的熱門(mén)研究領(lǐng)域之一,受到了谷歌、亞馬遜、微軟、百度、阿里、騰訊等科技巨頭的追捧。
1、谷歌
谷歌幾乎每年都會(huì)發(fā)表一些讓人驚艷的研究工作,包括之前的MapReduce、Word2Vec、BigTable,近期的BERT。數(shù)據(jù)挖掘是谷歌研究的一個(gè)重點(diǎn)領(lǐng)域。
2018年谷歌全球不同研究中心在數(shù)據(jù)挖掘頂級(jí)國(guó)際會(huì)議KDD上一共發(fā)表了7篇文章。
2、亞馬遜
亞馬遜公司近幾年發(fā)展勢(shì)頭超級(jí)猛,前幾年華麗的轉(zhuǎn)身:從一個(gè)網(wǎng)上商店公司變?yōu)樵破脚_(tái)公司再轉(zhuǎn)變到目前的人工智能公司,亞馬遜也在數(shù)據(jù)挖掘領(lǐng)域開(kāi)始占有一席,尤其是在人才網(wǎng)羅、開(kāi)源、核心技術(shù)研發(fā)。
2018年亞馬遜在數(shù)據(jù)挖掘頂級(jí)國(guó)際會(huì)議KDD的Applied Data Science Track(應(yīng)用數(shù)據(jù)科學(xué)Track)上一共發(fā)表了2篇文章,另外還有兩個(gè)應(yīng)用科學(xué)的邀請(qǐng)報(bào)告。
3、微軟
微軟是老牌論文王國(guó),一直以來(lái)都在學(xué)術(shù)界特別活躍,因此在KDD上每年和微軟有關(guān)的論文非常多,因此這里只統(tǒng)計(jì)了微軟作為第一作者的文章。
2018年在數(shù)據(jù)挖掘頂級(jí)國(guó)際會(huì)議KDD上一共發(fā)表了6篇文章,另外還有一個(gè)應(yīng)用科學(xué)的邀請(qǐng)報(bào)告,這些文章和報(bào)告都更多的從大數(shù)據(jù)的角度在思考如何更有效,更快速的分析。
4、阿里巴巴
阿里巴巴在電子商務(wù)方面做了大量的數(shù)據(jù)挖掘研究。尤其是在表示學(xué)習(xí)和增強(qiáng)學(xué)習(xí)做了幾個(gè)很有意思的工作。
2018年阿里巴巴在數(shù)據(jù)挖掘頂級(jí)國(guó)際會(huì)議KDD上作為第一作者單位一共發(fā)表了8篇文章。
5、騰訊
2018年騰訊在數(shù)據(jù)挖掘頂級(jí)國(guó)際會(huì)議KDD上作為第一作者單位一共發(fā)表了2篇文章。
6、百度
2018年百度在數(shù)據(jù)挖掘頂級(jí)國(guó)際會(huì)議KDD上作為第一作者單位一共發(fā)表了2篇文章。
五、大數(shù)據(jù)與數(shù)據(jù)挖掘
大數(shù)據(jù)是近年隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、通信網(wǎng)絡(luò)以及人類(lèi)社交網(wǎng)絡(luò)快速發(fā)展的結(jié)果,成為一個(gè)交叉研究學(xué)科,和數(shù)據(jù)挖掘緊密相連。
大數(shù)據(jù)的迅速發(fā)展也使得數(shù)據(jù)挖掘?qū)ο笞兊酶鼮閺?fù)雜,不僅包括人類(lèi)社會(huì)與物理世界的復(fù)雜聯(lián)系,還包括呈現(xiàn)出的高度動(dòng)態(tài)化。這使得很多傳統(tǒng)數(shù)據(jù)挖掘算法不再適用,傳統(tǒng)數(shù)據(jù)挖掘算法必須滿(mǎn)足對(duì)真實(shí)數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)的處理能力,才能從大量無(wú)序數(shù)據(jù)中獲取真正價(jià)值。
一方面大數(shù)據(jù)包含數(shù)據(jù)挖掘的各個(gè)階段,即數(shù)據(jù)收集、預(yù)處理、特征選擇、模式挖掘、表示等;另一方面大數(shù)據(jù)的基礎(chǔ)架構(gòu)又為數(shù)據(jù)挖掘提供上層數(shù)據(jù)處理的硬件設(shè)施。
▲大數(shù)據(jù)處理平臺(tái)技術(shù)架構(gòu)圖
從技術(shù)架構(gòu)角度,大數(shù)據(jù)處理平臺(tái)可劃分為4個(gè)層次:數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)處理層和服務(wù)封裝層。
除此之外,大數(shù)據(jù)處理平臺(tái)一般還包括數(shù)據(jù)安全和隱式保護(hù)模塊,這一模塊貫穿大數(shù)據(jù)處理平臺(tái)的各個(gè)層次。
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,各行各業(yè)所積累的數(shù)據(jù)呈爆炸式增長(zhǎng),數(shù)據(jù)挖掘在各個(gè)領(lǐng)域的需求將會(huì)越來(lái)越強(qiáng)烈,與各個(gè)專(zhuān)業(yè)領(lǐng)域的結(jié)合也將會(huì)越來(lái)越廣泛。無(wú)論是在科學(xué)領(lǐng)域還是工程領(lǐng)域、理論研究還是現(xiàn)實(shí)生活中,數(shù)據(jù)挖掘都將有著極為廣闊的發(fā)展前景。
-
處理器
+關(guān)注
關(guān)注
68文章
19161瀏覽量
229122 -
人工智能
+關(guān)注
關(guān)注
1791文章
46854瀏覽量
237551 -
量子計(jì)算
+關(guān)注
關(guān)注
4文章
1081瀏覽量
34904
原文標(biāo)題:量子計(jì)算、邊緣計(jì)算、數(shù)據(jù)挖掘 前沿研究報(bào)告
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論