最近幾年,企業(yè)應(yīng)用云化越來越明顯,很多企業(yè)把公司的業(yè)務(wù)轉(zhuǎn)移到云平臺上,完成遷云之后原有的數(shù)據(jù)中心會被控制出來。這時很多企業(yè)會選擇出售這些閑置的數(shù)據(jù)中心,而這些數(shù)據(jù)中心一般會被托管服務(wù)商(比如云服務(wù)商等)買入,然后服務(wù)商將這些資源整合到自己的平臺中,然后再出售給用戶進行使用。
我們知道數(shù)據(jù)中心在發(fā)展到一定的規(guī)模的時候,一般都會面臨或多或少的一些問題,常見的比如數(shù)據(jù)中心物理空間不足、硬件設(shè)備老化、硬件設(shè)備的效率低下、網(wǎng)絡(luò)的擁堵、各種安全隱患、電力緊張以及管理效率降低等問題,這些可以說是一些老舊數(shù)據(jù)中心的通病。
即使是老舊的數(shù)據(jù)中心仍然具有它的價值,云廠商提供的產(chǎn)品中,同類產(chǎn)品一般會存在多個檔次。以云硬盤為例,底層對應(yīng)的物理存儲設(shè)備可能是高性能的SSD盤、一般的SSD盤或者機械盤,用戶可以根據(jù)自己的需要進行按需購買,老舊數(shù)據(jù)中心中的存儲設(shè)備可以用來部署性能相對較低的數(shù)據(jù)盤業(yè)務(wù)。
當(dāng)然數(shù)據(jù)盤只是一種情況,其他的設(shè)備基本也都可以按照數(shù)據(jù)盤的思路二次利用起來。這種直接使用老舊數(shù)據(jù)中心的方式只是一種思路,除了這些我們還可以對老舊的數(shù)據(jù)數(shù)據(jù)中心進行現(xiàn)代化的改造以符合當(dāng)前業(yè)務(wù)得需要,這部分我們在后面的內(nèi)容中還會專門描述。
從2018年的云計算市場報告我們也可以看出,云計算的市場增長仍在繼續(xù)。筆者近期注意到,根據(jù)媒體的報道,今年處于待售狀態(tài)的數(shù)據(jù)中心的數(shù)量比過去幾年中的任何一個時間點都要多,難道真的如報導(dǎo)所說數(shù)據(jù)中心正在消亡嗎?
被歪曲的事實
企業(yè)服務(wù)上云近年來確實是個大趨勢,云計算興起之前很多公司都有自己的數(shù)據(jù)中心,企業(yè)業(yè)務(wù)上云之后由于數(shù)據(jù)中心一般不會被長期閑置,從國內(nèi)的實際情況來看,這種情況下企業(yè)一般都會尋求出售自己的數(shù)據(jù)中心(畢竟地租、電費、維護等成本都不低),這些數(shù)據(jù)中心被售出之后一般很快都會以云資源的形式被再次使用,所以云計算的發(fā)展導(dǎo)致數(shù)據(jù)中心的消亡是個偽命題,畢竟云計算平臺也是強烈依賴于數(shù)據(jù)中心的。
那么問題來了,數(shù)據(jù)中心總體是在向前發(fā)展還是在逐步萎縮呢? 要回答這個問題其實看下云計算未來幾年的發(fā)展趨勢即可,在筆者搜羅了幾個比較權(quán)威的機構(gòu)的預(yù)測結(jié)果:
(1) IDC
IDC公司的預(yù)測結(jié)果顯示,未來幾年全球公有云計算市場的營收將會從2018年的1800億美元增長到2021年的2770億美元,增長額接近1000億美元,增長率達到54%。
(2) Forrester
Forrester 公司的預(yù)測結(jié)果顯示,未來幾年全球公有云計算市場的營收將從2018年的1780億美元增長至2021年的3230億美元,增長額為1450億美元,增長率約為81%。
(3) Gartner
Gartner 公司的預(yù)測結(jié)果顯示,未來幾年全球公有云計算市場的營收將從2018年的1760億美元增長至2021年的2780億美元,增長額為1020億美元,增長率為58%。
毫無疑問的是全球公有云、私有云市場以及IDC托管都在以極為驚人的速度在增長,尤其是國內(nèi)外知名的那些公有云大廠,比如自2010年以來,亞馬遜AWS 的云計算營收每年的復(fù)合增長率都超過60%,這種增長勢頭一直持續(xù)到2018年。2018年的上半年亞馬遜AWS的營收同比增長約50%,總營收從2017年第3個季度的36億美元一度上升到2018年第2季度的61億美元,中間相差不到一年。
如果我們把亞馬遜AWS 2018年第2季度的營收粗略的當(dāng)做2018年季度平均營收,那么AWS 2018年的總營收會達到244億美元,比2017年的總營收大約增長了100億美元。
微軟2018財年第4季度的報告顯示,公司的服務(wù)器產(chǎn)品和云計算產(chǎn)品的營收同比增長了45億美元,增長率約為21%,據(jù)分析這部分的增長主要來自于微軟Azure 和服務(wù)器產(chǎn)品獲得內(nèi)部產(chǎn)品的認可并被采用的結(jié)果,但算Azure 的營收的話增長率達到了91%。
不論是公有云還是私有云以及混合云,其底層的基礎(chǔ)資源設(shè)備都需要部署到數(shù)據(jù)中心中,如果上文中預(yù)測成立的話云計算在未來幾年勢必會繼續(xù)保持快速的發(fā)展,因此數(shù)據(jù)中心也必須一并快速發(fā)展。
需要注意的是,技術(shù)在發(fā)展過程中一般都會伴隨著老舊技術(shù)的淘汰,在這一點上云計算也不例外,因此未來數(shù)據(jù)中心的發(fā)展還會面臨一系列的問題,比如設(shè)備老舊帶來的運行效率和成本效益問題以及擴展性的問題。
云計算未來幾年的發(fā)展
我們知道云廠商的數(shù)據(jù)中心并非都是自建的,由于數(shù)據(jù)中心的建立需要考慮很多的因素,光是選址可能就需要需要耗費很多的時間。在云業(yè)務(wù)的快速成長期自建數(shù)據(jù)中心可能來不及,因此很多的云廠商這個時候會從基礎(chǔ)設(shè)施提供商那里租賃現(xiàn)成的數(shù)據(jù)中心。在這種背景下,曾經(jīng)有一位著名的分析師預(yù)測,隨著越來越多的企業(yè)將自己的業(yè)務(wù)遷到云服務(wù)商所擁有的的超大數(shù)據(jù)中心之中,企業(yè)自己擁有的數(shù)據(jù)中心將會逐漸的消失,因為相比云服務(wù)商一般的企業(yè)很難自己快速的建立起足夠的容量。
還有一點需要注意,并不是所有的企業(yè)應(yīng)用都適合遷移到公共的云平臺之上,從實際來看很多企業(yè)出于業(yè)務(wù)屬性的考慮選擇的是私有云,這些私有云平臺一般是直接部署在用戶自己的數(shù)據(jù)中心或者部署到托管的數(shù)據(jù)中心中。從近幾年的數(shù)據(jù)來看私有云市場在增長率上不如公有云,但私有云的市場的基數(shù)大,導(dǎo)致目前私有云市場的收入目前還是高于公有云的,比如根據(jù)451 Research 2018年的調(diào)查,2018年私有云市場的營收比公有云市場的營收要高出43%。
另外,如果未來云計算市場的發(fā)展符合預(yù)測的話,即使是這些云計算大廠恐怕也很難應(yīng)對這樣大量的數(shù)據(jù)中心的建立,在這種情況下云計算廠商勢必會向數(shù)據(jù)中心托管服務(wù)提供商需求幫助或者合作。
如果分析師的預(yù)測成立的話,那么未來幾年我們需要添加多少資源呢? 這個不是很好評估,但是計量單位就很難選擇,是選擇機架作為單位呢還是數(shù)據(jù)中心作為基本的單位呢?針對這個問題,業(yè)界比較認可的方式是采用機架作為基本的評估單位,因為數(shù)據(jù)中心規(guī)模目前全世界并沒有一個統(tǒng)一的評估標(biāo)準(zhǔn)。為了找到問題答案,我們先做兩個假設(shè):
(1) 假設(shè)數(shù)據(jù)中心中的機架大部分都是標(biāo)準(zhǔn)的8KW供應(yīng)的機架。
(2) 假設(shè)每個機柜滿負載(8KW)運行時每個月可以獲取4.5萬美元的營收。
基于以上兩個假設(shè),下面我們開始我們的推斷,看下為了支持近幾年云計算的發(fā)展我們需要增加多少基礎(chǔ)資源設(shè)備。
前文中我們引用了三家評測機構(gòu)對未來三年云計算營收的評估數(shù)據(jù),在此我們以最知名的一家Gartner 為例推算未來3年需要的基礎(chǔ)設(shè)備數(shù)量。Gartner 預(yù)測2018年到2021年之間的36個月中全球云計算市場的規(guī)模將會擴大1020億美元,這個個數(shù)據(jù)相當(dāng)于每個月將會增加28億美元。上文中我們假設(shè)每個滿負荷下的標(biāo)準(zhǔn)機架每個月帶來的營收約為4.5萬美元,則全球平均每個月需要新增約6.3萬個標(biāo)準(zhǔn)的機架。每個標(biāo)準(zhǔn)機架滿負荷下的功率為8KW,則全球每個月新增數(shù)據(jù)中心的電力容量會達到500兆瓦。
在此筆者專門查了下,目前全球新建一個1兆瓦的數(shù)據(jù)中心的平均成本為800萬美元到1000萬美元。假設(shè)未來三年新建數(shù)據(jù)中心的成本保持不變(一般會逐年增高)的前提下,為滿足未來三年中每個月新增500兆瓦的需求,未來三年全球每個月用在數(shù)據(jù)中心新建上的成本約為40億美元到50億美元。
從我們推算的結(jié)果可以看出,未來三年需要新建或者改造數(shù)量眾多的數(shù)據(jù)中心。那么問題來了,未來三年我們該如何保證可以提供這么大數(shù)量的數(shù)據(jù)中心?還有一個問題,那就是我們除了新建數(shù)據(jù)中心還沒有其他的辦法呢? 答案是有的,那就是整合現(xiàn)有的數(shù)據(jù)中心,進行老舊數(shù)據(jù)中心的升級,完成數(shù)據(jù)中心的現(xiàn)代化,讓老舊數(shù)據(jù)中心在未來的三年中重新煥發(fā)生機。
數(shù)據(jù)中心現(xiàn)代化
程序員大部分情況下只會去關(guān)注軟件層面的更新?lián)Q代,其實作為云計算平臺的基礎(chǔ)設(shè)施,未來幾年數(shù)據(jù)中心的現(xiàn)代化也是至關(guān)重要的。為適應(yīng)未來幾年(不僅僅是未來幾年,只要上層應(yīng)用在發(fā)展,依托的數(shù)據(jù)中心也必須要進行發(fā)展)云業(yè)務(wù)的發(fā)展,數(shù)據(jù)中心在技術(shù)層面上必須保持進步,以免技術(shù)落后導(dǎo)致競爭力下的下降。數(shù)據(jù)中心在技術(shù)迭代跟不上的話,還可能給上層的業(yè)務(wù)帶來風(fēng)險,比如如果數(shù)據(jù)中心在安全這個層面上沒有與時俱進,數(shù)據(jù)中心很容易會遭到新出現(xiàn)的復(fù)雜的網(wǎng)絡(luò)攻擊,在這方面不乏先例,單從這幾年日益頻繁的網(wǎng)絡(luò)攻擊來看也能從側(cè)面反映出未來數(shù)據(jù)中心面臨的技術(shù)升級壓力。
數(shù)據(jù)中心中一排排整齊的機架,不同設(shè)備都有自己各自的位置和標(biāo)簽,跟我們的城市很像,去過數(shù)據(jù)中心的同學(xué)應(yīng)該都有這種體會。數(shù)據(jù)中心的整合類似城市改造,通過對老舊數(shù)據(jù)中心的機房改造、資源整合、結(jié)構(gòu)優(yōu)化、系統(tǒng)遷移、網(wǎng)絡(luò)改造等方式,可以讓老舊的數(shù)據(jù)中心更加高效、經(jīng)濟、可靠。
接觸過數(shù)據(jù)中心維護這塊的同學(xué)應(yīng)該知道,數(shù)據(jù)中心工程人員和維護人員基本上就是維持這樣一個原則:不損壞,就不動。這種情況并不是個例,可以說是常態(tài)了。這幾年用戶對數(shù)據(jù)新需求的增加和日益嚴峻的安全風(fēng)險,需要數(shù)據(jù)中心管理人員逐步的改變自己的過去的工作方式,需要從過去的被動工作模式逐步的向主動模式改變,需要主動的配合上面業(yè)務(wù)方使已有的基礎(chǔ)設(shè)施資源的效率發(fā)揮到最大,加快應(yīng)用程序和基礎(chǔ)的IT設(shè)施的發(fā)展。
上文中我們已經(jīng)了解到未來的技術(shù)發(fā)展對數(shù)據(jù)中心現(xiàn)代化的迫切需求,企業(yè)要想有效實現(xiàn)數(shù)據(jù)中心的現(xiàn)代化面臨著很多的前期工作,從筆者了解到的一些業(yè)界的數(shù)據(jù)中心改造項目來看后續(xù)的整個現(xiàn)代化的過程需要投入大量的時間和成本,但數(shù)據(jù)中心現(xiàn)代化需要付出的代價從長遠看來是值得的。下面我們看一下目前業(yè)界在數(shù)據(jù)中心現(xiàn)代化改造和更新方面的具體措施。
1. 技術(shù)持續(xù)更新
大部分企業(yè)數(shù)據(jù)中心中大部分時候老舊設(shè)備的更新?lián)Q代是在設(shè)備損壞后才進行的,但從實際來看老舊過時的設(shè)備通常需要更多的操縱成本和維護成本,且可能會存在影響用戶既有業(yè)務(wù)的風(fēng)險。
針對這一點一般建議企業(yè)建立資產(chǎn)跟蹤,對現(xiàn)存的每一臺設(shè)備都要建立檔案庫,同時管理人員需要了解每一臺老舊設(shè)備的使用壽命以及是否在保修期等問題。數(shù)據(jù)中心上層的云平臺管理人員在上層的監(jiān)控系統(tǒng)中發(fā)現(xiàn)疑似硬件設(shè)備問題時要主動聯(lián)系機房管理人員進行設(shè)備的確認,因為從實際使用來看部分設(shè)備在即將出現(xiàn)問題但未出現(xiàn)問題時機房的告警平臺有時是發(fā)現(xiàn)不了的。確認是硬件設(shè)備問題后,就需要機房的管理人員盡快進行設(shè)備的更新。
另外一般建議數(shù)據(jù)中心中都要配備基礎(chǔ)設(shè)施管理軟件(DCIM),這樣在不依賴于上層的云平臺管理人員的情況下數(shù)據(jù)中心管理人員也可快速的了解到即將淘汰的數(shù)據(jù)中心組件,另外數(shù)據(jù)中心管理人員也可根據(jù)DCIM系統(tǒng)了解到每臺關(guān)鍵設(shè)備的電量消耗情況,從而可以在設(shè)備故障前發(fā)出告警,提醒管理人員及時介入處理。
2. 制定工作流程
借助DCIM 系統(tǒng)規(guī)范數(shù)據(jù)中心的資產(chǎn)管理工作,DCIM工作流可以幫助我們跟蹤每個數(shù)據(jù)中心的幾乎所有的資產(chǎn)管理工作。 數(shù)據(jù)中心管理人員在每次進行設(shè)備的配置變更時都要在DCIM系統(tǒng)中注明本次所做的操作、本次操作所耗時間以及本次操作額執(zhí)行人等,如果本次操作中出現(xiàn)過異常的情況則還需要注明本次操作的注意點,防止后續(xù)管理人員在操作時再次踩坑。
一般可以專門為這些數(shù)據(jù)設(shè)置一個專屬的數(shù)據(jù)庫,這樣可以幫助我們更加輕松的進行資源的安排、工作訂單的生成,更加重要的是這樣可以確保團隊操作的順利性。 增加工作流程的一致性和問責(zé)性可以幫助團隊更加高效快捷的工作,從而提高企業(yè)的生產(chǎn)力。
3. 周期性故障模擬
停電對于數(shù)據(jù)中心來說可以說是重大的故障,如果數(shù)據(jù)中心沒有備用電源或者主電源中斷后備用電源沒有切換成功會給企業(yè)帶來巨大的損失。根據(jù)美國一家公司Hexa Research的調(diào)查統(tǒng)計,但是美國的數(shù)據(jù)中心每年由于停電所造成的損失高達5500萬美元。因此一般建議每一個數(shù)據(jù)中心都要進行電源的強化配置,在配置主備電源后也要周期性的對數(shù)據(jù)中心的供電系統(tǒng)進行周期性的斷電測試,防止配置主備后當(dāng)主電源真的被切斷后備用的電源不能及時的切換。
實際的斷電模擬測試中并不是直接將所有的電源切斷,一般數(shù)據(jù)中心中還會根據(jù)機器的上所跑業(yè)務(wù)的重要程度配置不同的電源系統(tǒng),因此數(shù)據(jù)中心的管理人員還要知悉數(shù)據(jù)中心中哪些機器是核心的機器,在進行電源斷電測試時需要對核心的機器進行著重的測試。
4. 混合部署
隨著時間的推移,一個數(shù)據(jù)中心中的機器一般會越來越多,這么多的機器一般不會進行單一的部署,未來數(shù)據(jù)中心的戰(zhàn)略是一種混合策略。數(shù)據(jù)中心的混合部署一般會包公有云、私有云以及基礎(chǔ)設(shè)備的托管。
混合部署的策略的優(yōu)勢在于其靈活性和適應(yīng)性,通過實施混合策略可以將應(yīng)用程序和用戶的工作負載部署在性價比最高的機器上,提高機器的利用效率。
5. 虛擬化改造
我們知道虛擬化不僅可以對底層的資源進行充分的利用,另外還可降低一些工作負載的風(fēng)險。雖然虛擬化的系統(tǒng)中部分軟件的性能水平不及直接部署在硬件之上的水平,但是由于大部分情況下硬件的性能并不會被榨干耗盡,而是維持在一個不高的水平之上,剩下的計算能力可以借助虛擬化進行合理的使用,因此虛擬化改造會具有更大的,靈活性和控制能力。
DCIM解決方案仍然是現(xiàn)代數(shù)據(jù)中心中工作的核心管理軟件,借助DCIM 數(shù)據(jù)中心管理人員可以對整個虛擬化層的資源進行分配、跟蹤,對數(shù)據(jù)中心中底層資源進行有效的利用。
最后的話
從市場的實際需求來看,不論我們采用什么樣的預(yù)測方式,未來幾年內(nèi)我們都需要大量的數(shù)據(jù)中心,尤其是在5G開始商用的背景之下。為了確保未來的數(shù)據(jù)中心可以滿足市場的需要,接下來幾年的數(shù)據(jù)中心的改造和新建必須在成本控制、機器效率、功率密度以及快速擴展能力上進行優(yōu)化。
模塊化的設(shè)計可以提高數(shù)據(jù)中心的部署效率,尤其是對于超大規(guī)模的數(shù)據(jù)中心這種情況。所以后續(xù)在對托管服務(wù)提供商進行評價時可以將服務(wù)商是否采用了模塊化構(gòu)建方法構(gòu)建數(shù)據(jù)中心來作為其中的一個評價標(biāo)準(zhǔn)。
DCIM 現(xiàn)在仍是數(shù)據(jù)中心中核心的管理軟件,為適應(yīng)未來幾年不斷變化的技術(shù)生態(tài)系統(tǒng)的需求,建議每一個想要進行數(shù)據(jù)中心現(xiàn)代化的企業(yè)將DCIM 引入自己的數(shù)據(jù)中心管理之中。
責(zé)任編輯:ct
評論
查看更多