雙十一剛過(guò),云服務(wù)商宕機(jī)導(dǎo)致大面積故障的新聞就引爆全網(wǎng),再一次引發(fā)全網(wǎng)關(guān)于云計(jì)算安全可靠的大討論。
在一個(gè)充滿著復(fù)雜性、不穩(wěn)定性和不確定性的烏卡時(shí)代,云故障頻發(fā)似乎已發(fā)展成一種“常態(tài)”,讓企業(yè)對(duì)于云計(jì)算逐漸產(chǎn)生諸多顧慮。但隨著數(shù)字經(jīng)濟(jì)和產(chǎn)業(yè)數(shù)字化的提速,上云與用云已是企業(yè)推動(dòng)數(shù)字化轉(zhuǎn)型不斷深入的重要抓手,成為不可阻擋的趨勢(shì)。Gartner 預(yù)測(cè),至 2025 年或?qū)⒂?90%的企業(yè)關(guān)閉傳統(tǒng)數(shù)據(jù)中心,企業(yè)各種行業(yè)應(yīng)用開(kāi)發(fā)將全面走向云化。
因此,企業(yè)在烏卡時(shí)代不能對(duì)云望而遠(yuǎn)之,而需要邁向全面云化的同時(shí),重視多云戰(zhàn)略的投入,并在選擇云服務(wù)時(shí)更加看重云服務(wù)的穩(wěn)定可靠。
數(shù)字化轉(zhuǎn)型不可逆
企業(yè)切莫對(duì)云望而遠(yuǎn)之
近年來(lái),在數(shù)字經(jīng)濟(jì)浪潮的助推下,加速上云被公認(rèn)為是垂直行業(yè)的大勢(shì)所趨。
在新應(yīng)用、新場(chǎng)景、新技術(shù)不斷涌現(xiàn)的今天,企業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程已不可逆,越來(lái)越多企業(yè)借助數(shù)字化轉(zhuǎn)型在市場(chǎng)競(jìng)爭(zhēng)中獲得成功。這其中,云計(jì)算扮演著關(guān)鍵的數(shù)字底座角色。憑借著彈性、靈活、高效、合規(guī)與可控等優(yōu)勢(shì),云計(jì)算如今成為企業(yè)數(shù)字化轉(zhuǎn)型中綜合應(yīng)用 AI、大數(shù)據(jù)等新技術(shù)的最佳載體,為企業(yè)業(yè)務(wù)高效發(fā)展提供持續(xù)的動(dòng)力。
歸根結(jié)底,在數(shù)字經(jīng)濟(jì)的大浪潮下,云計(jì)算改變了資源使用的模式,帶來(lái)商業(yè)效率的根本性提升。雖然云服務(wù)商也會(huì)有各種故障發(fā)生的情況出現(xiàn),但云計(jì)算的諸多特性決定了其仍然是最為可靠的數(shù)字底座,上云是企業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程中的最佳選擇。
以金融行業(yè)為例,極為看重安全、可靠的各種金融機(jī)構(gòu)均沒(méi)有放慢擁抱云計(jì)算的步伐。最新的《金融科技發(fā)展規(guī)劃(2022—2025年)》明確鼓勵(lì)各類金融機(jī)構(gòu)基于“云”發(fā)展業(yè)務(wù)系統(tǒng)、技術(shù)測(cè)試、信息安全等,支持金融機(jī)構(gòu)“上云”部署,利用云計(jì)算資源開(kāi)展業(yè)務(wù)。
例如,借助云計(jì)算的優(yōu)勢(shì),郵儲(chǔ)銀行新一代分布式核心系統(tǒng)實(shí)現(xiàn)為 6 億多用戶提供日均 20 億筆的處理能力,將聯(lián)機(jī)交易處理效率提升一倍、批處理效率提升 33%,在日趨激烈的市場(chǎng)競(jìng)爭(zhēng)中為用戶提供了穩(wěn)定、快速的金融服務(wù)。
可以說(shuō),金融機(jī)構(gòu)上云是垂直行業(yè)積極上云的一個(gè)縮影。事實(shí)上,隨著企業(yè)上云與用云步伐的加快,多云戰(zhàn)略已經(jīng)成為企業(yè)數(shù)字化轉(zhuǎn)型中的核心戰(zhàn)略。企業(yè)愈發(fā)傾向于通過(guò)多云戰(zhàn)略來(lái)分散云計(jì)算的風(fēng)險(xiǎn),實(shí)現(xiàn)資源的合理分配以及風(fēng)險(xiǎn)防范。
多云戰(zhàn)略提速
企業(yè)需看重什么
Flexera《2022 年云狀態(tài)報(bào)告》顯示,89%的受訪企業(yè)選擇了多云戰(zhàn)略。
無(wú)疑,多云戰(zhàn)略已成為企業(yè)數(shù)字化轉(zhuǎn)型的共識(shí)。在云故障不可避免的今天,出于“避免雞蛋放在一個(gè)籃子里”的考慮,企業(yè)選擇多個(gè)云計(jì)算服務(wù)商是降低風(fēng)險(xiǎn)、實(shí)現(xiàn)資源合理分配的最佳途徑。
但每個(gè)云計(jì)算服務(wù)商都有著不同的特征,企業(yè)要想通過(guò)多云戰(zhàn)略來(lái)充分利用每個(gè)云計(jì)算服務(wù)商的獨(dú)特優(yōu)勢(shì),實(shí)現(xiàn)跨云的無(wú)縫治理、資源利用等并不容易。Gartner 就認(rèn)為多云能夠降低對(duì)單一云服務(wù)商的依賴性,也會(huì)增加運(yùn)營(yíng)的復(fù)雜性和成本,企業(yè)在多云戰(zhàn)略中需要優(yōu)先考慮主要云服務(wù)商和制定工作負(fù)載的歸屬策略,實(shí)現(xiàn)應(yīng)用在云端的合理部署與使用。
特別是那些大規(guī)模核心業(yè)務(wù)上云的企業(yè),多云戰(zhàn)略中對(duì)于主要云服務(wù)商的選擇更為關(guān)鍵。這些企業(yè)通常希望主要云服務(wù)商既能夠支持云原生、人工智能、大數(shù)據(jù)等先進(jìn)的數(shù)字化技術(shù),更希望云服務(wù)商基礎(chǔ)設(shè)施穩(wěn)定性、可靠性、安全性具備高水平,以確保云上部署的各種業(yè)務(wù)應(yīng)用的安全與可靠。
例如,《銀行業(yè)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)劃》規(guī)定,AB 類業(yè)務(wù)災(zāi)難恢復(fù)要求在 5 級(jí)以上,業(yè)務(wù)中斷需要低于 15 分鐘。現(xiàn)實(shí)情況中,很多金融機(jī)構(gòu)出于對(duì)監(jiān)管和用戶體驗(yàn)的要求,往往對(duì)于業(yè)務(wù)中斷的要求會(huì)遠(yuǎn)遠(yuǎn)高于《規(guī)劃》的規(guī)定。
因此,在企業(yè)的多云戰(zhàn)略中,主要云服務(wù)商的運(yùn)維與災(zāi)備能力至關(guān)重要。眾所周知,云服務(wù)商的數(shù)據(jù)中心等基礎(chǔ)設(shè)施隨著規(guī)模不斷增大、部署應(yīng)用復(fù)雜性提升和業(yè)務(wù)快速變化,數(shù)據(jù)中心設(shè)備故障、應(yīng)用故障等帶來(lái)的風(fēng)險(xiǎn)也隨之增長(zhǎng)。
云服務(wù)商一是需要具備先進(jìn)的運(yùn)維能力,在運(yùn)維管理等層面有能力去預(yù)測(cè)、發(fā)現(xiàn)故障,降低故障可能帶來(lái)的風(fēng)險(xiǎn);二是需要具備強(qiáng)大的災(zāi)備能力,一旦發(fā)生故障或者災(zāi)難,可以快速實(shí)現(xiàn)業(yè)務(wù)恢復(fù),避免因故障造成業(yè)務(wù)的停頓。
以華為云為例,得益于華為從高可靠性、高可用性的運(yùn)營(yíng)商業(yè)務(wù)起家,可用性保障基因深入骨髓,華為云一直重視災(zāi)備安全,可以提供同城 AZ(AvailabilityZone)內(nèi)、跨 AZ、異地跨 Region 的兩地三中心容災(zāi)方案和 1000 公里以上的城市級(jí)容災(zāi)能力。
更加重要的是,華為云 SRE 團(tuán)隊(duì)在華為云高速成長(zhǎng)的過(guò)程中不斷實(shí)踐,結(jié)合政企運(yùn)維經(jīng)驗(yàn),形成了確定性運(yùn)維的理念,正在對(duì)數(shù)據(jù)中心運(yùn)維領(lǐng)域產(chǎn)生深遠(yuǎn)影響。
確定性運(yùn)維
為不確定的云時(shí)代帶來(lái)確定
穩(wěn)定、可靠是云時(shí)代最為核心的競(jìng)爭(zhēng)力之一。
華為云的穩(wěn)定、可靠背后離不開(kāi)其 SRE 團(tuán)隊(duì)的長(zhǎng)期努力。所謂 SRE(SiteReliabilityEngineer,站點(diǎn)可用性工程師)是 DevOps 模式的一種組織實(shí)現(xiàn)形式,強(qiáng)調(diào)研發(fā)和運(yùn)維團(tuán)隊(duì)的組織級(jí)協(xié)作,構(gòu)建 PRR、EB 等質(zhì)量保障的流程機(jī)制,打造全棧工程師來(lái)應(yīng)對(duì)業(yè)務(wù)快速迭代和敏態(tài)發(fā)展所帶來(lái)的運(yùn)維挑戰(zhàn)。
從 2017 年開(kāi)始,華為云致力于實(shí)踐 SRE 的實(shí)踐。伴隨著華為云業(yè)務(wù)的高速成長(zhǎng),華為云 SRE 團(tuán)隊(duì)在實(shí)踐中不斷成長(zhǎng),并結(jié)合華為政企運(yùn)維經(jīng)驗(yàn),形成了確定性運(yùn)維的理念,并逐步演進(jìn)為包括“質(zhì)量文化”、“高可用架構(gòu)”、“動(dòng)態(tài)風(fēng)險(xiǎn)治理體系”和“高度智能運(yùn)維框架”的確定性運(yùn)維體系,面向云服務(wù)全生命周期的質(zhì)量看護(hù),實(shí)現(xiàn)現(xiàn)網(wǎng)可預(yù)期的高可用質(zhì)量結(jié)果。
在“高可用架構(gòu)”方面,華為云 SRE 確定三個(gè)維度:即軟件有確定性的失效率,且在控制范圍之內(nèi);確定性的恢復(fù)時(shí)長(zhǎng),在故障出現(xiàn)后可以快速恢復(fù);確定性影響面,確定故障的爆炸半徑,縮小故障影響面。通過(guò)“高可用架構(gòu)”,華為云可以讓前端的云服務(wù)具備高可靠和高可用的能力,并且故障發(fā)生時(shí),確保故障不跨 AZ 擴(kuò)散。
在“動(dòng)態(tài)風(fēng)險(xiǎn)治理體系”方面,華為云 SRE 將 AI 能力引入到運(yùn)維之中,實(shí)現(xiàn)于運(yùn)維風(fēng)險(xiǎn)冒泡和及時(shí)清除;持續(xù)提升監(jiān)控、定界與快速恢復(fù)能力;構(gòu)建混沌工程等主動(dòng)運(yùn)維能力;用數(shù)據(jù)智能支撐持續(xù)的自我改進(jìn)。
在“高度智能運(yùn)維框架”方面,華為云 SRE 依托數(shù)據(jù)中臺(tái),結(jié)合先進(jìn)的算法,實(shí)現(xiàn)智能告警、智能故障定界、自動(dòng)恢復(fù)等。
此外,華為云還推出確定性運(yùn)維成熟度模型,幫助業(yè)內(nèi)同行基于運(yùn)維模式,對(duì)運(yùn)維流程、工具、人力進(jìn)行治理進(jìn)行評(píng)估,從而有效地規(guī)劃和制定運(yùn)維策略。
如今,在確定性運(yùn)維理念的驅(qū)動(dòng)下,華為云在業(yè)務(wù)高速發(fā)展中不斷提升了服務(wù)效率,并且為用戶帶來(lái)了確定性的服務(wù)質(zhì)量、更好的服務(wù)體驗(yàn)。
綜合觀察,墨菲定律告訴我們:“如果某件事情可能出錯(cuò),那么它就一定會(huì)出錯(cuò)”,云計(jì)算也不能免俗。云服務(wù)商過(guò)去、現(xiàn)在都有故障發(fā)生,將來(lái)也會(huì)出現(xiàn)故障。面向未來(lái),隨著基礎(chǔ)服務(wù)在功能層面上走向驅(qū)動(dòng),云服務(wù)商之間的競(jìng)爭(zhēng)焦點(diǎn)一定是質(zhì)量的競(jìng)爭(zhēng),安全、穩(wěn)定、高質(zhì)量的云服務(wù)意味著信賴,也將決定著用戶的選擇。
審核編輯 黃宇
-
華為云
+關(guān)注
關(guān)注
3文章
2423瀏覽量
17312
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論