精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

干貨:設計DevOps運維服務體系的詳細思路和設計步驟

如意 ? 來源:高效運維 ? 作者:矢量比特 ? 2020-10-20 14:30 ? 次閱讀

前記

體系就像是一頂帽子,是對 DevOps 運維的一個深度總結,寫一下工作中的感悟,希望對你有所啟迪。

DevOps 體系是從原始運維一步步走過來的,原始運維好比是本,有了本進而想繼續提升效率、減少出錯、優化流程,就發展到了 DevOps,AIOps……

首先,運維的業務職能規范后形成章程、綱領,在互聯網快速發展的特點下,形成了一套應對”快”和”變”的體系,并不停的迭代升級,工作這些年,體會到千象背后是有恒道的,運維工作一直圍繞高 SLA 和低成本的業務目標運轉著,只是工具在圍繞著體系變來變去。從開發的角度理解,運維體系就像是算法,實現算法的語言就像是工具,DevOps 就是工具的升級。

工具的本質其實是一個基礎支撐,有了這個支撐,一系列目標的實現才更科學、高效,簡單示意如下。

干貨:設計DevOps運維服務體系的詳細思路和設計步驟

原始階段,運維工程師與各部門無數的磨合、探索下,慢慢形成了最初的體系,其無形的規范著運維的工作和注意事項,工程師通過這個綱領開展日常工作并保障業務的健康發展,這個階段可以說是制度為王、制度規范,沒有系統的運維平臺,有的只是零散的一些大小工具,各種事物基本靠人工、靠制度、靠約束,雖是原始階段,但也是運維最真實的樣子,忙碌而又忙碌,效率總跟不上需求,制度總跟不上執行,與開發的協作總難同一頻道,需要大量的運維人力。

再向后發展,為了提高效率的同時解決與開發間的溝通協作問題,提出了 DevOps,大家開始做自動化、做 DevOps 文化,這個自動化其本質是把運維體系落在一個到多個系統上,通過自動化系統來提高工作效率,同時用系統來實現制度,開發和運維都在一個系統上協作,遵守同樣的規則,協作上也高效多了,這個階段到了技術為王、平臺規范,市場上出現了運維開發,出現了 SRE,各種問題得到了有效的解決,當然解決的程度取決 DevOps 系統做的優劣,這個就參差不齊了,但出現了這個發展方向。

再向后發展,行業領頭羊提出要進一步減少人工參與,用機器自動化替換人工自動化,進而出現了 AIOps。

細心觀察,從原始運維向 DevOps 的演進過程,就是越來越注重技術解決問題的過程,人員需要越來越少,能用技術替代的崗位慢慢被替代,隨著自動化平臺的成熟穩定,理論上理想的終極狀態可能只留”運維平臺+業務運維“,其他運維轉崗業務運維,業務運維轉崗技術運營。

那么我們如何思考設計一套 DevOps 運維服務體系呢?總結下來,一個最小的模型為定業務規范、建工作制度、搭 DevOps 系統,以此為最小單元循環往復、迭代升級。

一、定業務規范

先講個美國人與中國人種地的事兒,美國人建立農場,把種地標準化流程化后,引入工具,幾個人種幾百畝地收成高、成本低反而不累,中國人每個人幾畝地各自作業,收成低、成本高反而都很累。

做運維我感覺也是這個道理,想要批量化、高效率的作業就要規范化,制定各種標準形成規范,如果每個服務各自為戰,就會出現烏泱泱一群人確實忙的腳不離地兒,但就是不出活兒。

那么我們通過 DevOps 要批量管理哪些東西呢,集中一下大概就是資源、服務、規范三類,資源包括像服務器、網絡設備、負載均衡、證書、域名、代碼、容器等,服務包括像圍繞運維提供的服務監控告警、CI/CD、日志分析、服務預案、配置管理等,規范包括像流程、資源、服務的各種標準化等,簡單示意如下。

干貨:設計DevOps運維服務體系的詳細思路和設計步驟

所以規范是整個 DevOps 體系建設里非常重要的一環,每個規范也對應了一些最佳實踐原則,整理了一些運維中的規范如下:

1、變更規范

上線變更:代碼上線、回滾、擴縮容;

配置變更:系統配置、應用配置;

網絡變更:網絡割接、設備更換;

其它變更:流量調度、服務切換、服務下線…

原則:

制定變更審核流程;

制定變更相關方通知(群、郵件);

制定變更回滾策略;

遵循測試、灰度、全量上線的規則;

下線變更要將服務器依賴處理干凈,比如說掛著vip、有域名解析。

2、容災規范

服務災備:多機器、多機房;

數據災備:多備份、異地備份;

網絡災備:多線路、多設備;

原則:

自動切換 好于 手動切換;

無狀態 好于 有狀態;

熱備 好于 冷備;

多機房 好于 單機房。

3、容量規范

系統容量:木桶原理計算系統的全鏈路容量、用量、余量;

模塊容量:模塊的容量、用量、余量;

機房容量:分機房的容量、用量、余量;

單機容量:用于反向計算機房、模塊容量;

原則:

制定模塊單機容量指標(比如QPS、連接數、在線用戶數等);

容量要考慮下行(讀)、上行(寫),考慮存儲增量;

計算當前模塊總容量,收集當前的用量,并對比容量計算余量;

系統總容量可以根據木桶原理,找到短板模塊后,反向計算出來。

4、巡檢規范

用戶核心指標;

服務核心指標;

基礎資源指標:服務器;

依賴資源指標:依賴db、依賴接口;

自動化巡檢報告;

值班oncall安排;

原則:

DashBoard核心在于收斂、舍得;

自動化巡檢的必要性在于異常偵測,預防故障。

5、告警規范

基礎監控:CPU、內存、網絡、IO;

應用監控:進程、端口;

業務監控:日志、業務埋點;

依賴監控:數據庫、依賴接口……

原則:

核心監控收斂成告警,并對告警進行分級,備注告警影響;

核心監控形成可排查問題的DashBoard;

告警的價值在于實時發現故障。

6、預案規范

線路切換:移動、電信、聯通線路切換;

機房切換:不同機房切換;

機器切換:機器故障時進行摘除;

服務降級:無法切換時,降低標準繼續服務;

數據庫切換:主從切換、讀寫切換;

網絡切換:主備線路切換、鏈路切換;

原則:

域名切換 好于 更換IP;

自動摘除 好于 手動操作;

自動切換 好于 手動切換;

考慮好雪崩事宜。

7、故障管理規范

服務分級:確定各服務用戶角度的影響;

故障定級:制定故障定級標準;

制定故障通知、處理規范;

制定故障復盤,改進措施按時保量完成的規范;

原則:

擁抱故障,同類故障不能重復發生。

8、權限安全規范

開發、運維、臨時權限;

安全上符合安全審計標準。

9、文檔、工具規范

統一共享知識文檔;

統一共享各種腳本工具;

原則:

理想的情況是“一站式運維平臺”,一個平臺涵蓋所有工具操作。

10、標準化規范:

主機名標準化;

日志存儲標準化;

日志格式標準化;

域名使用標準化;

軟件安裝目錄結構標準化;

原則:

主機名盡量能看出更多信息,比如服務、模塊、機房等;

日志是排查問題的重要信息,一定要標準化,方便手工排查,更是為了以后用工具處理打下基礎。

11、資源管理規范

服務器

vip

域名

證書

代碼

原則:

資源之間是有關系的,要建立有關系的資源管理。

這里只列了一些常見的業務規范,還有很多規范是要在業務實際問題中去制定的,規范代表了運維的最佳實踐,在DevOps建設中非常重要。

二、建工作制度

制度對應著工作的做事流程方法,會影響到文化,制度的建設情況,也反映了解決問題的層次,好的制度是應該能夠系統化、工具化、可執行、可量化的,這樣在后期才好用DevOps實現,把制度友好的落到運維平臺上。

制度的產生不應該是解決一個case,而是科學的解決一類問題,制度的執行如果僅靠人的自覺自律,是靠不住的,一定要盡可能落到技術上。

上線審批制度

合規部署制度

日志清理制度

容量管理制度

oncall管理制度

服務巡檢制度

故障管理制度

安全管理制度

……

工作中最不缺的是各種制度,如何建是有技巧的,也體現了一個運維的能力,這種能力堅持下去就會變為一種文化,例如考慮問題看到本質,解決問題解決根本。

另外,制度的建立要一定要本著長遠的眼光,科學的態度,DevOps的思想(工具思維)。

三、搭 DevOps 系統

搭系統就是把前面的內容用技術的手段信息化,用科學的工具實現零散的資源管理、規范制度、手工操作,最理想的目標是“一站式運維”,工程師不需要切換系統,一個平臺解決所有事情。

但要管的東西實在太多了,為了專業,市面上首先出現了解決單個點的優秀方案,比如說zabbix、Jenkins…。.但從用戶的角度看就像“五行有了缺一個串”,解決一個業務問題,需要打開N多個系統,來回跳轉,這種方式令人崩潰。好一點的大廠做個單點登陸,解決了賬號混亂的問題,不過依舊是一堆系統,用戶體驗差、操作效率低。

實際上,這些單點的解決方案非常重要,我們在思考設計DevOps的時候,想要做到高質量、低成本,必須用好這些方案像拼積木一樣做資源整合,把他們當作底層的輪子,站在巨人的肩膀上做系統,力爭在應用層做到“一站式”,工作細分到這個程度,指望一個系統解決所有底層問題是不現實的,用圖示意如下。

干貨:設計DevOps運維服務體系的詳細思路和設計步驟

可以看到,整個工具體系分為了兩層,一層是底層的輪子層,這一層面向的是單個主題的解決,講究深度和系統的解決一類問題,上層是面向SRE的應用層,也可以說是業務層,業務層通過底層輪子封裝后管理了資源、規范制度、運維服務(運維提供的服務)這三類內容,所有的輪子通過一套賬號和權限體系打通。

我們要用好開源社區優秀的輪子,特別是小廠,沒有必要重復建設,要通過輪子的api接口做好應用層的流程封裝,通過應用層的集成,做到一站式操作,應用層作為和SRE的用戶接口,體現了一個 DevOps 的用戶體驗,輪子可以復雜,“一站式運維平臺”要做到盡可能簡單、優雅。

寫到這里,希望對從業的你有所啟迪。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 運維
    +關注

    關注

    1

    文章

    253

    瀏覽量

    7544
  • 開源工具
    +關注

    關注

    0

    文章

    27

    瀏覽量

    4446
  • devops
    +關注

    關注

    0

    文章

    112

    瀏覽量

    12000
收藏 人收藏

    評論

    相關推薦

    實戰:阿里巴巴 DevOps 轉型后的平臺建設

    摘要:阿里巴巴DevOps轉型之后,平臺是如何建設的?阿里巴巴高級技術專家陳喻結合自身的理解,業務場景的分析和業界方法論的一些思考,
    發表于 04-12 13:23

    一種智能云安全服務體系結構研究與設計_黃成榮

    一種智能云安全服務體系結構研究與設計_黃成榮
    發表于 03-19 11:45 ?0次下載

    華為OWS云服務提升網絡安全能力

    華為自主研發的OWS是基于微服務架構的云化平臺,以開源、可編程的模式來實現覆蓋ICT網絡的實時、按需的管理。OWS主要包括ICT網絡
    的頭像 發表于 12-08 11:36 ?2.3w次閱讀

    利用6 個 Linux 典型問題來分析處理問題的思路

    結合上面介紹的 Linux 問題的解決思路后,下面我們挑選了6個比較典型的 Linux 問題,來看看是如何分析和解決的。
    的頭像 發表于 01-13 10:37 ?2928次閱讀

    DevOps Foundation? 是什么?DevOps塑造著軟件世界的未來

    DevOps Foundation? 課程旨在培養個人對 DevOps Foundation? 概念的理解以及 DevOps 如何用于提升軟件開發人員和 IT
    的頭像 發表于 04-16 12:46 ?5524次閱讀

    Ansible企業級自動化探索的詳細資料說明

    本文檔的主要內容詳細介紹的是Ansible企業級自動化探索的詳細資料說明主要內容包括了:場景一:自動化
    發表于 06-03 08:00 ?2次下載
    Ansible企業級自動化<b class='flag-5'>運</b><b class='flag-5'>維</b>探索的<b class='flag-5'>詳細</b>資料說明

    ITS服務工程的實施方案詳細說明

    本文檔的主要內容詳細介紹的是ITS服務工程的實施方案詳細說明。
    發表于 12-26 14:32 ?11次下載
    ITS<b class='flag-5'>運</b><b class='flag-5'>維</b><b class='flag-5'>服務</b>工程的實施方案<b class='flag-5'>詳細</b>說明

    干貨:VMware虛擬機和 keepalived的手冊

    干貨:VMware虛擬機和 keepalived的手冊
    的頭像 發表于 06-28 10:00 ?2664次閱讀
    <b class='flag-5'>干貨</b>:VMware虛擬機和 keepalived的<b class='flag-5'>運</b><b class='flag-5'>維</b>手冊

    干貨:node服務實現負載均衡的步驟

    干貨:node服務實現負載均衡的步驟
    的頭像 發表于 07-07 10:20 ?3598次閱讀

    云計算管理的優化與改進

    來源:CIO之家 本文經授權轉載 為促進當前云計算管理的優化與改進,應從打造一體化的的管理模式開始,并將業務導向放在首位,從而有效實現完善、成熟的IT
    的頭像 發表于 11-03 14:41 ?3008次閱讀
    云計算<b class='flag-5'>運</b><b class='flag-5'>維</b>管理的優化與改進

    電力服務方案(配電室無人值守系統解決方案)

    通過配電室物聯采集裝置及各類傳感器,將數據傳送到電易云平臺,監控中心對配電室進行遠程、集中、實時監控,同時為用戶提供巡檢、試驗、搶修等線下服務,構建“線上監管+遠程值守+線下服務
    的頭像 發表于 08-23 16:55 ?1844次閱讀
    電力<b class='flag-5'>運</b><b class='flag-5'>維</b><b class='flag-5'>服務</b>方案(配電室無人值守系統解決方案)

    打造智能化極致體驗 軟通動力AIOps體系亮相GOPS全球運大會

    最佳實踐及解決方案專場”,發表《數智化時代軟通動力AIOps體系最佳實踐與探索》主題演講。 隨著信息技術、數字技術的快速發展,以及企業IT系統和服務的復雜性不斷提高,傳統的IT已經
    的頭像 發表于 10-28 16:10 ?453次閱讀

    凱米斯科技提供高效優質的服務

    水質監測管養服務是目前社會發展中不可或缺的一項重要服務,它對于保障人民生活用水的安全性、促進環境可持續發展具有重要意義。凱米斯擁有完善的服務體系
    的頭像 發表于 12-27 08:12 ?417次閱讀
    凱米斯科技提供高效優質的<b class='flag-5'>運</b><b class='flag-5'>維</b><b class='flag-5'>服務</b>

    海辰儲能榮獲NECAS、CTEAS售后服務體系雙項權威認證

    近日,憑借完善、專業的售后服務體系,經過嚴格審核,海辰儲能順利通過NECAS、CTEAS雙體系權威認證,榮獲“NECAS全國商品售后服務達標認證五星級”和“CTEAS售后服務體系完善程
    的頭像 發表于 02-29 11:10 ?2153次閱讀
    海辰儲能榮獲NECAS、CTEAS售后<b class='flag-5'>服務體系</b>雙項權威認證

    施耐德電氣全配電服務體系全新升級

    施耐德電氣希望通過以創新為驅動,以服務為支撐,幫助企業進行科學高效的設備管理,實現能源與運營效率的持續優化,從而助力企業邁向高效與可持續,讓存量激發更多能量。未來,施耐德電氣將繼續秉承‘創新、卓越、綠色、可持續’的理念,為構
    的頭像 發表于 09-25 17:22 ?473次閱讀