什么是Kubernetes CoreDNS？如何監控 CoreDNS？

CoreDNS 是 Kubernetes 環境的?DNS add-on[1]組件。它是在控制平面節點中運行的組件之一，使其正常運行和響應是 Kubernetes 集群正常運行的關鍵。學習如何監控 CoreDNS，以及它最重要的指標是什么，對于運維團隊來說是必須的。

DNS 是每個體系結構中最敏感和最重要的服務之一。應用程序、微服務、服務、主機......如今，萬物互聯，并不一定意味著只用于內部服務。它也可以應用于外部服務。DNS 負責解析域名并關聯內部或外部服務和 PodIP。維護 Pod 的 DNS 記錄是一項關鍵任務，尤其是涉及到臨時 Pod 時，IP 地址可以在沒有警告的情況下隨時更改。

如果您在 Kubernetes 中運行您的工作負載，并且您不知道如何監控 CoreDNS，請繼續閱讀本文：如何使用 Prometheus 來抓取 CoreDNS 指標，您應該檢查哪些指標，以及它們的含義。

什么是 Kubernetes CoreDNS？

從 Kubernetes 1.11 開始，在基于 DNS 的服務發現達到一般可用性（GA）之后，引入了?CoreDNS[2]?作為 kube-dns 的替代方案，CoreDNS 到目前為止一直是 Kubernetes 事實上集群的 DNS 引擎。顧名思義，CoreDNS 是一種用 Go 編寫的 DNS 服務，因其靈活性而被廣泛采用。

談到 kube-DNS 附加組件，它是以單個 pod 中三個不同容器的形式提供整個 DNS 功能: kubedns、 dnsmasq 和 sidecar。我們來看看這三個容器:

kubedns：這是 Kubernetes 的 SkyDNS 實現。它負責 Kubernetes 集群內的 DNS 解析。它監視 Kubernetes API 并提供適當的 DNS 記錄。

dnsmasq: 為 SkyDNS 解析請求提供 DNS 緩存機制。

sidecar：此容器導出指標并對 DNS 服務執行健康檢查。

現在讓我們談談 CoreDNS！

CoreDNS 解決了 Kube-dns 當時帶來的一些問題。Dnsmasq 引入了一些安全漏洞問題，導致在過去需要 Kubernetes 安全補丁。此外，CoreDNS 在一個容器中而不是 kube-dns 中需要的三個容器中提供所有功能，解決了 kube-dns 中外部服務的存根域的一些其他問題。

CoreDNS 在 9153 端口上公開其指標端點，并且可以從 SDN 網絡中的 Pod 或主機節點網絡訪問它。

# kubectl get ep kube-dns -n kube-system -o json |jq -r ".subsets"
[
  {
    "addresses": [
      {
        "ip": "192.169.107.100",
        "nodeName": "k8s-control-2.lab.example.com",
        "targetRef": {
          "kind": "Pod",
          "name": "coredns-565d847f94-rz4b6",
          "namespace": "kube-system",
          "uid": "c1b62754-4740-49ca-b506-3f40fb681778"
        }
      },
      {
        "ip": "192.169.203.46",
        "nodeName": "k8s-control-3.lab.example.com",
        "targetRef": {
          "kind": "Pod",
          "name": "coredns-565d847f94-8xqxg",
          "namespace": "kube-system",
          "uid": "bec3ca63-f09a-4007-82e9-0e147e8587de"
        }
      }
],
    "ports": [
      {
        "name": "dns-tcp",
        "port": 53,
        "protocol": "TCP"
      },
      {
        "name": "dns",
        "port": 53,
        "protocol": "UDP"
      },
      {
        "name": "metrics",
        "port": 9153,
        "protocol": "TCP"
      }
    ]
  }
]

您已經知道 CoreDNS 是什么以及已經解決的問題。是時候深入了解如何獲取 CoreDNS 指標，以及如何配置 Prometheus 實例以開始抓取其指標。讓我們開始吧！

如何在 Kubernetes 中監控 CoreDNS？

正如您剛剛看到的那樣，CoreDNS 已經被檢測并在每個 CoreDNS Pod 的端口 9153 上公開了?端點。訪問這個?端點很簡單，只需運行 curl 并立即開始提取 CoreDNS 指標！/metrics/metrics

手動訪問端點

知道運行 CoreDNS 的端點或 IP 后，請嘗試訪問 9153 端口。

# curl http://192.169.203.46:9153/metrics
# HELP coredns_build_info A metric with a constant '1' value labeled by version, revision, and goversion from which CoreDNS was built.
# TYPE coredns_build_info gauge
coredns_build_info{goversion="go1.18.2",revision="45b0a11",version="1.9.3"} 1
# HELP coredns_cache_entries The number of elements in the cache.
# TYPE coredns_cache_entries gauge
coredns_cache_entries{server="dns://:53",type="denial",zones="."} 46
coredns_cache_entries{server="dns://:53",type="success",zones="."} 9
# HELP coredns_cache_hits_total The count of cache hits.
# TYPE coredns_cache_hits_total counter
coredns_cache_hits_total{server="dns://:53",type="denial",zones="."} 6471
coredns_cache_hits_total{server="dns://:53",type="success",zones="."} 6596
# HELP coredns_cache_misses_total The count of cache misses. Deprecated, derive misses from cache hits/requests counters.
# TYPE coredns_cache_misses_total counter
coredns_cache_misses_total{server="dns://:53",zones="."} 1951
# HELP coredns_cache_requests_total The count of cache requests.
# TYPE coredns_cache_requests_total counter
coredns_cache_requests_total{server="dns://:53",zones="."} 15018
# HELP coredns_dns_request_duration_seconds Histogram of the time (in seconds) each request took per zone.
# TYPE coredns_dns_request_duration_seconds histogram
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.00025"} 14098
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.0005"} 14836
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.001"} 14850
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.002"} 14856
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.004"} 14857
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.008"} 14870
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.016"} 14879
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.032"} 14883
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.064"} 14884
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.128"} 14884
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.256"} 14885
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="0.512"} 14886
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="1.024"} 14887
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="2.048"} 14903
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="4.096"} 14911
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="8.192"} 15018
coredns_dns_request_duration_seconds_bucket{server="dns://:53",zone=".",le="+Inf"} 15018
coredns_dns_request_duration_seconds_sum{server="dns://:53",zone="."} 698.531992215999
coredns_dns_request_duration_seconds_count{server="dns://:53",zone="."} 15018
…
(output truncated)

您還可以通過 Kubernetes 集群中默認公開的 CoreDNS Kubernetes 服務訪問端點。/metrics

# kubectl get svc -n kube-system
NAME       TYPE        CLUSTER-IP   EXTERNAL-IP   PORT(S)                  AGE
kube-dns   ClusterIP   10.96.0.10           53/UDP,53/TCP,9153/TCP   129d


# kubectl exec -it my-pod -n default -- /bin/bash


# curl http://kube-dns.kube-system.svc:9153/metrics

如何配置 Prometheus 以抓取 CoreDNS 指標

Prometheus 提供了一組角色來開始發現目標并從多個來源(如 Pods、 Kubernetes 節點和 Kubernetes 服務等)獲取指標。當需要從嵌入在 Kubernetes 集群中的 CoreDNS 服務中獲取指標時，您只需要使用適當的配置來配置 prometheus.yml 文件。這一次，您應該使用?endpoints role[3]?來發現這個目標。

編輯包含配置文件的。prometheus.ymlConfigMap

# kubectl edit cm prometheus-server -n monitoring -o yaml

然后，在部分下添加下面的配置片段。scrape_configs

 - honor_labels: true
      job_name: kubernetes-service-endpoints
      kubernetes_sd_configs:
      - role: endpoints
      relabel_configs:
      - action: keep
        regex: true
        source_labels:
        - __meta_kubernetes_service_annotation_prometheus_io_scrape
      - action: drop
        regex: true
        source_labels:
        - __meta_kubernetes_service_annotation_prometheus_io_scrape_slow
      - action: replace
        regex: (https?)
        source_labels:
        - __meta_kubernetes_service_annotation_prometheus_io_scheme
        target_label: __scheme__
      - action: replace
        regex: (.+)
        source_labels:
        - __meta_kubernetes_service_annotation_prometheus_io_path
        target_label: __metrics_path__
      - action: replace
        regex: (.+?)(?::d+)?;(d+)
        replacement: $1:$2
        source_labels:
        - __address__
        - __meta_kubernetes_service_annotation_prometheus_io_port
        target_label: __address__
      - action: labelmap
        regex: __meta_kubernetes_service_annotation_prometheus_io_param_(.+)
        replacement: __param_$1
      - action: labelmap
        regex: __meta_kubernetes_service_label_(.+)
      - action: replace
        source_labels:
        - __meta_kubernetes_namespace
        target_label: namespace
      - action: replace
        source_labels:
        - __meta_kubernetes_service_name
        target_label: service
      - action: replace
        source_labels:
        - __meta_kubernetes_pod_node_name
        target_label: node

此時，在重新部署 Prometheus Pod 后，您應該能夠在 Prometheus 控制臺中看到可用的 CoreDNS 指標端點（轉到 Status -> Targets）。

CoreDNS 指標從現在開始可用，并可從 Prometheus 控制臺訪問。

應該檢查哪些指標？

注意：CoreDNS 指標可能因 Kubernetes 版本和平臺而異。在這里，我們使用了 Kubernetes 1.25 和 CoreDNS 1.9.3。您可以在?CoreDNS 存儲庫[4]?中檢查適用于您的版本的指標。

首先，讓我們談談可用性。集群中運行的 CoreDNS 副本數量可能會有所不同，因此最好進行監控，以防出現任何可能影響可用性和性能的變化。

CoreDNS 副本數：如果您想監控在 Kubernetes 環境中運行的 CoreDNS 副本數，您可以通過計算. 此指標提供有關在此類 Pod 上運行的 CoreDNS 構建的信息。coredns_build_info metric

count(coredns_build_info)

從現在開始，讓我們遵循四個黃金信號方法。在本節中，您將學習如何從該角度監控 CoreDNS，測量錯誤、延遲、流量和飽和度。

錯誤 Errors

能夠測量 CoreDNS 服務中的錯誤數量是更好地了解 Kubernetes 集群、應用程序和服務健康狀況的關鍵。如果任何應用程序或內部 Kubernetes 組件從 DNS 服務收到意外錯誤響應，您可能會遇到嚴重的麻煩。當心?SERVFAIL?和?REFUSED?錯誤。在解析 Kubernetes 內部組件和應用程序的名稱時，這些可能意味著問題。

coredns_dns_responses_total：此計數器提供有關 CoreDNS 響應代碼、命名空間和 CoreDNS 實例的數量的信息。您可能希望獲取每個響應代碼的速率。它始終是測量 CoreDNS 實例中的錯誤率的有用方法。

sum(rate(coredns_dns_responses_total{instance=~".*"}[2m])) by (rcode, instance)

延遲 Latency

測量延遲是確保 DNS 服務性能最佳以在 Kubernetes 中正常運行的關鍵。如果延遲很高或隨著時間的推移而增加，則可能表示存在負載問題。如果 CoreDNS 實例過載，您可能會遇到 DNS 名稱解析問題，并預計您的應用程序和 Kubernetes 內部服務會出現延遲甚至中斷。

coredns_dns_request_duration_seconds_bucket：CoreDNS 請求持續時間（以秒為單位）。您可能想要計算第 99 個百分位數，以查看延遲在 CoreDNS 實例之間的分布情況。

histogram_quantile(0.99, sum(rate(coredns_dns_request_duration_seconds_bucket{instance=~".*"}[2m])) by (server,zone,le,instance))

流量 Traffic

CoreDNS 服務正在處理的流量或請求量。監控 CoreDNS 中的流量非常重要，值得定期檢查。觀察流量是否有峰值或任何趨勢變化是保證良好性能和避免問題的關鍵。

coredns_dns_requests_total：每個區域、協議和系列的 DNS 請求計數器。您可能希望按類型（A、AAAA）測量和監控 CoreDNS 請求的速率。?代表 ipv4 查詢，而?是 ipv6 查詢。AAAAA

(sum(rate(coredns_dns_requests_total{instance=~".*"}[2m])) by (type,instance))

飽和度 Saturation

您可以使用系統資源消耗指標（例如 CoreDNS Pod 的 CPU、內存和網絡使用情況）輕松監控 CoreDNS 飽和度。

其他的

CoreDNS 實現了一種緩存機制[5]，允許 DNS 服務緩存記錄長達 3600 秒。此緩存可以顯著降低 CoreDNS 負載并提高性能。

coredns_cache_hits_total：緩存命中計數器。您可能希望通過運行以下查詢來監視緩存命中率。多虧了這個 PromQL 查詢，您可以輕松監控 CoreDNS 緩存命中的拒絕率和成功率。

sum(rate(coredns_cache_hits_total{instance=~".*"}[2m])) by (type,instance)

結論

與 kube-dns 一起，CoreDNS 是可用于在 Kubernetes 環境中實施 DNS 服務的選擇之一。DNS 是 Kubernetes 集群正常運行所必需的，而 CoreDNS 一直是大多數人的首選，因為它的靈活性以及與 kube-dns 相比它解決的問題數量。

如果您想確保您的 Kubernetes 基礎設施健康且正常工作，您必須持續檢查您的 DNS 服務。確保在每個應用程序、操作系統、IT 架構或云環境中正常運行是關鍵。

在本文中，您了解了如何提取 CoreDNS 指標以及如何配置您自己的 Prometheus 實例以從 CoreDNS 端點抓取指標。得益于 CoreDNS 的關鍵指標，您可以輕松地在任何 Kubernetes 環境中開始監控您自己的 CoreDNS。

編輯：黃飛

閱讀全文

cpu(206162) cpu(206162)
內存(72585) 內存(72585)
DNS(19581) DNS(19581)
kubernetes(8556) kubernetes(8556)

Kubernetes架構和核心組件組成 Kubernetes節點“容器運行時”技術分析

Kubernetes 架構簡介 Kubernetes架構如下圖所示：在這張系統架構圖中，我們把服務分為運行在工作節點上的服務和組成集群級別控制板的服務。Kubernetes節點有運行應用容器必備

2020-09-25 15:53:24

2874

leader選舉在kubernetes controller中是如何實現的

在 Kubernetes 的 kube-controller-manager , kube-scheduler, 以及使用 Operator 的底層實現 controller-rumtime 都支持高可用系統中的 leader 選舉。

2022-07-21 10:03:14

1294

Kubernetes 網絡模型如何實現常見網絡任務

Kubernetes 是為運行分布式集群而建立的，分布式系統的本質使得網絡成為 Kubernetes 的核心和必要組成部分，了解 Kubernetes 網絡模型可以使你能夠正確運行、監控和排查應用程序故障。

2022-10-08 11:32:38

807

如何使用Kubernetes實現零停機應用程序

我在本地和托管 Kubernetes 集群方面工作了七年多。我能說的是，容器已經徹底改變了托管格局！它帶來了許多需要復雜設置的設施。擁有多個實例，具有滾動重啟、零停機、健康檢查等功能。以前真是費時

2023-09-01 10:04:36

498

Kubernetes Dashboard實踐學習

關于Kubernetes Dashboard的實踐學習

2020-04-10 14:09:32

Kubernetes Ingress 高可靠部署最佳實踐

摘要：在Kubernetes集群中，Ingress作為集群流量接入層，Ingress的高可靠性顯得尤為重要，今天我們主要探討如何部署一套高性能高可靠的Ingress接入層。簡介

2018-04-17 14:35:22

Kubernetes之路 1 - Java應用資源限制的迷思

摘要：隨著容器技術的成熟，越來越多的企業客戶在企業中選擇Docker和Kubernetes作為應用平臺的基礎。然而在實踐過程中，還會遇到很多具體問題。本文分析并解決了Java應用在容器

2018-03-29 13:06:24

Kubernetes之路 2 - 利用LXCFS提升容器資源可見性

。也可以方便地利用Kubernetes自身的容器管理能力，支持lxcfs進程失效時自動恢復，在集群伸縮時也可以保證節點部署的一致性。這個技巧對于其他類似的監控或者系統擴展都是適用的。另外我們介紹了利用

2018-04-17 14:05:37

Kubernetes平臺中的日志收集方案

十、Kubernetes平臺中日志收集

2019-11-04 09:19:30

Kubernetes的Device Plugin設計解讀

摘要： Kubernetes的生態地位已經確立，可擴展性將是其發力的主戰場。異構計算作為非常重要的新戰場，Kubernetes非常重視。而異構計算需要強大的計算力和高性能網絡，需要提供一種統一的方式

2018-03-12 16:23:37

Kubernetes經驗總結

Kubernetes學習筆記——24 允許外部訪問

2019-06-18 12:10:07

Kubernetes資源配額的詳細步驟

Kubernetes資源配額

2020-03-06 10:18:15

kubernetes v112二進制方式集群部署

kubernetes v112 二進制方式集群部署

2020-05-05 16:30:01

kubernetes系統基本概念

一文帶你看透kubernetes 容器編排系統

2019-11-05 08:26:58

kubernetes部署與應用

kubernetes運維筆記

2019-10-25 13:08:55

kubernetes集群配置

基于v1104版本手動搭建高可用kubernetes 集群

2019-08-19 08:07:44

不吹不黑，今天我們來聊一聊 Kubernetes 落地的三種方式

。那對于這些用戶而言，肯定不能看著別人吃肉自己啃窩窩頭。On Kubernetes 的落地形態其實是一種妥協和中間過程，一方面很難一下子拋棄已有的基礎設施，例如服務治理、監控、網絡拓撲等等，只能在原生

2019-10-12 16:07:03

再次升級！阿里云Kubernetes日志解決方案

摘要：今天阿里云Kubernetes日志解決方案再次升級，為您帶來以下改進： 1、極致部署體驗：只需一條命令一個參數即可完成整個K8S集群的日志解決方案部署。 2、支持更多配置方式：除原生控制臺

2018-05-28 19:08:30

在阿里云Kubernetes容器服務上打造TensorFlow實驗室

GPU的使用，同時支持最新的TensorFLow版本, 對于數據科學家來說既是復雜的，同時也是浪費精力的。在阿里云的Kubernetes集群上，您可以通過簡單的按鈕提交創建一套完整的TensorFlow

2018-05-10 10:24:11

如何在Arm上利用Istio搭建一個基于Kubernetes的Service Mesh平臺

基于Kubernetes的Service Mesh平臺。流程環境要求準備配置環境編譯生成鏡像搭建Kubernetes 環境配置安裝Istio環境要求a. 至少兩臺Arm64主機（歡迎使用Raspberry Pi）b.

2022-03-30 10:59:36

容器開啟數據服務之旅系列（二）：Kubernetes如何助力Spark大數據分析

摘要：容器開啟數據服務之旅系列（二）：Kubernetes如何助力Spark大數據分析（二）：Kubernetes如何助力Spark大數據分析概述本文為大家介紹一種容器化的數據服務Spark

2018-04-17 15:10:33

引以為戒，特斯拉Kubernetes控制臺被黑客攻擊

，特斯拉就可以檢測到Kubernetes pod中產生的可疑流量。最后，不僅要檢測基于地理位置或時間的異常，還要識別是否有異常事件。阿里云容器Kubernetes服務支持資源維度監控，從底層ECS到上

2018-03-12 17:42:31

搭建基于Arm的kubernetes+Istio開發環境

1、如何在Arm平臺上利用Istio搭建一個基于Kubernetes的Service Mesh平臺隨著云計算的普及，越來越多的公司、組織及個人開發者開始將業務轉移至云服務提供商（如Ali，GKE

2022-07-12 15:39:07

淺析Kubernetes

【k8s】Kubernetes基礎概念

2019-09-27 09:11:35

理解和創建Kubernetes對象

Kubernetes對象總結

2019-04-11 15:14:54

請問鴻蒙系統上可以部署kubernetes集群嗎？

鴻蒙系統上可以部署kubernetes集群嗎

2022-06-08 11:16:15

阿里云上Kubernetes集群聯邦

摘要： kubernetes集群讓您能夠方便的部署管理運維容器化的應用。但是實際情況中經常遇到的一些問題，就是單個集群通常無法跨單個云廠商的多個Region，更不用說支持跨跨域不同的云廠商。這樣會給

2018-03-12 17:10:52

阿里云宣布推出Serverless Kubernetes服務 30秒即可完成應用部署

摘要：阿里云宣布推出Serverless Kubernetes服務，容器服務新增Serverless形態。5月2日，阿里云宣布推出Serverless Kubernetes服務，容器服務新增

2018-05-03 15:38:01

阿里云容器Kubernetes監控(一) - 資源監控

中的service或者kubernetes中的ReplicaSet、Deployment等等則沒有太好的辦法從采集的數據中進行反向的抽象，造成單純的容器監控數據無法有效的進行監控數據的聚合和告警，一旦

2018-04-23 14:35:07

阿里云容器Kubernetes監控(一) - 資源監控

2018-04-23 14:35:07

阿里云容器Kubernetes監控(一) - 資源監控

2018-04-23 14:35:07

阿里云容器Kubernetes監控(二) - 使用Grafana展現Pod監控數據

摘要：簡介在kubernetes的監控方案中，Heapster+Influxdb+Grafana的組合相比prometheus等開源方案而言更為簡單直接。而且Heapster在

2018-05-10 15:28:19

在Kubernetes上運行Kubernetes

開源容器編排引擎 Kubernetes 絕對有魔力。一直以來，容器就是個很酷的概念，但事實上，廣泛部署卻十分困難。你幾乎沒法手動管理容器之間的網絡、持續存儲和數百個容器間的自動擴展

2017-09-30 13:33:57

如何部署基于Mesos的Kubernetes集群

kubernetes是一個跨多個計算節點的管理容器化應用的系統，它提供了一系列基本的功能，如應用的自動化部署，維護和擴展等。Mesos是Apache下的開源分布式資源管理框架，它被稱為是分布式系統

2017-10-09 18:04:28

淺談Kubernetes集群的高可用方案

Kubernetes作為容器應用的管理中心，通過對Pod的數量進行監控，并且根據主機或容器失效的狀態將新的Pod調度到其他Node上，實現了應用層的高可用性。針對Kubernetes集群，高可用性

2017-10-11 10:04:47

Kubernetes API詳解

摘要：Kubernetes是Google開源的容器集群管理系統。它構建Ddocker技術之上，為容器化的應用提供資源調度、部署運行、服務發現、擴容縮容等整一套功能，本文節選自

2017-10-12 16:19:35

Kubernetes和Mesos集成的優勢與原理

Kubernetes是一個docker集群管理工具，主要包含資源管理，部署運行，服務發現，擴容縮容等功能，幫助用戶把所有的應用都部署在Docker Container里邊，Kubernetes可以

2017-10-12 17:46:45

Kubernetes網絡隔離NetworkPolicy實驗

Kubernetes的一個重要特性就是要把不同node節點的pod（container）連接起來，無視物理節點的限制。但是在某些應用環境中，比如公有云，不同租戶的pod不應該互通，這個時候就需要網絡

2017-11-28 10:00:25

2515

深入了解kubernetes

2014年出現的kubernetes（又叫k8s）更加炙手可熱，我想大部分人僅僅是聽說過，簡單了解它，但并沒有真正使用過。那今天本文將帶著大家一起走近kubernetes。

2018-02-09 15:56:45

4069

如何在 Intellij IDEA 更高效地將應用部署到容器服務 Kubernetes

前言在之前的一篇文章中，我們介紹了? 如何將一個本地的 Java 應用程序直接部署到阿里云 ECS? ，有不少讀者反饋，如果目前已經在使用阿里云容器服務 Kubernetes 了，那該如何配合這個

2018-12-28 16:06:57

290

一文解讀Kubernetes的重要性

如果你對容器化感興趣并且關注過，可能會聽過許多關于Kubernetes的事情。隨著云開發的重點轉移到容器，Kubernetes等這些容器相關技術已經變得大受歡迎。什么是Kubernetes？為什么這項技術很重要呢？

2019-06-02 10:06:50

7511

預測2020年Kubernetes的五種趨勢

隨著 Kubernetes 的采用率不斷增長，IT 領域在接下來的這一年里應當關注什么？The Enterprisers Project 網站的作者 Kevin Casey 探討了關于 Kubernetes 的五種可能的趨勢。

2020-01-14 11:00:36

3290

為什么有了Docker還要Kubernetes

“一千個讀者眼里有一千個哈姆雷特”。同樣的話也適用于 Kubernetes，同樣的系統在不同的開發人員眼中也是不同的，甚至在不同階段對于它的理解也截然不同。

2020-02-12 12:16:27

2309

如何解決Kubernetes中部署故障及技巧

Kubernetes資源配置中的錯誤，例如在部署（Deployment）和服務（Service）里。

2020-05-04 07:12:00

516

云計算：Kubernetes架構的八個問題解答

Kubernetes的架構非常適合大規模的組織，但是對于中小組織來說，它可能會過于復雜。

2020-08-19 11:24:41

1381

解析Docker、Kubernetes、Openshift的發展歷史及架構

Kubernetes前身是谷歌大規模集群管理系統Brog，它基于容器技術，實現資源管理的自動化，以及跨數據中心資源利用的最大化。Kubernetes于2015年正式對外發布，經過4年多的發展，為容器編排提供強大的解決方案，成為云原生系統的重要支撐。

2020-09-08 10:15:51

3988

首次部署 Kubernetes 應用程序需注意的“陷阱”

根據我的個人經驗，大多數人似乎傾向于通過 Helm 或者手動方式將應用程序甩給 Kubernetes，之后就坐等每天輕松調用的美好生活。但在 GumGum 公司的實踐當中，我們體會到

2020-10-08 14:43:00

1522

云計算的發展：Kubernetes的特性

2020-12-25 17:41:45

439

如何創建Kubernetes jobs和cronjobs？

Kubernetes jobs主要是針對短時和批量的工作負載。

2021-06-15 14:04:31

1426

Kubernetes入門指南電子版下載

Kubernetes入門指南電子版下載

2021-07-12 10:05:47

最常用的11款Kubernetes工具

“到 2021 年，幾乎所有接觸過云基礎設施的人都熟悉 Kubernetes 項目。簡單地說，Kubernetes 是一個非常強大的容器編排平臺，并且 Kubernetes 社區一直在共享工具，這有

2021-08-23 10:43:00

1863

深入研究Kubernetes調度

“本文從 Pod 和節點的配置開始，介紹了 Kubernetes Scheduler 框架、擴展點、API 以及可能發生的與資源相關的瓶頸，并展示了性能調整設置，涵蓋了 Kubernetes 中調度

2021-08-23 10:39:02

1151

如何獲取采集服務器Kubernetes監控指標

對比 node-exporter用于采集服務器層面的運行指標，包括機器的loadavg、filesystem、meminfo等基礎監控，類似于傳統主機監控維度的zabbix-agent

2021-09-26 10:13:10

1196

解析Kubernetes監控指標獲取方式對比

對比 node-exporter用于采集服務器層面的運行指標，包括機器的loadavg、filesystem、meminfo等基礎監控，類似于傳統主機監控維度的zabbix-agent

2021-09-26 10:45:09

1267

Kubernetes是什么，一文了解Kubernetes

不香了。這時候就需要我們的主角 Kubernetes 上場了，先來了解一下 Kubernetes 的基本概念，后面再介紹實踐，由淺入深步步為營。關于 Kubernetes 的基本概念我們將會圍繞如下七點展開：一、Docker 的管理痛點如果想要將 Docker 應用于龐大的

2021-12-21 13:40:17

1548

使用NVIDIA操作符加速Kubernetes

　　Kubernetes 是一個開源的容器編排系統，用于自動化計算機應用程序部署、擴展和管理。它是一個非常流行的工具，可以用于自動展開和回滾、水平擴展、存儲編排等。對于許多組織來說， Kubernetes 是其基礎架構的關鍵組件。

2022-04-11 16:13:37

789

Kubernetes網絡模型介紹以及如何實現常見網絡任務

2022-05-05 20:22:32

1426

Kubernetes-Mesos容器編排系統

./oschina_soft/kubernetes.zip

2022-05-11 10:01:48

KUBERNETES的工作原理是什么

Kubernetes 提供了一個框架，用于部署、管理、擴展和切換分布式容器，這些容器是隨依賴項和配置打包的微服務。

2022-06-10 13:19:25

1419

輕量級Kubernetes-K3S工具介紹

K3s 是一個輕量級的 Kubernetes 發行版，它針對邊緣計算、物聯網等場景進行了高度優化。

2022-06-21 16:50:08

1922

K8S(kubernetes)學習指南

K8S(kubernetes)學習指南

2022-06-29 14:14:24

Kubernetes網絡模型的基礎知識

2022-07-20 09:46:06

879

快速了解kubernetes

Master 即主節點，負責控制整個 kubernetes 集群。它包括 Api Server、Scheduler、Controller 等組成部分。它們都需要和 Etcd 進行交互以存儲數據。

2022-08-03 10:38:20

249

在Kubernetes集群發生網絡異常時如何排查

本文將引入一個思路：“在 Kubernetes 集群發生網絡異常時如何排查”。文章將引入 Kubernetes 集群中網絡排查的思路，包含網絡異常模型，常用工具，并且提出一些案例以供學習。

2022-09-02 09:45:10

3054

Kubernetes 集群的功能

Telepresence 是一個開源工具，可讓您在本地運行單個服務，同時將該服務連接到遠程 Kubernetes 集群。

2022-09-05 10:58:07

762

Kubernetes中如何實現灰度發布

Kubernetes 作為基礎平臺，提供了強大的容器編排能力。但是在其上部署業務和服務治理上，仍然會面對一些復雜性和局限性。在服務治理上，已經有許多成熟的 ServiceMesh 框架用于擴充其能力

2022-09-22 11:33:14

3052

kubernetes是怎么運作的

kubernetes 已經成為容器編排領域的王者，它是基于容器的集群編排引擎，具備擴展集群、滾動升級回滾、彈性伸縮、自動治愈、服務發現等多種特性能力。本文將帶著大家快速了解 kubernetes ，了解我們談論 kubernetes 都是在談論什么。

2022-09-27 09:18:38

556

跟蹤Kubernetes的網絡流量路徑

通過本文，你將了解在 Kubernetes 內外，數據包是如何轉發的，從原始的 Web 請求開始，到托管應用程序的容器。在深入了解在 Kubernetes 集群中數據包如何流轉的細節之前，先明確一下 Kubernetes 對網絡的要求。

2022-10-24 10:22:06

724

Go的 DNS Lookup 的接口語義

遇到過這么一個問題，有童鞋的 Go 程序用 DNS 解析做服務發現（內網用的 CoreDNS 做的域名解析服務器）。

2022-10-25 16:28:23

583

Kubernetes集群的關閉與重啟

在日常對 Kubernetes 集群運行維護的過程中，您可能需要臨時的關閉或者是重啟 Kubernetes 集群對集群進行維護，本文將介紹如何去安全的關閉 K8s 集群以及如何重新啟動集群。

2022-11-07 09:50:58

8576

樹莓派上的Kubernetes

電子發燒友網站提供《樹莓派上的Kubernetes.zip》資料免費下載

2022-11-17 11:19:49

在樹莓派上搭建Kubernetes智能邊緣集群

電子發燒友網站提供《在樹莓派上搭建Kubernetes智能邊緣集群.zip》資料免費下載

2022-12-09 09:20:20

Kubernetes中的網絡模型

在 kubernetes 中，underlay network 中比較典型的例子是通過將宿主機作為路由器設備，Pod 的網絡則通過學習路由條目從而實現跨節點通訊。

2022-12-14 10:07:55

557

如何從零開發Kubernetes Operator？

大多數人使用Kubernetes的方式是使用原生資源（如Pod、Deployment、Service等）部署應用程序。但是，也可以擴展Kubernetes的功能，從而添加滿足特定需求的新業務邏輯，這就是Operator的作用。

2023-01-05 11:27:21

888

帶你快速了解 kubernetes

kubernetes 已經成為容器編排領域的王者，它是基于容器的集群編排引擎，具備擴展集群、滾動升級回滾、彈性伸縮、自動治愈、服務發現等多種特性能力。本文將帶著大家快速了解 kubernetes

2023-01-17 10:00:50

448

Kubernetes的應用部署與訪問

Service是Kubernetes最核心的概念，本質上是篩選具有相同功能的容器，并提供一個統一的入口地址，進而進行負載并分發到后端的Endpoint（容器應用）上。

2023-02-15 10:32:37

648

Kubernetes的集群部署

Kubeadm是一種Kubernetes集群部署工具，通過kubeadm init命令創建master節點，通過 kubeadm join命令把node節點加入到集群中

2023-02-15 10:35:14

822

Kubernetes中的Pod簡易理解

Pod是Kubernetes中非常重要的概念，也是Kubernetes管理的基本單位。正如其名，Pod像一個豌豆莢，可以容納多個container，擁有相同的IP地址。

2023-02-15 10:44:19

871

Kubernetes中的邏輯組件

Kubernetes是生產級別的容器編排系統，其物理集群有Master和Node兩種類型的節點

2023-02-15 10:46:49

894

kubernetes是什么，Kubernetes架構原理詳解

Kubernetes是一個基于容器技術的分布式集群管理系統。它是谷歌在大規模應用容器技術方面數十年經驗的實際成果。因此，支持大規模的集群管理承載著非常多的組件，分布式本身的復雜度非常高。

2023-03-31 10:06:50

394

Kubernetes Operator最佳實踐介紹

kubernetes operator是通過連接主API并watch時間的一組進程，一般會watch有限的資源類型。

2023-04-19 09:16:53

604

探討使用YAML文件定義Kubernetes應用程序

Kubernetes已經占據如何管理集容器化應用程序的核心位置。因此，存在許多定義Kubernetes應用程序的約定文件格式，包括YAML、JSON、INI等。

2023-04-20 10:03:02

326

如何用zabbix的實現主機監控

Zabbix是企業級分布式開源監控解決方案。可以對應用服務，數據庫，網絡，操作系統等提供7x24小時的監控，在6.x版本開始也新增了Kubernetes監控功能；本文主要介紹如何用zabbix的實現主機監控。

2023-05-05 10:34:25

1041

Kubernetes是怎樣工作的？

Kubernetes 是一個可移植、可擴展的開源平臺，用于管理容器化工作負載和服務，有助于聲明式配置和自動化，它擁有龐大且快速發展的生態系統，Kubernetes 服務、支持和工具隨處可見

2023-05-12 16:13:58

288

Kubernetes特性有哪些？

本文將介紹Kubernetes 的重要特性，這將有助于您更深入地了解 Kubernetes 的功能概念。

2023-05-12 16:16:50

605

Kubernetes多租戶集群的概念和常見的應用模式

KaaS 多租戶方案通常與云服務提供商有關。在這種場景下，業務平臺的服務通過 Kubernetes 控制平面直接暴露給不同租戶的用戶。最終用戶可以使用服務提供商提供的 Kubernetes API 或其他擴展 API。

2023-05-15 16:13:54

822

Kubernetes Pod如何獨立工作

在學習 Kubernetes 網絡模型的過程中，了解各種網絡組件的作用以及如何交互非常重要。本文就介紹了各種網絡組件在 Kubernetes 集群中是如何交互的，以及如何幫助每個 Pod 都能獲取 IP 地址。

2023-05-16 14:29:04

405

Kubernetes 監控利器功能特性

Kubeshark 是專為 Kubernetes 設計的 API 流量分析器，它提供實時的 K8s 協議級別的可見性，可以捕獲和監控所有在容器、Pod、節點和集群之間進出和流動的流量和負載。可以把它想象成專門針對 Kubernetes 重新發明的 TCPDump 和 Wireshark 工具。

2023-05-17 16:10:38

365

各種網絡組件在 Kubernetes 集群中是如何交互的

在 Kubernetes 中有多種網絡設置方法，以及 container runtime 的各種選項。這篇文章將使用 Flannel 作為 network provider，并使用 Containered 作為 container runtime。

2023-05-23 09:49:40

516

基于kube-prometheus的大數據平臺監控系統設計

本文介紹了如何基于 kube-prometheus 設計一個監控系統，以靈活簡單的方式對 kubernetes 上的應用進行指標采集，并實現監控報警功能。

2023-05-30 17:02:27

411

Awesome 工具如何更好地管理Kubernetes

應用程序，那么 Kubernetes 是必備工具之一。有數百種工具可與 Kubernetes 配合使用以添加更多功能。我說的是用于更好地管理，安全性，儀表板和 Kubernetes 集群監控的工具

2023-06-25 16:12:13

332

基于Prometheus的全方位監控平臺設計

Kubernetes集群規模大、動態變化快，而且容器化應用部署和服務治理機制的普及，傳統的基礎設施監控方式已經無法滿足Kubernetes集群的監控需求。

2023-06-29 11:37:31

540

ChatGPT團隊是如何使用Kubernetes的

在本文中，OpenAI 的工程師團隊分享了他們在 Kubernetes 集群擴展過程中遇到的各種挑戰和解決方案，以及他們取得的性能和效果。

2023-07-06 11:17:27

299

Commvault：護航Kubernetes，不止Kubernetes

Kubernetes已經不再是只存在于路線圖中的未來產品。事實上，幾乎所有（94%）已經采用容器的企業都在使用Kubernetes，大多數（86%）企業甚至認為它對他們的運營至關重要。這并不令人意外，Kubernetes正在幫助企業推進高效的云遷移，加強靈活性，進行容器編排，強化工作負載移動性。

2023-07-07 14:42:13

278