基于Prometheus的全方位监控平台--基于Prometheus的HPA自动伸缩一、背景:二、Metrics-server2.1、Metrics-server部署配置三、HorizontalPodAutoscaler3.1、使用HorizontalPodAutoscaler3.2、测试验证四、总结
Prometheus则是目前Kubernetes集群中最常用的监控工具之一,它可以通过Kubernetes API中的 metrics-server
获取 Kubernetes
集群的指标数据,从而实现对Kubernetes集群的应用层面监控,以及基于它们的水平自动伸缩对象 HorizontalPodAutoscaler
。
资源指标管道 Metrics API | Kubernetes
Metrics Server
是一个专门用来收集 Kubernetes 核心资源指标(metrics)的工具,它定时从所有节点的 kubelet 里采集信息,但是对集群的整体性能影响极小,每个节点只大约会占用 1m 的 CPU 和 2MB 的内存,所以性价比非常高。
Metrics Server 工作原理:
图中从右到左的架构组件包括以下内容:
/metrics/resource
和 /stats
kubelet API 端点访问资源指标。/stats
端点获得的每个节点的汇总统计信息。kubectl top
命令使用。Metrics Server 是 Metrics API 的参考实现。Metrics Server 的项目网址(https://github.com/kubernetes-sigs/metrics-server)
xxxxxxxxxx
$ wget https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml && mv components.yaml metrics-server.yaml
修改 YAML 文件
xxxxxxxxxx
apiVersion apps/v1
kind Deployment
metadata
name metrics-server
namespace kube-system
spec
... ...
template
spec
containers
args
--kubelet-insecure-tls
... ...
Metrics Server 默认使用 TLS 协议
,要验证证书才能与 kubelet
实现安全通信,而我们的内网环境里没有这个必要。
默认镜像源非国内,如有下载失败的小伙伴,更改镜像为如下阿里云提供的即可:
xxxxxxxxxx
registry.aliyuncs.com/google_containers/metrics-server:v0.6.1
部署:
xxxxxxxxxx
$ kubectl apply -f metrics-server.yaml
测试验证:
xxxxxxxxxx
$ kubectl top node
$ kubectl top pod -n kube-system
HorizontalPodAutoscaler (HPA)是Kubernetes中的一个控制器,用于动态地调整Pod副本的数量。HPA可以根据Metrics-server提供的指标(如CPU使用率、内存使用率等)或内部指标(如每秒的请求数)来自动调整Pod的副本数量,以确保应用程序具有足够的资源,并且不会浪费资源。
HPA是Kubernetes扩展程序中非常常用的部分,特别是在负载高峰期自动扩展应用程序时。
创建一个 Nginx 应用,定义 Deployment 和 Service,作为自动伸缩的目标对象:
xxxxxxxxxx
apiVersion apps/v1
kind Deployment
metadata
name ngx-hpa-dep
spec
replicas1
selector
matchLabels
app ngx-hpa-dep
template
metadata
labels
app ngx-hpa-dep
spec
containers
image nginx alpine
name nginx
ports
containerPort80
resources
requests
cpu 50m
memory 10Mi
limits
cpu 100m
memory 20Mi
---
apiVersion v1
kind Service
metadata
name ngx-hpa-svc
spec
ports
port80
protocol TCP
targetPort80
selector
app ngx-hpa-dep
注意在它的 spec
里一定要用 resources
字段写清楚资源配额,否则 HorizontalPodAutoscaler
会无法获取 Pod 的指标,也就无法实现自动化扩缩容。
接下来我们要用命令 kubectl autoscale
创建一个 HorizontalPodAutoscaler
的样板 YAML 文件,它有三个参数:
现在我们就来为刚才的 Nginx 应用创建 HorizontalPodAutoscaler,指定 Pod 数量最少 2 个,最多 8 个,CPU 使用率指标设置的小一点,5%,方便我们观察扩容现象:
xxxxxxxxxx
$ kubectl autoscale deploy ngx-hpa-dep --min=2 --max=8 --cpu-percent=5 --dry-run=client -o yaml > nginx-demo-hpa.yaml
YAML 描述文件:
xxxxxxxxxx
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: ngx-hpa
spec:
maxReplicas: 8
minReplicas: 2
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: ngx-hpa-dep
targetCPUUtilizationPercentage: 5
通过kubectl apply
创建这个 HorizontalPodAutoscaler
后,它会发现 Deployment
里的实例只有 1 个,不符合 min 定义的下限的要求,就先扩容到 2 个:
xxxxxxxxxx
# kubectl get deploy
NAME READY UP-TO-DATE AVAILABLE AGE
ngx-hpa-dep 1/2 2 1 95s
下面我们来给 Nginx 加上压力流量,运行一个测试 Pod,使用的镜像是httpd:alpine
,它里面有 HTTP 性能测试工具 ab(Apache Bench):
xxxxxxxxxx
$ kubectl run test -it --image=httpd:alpine -- sh
然后我们向 Nginx 发送一百万个请求,持续 1 分钟,再用 kubectl get hpa
来观察 HorizontalPodAutoscaler
的运行状况:
xxxxxxxxxx
$ ab -c 10 -t 60 -n 1000000 'http://ngx-hpa-svc/'
Metrics Server
大约每 15 秒采集一次数据,所以 HorizontalPodAutoscaler
的自动化扩容和缩容也是按照这个时间点来逐步处理的。
当它发现目标的 CPU 使用率超过了预定的 5% 后,就会以 2 的倍数开始扩容,一直到数量上限,然后持续监控一段时间;
如果 CPU 使用率回落,就会再缩容到最小值 (默认会等待五分钟如果负载没有上去,就会缩小到最低水平,防止抖动)。
xxxxxxxxxx
$ kubectl get po
NAME READY STATUS RESTARTS AGE
ngx-hpa-dep-7984687bb9-86cg5 0/1 ContainerCreating 0 14s
ngx-hpa-dep-7984687bb9-9wpr8 1/1 Running 0 29s
ngx-hpa-dep-7984687bb9-gjzwl 0/1 ContainerCreating 0 14s
ngx-hpa-dep-7984687bb9-k4dpj 0/1 ContainerCreating 0 14s
ngx-hpa-dep-7984687bb9-qkhpq 1/1 Running 0 4m45s
ngx-hpa-dep-7984687bb9-sgxtc 0/1 ContainerCreating 0 14s
ngx-hpa-dep-7984687bb9-xq6xk 1/1 Running 0 6m11s
ngx-hpa-dep-7984687bb9-xs9q8 0/1 ContainerCreating 0 29s
Metrics Server
是Kubernetes中的一个组件,它可以将集群中的散布的资源使用情况数据收集并聚合起来。收集的数据包括节点的CPU和内存使用情况等。Kubernetes
中的其它组件(如HPA)使用。Metrics Server
可以帮助集群管理员和应用程序开发者更好的了解集群中资源的使用情况,并根据这些数据做出合理的决策,例如调整Pod副本数、扩展集群等。Metrics Server
对于Kubernetes中的资源管理和应用程序扩展非常重要。