在K8S中，集群可以做哪些优化？

来源：cnblogs　　作者：黄嘉波　　时间：2024/2/2 9:16:58　　对本文有异议

在Kubernetes（简称K8s）集群中，可以进行多种优化以提升性能、稳定性和资源利用率。以下是一些常见的优化措施：

控制面组件优化：
- kube-apiserver 高可用与扩展：通过配置多个API服务器实例并使用负载均衡器分发请求，确保即使单个节点故障也不会影响服务；设置合适的内存和CPU限制，监控其性能指标。
- etcd 集群优化：部署高可用的etcd集群，并根据集群规模动态扩展etcd节点数；将etcd存储放在SSD上提高读写性能；调整--quota-backend-bytes参数增大存储容量限制。
- kube-scheduler 和 kube-controller-manager 优化：设置合理的调度策略、参数调优、启用 leader election 并且考虑预加载 informer 缓存以减少延迟。
网络优化：
- CoreDNS 相关优化：增加 CoreDNS 副本数量以分散负载，使用缓存减少对上游 DNS 的查询次数；考虑启用 IPVS 模式代替 iptables 进行服务转发以提高大规模场景下的性能。
- CNI 插件优化：选择高性能或适合特定应用场景的 CNI 插件，如 Calico、Flannel 或 Canal，并根据需要调整网络策略和配置。
资源管理与调度优化：
- Pod 级别资源配额与限制：为 namespace 或 Pod 设置资源配额，防止资源滥用；合理设置容器的 CPU 和内存请求与限制，以便更精确地调度和避免资源争抢。
- 亲和性与反亲和性规则：利用 NodeAffinity 和 PodAffinity 实现应用之间的紧密耦合或分离，优化资源分布。
- 滚动更新策略优化：调整 Deployment 的滚动更新参数（如 maxSurge 和 maxUnavailable），实现平滑升级而尽量不影响整体服务。
内核参数调优：
- 根据 Kubernetes 工作负载特点，调整 Linux 内核参数，例如 TCP 超时、连接队列长度、内存分配策略等，以适应容器环境。
硬件与架构优化：
- 使用 SSD 存储而非 HDD，尤其是在处理大量IO操作的应用场景下。
- 合理规划节点角色，将工作负载和系统服务节点分离。
- 适当扩大节点规格，根据业务需求提供足够的计算和存储资源。
监控与日志：
- 完善集群监控体系，包括但不限于资源利用率、节点健康状况、Pod状态、网络流量等关键指标的监控。
- 对异常事件及时响应，结合自动化运维工具进行故障恢复和性能调优。
持久化存储优化：
- 根据不同的应用程序需求选择合适的持久化存储解决方案，比如本地存储、云存储或者分布式存储，并对其进行性能调优。
安全优化：
- 开启 RBAC 权限控制，实施最小权限原则。
- 定期审计集群安全性，更新补丁及修复漏洞。
- 使用网络策略限制不必要的通信，提高集群内部的安全隔离性。