本文分享自华为云社区《基于istio实现多集群流量治理》,作者: 可以交个朋友。
一 背景
对多云、混合云等异构基础设施的服务治理是Istio重点支持的场景之一。为了提高服务的可用性,避免厂商锁定,企业通常会选择将应用部署在多个地域的多个集群,甚至多云、混合云等多种云环境下,多集群的方案逐步成为企业应用部署的最佳选择。因此越来越多的用户对跨集群的服务治理有着强烈的需求,在此背景下Istio作为ServiceMesh领域的事实标准,推出了多种多集群管理方案。
二 简介
目前Istio支持4种多集群模型。
- 扁平网络单控制面模型
- 扁平网络多控制面模型
- 非扁平网络单控制面模型
- 非扁平网络多控制面模型
多集群的单控制面模型是指多个集群共用同一套Istio控制面,多集群的多控制面模型指每个集群都要独立使用一套Istio控制面,无论是单控制面还是多控制面模型,每套Istio控制面(istiod)都要连接所有集群的Kube-apiserver,并且List-Watch获取所有集群的Service、Endpoint、Pod 、Node
,并控制面集群内或集群间的服务访问,但是只监听主集群的VirtualService、DestinationRule、Gateway
等Istio API对象。
根据集群间网络是否扁平,Istio又对两种控制面模型进行了细分:
- 扁平网络:多集群容器网络通过VPN等技术打通,Pod跨集群访问直通。
- 非扁平网络:每个集群的容器网络都相互隔离,跨集群的访问不能直通,必须通过东西向网关
生产环境上在选择 Istio 多集群模型时,当然需要结合自己的实际场景来决定。如果集群之间的网络是扁平的,那么可以选择扁平网络模型,如果集群之间的网络是隔离的,那么可以选择非扁平网络模型。如果集群规模较小,那么可以选择单控制面模型,如果集群规模较大,那么可以选择多控制面模型。
本文档选择非扁平网络多控制面模型来进行安装说明:安装模型如下所示

非扁平网络多控制面模型有如下特点。
- 不同的集群不需要在一张大网下,即容器网络不需要三层打通,跨集群的服务访问通过
Istio East-West Gateway
转发。
- 每个kubernetes集群的Pod地址范围与服务地址范围没有限制,可以与其他集群重叠,不同集群之间互不干扰
- 每个Kubernetes集群的Sidecar仅连接到本集群的Istio控制面,通信效率更高。
- Istiod只监听主集群的Istio配置,因此
VirtualService、DestinationRule、Gateway
等资源存在冗余复制问题
- 同一集群内部服务访问: Pod之间直接连接;跨集群的服务访问:依赖DNS代理解析其他集群的服务域名,由于集群之间的网络相互隔离,所以依赖Remote集群的
East-west Gateway
中转流量。
三 ClusterMesh 环境搭建
搭建 cluster1 和 cluster2 两个集群,然后每个集群上安装 Istio 控制平面, 且将两者均设置为主集群(primary cluster)。 集群 cluster1 在 network1 网络上,而集群 cluster2 在 network2 网络上。
3.1 前提条件
本次搭建环境信息如下: 使用Kind搭建Kubernetes集群,Kind版本为v0.19.0。 Kubernetes 版本为1.27.3 ; Istio 版本为 1.20.1。

在搭建k8s 集群之前确保Linux节点已安装docker kubectl 和 kind。
下载istioctl二进制
curl -L https://istio.io/downloadIstio | ISTIO_VERSION=1.20.1 TARGET_ARCH=x86_64 sh -
将 istioctl 客户端添加到路径
3.2 Kubernetes集群安装
cluster1和cluster2集群安装脚本如下
- # create-cluster.sh
- # This script handles the creation of multiple clusters using kind and the
- # ability to create and configure an insecure container registry.
- set -o xtrace
- set -o errexit
- set -o nounset
- set -o pipefail
- # shellcheck source=util.sh
- NUM_CLUSTERS="${NUM_CLUSTERS:-2}"
- KIND_IMAGE="${KIND_IMAGE:-}"
- KIND_TAG="${KIND_TAG:-v1.27.3@sha256:3966ac761ae0136263ffdb6cfd4db23ef8a83cba8a463690e98317add2c9ba72}"
- OS="$(uname)"
- function create-clusters() {
- local num_clusters=${1}
- local image_arg=""
- if [[ "${KIND_IMAGE}" ]]; then
- image_arg="--image=${KIND_IMAGE}"
- elif [[ "${KIND_TAG}" ]]; then
- image_arg="--image=kindest/node:${KIND_TAG}"
- fi
- for i in $(seq "${num_clusters}"); do
- kind create cluster --name "cluster${i}" "${image_arg}"
- fixup-cluster "${i}"
- echo
- done
- }
- function fixup-cluster() {
- local i=${1} # cluster num
- if [ "$OS" != "Darwin" ];then
- # Set container IP address as kube API endpoint in order for clusters to reach kube API servers in other clusters.
- local docker_ip
- docker_ip=$(docker inspect --format='{{range .NetworkSettings.Networks}}{{.IPAddress}}{{end}}' "cluster${i}-control-plane")
- kubectl config set-cluster "kind-cluster${i}" --server="https://${docker_ip}:6443"
- fi
- # Simplify context name
- kubectl config rename-context "kind-cluster${i}" "cluster${i}"
- }
- echo "Creating ${NUM_CLUSTERS} clusters"
- create-clusters "${NUM_CLUSTERS}"
- kubectl config use-context cluster1
- echo "Kind CIDR is $(docker network inspect -f '{{$map := index .IPAM.Config 0}}{{index $map "Subnet"}}' kind)"
- echo "Complete"
以上集群安装的过程中,为了istiod能够访问对方集群的apiserver
地址,集群kube-apiserver
的地址设置为master节点的地址。因为是kind部署的集群,两个集群的master节点本质上都是同个宿主机上的docker运行的容器。

确认cluster1和cluster2 是否就绪
3.3 使用MetalLB为网关分配ExternalIP
由于使用的是kind部署多集群,istio南北向网关和东西向网关创建需要创建LoadBalencer service,均需要使用到ExternalIP。这里借助metalLB 实现LB ip地址的分发和宣告。
查看kind搭建集群使用节点子网网段: 172.18.0.0/16
采用metalLB L2模式进行部署。
cluster1中的metalLB配置清单: metallb-config-1.yaml
- ### for cluster1
- ##配置IPAddressPool,用于lbip地址的分配。L2模式下,ippool地址和worker节点处于同一子网即可
- apiVersion: metallb.io/v1beta1
- kind: IPAddressPool
- metadata:
- name: first-pool
- namespace: metallb-system
- spec:
- addresses:
- - 172.18.1.230-172.18.1.240
- ---
- ##配置L2Advertisement,用于地址宣告
- apiVersion: metallb.io/v1beta1
- kind: L2Advertisement
- metadata:
- name: first-adv
- namespace: metallb-system
- spec:
- ipAddressPools:
- - first-pool
cluster2集群中的metalLB配置清单:metallb-config-2.yaml
- ### for cluster2
- ##配置IPAddressPool,用于lbip地址的分配。L2模式下,ippool地址和worker节点处于同一子网即可
- apiVersion: metallb.io/v1beta1
- kind: IPAddressPool
- metadata:
- name: second-pool
- namespace: metallb-system
- spec:
- addresses:
- - 172.18.1.241-172.18.1.252
- ---
- ##配置L2Advertisement,用于地址宣告
- apiVersion: metallb.io/v1beta1
- kind: L2Advertisement
- metadata:
- name: second-adv
- namespace: metallb-system
- spec:
- ipAddressPools:
- - second-pool
使用脚本进行安装
- #!/usr/bin/env bash
- set -o xtrace
- set -o errexit
- set -o nounset
- set -o pipefail
- NUM_CLUSTERS="${NUM_CLUSTERS:-2}"
- for i in $(seq "${NUM_CLUSTERS}"); do
- echo "Starting metallb deployment in cluster${i}"
- kubectl apply -f https://raw.githubusercontent.com/metallb/metallb/v0.13.10/config/manifests/metallb-native.yaml --context "cluster${i}"
- kubectl create secret generic -n metallb-system memberlist --from-literal=secretkey="$(openssl rand -base64 128)" --context "cluster${i}"
- ## 增加等待时间,如果metallb负载没部署起来,创建IPAddressPool L2Advertisement 会报错
- sleep 10
- kubectl apply -f ./metallb-config-${i}.yaml --context "cluster${i}"
- echo "----"
- done
确认metalLB部署情况
