容器编排

编程范式

API对象，用于描述应用，为应用提供各种各样的服务。为了使用这些API对象提供的能力，需要编写一个对应的YAML文件交给Kubernetes。这个YAML文件是kubernetes声明式API所必须具备的一个要素。

命令式命令行操作

容器的编排操作都是基于命令行。比如，要修改容器的镜像：

通过kubectl set image和kubectl edit命令直接修改kubernetes里面的API对象
通过修改本地YAML文件，然后使用kubectl replace命令完成镜像的更新操作

第二种方法，基于YAML文件的操作就是“声明式API”吗？显然不是。第二种方式称为命令式配置文件操作。处理方式与第一种没有区别，只不过把命令行参数写在配置文件中。

声明式API操作

kubectl apply命令，就是声明式API。

执行的操作

声明式API

命令式操作

异同

创建容器

kubectl apply

kubectl create

效果一样

修改容器配置

kubectl apply

kubectl replace

apply都可以，create需要更换命令才行

这两者的本质区别：

create到replace是使用新的YAML文件中的API对象替换原有的API对象
apply 是执行一个对原有API对象的PATCH操作
kube-apiserver在响应命令式请求（如 kubectl replace）的时候，一次只能处理一个写请求，否则会产生冲突的可能
对于声明式请求（如 kubectl apply），一次能处理多个写操作，并且具备Merge能力

声明式API的定义：

需要提交一个定义好的API对象来“声明”，我们所期望的状态是什么样子
声明式API允许有多个API写端，以PATCH的方式对API对象进行修改，而无需关心本地原始YAML文件的内容
在完全无需外界干预的情况下，基于对API对象的增删改查，完成对“实际状态”和“期望状态”的调谐（Reconcile）过程

声明式API才是kubernetes项目编排能力“赖以生存”的核心所在。

kubernetes编程范式：如何使用控制器模式，同kubernetes里API对象的“增删改查”进行协作，进而完成用户业务逻辑的编写过程。

Istio

以Istio项目为例，它是一个基于kubernetes项目的微服务治理框架。架构如下所示：

Istio最根本的组件，是运行在每一个应用Pod里的Envoy容器（网络代理）。把每个代理服务以sidecar容器的方式，运行在了每一个被治理的应用Pod中。

Envoy容器是Lyft公司推出的一个高性能C++网络代理。Pod中的所有容器都共享同一个Network Namespace。所以Enovy容器就能够通过配置Pod的iptables规则，把整个Pod的进出流量都接管下来。

Istio的控制层（Control Plane）里的Pilot组件，就能够通过调用每个Envoy容器的API，对整个Envoy代理进行配置，从而实现微服务治理。

假设这个 Istio 架构图左边的 Pod 是已经在运行的应用，而右边的 Pod 则是我们刚刚上线的应用的新版本
这时候，Pilot 通过调节这两 Pod 里的 Envoy 容器的配置，从而将 90% 的流量分配给旧版本的应用，将 10% 的流量分配给新版本应用，并且，还可以在后续的过程中随时调整
这样，一个典型的“灰度发布”的场景就完成了
比如，Istio 可以调节这个流量从90%-10%，改到 80%-20%，再到 50%-50%，最后到 0%-100%，就完成了这个灰度发布的过程

更重要的是，整个微服务治理的过程中，无论是对Envoy容器的部署，还是对Envoy代理的配置，用户和应用都是“无感”的。Istio项目使用，kubernetes中的Dynamic Admission Control功能，实现上述的“无感”操作。在kubernetes项目中，当一个Pod或者任何API对象被提交给APIServer之后，总有一些“初始化“性质的工作（如，自动为所有Pod加上某些标签）需要在它们被kubernetes项目正式处理之前进行。

初始化操作的实现借助的是Admission功能，它是kubernetes项目里一组被称为Admission Controller的代码，可以选择性地被编译进APIServer中，在API对象创建之后被立刻调用到。当需要使用Admission Controller的时候，需要重新编译并启动APIServer，这种方式很麻烦，因此提供了一种热插拔的Admission机制，就是Dynamic Admission Controller，也叫作Initializer。

Istio的具体过程：

apiVersion: v1
kind: Pod
metadata:
  name: myapp-pod
  labels:
    app: myapp
spec:
  containers:
  - name: myapp-container
    image: busybox
    command: ['sh', '-c', 'echo Hello Kubernetes! && sleep 3600']

Pod中有一个容器，Istio项目需要完成的是，在这个Pod YAML被提交给kubernetes后，在它对应的API对象中自动加上Envoy容器的配置，编程如下：

apiVersion: v1
kind: Pod
metadata:
  name: myapp-pod
  labels:
    app: myapp
spec:
  containers:
  - name: myapp-container
    image: busybox
    command: ['sh', '-c', 'echo Hello Kubernetes! && sleep 3600']
  - name: envoy
    image: lyft/envoy:845747b88f102c0fd262ab234308e9e22f693a1
    command: ["/usr/local/bin/envoy"]
    ...

被Istio处理后，Pod中除了有一个自定义的容器还会有一个叫envoy的容器，它就是Istio要使用的Envoy代理。Istio通过编写一个用来给Pod自动注入Envoy容器的Initializer，做到在用户和应用无感的情况下，完成上述操作。

Istio将这个容器本身的定义，以ConfigMap（名字叫envoy-initializer）的方式保存在kubernetes当中。

apiVersion: v1
kind: ConfigMap
metadata:
  name: envoy-initializer
data:
  config: |
    containers:
      - name: envoy
        image: lyft/envoy:845747db88f102c0fd262ab234308e9e22f693a1
        command: ["/usr/local/bin/envoy"]
        args:
          - "--concurrency 4"
          - "--config-path /etc/envoy/envoy.json"
          - "--mode serve"
        ports:
          - containerPort: 80
            protocol: TCP
        resources:
          limits:
            cpu: "1000m"
            memory: "512Mi"
          requests:
            cpu: "100m"
            memory: "64Mi"
        volumeMounts:
          - name: envoy-conf
            mountPath: /etc/envoy
    volumes:
      - name: envoy-conf
        configMap:
          name: envoy

这个ConfigMap包括两部分，containers字段和volumes字段。

Initializer要完成的工作是把这部分Envoy相关的字段，自动添加到用户提交的Pod的API对象里。用户提交的Pod中本来就有containers和volumes字段，所有kubernetes在处理这样的更新请求的时，类似于git merge的操作，将两部分内容合并在一起。在Initializer更新用户的Pod对象时，必须用到PATCH API，这正式声明式API最主要的能力。

Istio将一个编写好的Initializer，作为一个Pod部署在kubernetes中，这个Pod的定义如下：

apiVersion: v1
kind: Pod
metadata:
  labels:
    app: envoy-initializer
  name: envoy-initializer
spec:
  containers:
    - name: envoy-initializer
      image: envoy-initializer:0.0.1
      imagePullPolicy: Always

这是一个事先编写好的“自定义控制器（custom controller）”。这个Initializer控制器，不断获取到“实际状态”（就是用户创建的Pod），它的“期望状态”就是在这个Pod中添加Envoy容器的定义。

在Kubernetes中，一个控制器，就是一个死循环，不断地获取“实际状态”，然后与“期望状态”作对比，并以此为依据决定下一步操作，如下所示：

for {
  // 获取新创建的 Pod
  pod := client.GetLatestPod()
  // Diff 一下，检查是否已经初始化过
  if !isInitialized(pod) {
    // 没有？那就来初始化一下
    doSomething(pod)
  }
}

如果这个Pod中已经添加过Envoy容器，那就放过这个pod，进入下一个检查周期
如果还没有添加Envoy容器，那就进行Initializer操作，即修改这个Pod的API对象

Initializer的工作逻辑

从APIServer中获取ConfigMap
把ConfigMap中存储的containers和volumes字段，直接添加到一个空的Pod对象里
Initializer使用这个TwoWayMergePatch的patch数据，调用kubernetes的client，发起一个PATCH请求
用户提交的Pod对象里，就自动加上了Envoy容器相关的字段

kubernetes的API库中，有一个方法，使得我们可以直接使用新旧两个Pod对象，生成一个TwoWayMergePatch。

// 步骤一
func doSomething(pod) {
  cm := client.Get(ConfigMap, "envoy-initializer")
}

// 步骤二
func doSomething(pod) {
  cm := client.Get(ConfigMap, "envoy-initializer")

  newPod := Pod{}
  newPod.Spec.Containers = cm.Containers
  newPod.Spec.Volumes = cm.Volumes
}

// 步骤三
func doSomething(pod) {
  cm := client.Get(ConfigMap, "envoy-initializer")

  newPod := Pod{}
  newPod.Spec.Containers = cm.Containers
  newPod.Spec.Volumes = cm.Volumes

  // 生成 patch 数据
  patchBytes := strategicpatch.CreateTwoWayMergePatch(pod, newPod)

  // 发起 PATCH 请求，修改这个 pod 对象
  client.Patch(pod.Name, patchBytes)
}

配置Initializer操作

创建InitializerConfiguration文件

通过配置，来指定对什么样的资源进行Initializer操作，如下例子：

apiVersion: admissionregistration.k8s.io/v1alpha1
kind: InitializerConfiguration
metadata:
  name: envoy-config
initializers:
  // 这个名字必须至少包括两个 "."
  - name: envoy.initializer.kubernetes.io
    rules:
      - apiGroups:
          - ""   // "" 就是 core API Group 的意思
        apiVersions:
          - v1
        resources:
          - pods

这个配置意味着kubernetes对所有pod进行Initializer操作，并且指定了负责这个操作的Initializer叫envoy-initializer。

这个InitializerConfiguration创建后，kubernetes就会自动把这个Initializer的名字，加到每个新创建的Pod的metadata中，如下所示：

apiVersion: v1
kind: Pod
metadata:
  initializers:
    pending:
      - name: envoy.initializer.kubernetes.io
  name: myapp-pod
  labels:
    app: myapp
...

每个新创建的Pod都会自动携带metadata.initializers.pending的metadata信息。这个metadata信息，就是Initializer控制器判断这个Pod有没有执行过自己所负责的初始化操作的重要依据。

当在Initializer中完成了要做的操作后，一定要将这个metadata.initializers.pending标志清除。

添加annotation字段

除了创建配置文件，也可在具体的Pod的annotation里添加一个字段，如下所示：

apiVersion: v1
kind: Pod
metadata
  annotations:
    "initializer.kubernetes.io/envoy": "true"
    ...

添加后，就会使用到前面定义的envoy-Initializer。

Istio项目的核心就是由无数个运行在应用Pod中的Envoy容器组成的服务代理网格。这也就是server mesh的含义。这个机制实现的原理是借助于kubernetes能够对API对象进行在线更新的能力，这就是kubernetes“声明式API”的独特之处。

Istio项目对sidecar容器的巧妙设计，对Initializer操作的合理利用，都依托于kubernetes的声明式API和它所提供的各种编排能力。Istio项目是kubernetes的集大成者。Istio项目部署完成，会在kubernetes里创建大约43个API对象。

声明式API

在kubernetes项目中，一个API对象在Etcd里的完整资源路径，由三部分组成：

Group（API组）
Version（API版本）
Resource（API资源类型）

通过这样的结构，整个Kubernetes里的所有API对象，实际上就是如下的树形结构：

API对象的组织方式是层层递进的。

apiVersion: batch/v2alpha1
kind: CronJob
...

上面的例子中：

Group（API组）： batch
Version（API版本）： v2alpha1
Resource（API资源类型）： CronJob

提交给kubernetes后，平台就把YAML文件中描述的内容转换成kubernetes里的一个CronJob对象。

解析的过程如下：

匹配Group，判断是否为核心API：
1. 核心API，如pod、Node等，是不需要Group的，因为它们的Group是""，kubernetes会在/api这个层级进行下一步的匹配过程
2. 非核心API，kubernetes就必须在/apis这个层级查找到对应的Group，API Group的分类是以对象功能为依据的
在对应的Group中匹配Version，同一种API对象可以有多个版本，这是kubernetes进行API版本化管理的重要手段，对于会影响到用户的变更就可以通过升级新版本来处理，从而保证了向后兼容
匹配Resource，匹配到正确的版本后，APIServer就会根据Resource创建对应的API对象

具体的执行过程如下图所示：

发起创建API对象的POST请求后，编写的YAML的信息就被提交给了APIServer，APIServer会过滤这个请求，并完成前置工作（授权、超时处理、审计等）
请求进入MUX和Routes（APIServer完成URL和Handler绑定的场所），APIServer的Handler要做的事情就是按照上面过程找到对应的API对象类型的定义
根据API对象类型定义，使用用户提交的YAML文件里面的字段，创建一个对象。在这个过程中，APIServer会进行一个Convert工作，把用户提交的YAML文件，转换成一个叫作Super Version的对象（该API资源类型所有版本的字段全集），用户提交的不同版本的YAML文件，都可以使用这个Super Version对象来处理
APIServer进行Admission()和Validation()操作。Admission Controller 和 Initializer属于Admission的功能，Validation,负责校验每个字段是否合法，被验证过的API对象保存在APIServer的Registry数据结构中。【只要一个API对象的定义能够在Registry中查到，那就是一个有效的对象】
APIServer把验证过的API对象转换成用户最初提交的版本，进行序列化操作，并调用Etcd的API把它保存起来。由此可见APIServer的重要性，同时要兼顾性能、API完备性、版本化、向后兼容等，因此在APIServer中大量使用Go语言的代码生成功能，来自动化诸如Convert、DeepCopy等与API资源相关的操作。

这导致要添加一个kubernetes风格的API非常困难。

添加自定义API对象

第一步，让kubernetes认识这个自定义的API对象

在kubernetes v1.7之后，添加了全新的API插件机制CRD，使得自定义API变得容易很多。CRD（custom Resource Definition），允许用户在kubernetes中添加与Pod、Node类似的新的API资源类型，即自定义API资源。

例如，添加一个叫Network的自定义API资源类型，它的作用是一旦用户创建了一个Network对象，那么Kubernetes就会使用这个对象定义的网络参数，调用真实的网络插件（如Neutron项目），为用户创建一个真正的“网络”。这样，将来创建的Pod就可以声明使用这个网络。

这个Network对象的YAML文件，如下，称为一个自定义API资源，CR（Custon Resource）：

Group（API组）： samplecrd.k8s.io
Version（API版本）： v1
Resource（API资源类型）： Network

apiVersion: samplecrd.k8s.io/v1
kind: Network
metadata:
  name: example-network
spec:
  cidr: "192.168.0.0/16"
  gateway: "192.168.0.1"

为了让Kubernetes能够认识这个CR，需要让kubernetes知道CR对应的宏观定义，即CRD。所以需要编写一个CRD对应的YAML文件，如下所示。

apiVersion: apiextensions.k8s.io/v1beta1
kind: CustomResourceDefinition
metadata:
  name: networks.samplecrd.k8s.io
spec:
  group: samplecrd.k8s.io
  version: v1
  names:
    kind: Network
    plural: networks     # 复数
  scope: Namespaced

在这个CRD的定义中：

Group（API组）： apiextensions.k8s.io
Version（API版本）： v1beta1
Resource（API资源类型）： CustomResourceDefinition

在这个CRD中定义了一个新的资源类型：

Group（API组）： samplecrd.k8s.io
Version（API版本）： v1
Resource（API资源类型）： Network
scope：Namespaced，表示这是一个属于Namespace的对象，隔离于不同namespace中

这些内容就是上面自定义的Network对象。有了这个CRD，kubernetes就能处理所有声明为samplecrd.k8s.io/v1/network类型的YAML文件。

第二步，让kubernetes认识自定义的API对象中的字段

编写代码实现。首先，在$GOPATH下创建一个结构如下的项目：

tree $GOPATH/src/github.com/<your-name>/k8s-controller-custom-resource
.
├── controller.go
├── crd
│   └── network.yaml
├── example
│   └── example-network.yaml
├── main.go
└── pkg
    └── apis
        └── samplecrd
            ├── register.go     # 存放全局变量
            └── v1
                ├── doc.go
                ├── register.go # APIServer完成服务器服务器端的注册，客户端的注册在这里完成
                └── types.go    # 定义对Network对象的完整描述

其中，pkg/api/samplecrd是API组的名字，v1是版本。register.go的代码如下：

package samplecrd

const (
 GroupName = "samplecrd.k8s.io"
 Version   = "v1"
)

doc.go （Golang的文档源文件），代码如下：

// +k8s:deepcopy-gen=package

/* 这里是对代码的注释，不属于这个源文件
   +<tag_name>[=value]格式的注释，就是kubernetes进行代码生成要用的Annotation风格的注释
   +k8s:deepcopy-gen=package意思是，请为整个v1包里的所有类型定义自动生成DeepCopy方法
*/

// +groupName=samplecrd.k8s.io

/* 这里是对代码的注释，不属于这个源文件
   +groupName=samplecrd.k8s.io，定义了这个包对应的API组的名字
*/

package v1

这些定义在doc.go文件的注释，起到的是全局的代码生成控制的作用，也被称为Global Tags。

types.go文件，它的作用就是定义一个Network类型有哪些字段（比如，spec字段里面的内容），代码如下：

package v1
...
/* +genclient，代码生成注释的意思是为下面这个API资源类型生成对应的Client代码
   +genclient:noStatus，表示这个API类型定义中没有Status字段，否则生成的Client会自动带上UpdateStatus方法
*/

// +genclient
// +genclient:noStatus

/* 下面的这个注释表示，在生成DeepCopy的时候，实现kubernetes提供的runtime.Object接口
   否则在某些kubernetes版本中会出现编译错误
   这是一个固定操作
*/

// +k8s:deepcopy-gen:interfaces=k8s.io/apimachinery/pkg/runtime.Object

// Network describes a Network resource
type Network struct {
 // TypeMeta is the metadata for the resource, like kind and apiversion
 metav1.TypeMeta `json:",inline"`
 // ObjectMeta contains the metadata for the particular object, including
 // things like...
 //  - name
 //  - namespace
 //  - self link
 //  - labels
 //  - ... etc ...
 metav1.ObjectMeta `json:"metadata,omitempty"`

 Spec networkspec `json:"spec"`
}
// networkspec is the spec for a Network resource
type networkspec struct {
 Cidr    string `json:"cidr"`  //反引号中内容表示，该字段被转换为JSON格式后的名字，即在YAML文件里的字段名字
 Gateway string `json:"gateway"`
}

// +k8s:deepcopy-gen:interfaces=k8s.io/apimachinery/pkg/runtime.Object

// NetworkList is a list of Network resources
type NetworkList struct {       //描述一组Network对象应该包括哪些字段
 metav1.TypeMeta `json:",inline"`
 metav1.ListMeta `json:"metadata"`

 Items []Network `json:"items"`
}

Network类型定义方法和标准的kubernetes对象一样，包括TypeMeta（API元数据）和ObjectMeta字段（对象元数据）。

注意，+genclient写在Network类型（主类型）上，而不是NetworkList类型（返回值类型）上。

registry.go(pkg/apis/samplecrd/v1/register.go,定义了如下的一个addKnowTypes()方法：

package v1
...
// addKnownTypes adds our types to the API scheme by registering
// Network and NetworkList
func addKnownTypes(scheme *runtime.Scheme) error {
 scheme.AddKnownTypes(
  SchemeGroupVersion,
  &Network{},
  &NetworkList{},
 )

 // register the type in the scheme
 metav1.AddToGroupVersion(scheme, SchemeGroupVersion)
 return nil
}

有了这个方法，kubernetes就能够在后面生成的client是知道Network以及NetworkList类型的定义。

通常，register.go文件里面的内容比较固定，使用的时候，资源类型，GruopName、Version等即可。

至此，自定义API对象完成，主要进行了两个部分：

自定义资源类型的API描述，包括：Group、Version、Resource等
自定义资源类型的对象描述，包括：Sepc、Status等

使用kubernetes提供的代码生成工具（k8s.io/code-generator），为上面定义的Network资源类型自动生成clientset、informer和lister，其中clientset就是操作Network对象所需要是使用的客户端。使用方式如下：

# 代码生成的工作目录，也就是我们的项目路径
ROOT_PACKAGE="github.com/resouer/k8s-controller-custom-resource"
# API Group
CUSTOM_RESOURCE_NAME="samplecrd"
# API Version
CUSTOM_RESOURCE_VERSION="v1"

# 安装 k8s.io/code-generator
go get -u k8s.io/code-generator/...
cd $GOPATH/src/k8s.io/code-generator

# 执行代码自动生成，其中 pkg/client 是生成目标目录，pkg/apis 是类型定义目录
./generate-groups.sh all "$ROOT_PACKAGE/pkg/client" "$ROOT_PACKAGE/pkg/apis" "$CUSTOM_RESOURCE_NAME:$CUSTOM_RESOURCE_VERSION"

执行后项目结构如下：

tree
.
├── controller.go
├── crd
│   └── network.yaml
├── example
│   └── example-network.yaml
├── main.go
└── pkg
    ├── apis
    │   └── samplecrd
    │       ├── constants.go
    │       └── v1
    │           ├── doc.go
    │           ├── register.go
    │           ├── types.go
    │           └── zz_generated.deepcopy.go    # 自动生成的DeepCopy代码文件
    └── client      # kubernetes为Network类型生成的客户端库，在编写自定义控制器时用到
        ├── clientset
        ├── informers
        └── listers

使用自定义的API对象：

# 创建CRD
kubectl apply -f crd/network.yaml
customresourcedefinition.apiextensions.k8s.io/networks.samplecrd.k8s.io created

# 查看已经创建的CRD
kubectl get crd
NAME                        CREATED AT
networks.samplecrd.k8s.io   2018-09-15T10:57:12Z

# 创建API对象
kubectl apply -f example/example-network.yaml
network.samplecrd.k8s.io/example-network created

# 获取API对象
kubectl get network
NAME              AGE
example-network   8s

# 查看API对象的详细信息
kubectl describe network example-network
Name:         example-network
Namespace:    default
Labels:       <none>
...API Version:  samplecrd.k8s.io/v1
Kind:         Network
Metadata:
  ...
  Generation:          1
  Resource Version:    468239
  ...
Spec:
  Cidr:     192.168.0.0/16
  Gateway:  192.168.0.1

第三步：为自定义API对象编写控制器

创建出一个自定义API对象，只是完成了kubernetes声明式API的一半工作，接下来还需要为这个API对象编写一个自定义控制器，这样kubernetes才能根据Network API对象的增删改查操作。

声明是API并不像命令式API那样有着明显的执行逻辑，使得基于声明式API的业务功能实现，往往需要通过控制器模式来“监视”API对象的变化（创建或删除），然后以此来决定实际要执行的具体工作。

总体来说，编写自定义控制器代码的过程包括：

编写main函数，定义并初始化一个自定义控制器（Custom Controller），然后启动它
编写自定义控制器的定义
编写控制器里的业务逻辑

func main() {
  ...

  cfg, err := clientcmd.BuildConfigFromFlags(masterURL, kubeconfig)
  ...
  kubeClient, err := kubernetes.NewForConfig(cfg)
  ...
  networkClient, err := clientset.NewForConfig(cfg)
  ...

  networkInformerFactory := informers.NewSharedInformerFactory(networkClient, ...)

  controller := NewController(kubeClient, networkClient,networkInformerFactory.Samplecrd().V1().Networks())

  go networkInformerFactory.Start(stopCh)

  if err = controller.Run(2, stopCh); err != nil {
    glog.Fatalf("Error running controller: %s", err.Error())
  }
}

main函数主要通过三个步骤完成初始化并启动一个自定义控制器的工作：

根据提供的Master配置（APIServer的地址端口和kubeconfig的路径）创建一个kubernetes的client(kubeclient)和Network对象的client（networkclient）
为Network对象创建一个叫作InformerFactory（networkinformerfactory）的工厂，并使用它生成一个Network独享的informer，传递给控制器
启动上述的informer，然后执行controller.Run，启动自定义控制器

如果没有提供Master的配置，main函数会直接使用一种叫InClusterConfig的方式来创建这个client。这种方式假设控制器是以Pod的方式运行在集群中的。因为集群中所有的pod都会默认以volume的形式挂载ServiceAccount，所以控制器就直接使用默认的ServiceAccount数据卷里的授权信息来访问APIServer。

自定义控制器的工作原理

第一步：自定义控制器从APIServer里获取它所关心的对象，这个操作依靠informer（通知器）的代码库完成。informer与API对象是一一对应的。所以传递给自定义控制器的就是API对象的informer。

创建informer工厂时，需要给它传递networkclient，informer使用这个networkclient与APIServer建立连接。informer使用Reflector包来维护这个连接。Reflector使用ListAndWatch方法来获取并监听这些network对象实例的变化。

ListAndWatch方法的首先通过APIServer的LIST API获取最新版的API对象，然后通过WATCH机制来监听这些API的变化：

在ListAndWatch机制下，一旦APIServer有新的对象实例被创建、删除或更新，Reflector都会收到事件通知。该事件以及对应的API对象的组合被以增量的形式放进Delta FIFO Queue中
informer会不断从这个Delta FIFO Queue里读取增量，每拿到一个增量就判断里面的事件类型，然后创建或者更新本地对象的缓存（在kubernetes中称为Store）

每经过resyncPeriod指定时间，Informer维护的本地缓存，都会使用最近一次LIST返回的结果强制更新一次，从而保证换成的有效性。该操作也会触发informer注册的更新事件，但是两个对象的ResourceVersion一样，因此informer不做进一步处理。

如果事件类型是Added，informer就会通知indexer把这个API对象保存到本地缓存，并为它创建索引。如果是删除，则从本地缓存中删除这个对象。

同步本地缓存是informer的第一个职责，最重要的职责。

第二步：根据事件类型触发事先注册好的ResourceEventHandler，Handler需要在创建控制器的时候注册给它对应的informer。控制器的定义如下：

func NewController(kubeclientset kubernetes.Interface, networkclientset clientset.Interface,networkInformer informers.NetworkInformer) *Controller {
  ...

  controller := &Controller{
    kubeclientset:    kubeclientset,
    networkclientset: networkclientset,
    networksLister:   networkInformer.Lister(),
    networksSynced:   networkInformer.Informer().HasSynced,
    workqueue:        workqueue.NewNamedRateLimitingQueue(...,  "Networks"),
    ...
  }

  networkInformer.Informer().AddEventHandler(
  cache.ResourceEventHandlerFuncs{
    AddFunc: controller.enqueueNetwork,
    UpdateFunc: func(old, new interface{}) {
      oldNetwork := old.(*samplecrdv1.Network)
      newNetwork := new.(*samplecrdv1.Network)
      if oldNetwork.ResourceVersion == newNetwork.ResourceVersion {
        return
      }
    }
    controller.enqueueNetwork(new),
    DeleteFunc: controller.enqueueNetworkForDelete,
  })
  return controller
}

在main函数中创建了kubeclientser和networkclientset，然后使用这两个client和informer初始化自定义控制器。在自定义控制器中设置了一个工作队列（work queue），负责同步informer和控制循环之间的数据。

kubernetes预置了很多工作队列的实现，可直接使用。

为networkinformer注册三个Handler（AddFunc、UpdateFunc、DeleteFunc），分别对应API对象的增删改操作。具体的操作就是将该事件对应的API对象加入到工作队列中（实际入队的是key而不是API对象本身，即<namespace>/<name>）。控制循环将不断从这个工作队列里拿到这些key，然后开始执行真正的控制逻辑。

informer其实是一个带有本地缓存和索引机制的可注册EventHandler的client，它是实现自定义控制器跟APIServer数据同步的重要组件。

第三步：循环控制，main函数最后调用controller.Run()启动循环控制，代码如下：

func (c *Controller) Run(threadiness int, stopCh <-chan struct{}) error {
 ...
  if ok := cache.WaitForCacheSync(stopCh, c.networksSynced); !ok {
    return fmt.Errorf("failed to wait for caches to sync")
  }

  ...
  for i := 0; i < threadiness; i++ {
    go wait.Until(c.runWorker, time.Second, stopCh)
  }

  ...
  return nil
}

等待informer完成一次本地缓存的数据同步操作
通过goroutine启动一个（或者并发启动多个）无限循环的任务（任务的每一个循环周期执行的正式具体的业务逻辑）

自定义控制器的业务逻辑如下：

func (c *Controller) runWorker() {
  for c.processNextWorkItem() {
  }
}

func (c *Controller) processNextWorkItem() bool {
  obj, shutdown := c.workqueue.Get()

  ...

  err := func(obj interface{}) error {
    ...
    if err := c.syncHandler(key); err != nil {
     return fmt.Errorf("error syncing '%s': %s", key, err.Error())
    }

    c.workqueue.Forget(obj)
    ...
    return nil
  }(obj)

  ...

  return true
}

func (c *Controller) syncHandler(key string) error {

  namespace, name, err := cache.SplitMetaNamespaceKey(key)
  ...

  network, err := c.networksLister.Networks(namespace).Get(name)
  if err != nil {
    if errors.IsNotFound(err) {
      glog.Warningf("Network does not exist in local cache: %s/%s, will delete it from Neutron ...",
      namespace, name)

      glog.Warningf("Network: %s/%s does not exist in local cache, will delete it from Neutron ...",
    namespace, name)

     // FIX ME: call Neutron API to delete this network by name.
     //
     // neutron.Delete(namespace, name)

     return nil
  }
    ...

    return err
  }

  glog.Infof("[Neutron] Try to process network: %#v ...", network)

  // FIX ME: Do diff().
  //
  // actualNetwork, exists := neutron.Get(namespace, name)
  //
  // if !exists {
  //   neutron.Create(namespace, name)
  // } else if !reflect.DeepEqual(actualNetwork, network) {
  //   neutron.Update(namespace, name)
  // }

  return nil
}

从Workqueue中出队一个key
syncHandler方法使用这个key，尝试从informer维护的缓存中拿到了它所对应的对象（使用networksLister方法）
如果控制循环从缓存中拿不到这个对象，说明key是通过删除操作被加入到workqueue中，这是调用对应的API把key对应的对象从集群中删除
如果能够获取到对应的对象，就可以执行控制器模式里面的对比期望状态和实际状态的逻辑

自定义控制器拿到的API对象，就是APIServer中保存的期望状态。实际状态直接从集群中获取，通过对比两者的状态来完成一次调谐过程。

最后更新于4年前

这有帮助吗？