You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

227 lines
13 KiB
Markdown

2 years ago
# 14 | 深入解析Pod对象基本概念
你好我是张磊。今天我和你分享的主题是深入解析Pod对象之基本概念。
在上一篇文章中我详细介绍了Pod这个Kubernetes项目中最重要的概念。而在今天这篇文章中我会和你分享Pod对象的更多细节。
现在你已经非常清楚Pod而不是容器才是Kubernetes项目中的最小编排单位。将这个设计落实到API对象上容器Container就成了Pod属性里的一个普通的字段。那么一个很自然的问题就是到底哪些属性属于Pod对象而又有哪些属性属于Container呢
要彻底理解这个问题你就一定要牢记我在上一篇文章中提到的一个结论Pod扮演的是传统部署环境里“虚拟机”的角色。这样的设计是为了使用户从传统环境虚拟机环境向Kubernetes容器环境的迁移更加平滑。
而如果你能把Pod看成传统环境里的“机器”、把容器看作是运行在这个“机器”里的“用户程序”那么很多关于Pod对象的设计就非常容易理解了。
比如,**凡是调度、网络、存储以及安全相关的属性基本上是Pod 级别的。**
这些属性的共同特征是它们描述的是“机器”这个整体而不是里面运行的“程序”。比如配置这个“机器”的网卡Pod的网络定义配置这个“机器”的磁盘Pod的存储定义配置这个“机器”的防火墙Pod的安全定义。更不用说这台“机器”运行在哪个服务器之上Pod的调度
接下来我就先为你介绍Pod中几个重要字段的含义和用法。
**NodeSelector是一个供用户将Pod与Node进行绑定的字段**,用法如下所示:
```
apiVersion: v1
kind: Pod
...
spec:
nodeSelector:
disktype: ssd
```
这样的一个配置意味着这个Pod永远只能运行在携带了“disktype: ssd”标签Label的节点上否则它将调度失败。
**NodeName**一旦Pod的这个字段被赋值Kubernetes项目就会被认为这个Pod已经经过了调度调度的结果就是赋值的节点名字。所以这个字段一般由调度器负责设置但用户也可以设置它来“骗过”调度器当然这个做法一般是在测试或者调试的时候才会用到。
**HostAliases定义了Pod的hosts文件比如/etc/hosts里的内容**,用法如下:
```
apiVersion: v1
kind: Pod
...
spec:
hostAliases:
- ip: "10.1.2.3"
hostnames:
- "foo.remote"
- "bar.remote"
...
```
在这个Pod的YAML文件中我设置了一组IP和hostname的数据。这样这个Pod启动后/etc/hosts文件的内容将如下所示
```
cat /etc/hosts
# Kubernetes-managed hosts file.
127.0.0.1 localhost
...
10.244.135.10 hostaliases-pod
10.1.2.3 foo.remote
10.1.2.3 bar.remote
```
其中最下面两行记录就是我通过HostAliases字段为Pod设置的。需要指出的是在Kubernetes项目中如果要设置hosts文件里的内容一定要通过这种方法。否则如果直接修改了hosts文件的话在Pod被删除重建之后kubelet会自动覆盖掉被修改的内容。
除了上述跟“机器”相关的配置外,你可能也会发现,**凡是跟容器的Linux Namespace相关的属性也一定是Pod 级别的**。这个原因也很容易理解Pod的设计就是要让它里面的容器尽可能多地共享Linux Namespace仅保留必要的隔离和限制能力。这样Pod模拟出的效果就跟虚拟机里程序间的关系非常类似了。
举个例子在下面这个Pod的YAML文件中我定义了shareProcessNamespace=true
```
apiVersion: v1
kind: Pod
metadata:
name: nginx
spec:
shareProcessNamespace: true
containers:
- name: nginx
image: nginx
- name: shell
image: busybox
stdin: true
tty: true
```
这就意味着这个Pod里的容器要共享PID Namespace。
而在这个YAML文件中我还定义了两个容器一个是nginx容器一个是开启了tty和stdin的shell容器。
我在前面介绍容器基础时曾经讲解过什么是tty和stdin。而在Pod的YAML文件里声明开启它们俩其实等同于设置了docker run里的-it-i即stdin-t即tty参数。
如果你还是不太理解它们俩的作用的话可以直接认为tty就是Linux给用户提供的一个常驻小程序用于接收用户的标准输入返回操作系统的标准输出。当然为了能够在tty中输入信息你还需要同时开启stdin标准输入流
于是这个Pod被创建后你就可以使用shell容器的tty跟这个容器进行交互了。我们一起实践一下
```
$ kubectl create -f nginx.yaml
```
接下来我们使用kubectl attach命令连接到shell容器的tty上
```
$ kubectl attach -it nginx -c shell
```
这样我们就可以在shell容器里执行ps指令查看所有正在运行的进程
```
$ kubectl attach -it nginx -c shell
/ # ps ax
PID USER TIME COMMAND
1 root 0:00 /pause
8 root 0:00 nginx: master process nginx -g daemon off;
14 101 0:00 nginx: worker process
15 root 0:00 sh
21 root 0:00 ps ax
```
可以看到在这个容器里我们不仅可以看到它本身的ps ax指令还可以看到nginx容器的进程以及Infra容器的/pause进程。这就意味着整个Pod里的每个容器的进程对于所有容器来说都是可见的它们共享了同一个PID Namespace。
类似地,**凡是Pod中的容器要共享宿主机的Namespace也一定是Pod级别的定义**,比如:
```
apiVersion: v1
kind: Pod
metadata:
name: nginx
spec:
hostNetwork: true
hostIPC: true
hostPID: true
containers:
- name: nginx
image: nginx
- name: shell
image: busybox
stdin: true
tty: true
```
在这个Pod中我定义了共享宿主机的Network、IPC和PID Namespace。这就意味着这个Pod里的所有容器会直接使用宿主机的网络、直接与宿主机进行IPC通信、看到宿主机里正在运行的所有进程。
当然除了这些属性Pod里最重要的字段当属“Containers”了。而在上一篇文章中我还介绍过“Init Containers”。其实这两个字段都属于Pod对容器的定义内容也完全相同只是Init Containers的生命周期会先于所有的Containers并且严格按照定义的顺序执行。
Kubernetes项目中对Container的定义和Docker相比并没有什么太大区别。我在前面的容器技术概念入门系列文章中和你分享的Image镜像、Command启动命令、workingDir容器的工作目录、Ports容器要开发的端口以及volumeMounts容器要挂载的Volume都是构成Kubernetes项目中Container的主要字段。不过在这里还有这么几个属性值得你额外关注。
**首先是ImagePullPolicy字段**。它定义了镜像拉取的策略。而它之所以是一个Container级别的属性是因为容器镜像本来就是Container定义中的一部分。
ImagePullPolicy的值默认是Always即每次创建Pod都重新拉取一次镜像。另外当容器的镜像是类似于nginx或者nginx:latest这样的名字时ImagePullPolicy也会被认为Always。
而如果它的值被定义为Never或者IfNotPresent则意味着Pod永远不会主动拉取这个镜像或者只在宿主机上不存在这个镜像时才拉取。
**其次是Lifecycle字段**。它定义的是Container Lifecycle Hooks。顾名思义Container Lifecycle Hooks的作用是在容器状态发生变化时触发一系列“钩子”。我们来看这样一个例子
```
apiVersion: v1
kind: Pod
metadata:
name: lifecycle-demo
spec:
containers:
- name: lifecycle-demo-container
image: nginx
lifecycle:
postStart:
exec:
command: ["/bin/sh", "-c", "echo Hello from the postStart handler > /usr/share/message"]
preStop:
exec:
command: ["/usr/sbin/nginx","-s","quit"]
```
这是一个来自Kubernetes官方文档的Pod的YAML文件。它其实非常简单只是定义了一个nginx镜像的容器。不过在这个YAML文件的容器Containers部分你会看到这个容器分别设置了一个postStart和preStop参数。这是什么意思呢
先说postStart吧。它指的是在容器启动后立刻执行一个指定的操作。需要明确的是postStart定义的操作虽然是在Docker容器ENTRYPOINT执行之后但它并不严格保证顺序。也就是说在postStart启动时ENTRYPOINT有可能还没有结束。
当然如果postStart执行超时或者错误Kubernetes会在该Pod的Events中报出该容器启动失败的错误信息导致Pod也处于失败的状态。
而类似地preStop发生的时机则是容器被杀死之前比如收到了SIGKILL信号。而需要明确的是preStop操作的执行是同步的。所以它会阻塞当前的容器杀死流程直到这个Hook定义操作完成之后才允许容器被杀死这跟postStart不一样。
所以,在这个例子中,我们在容器成功启动之后,在/usr/share/message里写入了一句“欢迎信息”即postStart定义的操作。而在这个容器被删除之前我们则先调用了nginx的退出指令即preStop定义的操作从而实现了容器的“优雅退出”。
在熟悉了Pod以及它的Container部分的主要字段之后我再和你分享一下**这样一个的Pod对象在Kubernetes中的生命周期**。
Pod生命周期的变化主要体现在Pod API对象的**Status部分**这是它除了Metadata和Spec之外的第三个重要字段。其中pod.status.phase就是Pod的当前状态它有如下几种可能的情况
1. Pending。这个状态意味着Pod的YAML文件已经提交给了KubernetesAPI对象已经被创建并保存在Etcd当中。但是这个Pod里有些容器因为某种原因而不能被顺利创建。比如调度不成功。
2. Running。这个状态下Pod已经调度成功跟一个具体的节点绑定。它包含的容器都已经创建成功并且至少有一个正在运行中。
3. Succeeded。这个状态意味着Pod里的所有容器都正常运行完毕并且已经退出了。这种情况在运行一次性任务时最为常见。
4. Failed。这个状态下Pod里至少有一个容器以不正常的状态非0的返回码退出。这个状态的出现意味着你得想办法Debug这个容器的应用比如查看Pod的Events和日志。
5. Unknown。这是一个异常状态意味着Pod的状态不能持续地被kubelet汇报给kube-apiserver这很有可能是主从节点Master和Kubelet间的通信出现了问题。
更进一步地Pod对象的Status字段还可以再细分出一组Conditions。这些细分状态的值包括PodScheduled、Ready、Initialized以及Unschedulable。它们主要用于描述造成当前Status的具体原因是什么。
比如Pod当前的Status是Pending对应的Condition是Unschedulable这就意味着它的调度出现了问题。
而其中Ready这个细分状态非常值得我们关注它意味着Pod不仅已经正常启动Running状态而且已经可以对外提供服务了。这两者之间Running和Ready是有区别的你不妨仔细思考一下。
Pod的这些状态信息是我们判断应用运行情况的重要标准尤其是Pod进入了非“Running”状态后你一定要能迅速做出反应根据它所代表的异常情况开始跟踪和定位而不是去手忙脚乱地查阅文档。
## 总结
在今天这篇文章中我详细讲解了Pod API对象介绍了Pod的核心使用方法并分析了Pod和Container在字段上的异同。希望这些讲解能够帮你更好地理解和记忆Pod YAML中的核心字段以及这些字段的准确含义。
实际上Pod API对象是整个Kubernetes体系中最核心的一个概念也是后面我讲解各种控制器时都要用到的。
在学习完这篇文章后,我希望你能仔细阅读$GOPATH/src/k8s.io/kubernetes/vendor/k8s.io/api/core/v1/types.go里type Pod struct 尤其是PodSpec部分的内容。争取做到下次看到一个Pod的YAML文件时不再需要查阅文档就能做到把常用字段及其作用信手拈来。
而在下一篇文章中我会通过大量的实践帮助你巩固和进阶关于Pod API对象核心字段的使用方法敬请期待吧。
## 思考题
你能否举出一些Pod即容器的状态是Running但是应用其实已经停止服务的例子相信Java Web开发者的亲身体会会比较多吧。
感谢你的收听,欢迎你给我留言,也欢迎分享给更多的朋友一起阅读。