gitbook/深入剖析Kubernetes/docs/14406.md
2022-09-03 22:05:03 +08:00

14 KiB
Raw Permalink Blame History

04 | 预习篇 · 小鲸鱼大事记(四):尘埃落定

你好,我是张磊。我今天分享的主题是:小鲸鱼大事记之尘埃落定。

在上一次的分享中我提到伴随着Docker公司一手打造出来的容器技术生态在云计算市场中站稳了脚跟围绕着Docker项目进行的各个层次的集成与创新产品也如雨后春笋般出现在这个新兴市场当中。而Docker公司不失时机地发布了Docker Compose、Swarm和Machine“三件套”在重新定义PaaS的方向上走出了最关键的一步。

这段时间也正是Docker生态创业公司们的春天大量围绕着Docker项目的网络、存储、监控、CI/CD甚至UI项目纷纷出台也涌现出了很多Rancher、Tutum这样在开源与商业上均取得了巨大成功的创业公司。

在2014~2015年间整个容器社区可谓热闹非凡。

这令人兴奋的繁荣背后却浮现出了更多的担忧。这其中最主要的负面情绪是对Docker公司商业化战略的种种顾虑。

事实上很多从业者也都看得明白Docker项目此时已经成为Docker公司一个商业产品。而开源只是Docker公司吸引开发者群体的一个重要手段。不过这么多年来开源社区的商业化其实都是类似的思路无非是高不高调、心不心急的问题罢了。

而真正令大多数人不满意的是Docker公司在Docker开源项目的发展上始终保持着绝对的权威和发言权并在多个场合用实际行动挑战到了其他玩家比如CoreOS、RedHat甚至谷歌和微软的切身利益。

那么这个时候大家的不满也就不再是在GitHub上发发牢骚这么简单了。

相信很多容器领域的老玩家们都听说过Docker项目刚刚兴起时Google也开源了一个在内部使用多年、经历过生产环境验证的Linux容器lmctfyLet Me Container That For You

然而面对Docker项目的强势崛起这个对用户没那么友好的Google容器项目根本没有招架之力。所以知难而退的Google公司向Docker公司表示了合作的愿望关停这个项目和Docker公司共同推进一个中立的容器运行时container runtime库作为Docker项目的核心依赖。

不过Docker公司并没有认同这个明显会削弱自己地位的提议还在不久后自己发布了一个容器运行时库Libcontainer。这次匆忙的、由一家主导的、并带有战略性考量的重构成了Libcontainer被社区长期诟病代码可读性差、可维护性不强的一个重要原因。

至此Docker公司在容器运行时层面上的强硬态度以及Docker项目在高速迭代中表现出来的不稳定和频繁变更的问题开始让社区叫苦不迭。

这种情绪在2015年达到了一个小高潮容器领域的其他几位玩家开始商议“切割”Docker项目的话语权。而“切割”的手段也非常经典那就是成立一个中立的基金会。

于是2015年6月22日由Docker公司牵头CoreOS、Google、RedHat等公司共同宣布Docker公司将Libcontainer捐出并改名为RunC项目交由一个完全中立的基金会管理然后以RunC为依据大家共同制定一套容器和镜像的标准和规范。

这套标准和规范就是OCI Open Container Initiative )。OCI的提出意在将容器运行时和镜像的实现从Docker项目中完全剥离出来。这样做一方面可以改善Docker公司在容器技术上一家独大的现状另一方面也为其他玩家不依赖于Docker项目构建各自的平台层能力提供了可能。

不过不难看出OCI的成立更多的是这些容器玩家出于自身利益进行干涉的一个妥协结果。所以尽管Docker是OCI的发起者和创始成员它却很少在OCI的技术推进和标准制定等事务上扮演关键角色也没有动力去积极地推进这些所谓的标准。

也正是迄今为止OCI组织效率持续低下的根本原因。

眼看着OCI并没能改变Docker公司在容器领域一家独大的现状Google和RedHat等公司于是把与第二把武器摆上了台面。

Docker之所以不担心OCI的威胁原因就在于它的Docker项目是容器生态的事实标准而它所维护的Docker社区也足够庞大。可是一旦这场斗争被转移到容器之上的平台层或者说PaaS层Docker公司的竞争优势便立刻捉襟见肘了。

在这个领域里像Google和RedHat这样的成熟公司都拥有着深厚的技术积累而像CoreOS这样的创业公司也拥有像Etcd这样被广泛使用的开源基础设施项目。

可是Docker公司呢它却只有一个Swarm。

所以这次Google、RedHat等开源基础设施领域玩家们共同牵头发起了一个名为CNCFCloud Native Computing Foundation的基金会。这个基金会的目的其实很容易理解它希望以Kubernetes项目为基础建立一个由开源基础设施领域厂商主导的、按照独立基金会方式运营的平台级社区来对抗以Docker公司为核心的容器商业生态。

而为了打造出这样一条围绕Kubernetes项目的“护城河”CNCF社区就需要至少确保两件事情

  1. Kubernetes项目必须能够在容器编排领域取得足够大的竞争优势

  2. CNCF社区必须以Kubernetes项目为核心覆盖足够多的场景。

我们先来看看CNCF社区如何解决Kubernetes项目在编排领域的竞争力的问题。

在容器编排领域Kubernetes项目需要面对来自Docker公司和Mesos社区两个方向的压力。不难看出Swarm和Mesos实际上分别从两个不同的方向讲出了自己最擅长的故事Swarm擅长的是跟Docker生态的无缝集成而Mesos擅长的则是大规模集群的调度与管理。

这两个方向也是大多数人做容器集群管理项目时最容易想到的两个出发点。也正因为如此Kubernetes项目如果继续在这两个方向上做文章恐怕就不太明智了。

所以这一次Kubernetes选择的应对方式是Borg。

如果你看过Kubernetes项目早期的GitHub Issue和Feature的话就会发现它们大多来自于Borg和Omega系统的内部特性这些特性落到Kubernetes项目上就是Pod、Sidecar等功能和设计模式。

这就解释了为什么Kubernetes发布后很多人“抱怨”其设计思想过于“超前”的原因Kubernetes项目的基础特性并不是几个工程师突然“拍脑袋”想出来的东西而是Google公司在容器化基础设施领域多年来实践经验的沉淀与升华。这正是Kubernetes项目能够从一开始就避免同Swarm和Mesos社区同质化的重要手段。

于是CNCF接下来的任务就是如何把这些先进的思想通过技术手段在开源社区落地并培育出一个认同这些理念的生态这时RedHat就发挥了重要作用。

当时Kubernetes团队规模很小能够投入的工程能力也十分紧张而这恰恰是RedHat的长处。更难得的是RedHat是世界上为数不多的、能真正理解开源社区运作和项目研发真谛的合作伙伴。

所以RedHat与Google联盟的成立不仅保证了RedHat在Kubernetes项目上的影响力也正式开启了容器编排领域“三国鼎立”的局面。

这时我们再重新审视容器生态的格局就不难发现Kubernetes项目、Docker公司和Mesos社区这三大玩家的关系已经发生了微妙的变化。

其中Mesos社区与容器技术的关系更像是“借势”而不是这个领域真正的参与者和领导者。这个事实加上它所属的Apache社区固有的封闭性导致了Mesos社区虽然技术最为成熟却在容器编排领域鲜有创新。

这也是为何Google公司很快就把注意力转向了动作更加激进的Docker公司。

有意思的是Docker公司对Mesos社区也是类似的看法。所以从一开始Docker公司就把应对Kubernetes项目的竞争摆在了首要位置一方面不断强调“Docker Native”的“重要性”另一方面与Kubernetes项目在多个场合进行了直接的碰撞。

不过这次竞争的发展态势很快就超过了Docker公司的预期。

Kubernetes项目并没有跟Swarm项目展开同质化的竞争所以“Docker Native”的说辞并没有太大的杀伤力。相反地Kubernetes项目让人耳目一新的设计理念和号召力很快就构建出了一个与众不同的容器编排与管理的生态。

就这样Kubernetes项目在GitHub上的各项指标开始一骑绝尘将Swarm项目远远地甩在了身后。

有了这个基础CNCF社区就可以放心地解决第二个问题了。

在已经囊括了容器监控事实标准的Prometheus项目之后CNCF社区迅速在成员项目中添加了Fluentd、OpenTracing、CNI等一系列容器生态的知名工具和项目。

而在看到了CNCF社区对用户表现出来的巨大吸引力之后大量的公司和创业团队也开始专门针对CNCF社区而非Docker公司制定推广策略。

面对这样的竞争态势Docker公司决定更进一步。在2016年Docker公司宣布了一个震惊所有人的计划放弃现有的Swarm项目将容器编排和集群管理功能全部内置到Docker项目当中。

显然Docker公司意识到了Swarm项目目前唯一的竞争优势就是跟Docker项目的无缝集成。那么如何让这种优势最大化呢那就是把Swarm内置到Docker项目当中。

实际上从工程角度来看这种做法的风险很大。内置容器编排、集群管理和负载均衡能力固然可以使得Docker项目的边界直接扩大到一个完整的PaaS项目的范畴但这种变更带来的技术复杂度和维护难度长远来看对Docker项目是不利的。

不过在当时的大环境下Docker公司的选择恐怕也带有一丝孤注一掷的意味。

Kubernetes的应对策略则是反其道而行之开始在整个社区推进“民主化”架构从API到容器运行时的每一层Kubernetes项目都为开发者暴露出了可以扩展的插件机制鼓励用户通过代码的方式介入Kubernetes项目的每一个阶段。

Kubernetes项目的这个变革的效果立竿见影很快在整个容器社区中催生出了大量的、基于Kubernetes API和扩展接口的二次创新工作比如

  • 目前热度极高的微服务治理项目Istio
  • 被广泛采用的有状态应用部署框架Operator
  • 还有像Rook这样的开源创业项目它通过Kubernetes的可扩展接口把Ceph这样的重量级产品封装成了简单易用的容器存储插件。

就这样在这种鼓励二次创新的整体氛围当中Kubernetes社区在2016年之后得到了空前的发展。更重要的是不同于之前局限于“打包、发布”这样的PaaS化路线这一次容器社区的繁荣是一次完全以Kubernetes项目为核心的“百家争鸣”

面对Kubernetes社区的崛起和壮大Docker公司也不得不面对自己豪赌失败的现实。但在早前拒绝了微软的天价收购之后Docker公司实际上已经没有什么回旋余地只能选择逐步放弃开源社区而专注于自己的商业化转型。

所以从2017年开始Docker公司先是将Docker项目的容器运行时部分Containerd捐赠给CNCF社区标志着Docker项目已经全面升级成为一个PaaS平台紧接着Docker公司宣布将Docker项目改名为Moby然后交给社区自行维护而Docker公司的商业产品将占有Docker这个注册商标。

Docker公司这些举措背后的含义非常明确它将全面放弃在开源社区同Kubernetes生态的竞争转而专注于自己的商业业务并且通过将Docker项目改名为Moby的举动将原本属于Docker社区的用户转化成了自己的客户。

2017年10月Docker公司出人意料地宣布将在自己的主打产品Docker企业版中内置Kubernetes项目这标志着持续了近两年之久的“编排之争”至此落下帷幕。

2018年1月30日RedHat宣布斥资2.5亿美元收购CoreOS。

2018年3月28日这一切纷争的始作俑者Docker公司的CTO Solomon Hykes宣布辞职曾经纷纷扰扰的容器技术圈子到此尘埃落定。

总结

容器技术圈子在短短几年里发生了很多变数但很多事情其实也都在情理之中。就像Docker这样一家创业公司在通过开源社区的运作取得了巨大的成功之后就不得不面对来自整个云计算产业的竞争和围剿。而这个产业的垄断特性对于Docker这样的技术型创业公司其实天生就不友好。

在这种局势下接受微软的天价收购在大多数人看来都是一个非常明智和实际的选择。可是Solomon Hykes却多少带有一些理想主义的影子既然不甘于“寄人篱下”那他就必须带领Docker公司去对抗来自整个云计算产业的压力。

只不过Docker公司最后选择的对抗方式是将开源项目与商业产品紧密绑定打造了一个极端封闭的技术生态。而这其实违背了Docker项目与开发者保持亲密关系的初衷。相比之下Kubernetes社区正是以一种更加温和的方式承接了Docker项目的未尽事业以开发者为核心构建一个相对民主和开放的容器生态。

这也是为何Kubernetes项目的成功其实是必然的。

现在我们很难想象如果Docker公司最初选择了跟Kubernetes社区合作如今的容器生态又将会是怎样的一番景象。不过我们可以肯定的是Docker公司在过去五年里的风云变幻以及Solomon Hykes本人的传奇经历都已经在云计算的长河中留下了浓墨重彩的一笔。

思考题

你如何评价Solomon Hykes在Docker公司发展历程中的所作所为你又是否看好Docker公司在今后的发展呢

欢迎你给我留言,也欢迎分享给更多的朋友一起阅读。