# 07 | 后端BaaS化(下):Container Serverless 你好,我是秦粤。上节课,我重点给你讲了业务逻辑的拆和合,拆的话可以借助DDD的方法论,也可以用动态网络的思想让微服务自然演进;合的话,我们可以用代码编排,也可以用事件流来驱动。另外,我们还了解了微服务拆解后会带来的安全信任问题,这可以通过微服务的跨域认证JWT方案解决。我们还了解了后端应用要支持快速迭代或发布,可以参考微服务搭建灰度发布流水线,也就是发布管道。其实我们在使用FaaS过程中遇到的很多问题,都可以借助或参考微服务的解决方案。 现在我们再回顾一下BaaS化后的“待办任务”Web服务,我们已经将后端拆解为用户微服务和待办任务微服务,前端用户访问我们的FaaS服务,登录后获取到JWT,通过数据接口+JWT安全地访问我们的微服务。而且我们的FaaS和微服务都具备了快速迭代的能力。 ![](https://static001.geekbang.org/resource/image/c8/15/c8ee82521e5c965d8955afe8c210b615.jpg "BaaS化后的“待办任务”Web服务") 到这里,我要指出我之前rule-faas.js的一个Bug,如果你之前亲自动手做过实验的话,估计也有发现。这个Bug的直接表现是用户初次请求数据时,如果触发了冷启动,返回的待办任务列表就会为空。 究其原因,是因为冷启动时连接数据库会有延时,这直接导致了第一个请求返回的待办任务列表还未同步到消息队列的数据。要解决这个bug,我们可以用之前讲过的预热FaaS或预留实例的方式,但你也要知道,FaaS函数扩容时,新启动的函数副本也会出现同样的问题。 我前面卖了很多关子,其实FaaS在设计时已经考虑到这个问题了,所以在FaaS的“函数配置”里,都会提供一项“函数初始化入口”的选项。但你会发现,它同时也会让你配置初始化时间,最少1秒。还记得我们在[\[第 2 课\]](https://time.geekbang.org/column/article/226574),讲函数执行阶段的一人一半的函数代码初始化时间吗?没错,就是那个时间。 当你配置了“函数初始化入口”,每次启动FaaS实例时,系统都会先等待初始化函数执行,而且在函数初始化时间结束后,才会继续执行函数。而从目前平台的配置来看,初始化时至少也需要1秒的时间(你去云服务商后台就能看到)。 对很多事件触发的应用场景,FaaS增加几秒的初始化时间,影响并不大。但对很多后端应用则不然,尤其是Java等语言,如果软件包比较大,启动和初始化的时间会更长。 要缩短或绕过初始化的时间,我们要尽可能地利用Runtime里面给我们提供的内置能力,例如我们BaaS化一直提倡使用服务编排和HTTP接口,就是因为云服务商SDK和HTTP协议,所有语言的Runtime里都内置了。 那什么是Runtime呢?Runtime其实就是运行我们代码所需要的函数库和二进制包。FaaS中的Runtime是云服务商预先设计好的,会放一些常用的函数库和二进制包进去,相当于是平台的能力。 但是当我们后端应用BaaS化后,想采用FaaS方案部署的话则会碰到Runtime这个拦路虎。FaaS虽然已经支持多数主流后端语言,但后端应用根据业务需求,要依赖特殊的函数库或二进制包,FaaS的官方Runtime就无法支持。而且像Java等语言,在代码包较大的情况下,FaaS启动速度很慢,也不适合。例如Node.js的Runtime,其实也包括我们自己安装的NPM包,所以相当于我们可以部分定制。但是你也注意到了,我们是整个目录包括node\_modules 一起上传的,也就是说涉及编译的NPM包是无法跨操作系统生效的。这种场景下FaaS的Runtime不可控就会成为我们难以绕过的问题了。当我们遇到FaaS无法解决的场景,我们就可以考虑下降一层,使用FaaS的底层支撑技术Docker容器了。 ![](https://static001.geekbang.org/resource/image/09/d7/09bb10fa7d1a95f88828bc413c7c9bd7.png "广义Serverless") 还记得我们[\[第 1 课\]](https://time.geekbang.org/column/article/224559) 中的广义Serverless的图吗?基础设施中的容器,一般情况下指的就是Docker容器。Docker 这个技术你肯定或多或少已经用过了,使用它们可以将应用代码和代码依赖的Runtime一起打包成一个Docker镜像。这个Docker镜像,可以在云上、自己的笔记本电脑、同事的电脑上无畅运行,并且完全不用担心环境依赖的问题,因为我们应用的依赖也打包在一起了。 到这里,我们又引入了Docker的概念,Docker出现之后,CaaS(Container as a Service)很快也就流行起来了。为了帮助你理解IaaS、PaaS、BaaS、CaaS这几者的关系,我画了张图,希望能从云服务发展的角度,帮你梳理下脉络。 ![](https://static001.geekbang.org/resource/image/f0/3e/f0d74468ff49c43c9367fff9cc58833e.png "云服务发展进程") 图片很好理解,我就不解释了。不过这里要解决一个你可能会有的疑惑:为什么BaaS的出现,比Serverless FaaS还要早三年?那是因为早期出现的BaaS其实是mBaaS(移动后端即服务),这概念当时也曾经火过一段时间,现在已经被Google收购的FireBase其实就是做的这个生意。mBaaS设计之初是专门为移动端提供后端服务的,例如用户管理、角色服务、文件存储服务等等。除了服务对象是移动端之外,跟我们说的BaaS概念很像。移动端可以将BaaS的所需鉴权算法放到客户端中,并随着客户端的版本定期更新秘钥。但前端却做不到,因此mBaaS只局限在移动端,没有火起来。直到FaaS的出现,才诞生了BaaS的使用场景,mBaaS也开始转型,支持更广范围的前端场景了。 VM是一种虚拟化技术,这个我们都知道,其实Docker也是一种虚拟化技术,只不过它是利用新版Linux内核提供Namespace、Cgroups和Union File System特性,模拟操作系统的运行环境。它跟虚拟机VM最大的区别在于,Docker是进程模型的。怎么理解这句话呢?我们需要画一张图。 ![](https://static001.geekbang.org/resource/image/2f/18/2f941369b366fff8883499d200cccb18.png "Docker进程模型") 从图中我们可以看出,虚拟机是在宿主机上启动一个虚拟机监视器HyperVisor管理控制虚拟机的。而虚拟机自身包含整个客户操作系统、函数库依赖和用户的应用,虚拟机操作系统之间相互都是隔离的。经典的HyperVisor就是VirtualBox\[1\],你感兴趣的话可以下载体验一下。你也可以试想一下,如果我们我们一台虚拟机部署一个微服务,其实资源利用率是很低的。 容器实例则只包含函数库依赖和用户的应用,操作系统是依赖宿主机的用户态模拟的,也就是说容器之间是共享宿主机内核的。所以Docker更加轻量,启动速度更快,代码执行速度也更快。 Docker的容器呢,因为只包含函数库依赖和用户的应用,可以部署到任意Docker引擎上,而Docker引擎呢,可以安装在你的个人电脑、公司机房或者云上。通常我们容器移动时,是移动容器的硬盘快照,内存中的状态我们比较难复制,这个硬盘快照就是Docker镜像。我们给Docker的镜像打上标签,标签就像是镜像的唯一标识符URI,打上后它就可以到处移动了。这个也是Docker的核心概念:build、ship、run。 其实你会不会觉得,Docker的这个层级结构有些眼熟?是的,这正是我们[\[第 2 课\]](https://time.geekbang.org/column/article/226574) 中讲的FaaS分层。我们回想一下,我当时所说的操作系统容器就是Docker模拟的,Runtime其实就是Bins/Libs层。云服务商的冷启动加速,就是利用Docker镜像缓存加速。我想你也应该猜到了,其实很多云服务商FaaS和PaaS的底层技术就是容器即服务CaaS。 那么接下来,我们就体验一下Docker的便利吧。我们的“待办任务”Web服务,只要添加一个文件,就可以让它变成Docker镜像了。 ## Docker再探 这里我建议你,最好自己在电脑上安装体验一下Docker。在主流的操作系统数安装Docker都不难的,只需要下载安装包就可以了。 ### build: Dockerfile 构建是Docker最重要的一环。Docker镜像是硬盘快照,那我们就看看标准的Docker硬盘快照如何制作吧。下面就是我们在代码根目录下增加的文件,供你参考: ``` # FROM是指我们的镜像基于哪个镜像来构建,我们这里是基于jessie linux的Node.js镜像 FROM registry.cn-shanghai.aliyuncs.com/jike-serverless/nodejs # ENV是设置环境变量 ENV HOME /home/myhome/myapp # RUN是执行一段命令 RUN mkdir -p /home/myhome/myapp/public # COPY是将当前目录下的内容拷贝到容器中 COPY . /home/myhome/myapp COPY public /home/myhome/myapp/public/ COPY node_modules /home/myhome/myapp/node_modules/ # WORKDIR是设置进入容器后的工作目录 WORKDIR /home/myhome/myapp/ # ENTRYPOINT是容器启动后执行的脚本 ENTRYPOINT [ "node","index.js" ] ``` 通常我们使用Docker前,先去Docker Hub上,找合适的基础镜像。看看基础镜像上都安装了哪些函数库或二进制包,再对比一下要运行自己的应用还缺少哪些函数库和二进制包。在基础镜像的层级上,加上自己的依赖。这样我们就构建好适合自己的镜像了。以后我们就能FROM自己的基础镜像,构建自己的应用了。 然后你在项目下执行:`docker build` 命令,就可以帮你构建Docker镜像了。 ``` docker build --force-rm -t myapp -f Dockerfile . ``` 构建好的镜像,我们可以通过 `docker run` 这个命令在本地调试。 ``` docker run -d -p 3001:3001 -e TEST=abc myapp:latest ``` 然后我们通过浏览器访问[http://127.0.0.1:3001](http://127.0.0.1:3001),就可以看到我们刚刚构建的Docker内容了。你会发现,这不就是我们云上运行的版本吗?是的,既然FaaS是用CaaS技术实现的。我们当然也可以利用Docker实现我们的“待办任务”Web服务。 为了方便Docker例子的展示,这节课的项目代码index.js,包含了rule.js的逻辑。你会发现index.js中,我们启动的时候,不用关心初始化需要等待多少秒了,而是直到初始化完成后,才监听3001端口,而Node.js连接数据库的时间通常也只需要几十毫秒。 ![](https://static001.geekbang.org/resource/image/9f/c4/9f7572a1ee36d167d30940f08d96ccc4.png "Docker版本的“待办任务”Web服务") 另外为了方面你观察和调试Docker容器实例,我这里给出一个登录Docker容器实例的命令。 ``` docker exec -it 容器ID bash ``` ### ship: Docker Registry 本地调试完,我们再看看如何部署到云上。Docker官方的镜像仓库\[2\]速度太慢,现在的云服务都支持私有的容器镜像仓库\[3\],上面构建Dockerfile里面的Node.js镜像,就是用我自己的私有容器仓库搭建的。 你可以登录云服务的容器镜像服务,他们都会告诉你如何 `Docker login` 到私有Registry,如何打标签,以及如何上传。 用我们的例子来说,大致会有下面的命令。 未登录过的话,要先登录Registry。 ``` docker login --username=极客时间serverless registry.cn-shanghai.aliyuncs.com ``` 根据容器镜像仓库的URI,打标签。镜像ID可以通过 `docker images` 查看。 ``` docker tag 你本地的镜像ID registry.cn-shanghai.aliyuncs.com/jike-serverless/todolist ``` 上传镜像到私有的Registry仓库。 ``` docker push registry.cn-shanghai.aliyuncs.com/jike-serverless/todolist ``` ### run: Docker Engine 运行Docker镜像就很简单了,云服务都支持容器服务CaaS。你只需要购买好容器服务,就可以从自己私有的容器镜像仓库Docker Registry中下载镜像,并运行了。你要是执行过上面的例子,那相信你也能体会到为什么FaaS的冷启动速度这么快了。不过需要提醒你一下,这里会产生费用。 ![](https://static001.geekbang.org/resource/image/b0/32/b0f0839d924252943ab9cd67df923b32.png "运行Docker镜像示意图") 另外,我们的专栏是讲Serverless,但是为了让你理解Serverless底层的实现,所以我们也讲到了Docker容器的部分内容。对于我们专栏来说,你不用尝试部署云上容器了。 恭喜你,获得DevOps奖章一枚! 现在我们了解了容器,也知道了FaaS是构建在容器上的。我们的微服务和整个应用都可以部署在CaaS之上,容器对我们来说更加可控,因为我们可以通过Dockerfile安装我们需要的各种函数库依赖或者二进制文件。但这里还有一个问题,FaaS的扩缩容是怎么做到的呢?我们如果采用了容器,容器如何做到扩缩容呢? ## FaaS与Docker的扩缩容 FaaS中的扩缩容,我们可以通过云控制台看到在FaaS函数配置中的“单实例并发度”。FaaS的做法比较简单粗暴,需要我们告诉函数服务,我们的单个函数实例可以承载多少的并发量,如果事件触发并发量超出了这个并发度,则会自动扩容。扩容的数量N,就是这个事件触发量除以单机并发量取整。例如我们设定,我们rule-faas函数的单实例并发度为10,那么当用户并发量是11时就会扩容2个实例。如果用户并发量达到100,就会扩容出10个实例。 这种做法其实是比较机械式的,我们再看看FaaS的“函数指标”监控图。你有没有想到,我们其实可以利用实时监控,去控制扩缩容?例如当单个函数实例承受不了时,内存使用率会越来越高,它的执行时间也会越来越长。 ![](https://static001.geekbang.org/resource/image/5e/2c/5e4d42ca0b4f27dbf04d91c31fa8f62c.png "FaaS的“函数指标”监控图") 是的,我们在使用Docker时,要考虑的就是:监控指标metrics以及扩容水位。 监控指标metrics就像FaaS“函数指标”监控图那样,是一系列需要我们关心的单个容器核心指标,包括CPU利用率、内存使用率、硬盘使用率、网络连接数等等。 我们将监控指标中的各项数值想象成蓄水,我们监控就像一个蓄水池,一旦某一项超过了蓄水池,水就会溢出。所以,我们要设定**水位**告警。我们在蓄水池里面画上刻度,当水位到这个刻度,我们就马上给这个蓄水池扩容。 ![](https://static001.geekbang.org/resource/image/ab/ba/abf169adcc352cc0c37c6e66b710c6ba.png "蓄水池案例") Docker容器本身并不提供扩缩容机制,但我们要让Docker自动化扩缩容,就可以用监控指标和水位去设计扩缩容机制。我们需要实时监控容器状态,当容器状态的某一项数值过高时,我们就需要给容器扩容。FaaS的弹性做法很简洁,而Docker的扩缩容机制弹性更高、更加可控。但是Docker容器,通常需要我们至少保持1个容器实例在线。相信你也知道了FaaS的预留实例是怎么做到的了吧? 讲到这里,不知道你发现没有,我们BaaS化的三讲,已经默默地实现了微服务的10要素。这也是为什么我一直说BaaS化和微服务高度重叠。 我们再来回顾一下微服务10要素。其中,API、服务调用、服务发现,我们可以通过RESTful HTTP接口实现;日志、链路追踪,我们没有展开,但我们可以依赖云服务商提供的日志采集解决;鉴权我们可以用跨域认证JWT解决;发布管道,需要我们搭建流水线发布管道;容灾性、监控、扩缩容,我们可以通过实时监控和扩缩容解决。到这儿呢,我们的高铁车厢也终于完成了。 这节课的内容挺多的,需要你动手消化吸收一下。下节课我们再看看,如何利用K8s调度我们的Docker容器。 ## 总结 BaaS化的内容,到今天,我们用了三节课讲完了,现在我们一起回顾一下。 我们讲后端应用BaaS化的问题,转换为后端应用NoOps微服务。所以我们先了解了微服务的10要素,并且看到微服务中如何通过消息队列将Stateful的节点,变成Stateless的。在微服务的拆解过程中,我们学习了微服务的拆解思想DDD和动态网络演进,以及拆解后带来的信任问题,需要我们加密身份认证。合并时,除了代码里面编排HTTP请求结果,我们还学习了事件流触发获取结果。为了让微服务能够快速迭代,我们还需要自己搭建流水线发布管道。 这节课我们通过FaaS和BaaS的初始化问题,向你介绍了FaaS和BaaS依赖的底层实现容器Docker。Docker也是一种虚拟化技术,它的核心理念是:build、ship、run。通过将我们的应用代码和应用依赖的函数库、二进制包,打包在一起的方式,解决应用开发环境和运行环境的一致性问题。我们可以借助Docker容器维持我们的应用实例,来解决初始化慢的问题。 我们还了解了FaaS的扩缩容逻辑是通过用户配置的“函数初始化入口”,以及固定的“初始化超时时间”配合“单实例并发度”来实现的。而我们在容器Docker,其实可以采用实时监控配合扩容水位,来做到更加弹性的扩缩容策略。 接下来我会通过K8s实践我们目前所学到的内容,我们的“待办任务”Web服务,将在我们本地搭建的CaaS环境和Serverless环境中开发和调试。 ## 作业 首先,拉取我们[lesson07](https://github.com/pusongyang/todolist-backend/tree/lesson07)的代码,为“待办任务”部署的rule-faas函数添加初始化入口。 这节课的作业呢,就是我们要在本地完全通过Docker容器,搭建起我们的“待办任务”Web服务。除了css和js静态资源是来自CDN,其它内容都将运行在Docker容器里。 相信你可以通过这个作业,体验到FaaS的底层CaaS的运行机制。 当然如果你有预算,也可以将Docker镜像上传到云服务商的Registry,在云上购买容器服务就可以部署你的Docker镜像,并在云上运行我们的“待办任务”Docker版本了。这样你就拥有了一个永不停机的Docker服务。 另外,我也希望你可以帮助我继续优化我们的课程作业代码。如果你有更好的建议,也可以通过Github的MergeRequest告知我。 接下来就期待你的作业和建议了。如果今天的内容让你有所收获,也欢迎你把文章分享给身边的朋友,邀请他加入学习。 ## 参考资料 \[1\] [https://www.virtualbox.org/](https://www.virtualbox.org/) \[2\] [https://docs.docker.com/get-docker/](https://docs.docker.com/get-docker/) \[3\] [https://hub.docker.com/](https://hub.docker.com/)