You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

113 lines
9.7 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 13 | 开源服务注册中心如何选型?
上一期我给你讲了服务注册中心的落地实践,以及在实际应用中可能会遇到的问题和对应的解决方案。关于注册中心,如果你的团队有足够的人才和技术储备,可以选择自己研发注册中心。但对于大多数中小规模团队来说,我的建议是最好使用业界开源的、应用比较成熟的注册中心解决方案,把精力投入到业务架构的改造中,不要自己造轮子。
当下主流的服务注册与发现的解决方案,主要有两种:
* 应用内注册与发现注册中心提供服务端和客户端的SDK业务应用通过引入注册中心提供的SDK通过SDK与注册中心交互来实现服务的注册和发现。
* 应用外注册与发现业务应用本身不需要通过SDK与注册中心打交道而是通过其他方式与注册中心交互间接完成服务注册与发现。
下面我会用两个业界使用比较成熟的注册中心开源实现,来讲解下应用内和应用外两种解决方案的不同之处。
## 两种典型的注册中心实现
**1\. 应用内**
采用应用内注册与发现的方式最典型的案例要属Netflix开源的Eureka官方架构图如下。
![](https://static001.geekbang.org/resource/image/d2/1c/d220f8970c8d7a4f4ea4677ec2cbd61c.jpg)
[https://github.com/Netflix/eureka/raw/master/images/eureka\_architecture.png](https://github.com/Netflix/eureka/raw/master/images/eureka_architecture.png)
对着这张图我来介绍下Eureka的架构它主要由三个重要的组件组成
* Eureka Server注册中心的服务端实现了服务信息注册、存储以及查询等功能。
* 服务端的Eureka Client集成在服务端的注册中心SDK服务提供者通过调用SDK实现服务注册、反注册等功能。
* 客户端的Eureka Client集成在客户端的注册中心SDK服务消费者通过调用SDK实现服务订阅、服务更新等功能。
**2\. 应用外**
采用应用外方式实现服务注册和发现最典型的案例是开源注册中心Consul它的架构图如下。
![](https://static001.geekbang.org/resource/image/da/3f/da82d0cba1c49252e1ae48f91fcb543f.png)
[https://technologyconversations.files.wordpress.com/2015/09/etcd-registrator-confd2.png](https://technologyconversations.files.wordpress.com/2015/09/etcd-registrator-confd2.png)
通过这张架构图可以看出来使用Consul实现应用外服务注册和发现主要依靠三个重要的组件
* Consul注册中心的服务端实现服务注册信息的存储并提供注册和发现服务。
* [Registrator](https://github.com/gliderlabs/registrator)一个开源的第三方服务管理器项目它通过监听服务部署的Docker实例是否存活来负责服务提供者的注册和销毁。
* [Consul Template](https://github.com/hashicorp/consul-template)定时从注册中心服务端获取最新的服务提供者节点列表并刷新LB配置比如Nginx的upstream这样服务消费者就通过访问Nginx就可以获取最新的服务提供者信息。
对比小结一下这两种解决方案的不同之处在于应用场景应用内的解决方案一般适用于服务提供者和服务消费者同属于一个技术体系应用外的解决方案一般适合服务提供者和服务消费者采用了不同技术体系的业务场景比如服务提供者提供的是C++服务而服务消费者是一个Java应用这时候采用应用外的解决方案就不依赖于具体一个技术体系。同时对于容器化后的云应用来说一般不适合采用应用内SDK的解决方案因为这样会侵入业务而应用外的解决方案正好能够解决这个问题。
## 注册中心选型要考虑的两个问题
在选择注册中心解决方案的时候,除了要考虑是采用应用内注册还是应用外注册的方式以外,还有两个最值得关注的问题,一个是高可用性,一个是数据一致性,下面我来给你详细解释下为什么。
**1\. 高可用性**
注册中心作为服务提供者和服务消费者之间沟通的纽带,它的高可用性十分重要。试想,如果注册中心不可用了,那么服务提供者就无法对外暴露自己的服务,而服务消费者也无法知道自己想要调用的服务的具体地址,后果将不堪设想。
根据我过往的实践经验,实现高可用性的方法主要有两种:
* 集群部署,顾名思义就是通过部署多个实例组成集群来保证高可用性,这样的话即使有部分机器宕机,将访问迁移到正常的机器上就可以保证服务的正常访问。
* 多IDC部署就是部署在不止一个机房这样能保证即使一个机房因为断电或者光缆被挖断等不可抗力因素不可用时仍然可以通过把请求迁移到其他机房来保证服务的正常访问。
我们以Consul为例来看看它是如何通过这两种方法来保证注册中心的高可用性。
从下面的官方架构图中你可以看到一方面在每个数据中心DATACENTER内都有多个注册中心Server节点可供访问另一方面还可以部署在多个数据中心来保证多机房高可用性。
![](https://static001.geekbang.org/resource/image/c0/ab/c0661d7687e29927fdcecc0f140fb5ab.png)
[https://www.consul.io/assets/images/consul-arch-420ce04a.png](https://www.consul.io/assets/images/consul-arch-420ce04a.png)
**2\. 数据一致性**
为了保证注册中心的高可用性,注册中心的部署往往都采用集群部署,并且还通常部署在不止一个数据中心,这样的话就会引出另一个问题,多个数据中心之间如何保证数据一致?如何确保访问数据中心中任何一台机器都能得到正确的数据?
这里就涉及分布式系统中著名的CAP理论即同时满足一致性、可用性、分区容错性这三者是不可能的其中CConsistency代表一致性AAvailability代表可用性PPartition Tolerance代表分区容错性。
为什么说CAP三者不能被同时满足的呢
你可以想象在一个分布式系统里面,包含了多个节点,节点之间通过网络连通在一起。正常情况下,通过网络,从一个节点可以访问任何别的节点上的数据。
但是有可能出现网络故障,导致整个网络被分成了互不连通的区域,这就叫作分区。一旦出现分区,那么一个区域内的节点就没法访问其他节点上的数据了,最好的办法是把数据复制到其他区域内的节点,这样即使出现分区,也能访问任意区域内节点上的数据,这就是分区容错性。
但是把数据复制到多个节点就可能出现数据不一致的情况,这就是一致性。要保证一致,就必须等待所有节点上的数据都更新成功才可用,这就是可用性。
总的来说,就是数据节点越多,分区容错性越高,但数据一致性越难保证。为了保证数据一致性,又会带来可用性的问题。
而注册中心一般采用分布式集群部署也面临着CAP的问题根据CAP不能同时满足所以不同的注册中心解决方案选择的方向也就不同大致可分为两种。
* CP型注册中心牺牲可用性来保证数据强一致性最典型的例子就是ZooKeeperetcdConsul了。ZooKeeper集群内只有一个Leader而且在Leader无法使用的时候通过Paxos算法选举出一个新的Leader。这个Leader的目的就是保证写信息的时候只向这个Leader写入Leader会同步信息到Followers这个过程就可以保证数据的强一致性。但如果多个ZooKeeper之间网络出现问题造成出现多个Leader发生脑裂的话注册中心就不可用了。而etcd和Consul集群内都是通过raft协议来保证强一致性如果出现脑裂的话 注册中心也不可用。
* AP型注册中心牺牲一致性来保证可用性最典型的例子就是Eureka了。对比下ZookeeperEureka不用选举一个Leader每个Eureka服务器单独保存服务注册地址因此有可能出现数据信息不一致的情况。但是当网络出现问题的时候每台服务器都可以完成独立的服务。
而对于注册中心来说最主要的功能是服务的注册和发现在网络出现问题的时候可用性的需求要远远高于数据一致性。即使因为数据不一致注册中心内引入了不可用的服务节点也可以通过其他措施来避免比如客户端的快速失败机制等只要实现最终一致性对于注册中心来说就足够了。因此选择AP型注册中心一般更加合适。
## 总结
总的来说,在选择开源注册中心解决方案的时候,要看业务的具体场景。
* 如果你的业务体系都采用Java语言的话Netflix开源的Eureka是一个不错的选择并且它作为服务注册与发现解决方案能够最大程度的保证可用性即使出现了网络问题导致不同节点间数据不一致你仍然能够访问Eureka获取数据。
* 如果你的业务体系语言比较复杂Eureka也提供了Sidecar的解决方案也可以考虑使用Consul它支持了多种语言接入包括Go、Python、PHP、Scala、JavaErlang、Ruby、Node.js、.NET、Perl等。
* 如果你的业务已经是云原生的应用可以考虑使用Consul搭配Registrator和Consul Template来实现应用外的服务注册与发现。
## 思考题
针对你的业务场景,如果要选择一种开源注册中心实现的话,你觉得哪种方案更适合?
欢迎你在留言区写下自己的思考,与我一起讨论。