You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

11 KiB

36 | 微博Service Mesh实践之路

专栏上一期我们聊到了微博的服务化是如何一步步走向Service Mesh之路的可以说正是由于微博自身业务对跨语言服务调用的需求日趋强烈才促使了Weibo Mesh的诞生也因此乘上了Service Mesh的东风。我在前面讲过Service Mesh主要由两部分组成一部分是SideCar负责服务之间请求的转发一部分是Control Plane负责具体的服务治理。从Weibo Mesh的实现方案来看对应的SideCar采用的是自研的Motan-go Agent服务治理则是通过统一服务治理中心来实现这里面的一些思路还是和Control Plane有很大区别的。

今天我们就来聊聊Weibo Mesh实现的技术细节看看它给业务带来了哪些收益最后再谈谈Weibo Mesh下一步的发展方向。

Motan-go Agent

通过上一期的学习我们知道Weibo Mesh中使用的SideCar就是Motan-go Agent考虑到Motan-go Agent要与PHP进程部署在一起为了减少对本机资源的占用这里Motan-go Agent采用了Go语言来实现它包含的功能模块请看下图。

我们拆解一下图中Motan-go Agent主要的模块看看它们的作用是什么。

Filter Chain模块是以请求处理链的组合方式来实现AccessLog请求日志记录、Metric监控统计、CircuitBreaker熔断、Switcher降级、Tracing服务追踪、Mock单元测试、ActiveLimit限流等功能。

High Available模块是用来保证高可用性默认集成了Failover、Backup Request等故障处理手段。

Load Balance模块负载均衡默认集成了Random、Roundrobin等负载均衡算法。

EndPoint模块的作用是封装请求来调用远程的Server端默认可以封装Motan请求和gRPC请求。

Serialize模块负责实现不同类型的序列化方式默认支持Simple序列化。

Server模块实现不同类型的Server要么是采用Motan协议实现要么是采用gRPC协议。

Motan-go Agent每个模块都是功能可扩展的你可以在Filter Chain模块加上自己实现的Trace功能这样请求在经过Filter Chain处理时就会自动加载你加上的Trace功能。当然你也可以在High Available模块添加自己实现的故障处理手段在Load Balance模块里实现自己的负载均衡算法在EndPoint模块封装HTTP协议的请求在Serialize模块添加PB序列化在Server模块实现HTTP协议等。

另外Motan-go Agent之间的通信采用的是自定义的Motan2协议它把请求中的Meta信息与请求参数信息进行了分离更适合对请求进行代理转发并且默认使用了Simple序列化来对不同语言的数据进行编码以实现跨语言服务通信。

更多关于Motan2协议和Simple序列化的介绍你可以点击这里查看。

统一服务治理中心

专栏上一期我给你讲过在Weibo Mesh中是通过统一服务治理平台与Motan-go Agent交互来实现服务治理功能的。对着下面这张Weibo Mesh的架构图我们一起看一下统一服务治理平台SGCenter具体是如何与Motan-go Agent交互来实现服务治理的各项功能的。

1.动态服务注册与发现

首先来看下统一服务治理平台是如何实现服务注册与发现的。如下图所示在Motan-go Agent中实现了具体的服务注册与发现的逻辑Server端进程启动时会通过Motan-go Agent向Vintage注册中心发起注册请求把服务注册到Vintage中。Client端发起服务调用时会经过Motan-go Agent转发Motan-go Agent会调用Vintage查询该服务在Vintage中的注册信息获取到服务节点列表后按照某一种负载均衡算法选择一个服务节点向这个服务节点发起调用。可以通过统一服务治理平台SGCenter调用Vintage的管理接口执行添加或者删除服务节点等操作Motan-go Agent会感知到服务节点的变化获取最新的服务节点。一般在业务开发或者运维人员需要手工扩容或者缩容一批服务节点时才会执行这个操作。

2.监控上报

再看下面这张图Client端发起的请求经过Motan-go Agent转发时Motan-go Agent就会在内存中统计每一次调用的耗时、成功率等信息并且每隔固定的时间间隔将这段时间内各个服务调用的QPS、平均耗时、成功率以及P999等metric信息发送给Graphite监控系统。这样的话通过SGCenter调用Graphite的Web API就可以获取到服务调用的信息了。

3.动态流量切换与降级

动态流量切换与降级的过程请看下面这张图。Motan-go Agent在查询Vintage中某个服务节点信息的同时也会订阅该服务的变更这样的话就可以通过SGCenter向Vintage下发服务的切流量或者降级指令订阅了这个服务的Motan-go Agent就会收到变更通知如果是切流量指令比如把调用永丰机房服务的流量都切换到土城机房那么Motan-go Agent就会把原本发给永丰机房的请求都发给土城机房如果是降级指令Motan-go Agent就会停止调用这个服务。

4.自动扩缩容

服务调用时Motan-go Agent会把Server端服务调用的监控信息上报给Graphite监控系统同时Diviner容量评估系统会实时调用Graphite以获取服务在不同区间的QPS信息以计算服务池的水位线然后SGCenter会每隔一段时间调用Diviner来获取各个服务池的冗余度以决定是否需要扩容。假如此时服务池的冗余度不足的话SGCenter就会调用DCP容器运维平台给服务池进行扩容DCP完成扩容后新的服务节点就会注册到Vintage当中这样的话订阅了该服务的Motan-go Agent就会感知到服务节点的变化从Vintage中获取最新的服务节点信息这就是一个服务自动扩缩容的整个流程你可以参考下面这张图。

Weibo Mesh的收益

经过前面的讲解相信你已经对Weibo Mesh的实现方案有了一定的了解。Weibo Mesh是在微博的业务场景下一步步进化到今天这个架构的它给微博的业务带来的巨大的收益总结起来主要有以下几点

  • 跨语言服务化调用的能力。Weibo Mesh发展之初最首要的目的就是想让微博内部的Motan服务化框架能够支持PHP应用与Java应用之间调用因而开发了Motan-go Agent并在此基础上演变成今天的Weibo Mesh。支持多种语言之间的服务化调用有助于统一公司内部业务不同语言所采用的服务化框架达到统一技术体系的目的。

  • 统一服务治理能力。以微博应对突发热点事件带来的峰值流量冲击为例为了确保首页信息流业务的稳定性我们有针对性的研发了自动扩缩容系统。而随着微博的不断发展不断涌现出新的业务线比如热门微博和热搜也同样面临着突发热点事件带来的流量冲击压力。而开发一套稳定可用的自动扩缩容系统并非一朝一夕之事如何能够把信息流业务研发的自动扩缩容系统推广到各个业务线是个比较棘手的问题。因为信息流业务的后端主要采用了Java语言实现而热门微博和热搜主要采用的是PHP语言无法直接接入自动扩缩容系统。而Weibo Mesh可以支持多种语言将热门微博和热搜业务进行服务化改造就可以统一接入到自动扩缩容系统实现了公司级的统一服务治理能力。

  • 业务无感知的持续功能更新能力。采用Motan或者Dubbo类似的传统服务化框架一旦服务框架功能有升级就需要业务同步进行代码升级这对大部分业务来说都是一种不愿承受的负担。而采用Weibo Mesh添加新功能只需要升级Motan-go Agent即可业务代码不需要做任何变更对于业务开发人员更友好。尤其是作为公司级的服务化框架时服务框架的升级如果跟业务系统升级绑定在一起从我的实践经验来看将是一件耗时费力的工作需要协调各个业务方配合才能完成。而Weibo Mesh可以看作是服务器上部署的基础组件它的升级与维护不需要各个业务方的参与这样才能具备作为公司级的服务化框架推广到各个业务线的前提。

Weibo Mesh的发展规划

在微博的业务场景下存在大量服务对缓存、数据库以及消息队列等资源的调用如果把资源也看作是一种服务那么Weibo Mesh不仅可以管理服务与服务之间的调用还可以管理服务与资源之间的调用这样的话Weibo Mesh强大的服务治理能力也能延伸到对资源的治理上对业务来说又将解决资源治理这一大难题。另一方面随着Weibo Mesh治理的服务越来越多收集的数据也越来越多利用这些数据可以挖掘一些更深层次的东西也是Weibo Mesh未来的发展方向之一。比如引入机器学习算法对采集的数据进行分析进行监控报警的优化等。

总结

今天我从Motan-go Agent和统一服务治理中心的具体实现这两个方面给你讲解了Weibo Mesh的技术细节你可以看到很多都是微博基于自身业务特点定制化的解决方案。对于大部分中小团队来说除非从一开始就采用了云原生应用的部署方式否则Istio等开源方案并不能直接拿来就用都需要从自身的业务特征和既有技术体系出发选择一条适合自己的Service Mesh实践之路。Weibo Mesh也因为其紧贴业务并没有脱离实际去设计所以才能够在微博的业务中落地生根被证明是行之有效的架构实践使得微博服务化体系的统一成为可能也坚定了我们在Weibo Mesh这条路上继续走下去。

思考题

Service Mesh中业务与服务框架解耦的优秀设计思想除了能用于服务与服务之间相互调用的场景你认为还能应用于哪些业务场景中

欢迎你在留言区写下自己的思考,与我一起讨论。