You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

305 lines
22 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 27 | 消费者组元数据(上):消费者组都有哪些元数据?
你好,我是胡夕。从今天这节课开始,我们进入到最后一个模块的源码学习:消费者组管理模块。
在这个模块中我将会带你详细阅读Kafka消费者组在Broker端的源码实现包括消费者组元数据的定义与管理、组元数据管理器、内部主题\_\_consumer\_offsets和重要的组件GroupCoordinator。
我先来给你简单介绍下这4部分的功能以方便你对消费者组管理有一个大概的理解。
* 消费者组元数据这部分源码主要包括GroupMetadata和MemberMetadata。这两个类共同定义了消费者组的元数据都由哪些内容构成。
* 组元数据管理器由GroupMetadataManager类定义可被视为消费者组的管理引擎提供了消费者组的增删改查功能。
* \_\_consumer\_offsetsKafka的内部主题。除了我们熟知的消费者组提交位移记录功能之外它还负责保存消费者组的注册记录消息。
* GroupCoordinator组协调者组件提供通用的组成员管理和位移管理。
我把这4部分源码的功能梳理到了一张思维导图中你可以保存下来随时查阅
![](https://static001.geekbang.org/resource/image/2e/d8/2e2f823737fe479a853204a1cb5f8dd8.jpg)
今天,我们首先学习消费者组元数据的源码实现,这是我们理解消费者组工作机制和深入学习消费者组管理组件的基础。除此之外,掌握这部分代码对我们还有什么实际意义吗?
当然有了。我想你肯定对下面这条命令不陌生吧它是查询消费者组状态的命令行工具。我们在输出中看到了GROUP、COORDINATOR、ASSIGNMENT-STRATEGY、STATE和MEMBERS等数据。实际上这些数据就是消费者组元数据的一部分。
```
bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group mygroup --verbose --state
GROUP COORDINATOR (ID) ASSIGNMENT-STRATEGY STATE #MEMBERS
mygroup 172.25.4.76:9092 (0) range Stable 2
```
所以你看,我们日常使用的命令和源码知识的联系是非常紧密的,弄明白了今天的内容,之后你在实际使用一些命令行工具时,就能理解得更加透彻了。
好了,我们现在就正式开始今天的学习吧。
就像我前面说的元数据主要是由GroupMetadata和MemberMetadata两个类组成它们分别位于GroupMetadata.scala和MemberMetadata.scala这两个源码文件中。从它们的名字上也可以看出来前者是保存消费者组的元数据后者是保存消费者组下成员的元数据。
由于一个消费者组下有多个成员因此一个GroupMetadata实例会对应于多个MemberMetadata实例。接下来我们先学习下MemberMetadata.scala源文件。
## 组成员元数据MemberMetadata
MemberMetadata.scala源文件位于coordinator.group包下。事实上coordinator.group包下的所有源代码都是与消费者组功能息息相关的。下图是coordinator.group包的源码文件列表你可以看到MemberMetdata.scala和稍后我们要学到的GroupMetadata.scala都在其中。
![](https://static001.geekbang.org/resource/image/26/49/263b1a4cd251bcd312a2c1a640167049.png)
从这个包结构图中我们还可以发现后面几节课中要学习的源码类比如GroupCoordinator、GroupMetadataManager也都在里面。当然了你一定也发现了coordinator包下还有个transcation包里面保存了Kafka事务相关的所有源代码。如果你想深入学习事务机制的话可以去阅读下这个包下的源代码。
现在我们聚焦到MemberMetadata.scala文件包括3个类和对象。
* MemberSummary类组成员概要数据提取了最核心的元数据信息。上面例子中工具行命令返回的结果就是这个类提供的数据。
* MemberMetadata伴生对象仅仅定义了一个工具方法供上层组件调用。
* MemberMetadata类消费者组成员的元数据。Kafka为消费者组成员定义了很多数据一会儿我们将会详细学习。
按照难易程度我们从最简单的MemberSummary类开始学起。
### MemberSummary类
MemberSummary类就是组成员元数据的一个概要数据类它的代码本质上是一个POJO类仅仅承载数据没有定义任何逻辑。代码如下
```
case class MemberSummary(
memberId: String, // 成员ID由Kafka自动生成
groupInstanceId: Option[String], // Consumer端参数group.instance.id值
clientId: String, // client.id参数值
clientHost: String, // Consumer端程序主机名
metadata: Array[Byte], // 消费者组成员使用的分配策略
assignment: Array[Byte]) // 成员订阅分区
```
可以看到这个类定义了6个字段我来详细解释下。
* memberId标识消费者组成员的ID这个ID是Kafka自动生成的规则是consumer-组ID-<序号>-。虽然现在社区有关于是否放开这个限制的讨论即是否允许用户自己设定这个ID但目前它还是硬编码的不能让你设置。
* groupInstanceId消费者组静态成员的ID。静态成员机制的引入能够规避不必要的消费者组Rebalance操作。它是非常新且高阶的功能这里你只要稍微知道它的含义就可以了。如果你对此感兴趣建议你去官网看看group.instance.id参数的说明。
* clientId消费者组成员配置的client.id参数。由于memberId不能被设置因此你可以用这个字段来区分消费者组下的不同成员。
* clientHost运行消费者程序的主机名。它记录了这个客户端是从哪台机器发出的消费请求。
* metadata标识消费者组成员分区分配策略的字节数组由消费者端参数partition.assignment.strategy值设定默认的RangeAssignor策略是按照主题平均分配分区。
* assignment保存分配给该成员的订阅分区。每个消费者组都要选出一个Leader消费者组成员负责给所有成员分配消费方案。之后Kafka将制定好的分配方案序列化成字节数组赋值给assignment分发给各个成员。
总之MemberSummary类是成员概要数据的容器类似于Java中的POJO类不涉及任何操作逻辑所以还是很好理解的。
### MemberMetadata伴生对象
接下来我们学习MemberMetadata伴生对象的代码。它只定义了一个plainProtocolSet方法供上层组件调用。这个方法只做一件事儿即从一组给定的分区分配策略详情中提取出分区分配策略的名称并将其封装成一个集合对象然后返回
```
private object MemberMetadata {
// 提取分区分配策略集合
def plainProtocolSet(supportedProtocols: List[(String, Array[Byte])]) = supportedProtocols.map(_._1).toSet
}
```
我举个例子说明下。如果消费者组下有3个成员它们的partition.assignment.strategy参数分别设置成RangeAssignor、RangeAssignor和RoundRobinAssignor那么plainProtocolSet方法的返回值就是集合\[RangeAssignorRoundRobinAssignor\]。实际上,它经常被用来统计一个消费者组下的成员到底配置了多少种分区分配策略。
### MemberMetadata类
现在我们看下MemberMetadata类的源码。首先我们看下**该类的构造函数以及字段定义**,了解下一个成员的元数据都有哪些。
```
@nonthreadsafe
private[group] class MemberMetadata(
var memberId: String,
val groupId: String,
val groupInstanceId: Option[String],
val clientId: String,
val clientHost: String,
val rebalanceTimeoutMs: Int, // Rebalane操作超时时间
val sessionTimeoutMs: Int, // 会话超时时间
val protocolType: String, // 对消费者组而言,是"consumer"
// 成员配置的多套分区分配策略
var supportedProtocols: List[(String, Array[Byte])]) {
// 分区分配方案
var assignment: Array[Byte] = Array.empty[Byte]
var awaitingJoinCallback: JoinGroupResult => Unit = null
var awaitingSyncCallback: SyncGroupResult => Unit = null
var isLeaving: Boolean = false
var isNew: Boolean = false
val isStaticMember: Boolean = groupInstanceId.isDefined
var heartbeatSatisfied: Boolean = false
......
}
```
MemberMetadata类保存的数据很丰富在它的构造函数中除了包含MemberSummary类定义的6个字段外还定义了4个新字段。
* rebalanceTimeoutMsRebalance操作的超时时间即一次Rebalance操作必须在这个时间内完成否则被视为超时。这个字段的值是Consumer端参数max.poll.interval.ms的值。
* sessionTimeoutMs会话超时时间。当前消费者组成员依靠心跳机制“保活”。如果在会话超时时间之内未能成功发送心跳组成员就被判定成“下线”从而触发新一轮的Rebalance。这个字段的值是Consumer端参数session.timeout.ms的值。
* protocolType直译就是协议类型。它实际上标识的是消费者组被用在了哪个场景。这里的场景具体有两个第一个是作为普通的消费者组使用该字段对应的值就是consumer第二个是供Kafka Connect组件中的消费者使用该字段对应的值是connect。当然不排除后续社区会增加新的协议类型。但现在你只要知道它是用字符串的值标识应用场景就足够了。除此之外该字段并无太大作用。
* supportedProtocols标识成员配置的多组分区分配策略。目前Consumer端参数partition.assignment.strategy的类型是List说明你可以为消费者组成员设置多组分配策略因此这个字段也是一个List类型每个元素是一个元组Tuple。元组的第一个元素是策略名称第二个元素是序列化后的策略详情。
除了构造函数中的10个字段之外该类还定义了7个额外的字段用于保存元数据和判断状态。这些扩展字段都是var型变量说明它们的值是可以变更的。MemberMetadata源码正是依靠这些字段来不断地调整组成员的元数据信息和状态。
我选择了5个比较重要的扩展字段和你介绍下。
* assignment保存分配给该成员的分区分配方案。
* awaitingJoinCallback表示组成员是否正在等待加入组。
* awaitingSyncCallback表示组成员是否正在等待GroupCoordinator发送分配方案。
* isLeaving表示组成员是否发起“退出组”的操作。
* isNew表示是否是消费者组下的新成员。
以上就是MemberMetadata类的构造函数以及字段定义了。它定义的方法都是操作这些元数据的而且大多都是逻辑很简单的操作。这里我选取metadata方法带你熟悉下它们的编码实现风格。你可以在课后自行阅读其他的方法代码掌握它们的工作原理。
我们看下metadata方法的代码
```
def metadata(protocol: String): Array[Byte] = {
// 从配置的分区分配策略中寻找给定策略
supportedProtocols.find(_._1 == protocol) match {
case Some((_, metadata)) => metadata
case None =>
throw new IllegalArgumentException("Member does not support protocol")
}
}
```
它实现的逻辑是:从该成员配置的分区分配方案列表中寻找给定策略的详情。如果找到,就直接返回详情字节数组数据,否则,就抛出异常。怎么样,是不是很简单?
## 组元数据GroupMetadata类
说完了组成员元数据类我们进入到组元数据类GroupMetadata的学习。它位于coordinator.group包下的同名scala文件下。
GroupMetadata管理的是消费者组而不是消费者组成员级别的元数据所以它的代码结构要比MemberMetadata类复杂得多。我先画一张思维导图帮你梳理下它的代码结构。
![](https://static001.geekbang.org/resource/image/c8/yy/c860782ca34a103efef3e6d0147ce5yy.jpg)
总体上来看GroupMetadata.scala文件由6部分构成。
* GroupState类定义了消费者组的状态空间。当前有5个状态分别是Empty、PreparingRebalance、CompletingRebalance、Stable和Dead。其中Empty表示当前无成员的消费者组PreparingRebalance表示正在执行加入组操作的消费者组CompletingRebalance表示等待Leader成员制定分配方案的消费者组Stable表示已完成Rebalance操作可正常工作的消费者组Dead表示当前无成员且元数据信息被删除的消费者组。
* GroupMetadata类组元数据类。这是该scala文件下最重要的类文件也是我们今天要学习的重点内容。
* GroupMetadata伴生对象该对象提供了创建GroupMetadata实例的方法。
* GroupOverview类定义了非常简略的消费者组概览信息。
* GroupSummary类与MemberSummary类类似它定义了消费者组的概要信息。
* CommitRecordMetadataAndOffset类保存写入到位移主题中的消息的位移值以及其他元数据信息。这个类的主要职责就是保存位移值因此我就不展开说它的详细代码了。
接下来我们依次看下这些代码结构中都保存了哪些元数据信息。我们从最简单的GroupState类开始。
### GroupState类及实现对象
GroupState类定义了消费者组的状态。这个类及其实现对象Stable的代码如下
```
// GroupState trait
private[group] sealed trait GroupState {
// 合法前置状态
val validPreviousStates: Set[GroupState]
}
// Stable状态
private[group] case object Stable extends GroupState {
val validPreviousStates: Set[GroupState] = Set(CompletingRebalance)
}
......
```
这里我只展示了Stable状态的代码其他4个状态的代码都差不多。为了方便你理解消费者组之间的状态流转我绘制了一张完整的状态流转图。
![](https://static001.geekbang.org/resource/image/47/85/479e5a91684b6eb625104a894d353585.jpg)
你需要记住的是一个消费者组从创建到正常工作它的状态流转路径是Empty -> PreparingRebalance -> CompletingRebalance -> Stable。
### GroupOverview类
接下来我们看下GroupOverview类的代码。就像我刚才说的这是一个非常简略的组概览信息。当我们在命令行运行kafka-consumer-groups.sh --list的时候Kafka就会创建GroupOverview实例返回给命令行。
我们来看下它的代码:
```
case class GroupOverview(
groupId: String, // 组ID信息即group.id参数值
protocolType: String, // 消费者组的协议类型
state: String) // 消费者组的状态
```
怎么样很简单吧。GroupOverview类封装了最基础的组数据包括组ID、协议类型和状态信息。如果你熟悉Java Web开发的话可以把GroupOverview和GroupMetadata的关系理解为DAO和DTO的关系。
### GroupSummary类
它的作用和GroupOverview非常相似只不过它保存的数据要稍微多一点。我们看下它的代码
```
case class GroupSummary(
state: String, // 消费者组状态
protocolType: String, // 协议类型
protocol: String, // 消费者组选定的分区分配策略
members: List[MemberSummary]) // 成员元数据
```
GroupSummary类有4个字段它们的含义也都很清晰看字段名就能理解。你需要关注的是**members字段**它是一个MemberSummary类型的列表里面保存了消费者组所有成员的元数据信息。通过这个字段我们可以看到**消费者组元数据和组成员元数据是1对多的关系**。
### GroupMetadata类
最后我们看下GroupMetadata类的源码。我们先看下该类构造函数所需的字段和自定义的扩展元数据
```
@nonthreadsafe
private[group] class GroupMetadata(
val groupId: String, // 组ID
initialState: GroupState, // 消费者组初始状态
time: Time) extends Logging {
type JoinCallback = JoinGroupResult => Unit
// 组状态
private var state: GroupState = initialState
// 记录状态最近一次变更的时间戳
var currentStateTimestamp: Option[Long] = Some(time.milliseconds())
var protocolType: Option[String] = None
var protocolName: Option[String] = None
var generationId = 0
// 记录消费者组的Leader成员可能不存在
private var leaderId: Option[String] = None
// 成员元数据列表信息
private val members = new mutable.HashMap[String, MemberMetadata]
// 静态成员Id列表
private val staticMembers = new mutable.HashMap[String, String]
private var numMembersAwaitingJoin = 0
// 分区分配策略支持票数
private val supportedProtocols = new mutable.HashMap[String, Integer]().withDefaultValue(0)
// 保存消费者组订阅分区的提交位移值
private val offsets = new mutable.HashMap[TopicPartition, CommitRecordMetadataAndOffset]
// 消费者组订阅的主题列表
private var subscribedTopics: Option[Set[String]] = None
......
}
```
GroupMetadata类定义的字段非常多也正因为这样它保存的数据是最全的绝对担得起消费者组元数据类的称号。
除了我们之前反复提到的字段外它还定义了很多其他字段。不过有些字段要么是与事务相关的元数据要么是属于中间状态的临时元数据不属于核心的元数据我们不需要花很多精力去学习它们。我们要重点关注的是上面的代码中所展示的字段这些是GroupMetadata类最重要的字段。
* currentStateTimestamp记录最近一次状态变更的时间戳用于确定位移主题中的过期消息。位移主题中的消息也要遵循Kafka的留存策略所有当前时间与该字段的差值超过了留存阈值的消息都被视为“已过期”Expired
* generationId消费组Generation号。Generation等同于消费者组执行过Rebalance操作的次数每次执行Rebalance时Generation数都要加1。
* leaderId消费者组中Leader成员的Member ID信息。当消费者组执行Rebalance过程时需要选举一个成员作为Leader负责为所有成员制定分区分配方案。在Rebalance早期阶段这个Leader可能尚未被选举出来。这就是leaderId字段是Option类型的原因。
* members保存消费者组下所有成员的元数据信息。组元数据是由MemberMetadata类建模的因此members字段是按照Member ID分组的MemberMetadata类。
* offsets保存按照主题分区分组的位移主题消息位移值的HashMap。Key是主题分区Value是前面讲过的CommitRecordMetadataAndOffset类型。当消费者组成员向Kafka提交位移时源码都会向这个字段插入对应的记录。
* subscribedTopics保存消费者组订阅的主题列表用于帮助从offsets字段中过滤订阅主题分区的位移值。
* supportedProtocols保存分区分配策略的支持票数。它是一个HashMap类型其中Key是分配策略的名称Value是支持的票数。前面我们说过每个成员可以选择多个分区分配策略因此假设成员A选择\[“range”“round-robin”\]、B选择\[“range”\]、C选择\[“round-robin”“sticky”\]那么这个字段就有3项分别是<“range”2>、<“round-robin”2>和<“sticky”1>。
这些扩展字段和构造函数中的字段,共同构建出了完整的消费者组元数据。就我个人而言,我认为这些字段中最重要的就是**members和offsets**它们分别保存了组内所有成员的元数据以及这些成员提交的位移值。这样看的话这两部分数据不就是一个消费者组最关心的3件事吗**组里面有多少个成员**、**每个成员都负责做什么**、**它们都做到了什么程度**。
## 总结
今天我带你深入到了GroupMetadata.scala和MemberMetadata.scala这两个源码文件中学习了消费者组元数据和组成员元数据的定义。它们封装了一个消费者组及其成员的所有数据。后续的GroupCoordinator和其他消费者组组件都会大量利用这部分元数据执行消费者组的管理。
为了让你更好地掌握今天的内容,我们来回顾下这节课的重点。
* 消费者组元数据包括组元数据和组成员元数据两部分分别由GroupMetadata和MemberMetadata类表征。
* MemberMetadata类保存组成员元数据比如组ID、Consumer主机名、协议类型等。同时它还提供了MemberSummary类封装了组成员元数据的概要信息。
* GroupMetadata类保存组元数据包括组状态、组成员元数据列表等等。
* 1对多关系组元数据与组成员元数据是1对多的关系。这是因为每个消费者组下存在若干个组成员。
![](https://static001.geekbang.org/resource/image/14/1f/14a63dda57facee5f686ea539848131f.jpg)
今天这节课的逻辑不是特别复杂我们重点学习了消费者组元数据的构成几乎未曾涉及元数据的操作。在下节课我们将继续在这两个scala文件中探索去学习操作这些元数据的方法实现。
但我要再次强调的是,今天学习的这些方法是上层组件调用的基础。如果你想彻底了解消费者组的工作原理,就必须先把这部分基础“铺平夯实”了,这样你才能借由它们到达“完全掌握消费者组实现源码”的目的地。
## 课后讨论
请你思考下这节课最开始的工具行命令输出中的ASSIGNMENT-STRATEGY项对应于咱们今天学习的哪一项元数据呢
欢迎在留言区写下你的思考和答案,跟我交流讨论,也欢迎你把今天的内容分享给你的朋友。