gitbook/Kafka核心技术与实战/docs/118319.md

178 lines
13 KiB
Markdown
Raw Permalink Normal View History

2022-09-03 22:05:03 +08:00
# 32 | KafkaAdminClientKafka的运维利器
你好我是胡夕。今天我要和你分享的主题是Kafka的运维利器KafkaAdminClient。
## 引入原因
在上一讲中我向你介绍了Kafka自带的各种命令行脚本这些脚本使用起来虽然方便却有一些弊端。
首先不论是Windows平台还是Linux平台命令行的脚本都只能运行在控制台上。如果你想要在应用程序、运维框架或是监控平台中集成它们会非常得困难。
其次这些命令行脚本很多都是通过连接ZooKeeper来提供服务的。目前社区已经越来越不推荐任何工具直连ZooKeeper了因为这会带来一些潜在的问题比如这可能会绕过Kafka的安全设置。在专栏前面我说过kafka-topics脚本连接ZooKeeper时不会考虑Kafka设置的用户认证机制。也就是说任何使用该脚本的用户不论是否具有创建主题的权限都能成功“跳过”权限检查强行创建主题。这显然和Kafka运维人员配置权限的初衷背道而驰。
最后运行这些脚本需要使用Kafka内部的类实现也就是Kafka**服务器端**的代码。实际上社区还是希望用户只使用Kafka**客户端**代码,通过现有的请求机制来运维管理集群。这样的话,所有运维操作都能纳入到统一的处理机制下,方便后面的功能演进。
基于这些原因社区于0.11版本正式推出了Java客户端版的AdminClient并不断地在后续的版本中对它进行完善。我粗略地计算了一下有关AdminClient的优化和更新的各种提案社区中有十几个之多而且贯穿各个大的版本足见社区对AdminClient的重视。
值得注意的是,**服务器端也有一个AdminClient**包路径是kafka.admin。这是之前的老运维工具类提供的功能也比较有限社区已经不再推荐使用它了。所以我们最好统一使用客户端的AdminClient。
## 如何使用?
下面我们来看一下如何在应用程序中使用AdminClient。我们在前面说过它是Java客户端提供的工具。想要使用它的话你需要在你的工程中显式地增加依赖。我以最新的2.3版本为例来进行一下展示。
如果你使用的是Maven需要增加以下依赖项
```
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka-clients</artifactId>
<version>2.3.0</version>
</dependency>
```
如果你使用的是Gradle那么添加方法如下
```
compile group: 'org.apache.kafka', name: 'kafka-clients', version: '2.3.0'
```
## 功能
鉴于社区还在不断地完善AdminClient的功能所以你需要时刻关注不同版本的发布说明Release Notes看看是否有新的运维操作被加入进来。在最新的2.3版本中AdminClient提供的功能有9大类。
1. 主题管理:包括主题的创建、删除和查询。
2. 权限管理:包括具体权限的配置与删除。
3. 配置参数管理包括Kafka各种资源的参数设置、详情查询。所谓的Kafka资源主要有Broker、主题、用户、Client-id等。
4. 副本日志管理:包括副本底层日志路径的变更和详情查询。
5. 分区管理:即创建额外的主题分区。
6. 消息删除:即删除指定位移之前的分区消息。
7. Delegation Token管理包括Delegation Token的创建、更新、过期和详情查询。
8. 消费者组管理:包括消费者组的查询、位移查询和删除。
9. Preferred领导者选举推选指定主题分区的Preferred Broker为领导者。
## 工作原理
在详细介绍AdminClient的主要功能之前我们先简单了解一下AdminClient的工作原理。**从设计上来看AdminClient是一个双线程的设计前端主线程和后端I/O线程**。前端线程负责将用户要执行的操作转换成对应的请求然后再将请求发送到后端I/O线程的队列中而后端I/O线程从队列中读取相应的请求然后发送到对应的Broker节点上之后把执行结果保存起来以便等待前端线程的获取。
值得一提的是AdminClient在内部大量使用生产者-消费者模式将请求生成与处理解耦。我在下面这张图中大致描述了它的工作原理。
![](https://static001.geekbang.org/resource/image/bd/88/bd820c9c2a5fb554561a9f78d6543c88.jpg)
如图所示前端主线程会创建名为Call的请求对象实例。该实例有两个主要的任务。
1. **构建对应的请求对象**。比如如果要创建主题那么就创建CreateTopicsRequest如果是查询消费者组位移就创建OffsetFetchRequest。
2. **指定响应的回调逻辑**。比如从Broker端接收到CreateTopicsResponse之后要执行的动作。一旦创建好Call实例前端主线程会将其放入到新请求队列New Call Queue此时前端主线程的任务就算完成了。它只需要等待结果返回即可。
剩下的所有事情就都是后端I/O线程的工作了。就像图中所展示的那样该线程使用了3个队列来承载不同时期的请求对象它们分别是新请求队列、待发送请求队列和处理中请求队列。为什么要使用3个呢原因是目前新请求队列的线程安全是由Java的monitor锁来保证的。**为了确保前端主线程不会因为monitor锁被阻塞后端I/O线程会定期地将新请求队列中的所有Call实例全部搬移到待发送请求队列中进行处理**。图中的待发送请求队列和处理中请求队列只由后端I/O线程处理因此无需任何锁机制来保证线程安全。
当I/O线程在处理某个请求时它会显式地将该请求保存在处理中请求队列。一旦处理完成I/O线程会自动地调用Call对象中的回调逻辑完成最后的处理。把这些都做完之后I/O线程会通知前端主线程说结果已经准备完毕这样前端主线程能够及时获取到执行操作的结果。AdminClient是使用Java Object对象的wait和notify实现的这种通知机制。
严格来说AdminClient并没有使用Java已有的队列去实现上面的请求队列它是使用ArrayList和HashMap这样的简单容器类再配以monitor锁来保证线程安全的。不过鉴于它们充当的角色就是请求队列这样的主体我还是坚持使用队列来指代它们了。
了解AdminClient工作原理的一个好处在于**它能够帮助我们有针对性地对调用AdminClient的程序进行调试**。
我们刚刚提到的后端I/O线程其实是有名字的名字的前缀是kafka-admin-client-thread。有时候我们会发现AdminClient程序貌似在正常工作但执行的操作没有返回结果或者hang住了现在你应该知道这可能是因为I/O线程出现问题导致的。如果你碰到了类似的问题不妨使用**jstack命令**去查看一下你的AdminClient程序确认下I/O线程是否在正常工作。
这可不是我杜撰出来的好处实际上这是实实在在的社区bug。出现这个问题的根本原因就是I/O线程未捕获某些异常导致意外“挂”掉。由于AdminClient是双线程的设计前端主线程不受任何影响依然可以正常接收用户发送的命令请求但此时程序已经不能正常工作了。
## 构造和销毁AdminClient实例
如果你正确地引入了kafka-clients依赖那么你应该可以在编写Java程序时看到AdminClient对象。**切记它的完整类路径是org.apache.kafka.clients.admin.AdminClient而不是kafka.admin.AdminClient**。后者就是我们刚才说的服务器端的AdminClient它已经不被推荐使用了。
创建AdminClient实例和创建KafkaProducer或KafkaConsumer实例的方法是类似的你需要手动构造一个Properties对象或Map对象然后传给对应的方法。社区专门为AdminClient提供了几十个专属参数最常见而且必须要指定的参数是我们熟知的**bootstrap.servers参数**。如果你想了解完整的参数列表,可以去[官网](https://kafka.apache.org/documentation/#adminclientconfigs)查询一下。如果要销毁AdminClient实例需要显式调用AdminClient的close方法。
你可以简单使用下面的代码同时实现AdminClient实例的创建与销毁。
```
Properties props = new Properties();
props.put(AdminClientConfig.BOOTSTRAP_SERVERS_CONFIG, "kafka-host:port");
props.put("request.timeout.ms", 600000);
try (AdminClient client = AdminClient.create(props)) {
// 执行你要做的操作……
}
```
这段代码使用Java 7的try-with-resource语法特性创建了AdminClient实例并在使用之后自动关闭。你可以在try代码块中加入你想要执行的操作逻辑。
## 常见的AdminClient应用实例
讲完了AdminClient的工作原理和构造方法接下来我举几个实际的代码程序来说明一下如何应用它。这几个例子都是我们最常见的。
### 创建主题
首先,我们来看看如何创建主题,代码如下:
```
String newTopicName = "test-topic";
try (AdminClient client = AdminClient.create(props)) {
NewTopic newTopic = new NewTopic(newTopicName, 10, (short) 3);
CreateTopicsResult result = client.createTopics(Arrays.asList(newTopic));
result.all().get(10, TimeUnit.SECONDS);
}
```
这段代码调用AdminClient的createTopics方法创建对应的主题。构造主题的类是NewTopic类它接收主题名称、分区数和副本数三个字段。
注意这段代码倒数第二行获取结果的方法。目前AdminClient各个方法的返回类型都是名为\*\*\*Result的对象。这类对象会将结果以Java Future的形式封装起来。如果要获取运行结果你需要调用相应的方法来获取对应的Future对象然后再调用相应的get方法来取得执行结果。
当然,对于创建主题而言,一旦主题被成功创建,任务也就完成了,它返回的结果也就不重要了,只要没有抛出异常就行。
### 查询消费者组位移
接下来,我来演示一下如何查询指定消费者组的位移信息,代码如下:
```
String groupID = "test-group";
try (AdminClient client = AdminClient.create(props)) {
ListConsumerGroupOffsetsResult result = client.listConsumerGroupOffsets(groupID);
Map<TopicPartition, OffsetAndMetadata> offsets =
result.partitionsToOffsetAndMetadata().get(10, TimeUnit.SECONDS);
System.out.println(offsets);
}
```
和创建主题的风格一样,**我们调用AdminClient的listConsumerGroupOffsets方法去获取指定消费者组的位移数据**。
不过,对于这次返回的结果,我们不能再丢弃不管了,**因为它返回的Map对象中保存着按照分区分组的位移数据**。你可以调用OffsetAndMetadata对象的offset()方法拿到实际的位移数据。
### 获取Broker磁盘占用
现在我们来使用AdminClient实现一个稍微高级一点的功能获取某台Broker上Kafka主题占用的磁盘空间量。有些遗憾的是目前Kafka的JMX监控指标没有提供这样的功能而磁盘占用这件事是很多Kafka运维人员要实时监控并且极为重视的。
幸运的是我们可以使用AdminClient来实现这一功能。代码如下
```
try (AdminClient client = AdminClient.create(props)) {
DescribeLogDirsResult ret = client.describeLogDirs(Collections.singletonList(targetBrokerId)); // 指定Broker id
long size = 0L;
for (Map<String, DescribeLogDirsResponse.LogDirInfo> logDirInfoMap : ret.all().get().values()) {
size += logDirInfoMap.values().stream().map(logDirInfo -> logDirInfo.replicaInfos).flatMap(
topicPartitionReplicaInfoMap ->
topicPartitionReplicaInfoMap.values().stream().map(replicaInfo -> replicaInfo.size))
.mapToLong(Long::longValue).sum();
}
System.out.println(size);
}
```
这段代码的主要思想是使用AdminClient的**describeLogDirs方法**获取指定Broker上所有分区主题的日志路径信息然后把它们累积在一起得出总的磁盘占用量。
## 小结
好了我们来小结一下。社区于0.11版本正式推出了Java客户端版的AdminClient工具该工具提供了几十种运维操作而且它还在不断地演进着。如果可以的话你最好统一使用AdminClient来执行各种Kafka集群管理操作摒弃掉连接ZooKeeper的那些工具。另外我建议你时刻关注该工具的功能完善情况毕竟目前社区对AdminClient的变更频率很高。
![](https://static001.geekbang.org/resource/image/06/f0/068a8cb7ea769799e60ad7f5a80a9bf0.jpg)
## 开放讨论
请思考一下如果我们要使用AdminClient去增加某个主题的分区代码应该怎么写请给出主体代码。
欢迎写下你的思考和答案,我们一起讨论。如果你觉得有所收获,也欢迎把文章分享给你的朋友。