目录
2.Kafka 中的ISR、AR 又代表什么?ISR 的伸缩又指什么
3.Kafka 中的 HW、LEO、LSO、LW 等分别代表什么?
5.Kafka 中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?
7.Kafka 生产者客户端中使用了几个线程来处理?分别是什么?
8.Kafka 的旧版Scala 的消费者客户端的设计有什么缺陷?
9.“消费组中的消费者个数如果超过 topic 的分区,那么就会有消费者消费不到数据”这句话是否正确?如果正确,那么有没有什么 hack 的手段?
12.KafkaConsumer 是非线程安全的,那么怎么样实现多线程消费?
14.当你使用 kafka-topics.sh 创建(删除)了一个 topic 之后,Kafka 背后会执行什么逻辑?
15.topic的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么?
16.topic的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么?
1. Kafka 目前有哪些内部 topic,它们都有什么特征?各自的作用又是什么?
3. Kafka 有哪几处地方有分区分配的概念?简述大致的过程及原理
6. 如果我指定了一个 offset,Kafka 怎么查找到对应的消息?
7. 如果我指定了一个 timestamp,Kafka 怎么查找到对应的消息?
8. 聊一聊你对 Kafka 的 Log Retention 的理解
9.聊一聊你对 Kafka 的 Log Compaction 的理解#
13.Kafka 的旧版 Scala 的消费者客户端的设计有什么缺陷?
14.消费再均衡的原理是什么?(提示:消费者协调器和消费组协调器)
10. 怎么计算 Lag ? ( 注意 read_uncommitted 和 read_committed 状态下的不同)
Kafka 基础篇
1.Kafka 的用途有哪些?使用场景如何?
消息系统: Kafka 和传统的消息系统(也称作消息中间件)都具备系统解耦、冗余存储、流量削峰、缓冲、异步通信、扩展性、可恢复性等功能。与此同时,Kafka 还提供了大多数消息系统难以实现的消息顺序性保障及回溯消费的功能。
存储系统: Kafka 把消息持久化到磁盘,相比于其他基于内存存储的系统而言,有效地降低了数据丢失的风险。也正是得益于 Kafka 的消息持久化功能和多副本机制,我们可以把Kafka 作为长期的数据存储系统来使用,只需要把对应的数据保留策略设置为“永久”或启用主题的日志压缩功能即可。
流式处理平台: Kafka 不仅为每个流行的流式处理框架提供了可靠的数据来源,还提供了一个完整的流式处理类库,比如窗口、连接、变换和聚合等各类操作。