Kafka 架构详解：高吞吐分布式消息系统设计

Kafka 架构详解：高吞吐分布式消息系统设计 | 极客日志

/kafka
├── brokers
│   ├── ids
│   │   ├── 0 (broker.id=0 的信息)
│   │   ├── 1 (broker.id=1 的信息)
│   │   └── 2 (broker.id=2 的信息)
│   └── topics
│       └── my-topic
│           ├── partitions
│           │   ├── 0
│           │   │   └── state (Leader 和 ISR 信息)
│           │   ├── 1
│           │   │   └── state
│           │   └── 2
│           │       └── state
│           ├── controller (控制器信息)
│           ├── controller_epoch (控制器纪元)
│           ├── config
│           │   ├── topics
│           │   │   └── my-topic (Topic 配置)
│           │   └── brokers
│           │       └── 0 (Broker 配置)
│           └── admin
│               └── delete_topics (待删除的 Topic)

// ZooKeeper 连接配置
Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092,broker3:9092");
props.put("zookeeper.connect", "zk1:2181,zk2:2181,zk3:2181/kafka");
props.put("zookeeper.connection.timeout.ms", "6000");
props.put("zookeeper.session.timeout.ms", "6000");
// 创建 AdminClient 来管理集群
AdminClient adminClient = AdminClient.create(props);
// 获取集群元数据
DescribeClusterResult clusterResult = adminClient.describeCluster();
System.out.println("Cluster ID: " + clusterResult.clusterId().get());
System.out.println("Controller: " + clusterResult.controller().get());

// 创建 Topic 时指定分区数和复制因子
Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092");
AdminClient adminClient = AdminClient.create(props);
NewTopic newTopic = new NewTopic("my-topic", // Topic 名称
    3, // 分区数
    (short) 2 // 复制因子
);
// 可以指定分区的副本分配
Map<Integer, List<Integer>> replicaAssignments = new HashMap<>();
replicaAssignments.put(0, Arrays.asList(0, 1)); // 分区 0 的副本在 Broker 0 和 1 上
replicaAssignments.put(1, Arrays.asList(1, 2)); // 分区 1 的副本在 Broker 1 和 2 上
replicaAssignments.put(2, Arrays.asList(2, 0)); // 分区 2 的副本在 Broker 2 和 0 上
NewTopic customTopic = new NewTopic("custom-topic", replicaAssignments);
adminClient.createTopics(Arrays.asList(newTopic, customTopic));

// 自定义分区器示例
public class CustomPartitioner implements Partitioner {
    private final AtomicInteger counter = new AtomicInteger(0);

    @Override
    public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) {
        List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
        int numPartitions = partitions.size();
        if (key == null) {
            // 如果没有 key，使用轮询策略
            return counter.getAndIncrement() % numPartitions;
        } else {
            // 基于 key 的哈希值进行分区
            return Math.abs(key.hashCode()) % numPartitions;
        }
    }

    @Override
    public void close() {
        // 清理资源
    }

    @Override
    public void configure(Map<String, ?> configs) {
        // 配置初始化
    }
}

// 使用自定义分区器
Properties producerProps = new Properties();
producerProps.put("bootstrap.servers", "broker1:9092,broker2:9092");
producerProps.put("partitioner.class", "com.example.CustomPartitioner");

// 配置消费者分区分配策略
Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092");
props.put("group.id", "my-consumer-group");
props.put("partition.assignment.strategy", "org.apache.kafka.clients.consumer.RangeAssignor," +
    "org.apache.kafka.clients.consumer.RoundRobinAssignor," +
    "org.apache.kafka.clients.consumer.StickyAssignor");

// 自定义分区分配策略
public class CustomAssignor extends AbstractPartitionAssignor {
    @Override
    public String name() {
        return "custom";
    }

    @Override
    public Map<String, List<TopicPartition>> assign(Map<String, Integer> partitionsPerTopic, Map<String, Subscription> subscriptions) {
        // 实现自定义分配逻辑
        Map<String, List<TopicPartition>> assignment = new HashMap<>();
        // ... 分配逻辑实现
        return assignment;
    }
}

// 生产者批处理配置
Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092");
props.put("batch.size", 16384); // 批次大小（字节）
props.put("linger.ms", 10); // 等待时间，增加批处理机会
props.put("buffer.memory", 33554432); // 缓冲区大小
props.put("compression.type", "lz4"); // 压缩类型

// 配置序列化器
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");

KafkaProducer<String, String> producer = new KafkaProducer<>(props);

// 异步发送消息
producer.send(new ProducerRecord<>("my-topic", "key", "value"), new Callback() {
    @Override
    public void onCompletion(RecordMetadata metadata, Exception exception) {
        if (exception != null) {
            exception.printStackTrace();
        } else {
            System.out.printf("Sent message to topic %s partition %d offset %d%n",
                metadata.topic(), metadata.partition(), metadata.offset());
        }
    }
});

// Topic 配置：日志保留策略
Properties topicConfig = new Properties();
topicConfig.put("cleanup.policy", "delete"); // 删除策略
topicConfig.put("retention.ms", "604800000"); // 保留 7 天
topicConfig.put("retention.bytes", "1073741824"); // 保留 1GB

// 或者使用压缩策略
Properties compactConfig = new Properties();
compactConfig.put("cleanup.policy", "compact"); // 压缩策略
compactConfig.put("min.cleanable.dirty.ratio", "0.5"); // 脏数据比例阈值
compactConfig.put("delete.retention.ms", "86400000"); // 删除标记保留时间

// 创建 Topic 时应用配置
NewTopic topic = new NewTopic("my-topic", 3, (short) 2);
topic.configs(topicConfig);

/kafka/consumers
├── my-consumer-group
│   ├── ids
│   │   ├── consumer-1 (消费者实例信息)
│   │   └── consumer-2
│   ├── owners
│   │   ├── my-topic
│   │   │   ├── 0 (分区 0 的所有者)
│   │   │   ├── 1 (分区 1 的所有者)
│   │   │   └── 2 (分区 2 的所有者)
│   │   └── offsets
│   │       └── my-topic
│   │           ├── 0 (分区 0 的偏移量)
│   │           ├── 1 (分区 1 的偏移量)
│   │           └── 2 (分区 2 的偏移量)

// 消费者配置
Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092");
props.put("group.id", "my-consumer-group");
props.put("enable.auto.commit", "false"); // 禁用自动提交
props.put("auto.offset.reset", "earliest"); // 从最早的消息开始消费
props.put("session.timeout.ms", "30000"); // 会话超时时间
props.put("heartbeat.interval.ms", "10000"); // 心跳间隔
props.put("max.poll.interval.ms", "300000"); // 最大轮询间隔

// 配置反序列化器
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
consumer.subscribe(Arrays.asList("my-topic"));

try {
    while (true) {
        ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
        // 按分区处理消息
        for (TopicPartition partition : records.partitions()) {
            List<ConsumerRecord<String, String>> partitionRecords = records.records(partition);
            for (ConsumerRecord<String, String> record : partitionRecords) {
                System.out.printf("Partition: %d, Offset: %d, Key: %s, Value: %s%n",
                    record.partition(), record.offset(), record.key(), record.value());
                // 处理消息
                processMessage(record);
            }
            // 手动提交特定分区的偏移量
            long lastOffset = partitionRecords.get(partitionRecords.size() - 1).offset();
            consumer.commitSync(Collections.singletonMap(partition, new OffsetAndMetadata(lastOffset + 1)));
        }
    }
} catch (Exception e) {
    e.printStackTrace();
} finally {
    consumer.close();
}

private void processMessage(ConsumerRecord<String, String> record) {
    // 业务逻辑处理
    try {
        // 模拟处理时间
        Thread.sleep(10);
        System.out.println("Processed message: " + record.value());
    } catch (InterruptedException e) {
        Thread.currentThread().interrupt();
    }
}

# ZooKeeper 配置优化 (zoo.cfg)
tickTime=2000 # 基本时间单位
initLimit=10 # 初始化连接时限
syncLimit=5 # 同步时限
dataDir=/var/lib/zookeeper # 数据目录
clientPort=2181 # 客户端连接端口
maxClientCnxns=60 # 最大客户端连接数
autopurge.snapRetainCount=3 # 保留快照数量
autopurge.purgeInterval=24 # 清理间隔（小时）
# 服务器列表
server.1=zk1:2888:3888
server.2=zk2:2888:3888
server.3=zk3:2888:3888

参数	说明	默认值	推荐值	影响
num.network.threads	网络线程数	3	核心数	处理网络请求的能力
num.io.threads	I/O 线程数	8	核心数*2	处理磁盘 I/O 的能力
socket.send.buffer.bytes	套接字发送缓冲区	100KB	1MB	网络发送性能
socket.receive.buffer.bytes	套接字接收缓冲区	100KB	1MB	网络接收性能
log.retention.hours	日志保留时间	168 (7 天)	根据业务需求	存储空间使用
log.segment.bytes	日志段大小	1GB	根据消息大小调整	文件管理效率
replica.fetch.max.bytes	副本获取最大字节数	1MB	根据消息大小调整	副本同步性能
zookeeper.session.timeout.ms	ZooKeeper 会话超时	6000	根据网络延迟调整	集群稳定性

// 生产者可靠性配置
Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092");
props.put("acks", "all"); // 所有 ISR 副本确认
props.put("retries", Integer.MAX_VALUE); // 无限重试
props.put("retry.backoff.ms", 100); // 重试间隔
props.put("max.in.flight.requests.per.connection", 1); // 防止消息乱序
props.put("enable.idempotence", true); // 启用幂等性
props.put("delivery.timeout.ms", 120000); // 交付超时时间

Producer<String, String> producer = new KafkaProducer<>(props);

// 事务支持
props.put("transactional.id", "my-transactional-id");
Producer<String, String> transactionalProducer = new KafkaProducer<>(props);
transactionalProducer.initTransactions();

try {
    transactionalProducer.beginTransaction();
    // 发送多条消息
    transactionalProducer.send(new ProducerRecord<>("topic1", "key1", "value1"));
    transactionalProducer.send(new ProducerRecord<>("topic2", "key2", "value2"));
    // 提交事务
    transactionalProducer.commitTransaction();
} catch (Exception e) {
    // 中止事务
    transactionalProducer.abortTransaction();
    throw e;
}

// 集群健康检查
public class KafkaHealthChecker {
    private final AdminClient adminClient;

    public KafkaHealthChecker(String bootstrapServers) {
        Properties props = new Properties();
        props.put("bootstrap.servers", bootstrapServers);
        this.adminClient = AdminClient.create(props);
    }

    public void checkClusterHealth() throws Exception {
        // 检查集群基本信息
        DescribeClusterResult clusterResult = adminClient.describeCluster();
        System.out.println("Cluster ID: " + clusterResult.clusterId().get());
        System.out.println("Controller: " + clusterResult.controller().get());

        // 检查 Broker 状态
        Collection<Node> nodes = clusterResult.nodes().get();
        System.out.println("Active Brokers: " + nodes.size());

        // 检查 Topic 状态
        ListTopicsResult topicsResult = adminClient.listTopics();
        Set<String> topics = topicsResult.names().get();
        System.out.println("Total Topics: " + topics.size());

        // 检查消费者组状态
        ListConsumerGroupsResult groupsResult = adminClient.listConsumerGroups();
        Collection<ConsumerGroupListing> groups = groupsResult.all().get();
        System.out.println("Active Consumer Groups: " + groups.size());
    }
}

Kafka 架构详解：高吞吐分布式消息系统设计

Kafka 架构详解：构建高吞吐量分布式消息系统

引言

Kafka 核心概念与架构总览

什么是 Kafka？

Kafka 的核心架构组件

Kafka 的数据模型

ZooKeeper 在 Kafka 架构中的关键作用

ZooKeeper 的核心职责

ZooKeeper 的数据结构

ZooKeeper 集群配置

Controller 机制

Kafka 的分区与复制机制

分区策略

自定义分区器

复制机制与 ISR

分区分配策略

Kafka 的存储机制

日志存储结构

高效的存储设计

日志清理策略

Kafka 的消费模型

消费者组与重平衡

ZooKeeper 在消费者协调中的作用

消费者实现

Kafka 性能调优与最佳实践

ZooKeeper 性能优化

Broker 配置优化

可靠性保证

监控与运维

总结

参考链接

更多推荐文章

相关免费在线工具

Kafka 架构详解：高吞吐分布式消息系统设计

Kafka 架构详解：构建高吞吐量分布式消息系统

引言

Kafka 核心概念与架构总览

什么是 Kafka？

Kafka 的核心架构组件

Kafka 的数据模型

ZooKeeper 在 Kafka 架构中的关键作用

ZooKeeper 的核心职责

ZooKeeper 的数据结构

ZooKeeper 集群配置

Controller 机制

Kafka 的分区与复制机制

分区策略

自定义分区器

复制机制与 ISR

分区分配策略

Kafka 的存储机制

日志存储结构

高效的存储设计

日志清理策略

Kafka 的消费模型

消费者组与重平衡

ZooKeeper 在消费者协调中的作用

消费者实现

Kafka 性能调优与最佳实践

ZooKeeper 性能优化

Broker 配置优化

可靠性保证

监控与运维

总结

参考链接

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具