Kafka Java 生态分布式高吞吐消息队列详解

Kafka 是Apache 基金会开发的一款分布式、高吞吐、低延迟、可持久化的分布式发布 - 订阅消息队列，基于 Scala/Java 开发，专为大数据场景下的高并发、高吞吐消息传输设计，是 Java 生态中最主流的分布式消息队列之一，广泛应用于日志收集、流处理、数据同步、微服务解耦等场景。

一、Kafka 核心设计特点

1. 分布式架构，高可用高扩展

import org.apache.kafka.clients.producer.*; import org.apache.kafka.common.serialization.StringSerializer; import java.util.Properties; import java.util.concurrent.ExecutionException; public class KafkaProducerDemo { // Kafka Broker 地址（集群用逗号分隔） private static final String BOOTSTRAP_SERVERS = "127.0.0.1:9092"; // 要发送的 Topic private static final String TOPIC = "test_topic"; public static void main(String[] args) { // 1. 配置生产者参数 Properties props = new Properties(); // 必配：Broker 地址 props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, BOOTSTRAP_SERVERS); // 必配：键的序列化器（消息的键和值必须序列化为字节数组，StringSerializer 序列化字符串） props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName()); props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName()); // 可选：消息确认机制（acks=1 表示主副本写入成功即返回，生产环境常用；acks=all 表示所有副本写入成功返回，最高可用） props.put(ProducerConfig.ACKS_CONFIG, "1"); // 可选：发送失败重试次数 props.put(ProducerConfig.RETRIES_CONFIG, 3); // 可选：批量发送大小（16KB），攒够大小再发送，提升吞吐 props.put(ProducerConfig.BATCH_SIZE_CONFIG, 16384); // 2. 创建生产者实例（实现 AutoCloseable，可使用 try-with-resources 自动关闭） try (KafkaProducer<String, String> producer = new KafkaProducer<>(props)) { // 3. 构建消息（ProducerRecord<键类型，值类型>） ProducerRecord<String, String> record = new ProducerRecord<>(TOPIC, "key1", "hello kafka from java"); // 方式 1：异步发送（无返回，通过回调处理成功/失败） producer.send(record, (metadata, exception) -> { if (exception == null) { // 发送成功：metadata 包含消息的分区、Offset 等信息 System.out.printf("异步发送成功：分区=%d，Offset=%d%n", metadata.partition(), metadata.offset()); } else { // 发送失败：处理异常 exception.printStackTrace(); } }); // 方式 2：同步发送（调用 get() 阻塞，直到返回结果） try { RecordMetadata metadata = producer.send(record).get(); System.out.printf("同步发送成功：分区=%d，Offset=%d%n", metadata.partition(), metadata.offset()); } catch (InterruptedException | ExecutionException e) { e.printStackTrace(); } // 刷新生产者，确保所有消息发送到 Broker producer.flush(); } } }

import org.apache.kafka.clients.consumer.ConsumerConfig; import org.apache.kafka.clients.consumer.ConsumerRecord; import org.apache.kafka.clients.consumer.ConsumerRecords; import org.apache.kafka.clients.consumer.KafkaConsumer; import org.apache.kafka.common.serialization.StringDeserializer; import java.time.Duration; import java.util.Collections; import java.util.Properties; public class KafkaConsumerDemo { private static final String BOOTSTRAP_SERVERS = "127.0.0.1:9092"; private static final String TOPIC = "test_topic"; // 消费者组 ID（必须指定，相同组 ID 的消费者属于同一个消费者组） private static final String GROUP_ID = "test_consumer_group"; public static void main(String[] args) { // 1. 配置消费者参数 Properties props = new Properties(); props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, BOOTSTRAP_SERVERS); props.put(ConsumerConfig.GROUP_ID_CONFIG, GROUP_ID); // 必配：键的反序列化器（与生产者序列化器对应） props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName()); props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName()); // 可选：是否自动提交 Offset（默认 true，生产环境可改为 false，手动提交保证消费幂等） props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "true"); // 可选：自动提交 Offset 的间隔（5000 毫秒） props.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "5000"); // 可选：消费者启动时，若没有消费位置（首次消费），从最新消息开始消费（latest）/从最早消息开始消费（earliest） props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "latest"); // 2. 创建消费者实例 try (KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props)) { // 3. 订阅 Topic（可订阅多个，传入集合） consumer.subscribe(Collections.singletonList(TOPIC)); // 4. 循环拉取消息（消费者是拉取模式，需持续轮询） while (true) { // 拉取消息，超时时间 100 毫秒：若没有消息，等待 100 毫秒后返回空集合 ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100)); // 遍历消费消息 for (ConsumerRecord<String, String> record : records) { System.out.printf("消费成功：Topic=%s，分区=%d，Offset=%d，键=%s，值=%s%n", record.topic(), record.partition(), record.offset(), record.key(), record.value()); } } } } }

特性	Kafka	RabbitMQ	RocketMQ
核心定位	分布式高吞吐消息队列	轻量级 AMQP 协议队列	分布式通用消息队列
吞吐能力	极高（十万级 TPS）	中等（万级 TPS）	高（十万级 TPS）
延迟特性	毫秒级	微秒级（低延迟）	毫秒级
持久化	磁盘持久化，支持长期保留	磁盘 / 内存持久化	磁盘持久化
分布式架构	原生分布式，易扩展	需手动搭建集群，扩展较复杂	原生分布式，易扩展
协议支持	自定义协议	AMQP/MQTT/STOMP	自定义协议，兼容部分 MQTT
适用场景	大数据、流处理、日志收集、削峰填谷	微服务轻量解耦、低延迟场景	微服务解耦、削峰填谷、分布式事务
Java 集成	原生客户端 + Spring Kafka	原生客户端 + Spring AMQP	原生客户端 + Spring Cloud Stream

Kafka Java 生态分布式高吞吐消息队列详解