Kafka 概念

2025/4/16 14:46:40 来源：https://blog.csdn.net/qq_41893505/article/details/147014818 浏览: 次关键词：Kafka 概念

🌀 Kafka 是什么？

Kafka 是一个分布式流处理平台，可以用来：

🚚 高效地收集、传输、存储、处理实时数据流。

它最初由 LinkedIn 开发，用于解决海量日志处理的问题，后来开源给 Apache，成为现在广泛应用的数据中枢系统。

能力	描述
✅ 消息队列	实现服务解耦，异步通信，类似 RabbitMQ、RocketMQ，但吞吐更高
✅ 日志采集系统	高性能写入、持久化、传输（用于 ELK、日志分析等）
✅ 事件驱动架构	系统之间通过“事件”交互，解耦微服务
✅ 实时数据流处理	配合 Flink、Spark 等组件做实时分析
✅ 数据管道（ETL）	把数据从业务系统、数据库、日志收集器汇总到数据仓库、Hadoop、ES 等

优势	解释
⚡ 高吞吐	每秒百万级消息处理，适合大规模应用
🔁 可持久化	消息写磁盘，多副本，支持数据留存几小时、几天甚至更久
🧱 分布式架构	天生支持横向扩展，节点越多性能越高
🔌 支持实时与离线	可用于实时流处理，也适合批量导入
🔧 容错性强	Broker 故障不会丢数据，自动重试
🧩 生态成熟	和 Spark、Flink、Hive、ClickHouse 等无缝集成
👀 可回溯消息	可指定 offset 重复消费，用于补数/故障恢复