Lambda与Kappa数据架构对比

Question

请对比Lambda架构和Kappa架构的设计理念、优缺点，以及各自适用的场景。。大数据 面试题。百度 面试题

我是大山 · Accepted Answer

Lambda架构： 设计理念： 同时维护批处理层（Batch Layer）和流处理层（Speed Layer），在服务层（Serving Layer）合并结果。 三层结构： 批处理层（Batch Layer）： 存储全量原始数据（HDFS/S3） 定期运行批作业计算准确结果 保障数据准确性（Accuracy） 流处理层（Speed Layer）： 实时计算新到数据 提供**低延迟（Low Latency）**的结果 补偿批处理的延迟 服务层（Serving Layer）： 合并批结果和流结果 提供统一查询服务 优缺点： | 优点 | 缺点 | |------|------| | 数据准确度高（批处理保证） | 两套代码维护成本高 | | 容错性好 | 结果合并逻辑复杂 | | 技术成熟 | 数据量翻倍存储 | Kappa架构： 设计理念： 只用一套流处理引擎处理所有数据，通过重放历史数据实现批处理等效。 核心思想： 所有数据以事件流形式进入Kafka（不可变日志） 流处理引擎（如Flink）实时处理 如需重新计算，直接重放Kafka中的历史数据 无需单独的批处理层 优缺点： | 优点...

Lambda与Kappa数据架构对比

回答

我是大山