Flink与Spark Streaming对比

Question

请从架构、延迟、容错、状态管理、时间语义等维度对比Flink和Spark Streaming（包括Structured Streaming）的差异。。大数据 面试题。阿里巴巴 面试题

我是大山 · Accepted Answer

核心架构差异： | 维度 | Flink | Spark Streaming | |------|-------|----------------| | 计算模型 | 真正的流式处理（逐条处理）| 微批处理（Micro-Batch）| | 运行时 | 独立Runtime | 基于Spark Engine | | 数据处理 | 事件驱动 | 批次驱动 | | 延迟 | 亚秒级（毫秒级）| 秒级（≥Batch Interval）| 时间语义对比： | 特性 | Flink | Spark Structured Streaming | |------|-------|---------------------------| | 事件时间 | 原生支持 | ✅ 支持 | | 处理时间 | ✅ | ✅ | | 摄入时间 | ✅ | ✅ | | 乱序处理 | Watermark机制非常成熟 | Watermark支持（2.4+） | | 迟到数据 | Allowed Lateness + Side Output | Drop或Update模式 | 容错机制： | 维度 | Flink | Spa...

Flink与Spark Streaming对比

回答

我是大山