Flink SQL Group Aggregation与Over Aggregation的区别

Question

Flink SQL中Group Aggregation（分组聚合）和Over Aggregation（窗口聚合/分析函数）在处理流数据时有什么本质区别？请解释Over Aggregation的窗口帧（ROWS BETWEEN/RANGE BETWEEN）在流处理中的语义，以及如何通过ROW_NUMBER()实现去重T...

孤独的心 · Accepted Answer

Group Aggregation vs Over Aggregation区别： 1. Group Aggregation（分组聚合）： SELECT user_id, SUM(amount) AS total FROM orders GROUP BY user_id; 按分组键聚合，每个分组输出一行 流模式下输出为更新流（changelog stream） 结果随新数据不断更新 2. Over Aggregation（窗口聚合/分析函数）： SELECT order_id, user_id, amount, order_time, SUM(amount) OVER ( PARTITION BY user_id ORDER BY order_time ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW ) AS cumulative_amount FROM orders; 在每一行上计算窗口帧内的聚合 不改变行数（每行对应输出一行） 适合计算累计值、移动平均、排名 3. ORDER BY +窗口帧定义： | 窗口帧 | 含义 | |---...

Flink SQL Group Aggregation与Over Aggregation的区别

回答

孤独的心