Flink SQL DDL中维表Join的实现与优化

Question

Flink SQL中如何实现维表Join（Lookup Join）？请列举支持的维表类型（JDBC/HBase/Redis），解释Lookup Cache/Batch模式的工作原理，以及如何处理延迟维表数据的更新。。大数据 面试题

古法程序员 · Accepted Answer

Flink SQL维表Join（Lookup Join）： DDL语法： CREATE TABLE dim_user ( user_id INT, user_name STRING, address STRING, PRIMARY KEY (user_id) NOT ENFORCED ) WITH ( 'connector' = 'jdbc', 'url' = 'jdbc:mysql://...', 'lookup.cache.max-rows' = '10000', 'lookup.cache.ttl' = '10min' ); SELECT * FROM fact_order LEFT JOIN dim_user FOR SYSTEM_TIME AS OF proctime() ON fact_order.user_id = dim_user.user_id; 支持的维表： JDBC（MySQL/PG） HBase Redis Elasticsearch 自定义AsyncLookupFunction Lookup Cache模式： Full Cache：启动时全量加载到TM内存，...

Flink SQL DDL中维表Join的实现与优化

回答

古法程序员