星型模型与雪花型模型对比

Question

请比较数据仓库中星型模型（Star Schema）和雪花型模型（Snowflake Schema）的设计差异、优缺点，并给出选型建议。。大数据 面试题。百度 面试题

我还是少年 · Accepted Answer

一、星型模型： 结构： 中心：一张事实表（包含度量值+外键） 周围：多张维度表（非规范化，维度表直接连接事实表） 示例：销售事实表直连客户维、产品维、时间维、门店维 优点： 查询性能好（Join路径短，只需一次Join） 对BI工具友好 理解简单 缺点： 数据冗余（维度表非规范化） 维护成本高（维度数据一致性需ETL保证） 二、雪花型模型： 结构： 事实表仍是中心 维度表规范化（分解为多张表） 示例：产品维→产品分类维（产品维存分类ID） 优点： 数据冗余少，存储成本低 维度数据一致性更好（分类信息只存一份） ETL维护相对简单 缺点： 查询需多次Join，性能下降 BI工具建模复杂 对用户理解不友好 对比表： | 维度 | 星型 | 雪花型 | |------|------|--------| | Join次数 | 1次（事实→维表） | 多次（事实→维表→子维表）| | 查询性能 | 高 | 低 | | 存储 | 冗余大 | 冗余小 | | 维度层次 | 扁平 | 分层 | | ETL复杂度 | 低 | 中 | | 数据一致性 | 人工保证 | 结构保证 | 选型建议： 优先星型...

星型模型与雪花型模型对比

回答

我还是少年