本文介绍: 电商平台离线数仓建模理论必备知识点
0. 思维导图
第 1 章 数据仓库概述
1.1 数据仓库概述
1.2 数据仓库核心架构
第 2 章 数据仓库建模概述
2.1 数据仓库建模的意义
2.2 维度模型
下图为一个典型的维度模型,其中位于中心的SalesOrder为事实表,其中保存的是下单这个业务过程的所有记录。位于周围每张表都是维度表,包括Date(日期),Customer(顾客),Product(产品),Lopcation(地区)等,这些维度表就组成了每个订单发生时所处的环境,即何人、何时、在何地下单了何种产品。从图中可以看出,模型相对清晰、简洁。
维度模型以数据分析作为出发点,为数据分析服务,因此它关注的重点是用户如何更快的完成需求分析以及如何实现好的大规模复杂查询的响应性能。
第 3 章 维度建模理论之事实表
3.1事实表概述
事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计。包含与业务过程有关的维度引用(维度表外键)以及该业务过程的度量(通常是可累加的数字类型字段)。
1. 事实表特点
事实表通常比较“细长”,即列较少,但行较多,且行的增速快。
2. 事实表分类
事实表有三种类型:分别是事务事实表、周期快照事实表和累计快照事实表,每种事实表都具有不同的特点和适用场景。
3.2 事务型事实表
1. 概述
2. 设计流程
3. 不足
3.3 周期型快照事实表
1. 概述
2. 设计流程
3. 事实类型
1.可加事实
2.半可加事实
3.不可加事实
3.4 累积型快照事实表
1. 概述
2. 设计流程
第 4 章 维度建模理论之维度表
4.1 维度表概述
4.2 维度表设计步骤
4.3 维度设计要点
1. 规范化与反规范化
2. 维度变化
3. 多值维度
4. 多值属性
第 5 章 数据仓库设计
5.1 数据仓库分层规划
5.2 数据仓库构建流程
1. 数据调研
2. 明确数据域
3. 构建业务总线矩阵
4. 明确统计指标
5. 维度模型设计
6. 汇总模型设计
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。