数据仓库-基础概念
什么是OLTP&OLAP
1.区别
- 联机事物处理:OLTP
侧重于事物
事物ACID特性
- 原子性(atomicity)
- 一致性(consistency)
- 孤立性(isolation)
- 持续性(durability)
联机分析处理:OLAP
侧重于分析
- 维度(Dimension)
- 度量(Measure)
- 下钻(Drill-down)与上卷(Roll-up)
- 切片(Slice)与切块(Dice)
- 旋转(Pivot)
2.关系
3.模型设计的三个阶段
- 概念模型
概念模型涉及主要是指通过分析和贵奈,将业务划分成几个主体,并确定主题之间的关系,比如: 电影行业:影院、影片、影人、用户、订单、渠道、发行等 出行行业:司机、乘客、订单、支付、车辆等
- 逻辑模型 在概念模型的基础上,定义数据仓库各种实体、属性、关系,指导后续的数据存储和数据应用的开发。
范式建模: 第一范式:原子性,数据不可分割。 第二范式:唯一性,每一行数据都具备唯一性。 第三范式:独立性,消除传递依赖
维度建模: 星型: 由一个事实表和一组维表组成,每个维表都有一个维度作为主键,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接,形成一个星型结构
雪花型: 在星型模型基础上,基于范式理论进一步层次化,将某些维表扩展成事实表,最终形成雪花状结构。
- 物理模型 物理模型是基于逻辑模型设计的结构,设计数据对象的物理实现,比如表的命名规范、字段的命名规范、字段类型选择、分区设置、存储设置、更新方式等等