数据仓库(一)

基本概念

Posted by LANY on January 4, 2020

数据仓库-基础概念

什么是OLTP&OLAP

1.区别

  • 联机事物处理:OLTP

侧重于事物

事物ACID特性

  • 原子性(atomicity)
  • 一致性(consistency)
  • 孤立性(isolation)
  • 持续性(durability)

联机分析处理:OLAP

侧重于分析

  • 维度(Dimension)
  • 度量(Measure)
  • 下钻(Drill-down)与上卷(Roll-up)
  • 切片(Slice)与切块(Dice)
  • 旋转(Pivot)

2.关系

3.模型设计的三个阶段

  • 概念模型

概念模型涉及主要是指通过分析和贵奈,将业务划分成几个主体,并确定主题之间的关系,比如: 电影行业:影院、影片、影人、用户、订单、渠道、发行等 出行行业:司机、乘客、订单、支付、车辆等

  • 逻辑模型 在概念模型的基础上,定义数据仓库各种实体、属性、关系,指导后续的数据存储和数据应用的开发。

范式建模: 第一范式:原子性,数据不可分割。 第二范式:唯一性,每一行数据都具备唯一性。 第三范式:独立性,消除传递依赖

维度建模: 星型: 由一个事实表和一组维表组成,每个维表都有一个维度作为主键,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接,形成一个星型结构

雪花型: 在星型模型基础上,基于范式理论进一步层次化,将某些维表扩展成事实表,最终形成雪花状结构。

  • 物理模型 物理模型是基于逻辑模型设计的结构,设计数据对象的物理实现,比如表的命名规范、字段的命名规范、字段类型选择、分区设置、存储设置、更新方式等等

流程

开发流程