1、数据仓库中的模型 数据仓库的设计范式内容提要n什么是模型n三级数据n概念数据模型n逻辑数据模型n物理数据模型nInmon的三级数据模型模型及其变迁客观对象从现实世界到计算机世界的变化过程数据仓库构造过程中各种数据模型 数据仓库的三级数据模型n数据仓库设计的三级数据模型,对应与数据库系统中的三级数据模型 n概念数据模型:主观和客观之间的桥梁;n逻辑数据模型:一般使用关系模型;n物理数据模型:逻辑数据模型的实现;数据仓库与数据库的数据模型的区别n主要有三点不同n数据仓库的数据模型不包含纯操作性的数据;n数据仓库的数据模型扩充了码结构,增加了时间属性作为码的一部分;n数据仓库的数据模型中增加了一些导
2、出数据;概念数据模型n概念数据模型:常用的表示方法是实体联系(E-R)法,用E-R图作为它的描述工具。n矩形表示实体主题,在矩形框内写上主题名。n椭圆形表示主题的属性,无向边把主题与其属性连接起来。n菱形表示主题之间的联系,菱形框内写上联系的名字。 例:一个制造企业的概念模型例:某商场的概念模型E-R图 购买供应顾客固有信息顾客号顾客顾客购物信息日期供应商固有信息供应商供应商号供应商品信息日期商品采购信息商品销售信息商品号商品商品固有信息商品库存信息日期概念数据模型的规范化常见的概念模型1星型模型常见的概念模型2雪花模型逻辑数据模型n逻辑数据模型n使用关系模型对主题进行描述;n主题与主题之间的
3、联系都用关系来表示;例:概念层与中间层的对应关系物理数据模型n物理数据模型n在逻辑数据模型的基础之上实现的,物理数据模型设计时,考虑的主要因素: I/O存取时间、空间利用率和维护代价。n物理模型的设计对数据仓库性能的影响 Inmon对数据模型的另一种阐述n高层数据模型:对数据抽象程度最大,使用E-R图。 n中间层数据模型n基本数据组:属于基本不会发生变化的项。 n二次数据组:基本不变化,但又存在变化的可能的数据项。 n联接数据组:本主题域与其他主题域间的联系,一个主题的公共码键。 n类型数据组:经常变化的数据项。n低层数据模型 :物理数据模型;中间层模型中的4种基本结构 数据模型的作用操作型环境设计操作型处理应用开发与设计DBDB数据仓库环境设计DSS应用开发与设计DW数据模型元数据模型n技术元数据内容元数据模型n业务元数据内容数据仓库的粒度模型 n粒度的大小与细节的损失 数据仓库的粒度模型n粒度划分的策略