数据仓库复习重点

内容发布更新时间 : 2025/1/5 22:49:01星期一 下面是文章的全部内容请认真阅读。

学习好资料 欢迎下载

数据仓库的用途(数据仓库与事务性数据库的区别)

1.事务性数据库帮助人们执行活动,数据仓库帮助人们制定计划 2.事务性数据库侧重于细节,数据仓库侧重于高层次的聚合

3.事务性数据库通常为特定的应用程序而设计,而数据仓库集成了不同源头的数据 4.事务性数据库关心的是现在,数据仓库关心的是随时间变化的活动 5.事务性数据库是易变的,数据仓库是稳定的

6.事务性数据库必须能够对详细信息快速获取或更新,数据仓库必须能够对高度汇总的信息快速获取。

事实表:在多维数据仓库中,保存度量值的详细值或事实的表。 度量值:在数据仓库中,用来监视业务的可以汇总的数值。 成员:维度中的项目称为维度的成员

主键列:数据库维度表中的一个列,它包含的值唯一地表示每行数据。主键列在维度表。 外键列

数据库表中的一个列,某个其他数据库表的主键列的每个值都可能在其中出现多次。 雪花型设计:一种数据库布局,其中维度的属性被保存在单独的(规范化的)表中。 星型设计

一种数据库布局,其中维度的多个属性被冗余地保存在单个(反规范化的)维度表中 第2章:

计算成员:一种使用比存储在多维数据集中更复杂的公式来聚合度量值的机制 多维数据集:一个或多个度量值组以及它们相关的维度的集合 度量值组

单个事实表中明细数值的概念容器,附带一个或多个维度层次结构的所有可能聚合 第3章

由顶至底开发方法

即是首先要创建一个没有数据源的多维数据集,然后再生成关系架构并加载数据源 商业智能开发平台

Visual Studio中的商业智能设计器称为商业智能开发工作台。在BIDS环境中,可以创建为高性能分析组织数据的分析服务项目,可以创建为分析服务项目准备和加载数据的集成服务包,还可以创建把分析结果呈现给业务用户社区的报表服务报表。 SQL Server管理工作台

对生产数据库进行常规维护工作——例如处理数据库项目 分析服务项目(主要构成)

主要构成:“数据源”、“数据源视图”、“多维数据集”、“维度”、“挖掘结构”、“角色”、“程序集”和“其他”。 第4章:

由底至顶开发方法

学习好资料 欢迎下载

即是首先添加数据源,接着创建数据源视图,然后使用维度向导创建维度的初始结构,最后创建多维数据集 角色共享维度

同一维度可以在事实表中担任不同的角色,当事实表中多个外键连接到同一个维度表时,可以认为该维度是一个角色共享维度。 (向多维数据集中添加角色共享维度:确保在事实表和维度表之间定义了多个关系。通过维度向导创建维度,打开多维数据集设计器,右击“多维数据集结构”选项卡上“维度”窗格的背景,单击“添加多维数据集维度”,单击列表中的维度,然后单击“确定”按钮) 父子维度

父子维度是指构建一个包含一个内置的递归层次结构的表,可以使用这个层次结构中的每个分支的所有级别来聚合数值。 (手工创建父子维度:遵循创建标准维度的过程,在维度向导“定义父子关系”页面选中“这个维度的属性中含有父子关系”复选框,最后指定父属性键) 第5章: 度量值组

(重命名度量值组:在多维数据集设计器的“多维数据集结构”选项卡中,右击度量值组,然后选择“重命名”,或在属性窗口中更改Name属性;向已有的多维数据集添加度量值组:在多维数据集设计器的“多维数据集结构”选项卡中,右击“度量值”窗格的任何区域,选择“新建度量值”,然后选择相应的事实表) 粒度属性

当关系类型为常规时,必须指定一个粒度属性,它是表示事实表中对应最低粒度明细信息的维度属性。

半累加性度量值

半累加性度量值只能按照多维数据集中部分维度进行累加,而不是全部。通常用于固定时间点数值(也称为快照)。(把半累加性度量值添加到多维数据集时,不管是通过多维数据集向导还是通过多维数据集设计器手工添加的,都要更改它的默认聚合行为) 无重复计数度量值

无重复计数度量值返回事实表中唯一成员的计数。必须包含在单独的度量值组中。 (添加无重复计数器度量值:在多维数据集设计器的“多维数据集结构”选项卡中,右击“度量值”窗格的任何区域,单击“新建度量值”,从“用法”下拉列表中选择“无重复计数”,然后从“源表”下拉列表中选择事实表,然后单击源列。) 第6章: 一元操作符

加法为+,减法为 — ,乘法为*,除法为/,~表示不对成员进行聚合。这些代码称为一元操作符。 第7章: 聚合设计

1.因为要避免数据爆炸,方法就是避免把聚合数据都存储起来,在需要的时候再计算它们。2.而且,对于大型的多维数据集,聚合会对查询速度产生巨大的影响,帮助分析服务快速地响应查询。

学习好资料 欢迎下载

3.不需要存储多维数据集所有可能的聚合值。分析服务可以使用已有的聚合尽快地计算出需要的数值。

聚合值:聚合值是从多维数据集中获取的单个总计值。 聚合

聚合包含了多维数据集中一个属性层次结构与所有其他层次结构所有可能的组合。是累加性度量值预先计算好的总计值。 层次结构

第8章:

MDX查询式的写法(8.2)

Select

CrossJoin([Time].[Calendar Year].[All].Children,

{[Measures].[Reseller Sales Amount], [Measures].[Reseller Order Quantity]} on Columns, {[Product].[Product Category].[Category].&[1],[Product].[Product Category].[Category].&[1].CHILDREN} on Rows From [SSAS] 计算的次序 关键性能指标

关键性能指标KPI度量的是业务为满足其目标所进行的过程。对于每个KPI,需要为KPI的数值、目标、当前状态和走向创建表达式。 目标表达式:定义业务目标。 状态表达式:定义怎样比较值与目标。

走向表达式:用来比较当前状态数值与前一个时间点状态的数值。 第9章: 引用关系

(创建引用维度:使用维度向导创建一个新维度。这个维度必须关联到另一个维度表,而后者必须关联到一个事实表。在多维数据集设计器的“多维数据集结构”窗格添加这个新维度。在多维数据集设计器的“维度用法”窗格,单击新维度与某个度量值组的交叉点,在“选择关系类型”下拉列表中选择“被引用”,在“维度”列表框中选择关联维度,最后在“维度属性”和“中间维度属性”下拉列表中选择相应的键列) 多对多关系

维度表中的多个成员与事实表中的多条记录相对应,这种类型的关系称为多对多关系。 (定义多对多关系:使用维度向导创建两个维度,每个都与一个事实表相关,这些事实表必须是存储第一个维度中多个成员与第二个维度中多个成员映射关系的中间事实表。其中一个维度要关联到一个主事实表。在“多维数据集结构”选项卡为每个事实表逐一创建度量值组,并添加这两个新维度。在多维数据集设计器的“维度用法”选项卡,单击关联到主事实表的维度与此事实表对应度量值组的交叉点,在“选择关系类型”下拉列表中选择“常规”,然后在“度量值组列”列表框选择相应的列值。在“维度用法”选项卡中单击另一个维度与中间度量值组的交叉点

第10章:

标准操作、钻取操作、数据集写回

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4 ceshi