数据仓库实验报告 下载本文

内容发布更新时间 : 2024/12/24 2:37:44星期一 下面是文章的全部内容请认真阅读。

实验报告 院、系 课程名称 指导教师 计算机学院 实 验 名 称 年级专业 计算机科学 姓名 学号 与技术 数据仓库与数据挖掘 成绩 同组实验者 实验日期 实验一基于SQLServer2005示例数据库的多维数据模型 一. 实验目的 通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下建立多维数据 模型过程的知识,训练其把教材上的内容应用到实际中的技能,为今后继续数据挖掘技术的 学习奠定基础。 二. 实验内容 在SQL Server 2005示例数据仓库环境下建立多维数据模型。 针对Adventure Works Cycle公司的销售分析需求,从Adventure WorksDW示例数据库中导出数据,建立并部署“销售分析”多维数据集,进而从多角度对Adventure Works Cycle公司的销售状况作分析研究。 三. 实验步骤 1. 创建一个新的数据仓库分析项目 打开Visual Studio 2005分析项目,选择Analysis Serveices项目,并将项目名称更改为“销售分析示例” 2. 定义数据源 在“数据源”文件夹上右击,在弹出的快捷菜单上选择“新建数据源”命令。启动新建数据源向导,单机新建按钮。出现”连接管理器“对话框,在“提供程序”下下拉列表框中确保已选中服务账户,并命名数据源为”销售分析数据源”。 3. 定义数据源视图 选择“数据源视图” 文件夹,新建一个数据原视图。数据源选择上一步新建的“销售分析数据源”。在“可用对象”列表框中,选择下列表(同时按下Ctrl键可选择多个表)。 4. 定义多维数据集 右键单击“多维数据集”,从弹出的快捷菜单中选择“新建多维数据集”命令;已选中“使用数据源生成多维数据集”选项和“自动生成”选项;在“时间维度表”下拉列表中选择“时间”别名。下一步设置时间维,将时间属性名称映射到已指定为“时间”维度和维度表中的相应列。选择事实表的度量值(去掉不是度量值的列),可以对度量值重新命名。设置和校验维度的属性及层次结构和属性,在“查看新建维度”页上,通过展开树控制件显示该方向导检测到的三个维度的层次结构和属性,查看其中每个维度的维度层次结构(可根据需要去掉部分为度属性)。在“完成向导”页上,将此多维数据集的名称改为“销售分析多维数据集”单击“完成”按钮,便完成了多维数据集的定义,此时仍可以对维度或度量等名称做更改,以便最终用户理解与使用。在维度设计器的“维度结构”选项卡上,可以添加,删除和编辑层次结构,级别和属性。 5. 部署“销售分析示例”项目 若要查看刚才建立的的销售分析多维数据集中的数据,必须将其所在的项目部署到分析服务的指定实例,然后可以处理多维数据集及其维度。 1) 部署配置 在解决方案资源管理器中,右键单击根结点“销售分析实例”项目,从弹出的快捷菜单中选择“属性”命令。在弹出的对话框中更改“数据库”对应值为Analysis Services。 2) 部署项目 在解决方案资源管理器中,右键单击“销售分析实例”项目,从弹出的快捷菜单中选择“部署”命令,或者在菜单栏上选择“生成”菜单,单击“部署销售分析实例”。 若服务器么有安装Analysis Services或没有启动数据库服务器,将报错“无法建立连接”,进而部署失败。 查看“输出”窗口和“部署进度-销售分析实例”窗口的内容,验证是否已生成,部署完成多维数据集,没有出现错误,且在右下角显示“部署成功完成”即表示部署成功。 6. 浏览已部署的多维数据集 部署完成后,就可以浏览多维数据集的实例数据了。浏览“销售分析实例”多维数据集及每个维度,已确定为了改进此多维数据集的功能而需要执行的更改。 在解决方案中单击“客户”维度,然后选择”浏览器“选择卡。 在这里,可以从各个角度浏览客户结构,现在有关客户级别的信息只显示客户的电子邮件地址,而不显示客户的姓名,需要通过后面的更改显示客户姓名,按省州分类浏览客户。 单击在解决方案的“多维数据集” 目录下的子项“销售分析图.cube”,切换到”浏览器”选项卡上,内容区分三个窗口:左边窗口显示事实表和维度表的元数据信息,右上窗口维度筛选器,右下窗口为报表数据显示窗口。 浏览多维数据集的操作方法:从元数据窗口拖动有关内容到右边显示区或筛选器中即可形成一个初步的报表,虽然还很粗糙,特别是显示格式等有待在后续的操作中改进。 展示数据的操作步骤如下: 1) 将事实表中的“销售额”度量值拖到数据显示区的“将合计或详细信息字段拖至此处”区域 2) 将客户维度表的“英语国家/地区区域名”属性层次结构拖到数据显示区的“将行字段拖至此处“区域。 3) 将产品维度表的“产品系列”拖到数据显示区的“将列字段拖至此处”区域;或者右键单击“产品系列”,从弹出的快捷菜单中选择“添加到列区域”命令。 4) 将“订单日期”维度的“季度”拖到数据显示区的“将筛选器字段拖至此处”区域,并单击“季度”下拉框,不选第四季度。 5) 右键单击“订单日期”维度的“年度”属性层次结构中的2002成员,然后单击“添加到子多维数据集区域”。再单击“筛选表达式”先单元格的下拉框,复选2003和2004年度即将选择2002/2003和2004这三年数据做报表。 7. 提高多维数据集的可用性和易用性 1) 修改度量值的有关属性。 2) 修改维度的层次结构和有关属性。 3) 增加维度属性。 4) 将命名计算列表作为弧度的成员名称。 5) 重新部署并查看修改。 6) 灵活快速地导出各类统计表。 四. 实验结果