数据仓库与数据挖掘考试题 下载本文

内容发布更新时间 : 2024/6/27 22:17:22星期一 下面是文章的全部内容请认真阅读。

多练出技巧 巧思出硕果 数据仓库与数据挖掘 姓名: 选择题 1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( ) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 2. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( ) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 3. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( ) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 4. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?( ) A. 探索性数据分析 B. 建模描述 C. 预测建模 D. 寻找模式和规则 5.下面哪种不属于数据预处理的方法? ( ) A变量代换 B离散化 C 聚集 D 估计遗漏值 6. 假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? ( ) A 第一个 B 第二个 C 第三个 D 第四个 7.上题中,等宽划分时(宽度为50),15又在哪个箱子里? ( ) A 第一个 B 第二个 C 第三个 D 第四个 8. 只有非零值才重要的二元属性被称作:( ) A 计数属性 B 离散属性 C非对称的二元属性 D 对称属性 9. 以下哪种方法不属于特征选择的标准方法: ( ) A嵌入 B 过滤 C 包装 D 抽样 10.下面不属于创建新属性的相关方法的是: ( ) A特征提取 B特征修改 C映射数据到新的空间 D特征构造 分数: 填空 1、调和数据是存储在 和操作型数据存储中的数据。 2、数据仓库就是一个 的、集成的、 、反映历史变化的数据集合。 3、数据仓库系统的体系结构根据应用需求的不同,可以分为以下4种类型: 、 、 、 。 4、当维表中的主键在事实表中没有与外键关联时,这样的维称为 。它于事实表并无关系,但有时在查询限制条件(如订单号码、出货单编号等)中需要用到。 5、连续型属性的数据样本之间的距离有 、 和 。 6、分类器设计阶段包含三个过程: 、 和 。 7、分类问题中常用的评价准则有 、 和 。 8、抽取、转换、加载过程的目的是为决策支持应用提供一个 、权威数据源。因此,我们要求ETL过程产生的数据(即调和数据层)是 、历史的、规范的、可理多练出技巧 巧思出硕果 解的、即时的和质量可控制的。 9、雪花型模式是对 维表的进一步层次化和规范化来消除冗余的数据。 10、支持向量机中常用的核函数有 、 和 。 简答、简述题 1、什么是数据仓库?数据仓库的特点主要有哪些? 2、什么是聚类?它与分类有什么异同? 3、简述处理空缺值的方法。 4、简述ID3算法的基本思想及其主算法的基本步骤。 多练出技巧 巧思出硕果 5、 何谓OLTP和OLAP?它们的主要异同有哪些? 6、简述你对数据仓库未来发展趋势的看法。