内容发布更新时间 : 2024/11/17 12:45:43星期一 下面是文章的全部内容请认真阅读。
1)数据获取
2)数据存取和管理 3)信息访问
3、对数据仓库的基本体系结构进行细分,一个数据仓库一般有7个主要部分组成 1)数据源
2)数据抽取、转换和装载工具 3)数据建模工具 4)核心仓储
5)数据仓库的目标数据库 6)前端数据访问和分析工具 7)数据仓库管理工具
三、数据仓库数据模型的设计
1、一般来说,数据仓库中数据模型设计,采取的是面向主题的自顶向下的设计方法,或者说是面向对象的设计方法。
2、数据仓库的设计与传统的设计方法一样,要经过概念模型设计、逻辑模型设计和物理模型设计三个阶段。
3、对于面向主题的数据仓库来说,分别有:1)概念模型设计—信息包图
①信息包图拥有三个重要对象:指标、维度和类别。指标是在维度空间衡量商务信息的一种方法;类别是在一个维度内为了提供详细分类而定义的,
②利用信息包图设计概念模型需要确定三大内容:确定指标、确定维度、确定类别。 2)、逻辑模型设计—星型图模型
①同信息包图中的三个对象对应,星型图拥有三个逻辑实体:维度、指标和类别
首先,位于星型图中心的实体是指标实体,对应信息包图中的指标对象,是用户最关心的基本实体和查询活动的中心,为用户的商务活动提供定量数据。
其次,位于星型图星角上的实体是维度实体,对应信息包图中的维度对象,其作用是限制用户的查询结果,将数据过滤使得指标实体查询返回较少的行,从而缩小访问范围
再次,另外一个实体是类别实体,它对应信息包图中的类别对象;一个维度的每个单元就是一个类别,代表维度内的一个单独层次。
②从概念模型(信息包图)转换为逻辑模型(星型图)需要确定三个实体:定义指标实体、定义维度实体和定义详细类别实体。
3)物理模型设计—星型图转换为数据模型
①星型图中的指标实体和详细类别实体通常转变为一个具体的物理数据库表,而维度实体则作为查询的参考、过滤和聚合数据使用,因此通常并不直接转变为物理数据库表。 ②物理模型设计阶段,需要确定三个内容:定义数据标准、定义实体和实体特征、定义规模。
第二节 数据挖掘技术
一、概述 数据挖掘:就是从大型数据库或仓库的数据中提取人们感兴趣的知识,这些知识实施隐含的、事先未知的潜在的有用的信息,提取的知识表示为概念、规则、模式等形式。 数据挖掘的任务:是从大量的数据中发现知识。
1、数据挖掘的主要任务:1)总规则挖掘 2)关联规则挖掘 3)分类规则挖掘 4)聚类规则挖掘
2、数据挖掘过程 (挖掘一般由三个阶段组成:数据准备、挖掘操作、结果表达和解释。
3、实际数据挖掘操作的要点:1)首先决定如何产生假设 2)选择合适的工具 3)挖掘知识的操作 4)证实发现的知识 5)结果表述和解释
4、数据挖掘过程中采用的挖掘技术 1)统计分析方法 2)决策树分析方法 3)遗传算法 4)人工神经网络 5) Rough集,又称粗集理论 6)最近邻技术 7)归纳规则 8)可视化技术 二、数据挖掘技术
数据挖掘:就是从大量的、不完全的、模糊的、随机的实际应用数据中,抽取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。 1、关联规则的数据挖掘
1)关联规则的数据挖掘就是要找出支持度大于用户指定的最小支持度、置信度大于用户指定的最小置信度的数据项集,即挖掘出数据库的强关联规则
2)关联规则的数据挖掘挑战的关键:第一步找出大项集的关键,第二步只要通过循环就可以从大项集中挖掘出关联规则。 2、转移规则的数据挖掘
3、分类方法数据挖掘
三、数据挖掘的功能
数据挖掘的目标:是从数据库中发现隐含的、有意义的知识
功能:1、自动预测趋势和行为 2、关联分析 3、聚类 4、概念描述 5、偏差检查 四、数据挖掘工具
1、基于人工神经网络的工具 2、基于规则和决策树的工具 3、基于模糊逻辑的工具 4、综合多种方法的工具
第三节 网络数据挖掘
一、网络数据挖掘与传统的数据挖掘
网络数据挖掘与传统数据挖掘相比,具有以下特点:1、数据源是无序的、非结构化的 2、数据源之间可能存在沉余、不一致甚至矛盾 3、数据源具有很强的动态性 4、数据具有多样性 5、用户目标的模糊性 二、网络数据挖掘的固定流程
网络数据挖掘的4个步骤:1、确定业务对象 2、数据准备 3、网络数据挖掘 4、结果分析
三、网络数据挖掘的形式
1、网络内容挖掘 (网络内容是由文本、图像、音频、元数据等形式的数据组成的) 2、网络结构挖掘 (网络结构挖掘就是挖掘Web潜在的链接结构模式) 3、网络用法挖掘
四、网络数据挖掘专业人员
1、业务分析人员 2、数据分析人员 3、数据管理人员
第四节 电子政务的数据挖掘
一、数据挖掘在电子政务中的应用
1、政府的电子贸易在服务器以及浏览器端日志记录的数据中隐藏着模式信息,运用网络数据挖掘技术可以自动发现系统的访问模式和用户的行为模式,从而进行预测分析
2、网站设计通过对网站内容的数据挖掘,主要是对文本内容的数据挖掘,可以有效的组织网站信息
3、搜索引擎网络数据挖掘是目前网络信息检索发展的一个关键 4、为政府重大政策出台提供决策支持 二、实施数据挖掘应考虑的问题
实施数据挖掘从三方面考虑:1、用数据挖掘解决什么样的问题 2、为进行数据挖掘所做的数据准备 3、数据挖掘的各种分析算法
第十章 决策支持系统在电子政务中的应用
第一节 决策支持系统及其发展过程
一、决策支持系统
决策支持系统:就是从数据库中找出必要的数据,并利用数学模型的功能,为用户生成所需要的信息系统。
一个好的决策支持系统应具备的特点:1、辅助决策者解决半结构化的问题
2、允许用户试探几种不同的决策方案 3、必须具备决策支持模型的管理功能 4、吧数学模型或分析技术与数据存储和检索功能结合起来 5、系统必须具备友好的人机交互界面
6、系统必须具备良好的适应能力,可以满足不同环境和用户的需求 二、决策支持系统的发展过程
1、决策者的迫切需求促进了DSS的发展 2、在一个单位内部将若干个分离的DSS集合 3、DSS和其他信息系统集成 4、专家信息系统(EIS)的出现 三、决策过程的三个阶段 1、发现问题阶段 2、分析和探讨问题阶段
分析:不仅要对所发现和弄清的决策问题进行和列表,更重要的是要弄清一下问题: 1)证实这种决策问题发展的趋势和存在的必然性
2)搞清楚这种决策问题为什么会出现或为三年会存在这种趋势或异常 3)预测这种决策问题随着时间进程的发展趋势和演变过程 4)要预报这种决策问题的发展趋势或异常会造成什么影响和后果 3、说明结论和得到确认的阶段
第三阶段为向决策者说明所发现的这种决策问题和结论,并且能够得到确认的阶段
决策支持工具在线提供更加智能化的功能:1)全部决策过程利用数据和信息实现多元可视化 2)各种分析功能十分强大,但又能够面向大众,进行智能化决策支持的全过程要有以决策者为主导的灵活性,或者要有以系统功能使用者为主导的灵活性。
第二节 智能信息系统与智能化决策支持系统
一、智能信息系统
1、智能决策支持系统 2、专家系统 3、智能机器人 4、智能计算机 5、四库系统(知识系统) 6、自然语言理解 7、图像识别和语言识别 二、智能化决策支持系统
美国把多目标决策支持系统分成五代:第一代系统是单目标决策支持系统;第二代系统是利用数据库的系统;第三代系统是综合运用数据库及对话技术的系统;第四代系统是把各种决策方法汇集在一个模型库内,设有模型管理系统,同时也利用了数据库和对话库等技术; 第五代系统是知识工程为基础的系统,由语言系统、知识系统和问题处理系统构成
智能化支持系统包括:1、数据仓库和多维数据库 2、面向用户的交互式分析工具 3、用模块组建的集成工具 4、智能化的决策支持工具
第三节 电子政务决策支持系统
一、决策支持系统的运行步骤
信息系统(决策支持系统和信息管理系统)—→参谋(智囊)系统—→决策系统—→监督系统—→决策执行系统
二、电子政务决策支持系统
1、决策支持系统的三种信息处理技术
1)数据仓库技术 2)联机分析处理技术 3)数据挖掘技术 2、电子政务中使用的智囊技术
1)智能信息检索 ①模糊神经聚类算法 ②软件计算方发 2)智能网络入侵检测技术 ①基于神经网络的入侵检测方法
②基于专家系统的入侵检测技术 ③基于模型推理的入侵检测技术 3)智能网络监控 4)智能体
支持智能体独立工作技术主要包括:①模式匹配和复杂的逻辑比较 ②基于知识的快速推理系统 ③继承其他智能体知识的能力 ④当数据不完整时可以进行缺省推理的能力
我国新一代决策支持系统目前面临的问题:第一,目前我国可用的各类数据信息有限,基于数据仓库技术的决策支持系统缺乏坚实的基础
第二,数据仓库产品价格昂贵,限制了新一代决策支持系统在我国的推广速度
第三,由于新一代决策支持系统所需要的支撑平台几乎全部依赖进口,安全性无法保证,因此限制了我国核心部门发展决策支持系统的步伐,影响了我国的信息化进程 三、电子政务决策支持系统的研究内容
1、决策建模技术 2、模型库系统 3、接口技术 4、知识表示及推理技术 5、系统集成技术的研究 6、系统开发技术 7、国产化
第十一章 虚拟现实技术在电子政务中的应用
第一节 虚拟现实的定义
一、虚拟现实的定义 虚拟现实(VR):是一门集成人与信息的科学,其核心是由一些三维的交互式计算机生产的环境组成
虚拟现实的含义:1、VR是通过计算机生成一个非常逼真的足以“迷惑”我们人类视觉的虚幻世界
2、虚拟现实与通常CAD系统所产生的模型是不一样的它不是一个静态世界,而是一个开放环境,它可以对使用者的输入作响应;
3、虚拟现实不仅仅是一个媒体,一个高级用户界面,它是解决工程、医学、军事等方面的问题而由开发者设计出来的应用软件,她以夸大的形式反映设计者的思想。 二、虚拟现实技术的发展概述
四、虚拟现实在Internet上的应用
1、远程教育 2、商业应用 3、娱乐
第二节 虚拟现实涉及的关键技术
一、VR发动机
二、输入输出工具
1、跟踪三维物体运动的传感器 2、驱使使用者在虚拟环境中运动的技术 3、响应使用者手的姿态命令输入的感觉手套技术
4、产生具有深度信息及宽视区的三维立体成像装置 5、实时图像生成 6、三维虚拟立体声生成装置 三、VR的软件工程
VR的软件工程包括虚拟物体的几何模型、运动模型、物理模型的建立,虚拟立体声的产生,模型管理技术及实时模拟技术等
具体介绍:1、虚拟物体的几何模型、 2、运动模型、 3、虚拟立体声的模拟 4、物理模型的建立, 5、输入输出映射 6、模型的分割 7、虚拟现实模式的管理技术 8、虚拟环境数据库的建立和管理
第三节 信息传送与虚拟现实
一、 二、 三、
第一阶段:单纯数据、文字、字符信息传送 第二阶段:多媒体信息传送 第三阶段:虚拟现实信息传送