EMPI管理手册 下载本文

内容发布更新时间 : 2024/5/19 8:29:49星期一 下面是文章的全部内容请认真阅读。

BestEMPI管理手册(MIDM)

(最后修改:2011/3/9)

1. 主索引系统简介

主索引系统提供了一个具有很强适应性的框架结构,利用这个框架可以生成匹配和索引应用,也称为主索引应用。这是一个应用生成工具,可以帮助你设计、配置和生成主索引应用,具有唯一识别和交叉索引存储在数据库系统中的商业对象。商业对象可以是任意类型的存储信息的实体,如客户、病人、开发商、商业客户、硬件部件等等。主索引系统可以帮助你定义商业对象的数据结构,并进行存储和交叉索引。同时,你还可以定义如何对这些数据在数据库中进行修改、标准化、加权和匹配。

2. 关于主索引应用

由主索引系统生成的应用系统是企业级的主索引应用,维护商业企业中当前的对象信息。一个主索引应用创建一个单一的、一致对所有对象数据的观察,提供自动的且通用的识别方法,而不用考虑数据来自的系统的位置。各个不同系统中的对象概要通过企业级别的唯一识别标志(EUID)进行交叉索引。通过创建EUID,主索引应用可以识别许多类型的参与者,如客户,员工,联系方式等等。

所有对象的识别号和通用信息通过一个共享的索引被集中保存。一个主索引应用就是专门为支持分布式和不同应用信息系统之间进行企业级整合而设计的。其作用就是将各个不同应用系统的数据进行企业级整合形成一个中央数据库,同时还允许各个本地系统仍能独立运行。一个主索引系统可以方便从分散在各个应用系统之中的信息进行查找。

3、主索引系统的特性

创建的主索引应用的各个组件是高度可配置化的,可以允许每个主索引应用这对特殊的需求进行定制。下面是主

索引系统的主要特性:

? 集中信息 一个主索引应用维护一个中央数据库,允许企业级别的数据整合,同时允许各个本地系统仍能独立运行。索引存储了本地源记录的拷贝和最优记录(SBR),其中最优记录(SBR)表示每个对象的最准确和完整的数据。数据库集中存放了所有对象的信息和识别号,并可通过企业进行访问。来自各个不同系统的记录通过EUID进行交叉索引。

? 可配置在部署主索引应用之前,可以定制系统组件和处理功能。可配置的组件包括。 ? ? ? ? ? ? ? ? ? ?

索引对象的类型 存储数据的类型 标准化和匹配引擎

匹配、标准化和语音转换规则 决定SBR的加权和最优规则 可用的查询类型

对于匹配处理,查询如何分组和分块 MIDM的界面 MIDM查询的权限 本地ID的验证策略

? 交叉索引 主索引应用具有全局的交叉索引服务功能,可通过不同的源系统进行概要匹配处理,简化不同系统之间共享数据的处理过程。主索引可以使用由本地生成的识别号进行引用,允许你维护当前的系统。

? 数据清除 主索引应用使用可配置的逻辑算法进行匹配处理,唯一识别对象的概要信息,识别重复的和有可能重复的概要信息。主索引应用提供可以方便合并功能,并且通过配置,可以自动对发现的重复信息进行匹配。

? 数据修改 主索引应用提供了增加、修改、取消激活、合并和删除数据库中的数据功能,这些功能可以通过接收外部系统发来的消息命令,也可通过MIDM进行实现。对于从外部系统接收的消息和通过MIDM输入的信息,在处理过程中进行可能性重复判断处理。

? 修改外部系统数据 主索引应用可以向外部系统发布修改的信息,其前提条件是外部系统接收消息。这是通过JMS消息主题来完成的。

? 识别 主索引应用采用了可配置的probabilistic匹配技术。这项技术利用了匹配算法来生成一个有效的,具有统计性的公式来确定匹配的程度。采用先进算法和实时模式,来精确且一致性在企业级方位确定对象的概要信息。

? 匹配算法 主索引应用采用Mural匹配引擎或自定义的匹配引擎算法,对对象个概要信息进行加权匹配处理。用户定义匹配域值,来决定可能性重复记录和自动合并记录的操作。

? 唯一的识别号 主索引应用为每个对象在数据库中分配一个企业级范围的唯一标识号(EUID)。索引利用EUID来完成各个计算机系统之间的交叉索引来找到分配给每个对象的本地ID值。

4、主索引数据管理功能

主索引系统有时候并不能自动决定2个对象是否匹配,在这种情况下,通过主索引管理系统(MIDM)进行手工操

作管理就是必要的。MIDM可以辅助你来完成数据维护。

使用MIDM,你可以完成以下操作:

? ?

查看对象的历史记录 对每个对象,系统都提供了完整的事务历史记录,可以跟踪所有的数据修改记录。 查询对象的概要信息 使用MIDM,用户可以查询特定的对象或对象集合。MIDM允许用户使用不同的数据元素组合方式来进行组合查询,根据你输入的查询条件得到可能匹配的列表。对于特殊的查询,结果分配了一个匹配权重来指明匹配的可能程度。

? 维护对象数据 MIDM提供所有的特性用于维护对象概要信息。允许用户增加新的概要;查看、修改、取消激活状态或重新激活存在的概要;比较对象概要之间的相同之处和不同之处。用户也可以查看每个本地源系统记录和与其相关联的SBR。

? ?

比较对象数据 MIDM允许用户比较2个或多个对象的概要信息,用于评估他们之间的不同之处和相同之处。 查看和处理可能性的重复记录 通过匹配逻辑算法,主索引应用可以识别有可能性重复的对象。有可能重复对象的概要信息可以在线比较。有可能重复的对象可以进行合并,也可以取消他们的可能重复性标志。

? 合并和取消合并概要信息 用户可以比较有可能重复的概要信息,如果认为他们实际是重复的,就可以合并他们。使用合并特性,用户可以决定哪个概要可以作为活动的概要保留。MIDM也可以允许用户合并源记录,可以指定哪个源记录可以保留下来。如果2个对象概要或源记录合并出错,用户可以取消合并,并返回到原始记录。用户可以通过它的合并树查看合并的历史情况。

? 审计日志 系统管理员可以通过MIDM来维护对象数据的日志。日志提供如访问数据的用户ID、访问数据时执行了什么操作,以及访问时间等。

? 安全 安全是通过应用服务器来提供的,包括通过用户ID和口令访问数据库的基本访问,以及对特定功能的访问和主索引应用的各种操作。访问可以按照功能、操作、数据单元与用户ID进行限制。

5、学习MIDM对象概要

在主索引应用中一个对象的信息是被保存在对象概要中。概要包括来自该对象源记录的所有信息,也包括该对象

按照主索应用引进行优化后的信息。

下面是描述对象概要的主题和他们的组件:

? ? ?

MIDM对象概要组件

主索引中的源记录和SBR组件 主索引中每个实体的ID值

MIDM对象概要组件

一个对象概要,也称做一个企业级记录,是一个信息集合,用于描述主索引应用中单个对象的特性信息。一个对象概要包括来自一个或多个源系统的信息。信息可以被分解为子对象,子对象存储这对象的附加信息,如地址信息,电话信息或别名等。

一个概要包括2个记录类型:

? 源记录 源记录,也称为系统记录,是一个外部系统鱼主索引应用之间共享数据的信息集合。一个概要可以保存多个源记录。

? 单一最优记录 单一最优记录(SBR)是一个从每个源记录得到的对象概要的最优信息集合。每个对象概要只有一条SBR。

源记录

源记录与SBR不同,不同之处在于每个源记录包含一个系统和本地ID对,而且仅仅保存特定系统的数据。源记录

中的对象概要信息用于决定该概要SBR中的最优值。如果一个对象概要只包含一个源记录,SBR就会与源记录相同。然而,如果一个对象概要包括多个源记录,SBR就可能会同其中的一个源记录相同,但也很可能是各个源记录中的组合。对一个源记录的数据操作有可能引起SBR的改变,如修改、取消激活或合并一个源记录。每个处于活动状态的对象概要必须至少包括一个处于活动状态的源记录。如果一个概要的所有源记录都处于非活动状态,那么整个概要就会处于非活动状态。

单一最优记录

单一最优记录(SBR) 是一个由各个活动的源记录信息组合而成的。SBR表示的是由主索引得出的最为可靠的且有所

有源记录生成的对象概要信息。SBR是动态的,每次相关联的源记录如果被修改、合并或取消合并操作、被取消激活或重新激活,那么SBR都会被重新计算。用户可以MIDM使用重写功能对SBR直接修改,或修改源记录以便让survivor算法来决定如何修改SBR。

你可以重写survivor算法。用户可以利用重写功能直接修改一个字段,并保持该字段锁定,直到锁定被取消之前不会因源记录的改变而被修改。用户也可以直接将一个字段与SBR的相同字段进行链接,这样该SBR字段的值总是与该源记录的值相同。