01-SPSS软件聚类分析过程的图文解释及结果的全面分析【精选】 下载本文

内容发布更新时间 : 2024/11/17 6:24:19星期一 下面是文章的全部内容请认真阅读。

SPSS聚类分析过程

聚类的主要过程一般可分为如下四个步骤: 1.数据预处理(标准化)

2.构造关系矩阵(亲疏关系的描述) 3.聚类(根据不同方法进行分类) 4.确定最佳分类(类别数)

SPSS软件聚类步骤

1. 数据预处理(标准化)

→Analyze(分析) →Classify (分类,归类)→Hierachical Cluster Analysis(层序聚类分析) →Method(方法,条理,)然后从对话框中进行如下选择

从Transform Values框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:

标准化方法解释:None:不进行标准化,这是系统默认值;Z Scores(Z-Scores, 英文名又叫

O(∩_∩)O

Standardized Population Data, 是以标准差单位来表现的一组观察值):标准化变换;Range –1 to

1:极差标准化变换(作用:变换后的数据均值为0,极差为1,且|xij*|<1,消去了量纲的影响;在以后

的分析计算中可以减少误差的产生。);Range 0 to 1(极差正规化变换 / 规格化变换);

2. 构造关系矩阵

在SPSS中如何选择测度(相似性统计量):

→Analyze →Classify →Hierachical Cluster Analysis →Method 然后从对话框中进行如下选择

常用测度(选项说明):Euclidean distance:欧氏距离(二阶Minkowski距离),用途:聚类分析中用得最广泛的距离;Squared Eucidean distance:平方欧氏距离;Cosine:夹角余弦(相似性测度;Pearson correlation:皮尔逊相关系数; 3. 选择聚类方法

SPSS中如何选择系统聚类法 常用系统聚类方法

a)Between-groups linkage 组间平均距离连接法

方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。(项对的两成员分属不同类)特点:非最大距离,也非最小距离 b)Within-groups linkage 组内平均连接法

方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小

O(∩_∩)O

C)Nearest neighbor 最近邻法(最短距离法)

方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法 d)Furthest neighbor 最远邻法(最长距离法)

方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法 e)Centroid clustering 重心聚类法

方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值

特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦。

f)Median clustering 中位数法

方法简述:两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者间的距离

特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。 g)Ward’s method 离差平方和法

方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大

特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。

O(∩_∩)O