内容发布更新时间 : 2024/11/17 0:39:18星期一 下面是文章的全部内容请认真阅读。
到一个更低维的随机向量;主成分分析的作用就是在降低数据“维数”的同时又保留了原数据的大部分信息。
6.3 简述主成分分析中累积贡献率的具体含义。 答:主成分分析把p个原始变量X1,X2,,Xp的总方差tr(Σ)分解成了p个相互独立的变量Y1,Y2,,Yp的方差之和
??k?1pk。主成分分析的目的是减少变量的个数,所以一般不会使用所有p个主成分的,忽略一些带有较小方差的主成
分将不会给总方差带来太大的影响。这里我们称?k??k?最大,这表明Y1?T1X综合原始变量X1,X2,??k 为第k个主成分
k?1pYk的贡献率。第一主成分的贡献率
,Xp的能力最强,而Y2,Y3,,Yp的综合能力依次递减。若只取m(?p),Ym综合X1,X2,个主成分,则称?m???kk?1m??k?1pk 为主成分Y1,,Ym的累计贡献率,累计贡献率表明Y1,,Xp的能力。通常取m,使得累计贡献率达到一个较高的百分数(如85%以上)。
6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。
答:从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。从协方差矩阵 出发的,其结果受变量单位的影响。主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑。对于研究经济问题所涉及的变量单位大都不统一,采用R代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。
7.1 试述因子分析与主成分分析的联系与区别。 7.2 因子分析主要可应用于哪些方面?
7.3 简述因子模型 中载荷矩阵A的统计意义。
7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?
7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面?
答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型 中载荷矩阵A的统计意义。 答:对于因子模型
Xi?ai1F1?ai2F2??aijFj??aimFm??i i?1,2,,p ?a11?a21因子载荷阵为A?????ap1?a12a22ap2a1m?a2m???(A,A,12??apm??,Am)
Xi与Fj的协方差为:
Cov(Xi,Fj)?Cov(?aikFk??i,Fj)
k?1m=Cov(?ak?1mikFk,Fj)?Cov(?i,Fj)
=aij
若对Xi作标准化处理, =aij,因此 aij一方面表示Xi对Fj的依赖程度;另一方面也反映了变量
Xi对公共因子
Fj的相对重要性。
2i变量共同度h?2?aj?1m2ij2i?1,2,,p
2?aimD(Fm)?D(?i)?hi2??i2 说明变量Xi的方差由两部分组成:第一部分为
D(Xi)?ai1D(F1)?ai2D(F2)?2共同度hi,它描述了全部公共因子对变量Xi的总方差所作的贡献,反映了公共因子对变量Xi的影响程度。第二部分为特殊因子?i对变量Xi的方差的贡献,通常称为个性方差。 而公共因子Fj对X的贡献g?2jp?ai?12ijj?1,2,,m
表示同一公共因子Fj对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。
7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?
答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余的公共因子上的载荷比较小。
最大方差旋转法是一种正交旋转的方法,其基本思路为:
①A
*
*ijp12dij?a/hi dj??dij pi?1其中令A?AΓ?(a)p?m,*
*ij1p2A的第j列元素平方的相对方差可定义为Vj??(dij?dj)2
pi?1②V?V1?V2??Vm
最大方差旋转法就是选择正交矩阵Γ,使得矩阵A*所有m个列元素平方的相对方差之和达到最大。
8.1 什么是对应分析?它与因子分析有何关系?
8.2试述对应分析的基本思想。 8.3 试述对应分析的基本步骤。
8.1 什么是相应分析?它与因子分析有何关系?
答:相应分析也叫对应分析,通常意义下,是指两个定性变量的多种水平进行相应性研究。其特点是它所研究的变量可以是定性的。
相应分析与因子分析的关系是: 在进行相应分析过程中,计算出过渡矩阵后,要分别对变量和样本进行因子分析。因此,因子分析是相应分析的基础。具体而言, ( ) ( )式表明Zuj为相对于特征值 的关于因素A各水平构成的协差阵 的特征向量。从而建立了相应分析中R型因子分析和Q型因子分析的关系。
8.2试述相应分析的基本思想。
答:相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个r?c的二维列联表,记为K?(kij)r?c。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
8.3 试述相应分析的基本步骤。 答:(1)建立列联表 设受制于某个载体总体的两个因素为A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个r?c的二维列联表,记为
K?(kij)r?c。
(2)将原始的列联资料K=(kij) r ?c变换成矩阵Z=(zij) r ?c,使得zij对因素A和列因素B具有对等性。通过变换
。得Σc?Z?Z,Σr?ZZ?。
(3)对因素B 进行因子分析。
计算出Σc?Z?Z的特征向量 , , 及其相应的特征向量 , , 计算出因素B的因子 ) (4)对因素A 进行因子分析。
计算出Σr?ZZ?的特征向量 , , 及其相应的特征向量 , , 计算出因素A的因子 (5)选取因素B 的第一、第二公因子 选取因素A 的第一、第二公因子
将B因素的c个水平( ),( ) ,( ) A因素的r个水平( )( )( ) 同时反应到相同坐标轴的因子平面上上
(6)根据因素A和因素B各个水平在平面图上的分布,描述两因素及各个水平之间的相关关系。
9.1 什么是典型相关分析?简述其基本思想。 9.2 什么是典型变量?它具有哪些性质?
9.3 试分析一组变量的典型变量与其主成分的联系与区别。
9.1 什么是典型相关分析?简述其基本思想。
答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。 基本思想:
(1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即: 若设X(1)(1)?(X1(1),X2,(1)(2),Xp)、X(2)?(X1(2),X2,(2),Xq)是两组相互关联的随机变量,分别在两组变量中选
取若干有代表性的综合变量Ui、Vi,使是原变量的线性组合。
(i)(1)(i)(1)(i)(1)a(i)?X(1) Ui?a1X1?a2X2??aPXP (i)(2)(i)(2)(i)(2)(i)?(2)V?bX?bX??bXbX i1122qq
在D(a(1)?X(1))?D(b(1)?X(2))?1的条件下,使得?(a(1)?X(1),b(1)?X(2))达到最大。(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。
9.2 什么是典型变量?它具有哪些性质?
答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。具体来说,
X(1)?(X(1),X(1),,X(1))、X(2)?(X(2),X(2),,X(2)) 12p12qUi?aX(i)1(1)1?aX(i)2(1)2??aX(i)P(1)PaX
(i)?(1)(i)(2)Vi?b1(i)X1(2)?b2X2?(i)(2)?bqXqb(i)?X(2)
?(1)(1)(1)在D(a(1)?X(1))?D(b(1)?X(2))?1的条件下,使得?(a(1)?X(1),b(1)?X(2))达到最大,则称a?X、b(1)X(2)是X、
X(2)的第一对典型相关变量。
典型变量性质:
典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。 1. D(Uk)?1,D(Vk)?1(k?1,2,,r)
Cov(Ui,Uj)?0,Cov(Vi,Vj)?0(i?j)
??i?0?2. Cov(Ui,Vj)??0?0?(i?j,i?1,2,(i?j)(j?r),r)
9.3 试分析一组变量的典型变量与其主成分的联系与区别。
答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。
4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。
6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。
6.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。
7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。
4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。 销售情况 畅销 产品序号 1 2 3 4 5 6 7 8 9 10 销售价格 2.2 2.5 3.0 3.2 2.8 3.5 4.8 1.7 2.2 2.7 口味评分 5 6 3 8 7 8 9 3 4 4 信任度评分 8 7 9 6 6 7 8 4 2 3 平销 滞销 ⑴ 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。 ⑵ 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。
解:增加group变量,令畅销、平销、滞销分别为group1、2、3;销售价格为X1,口味评分为X2,信任度评分为X3,用spss 解题的步骤如下:
1. 在SPSS窗口中选择Analyze→Classify→Discriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将X1、X2、X3变量选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判别分析。
2. 点击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。如图4.1