主成分分析练习题 下载本文

内容发布更新时间 : 2024/5/3 12:04:52星期一 下面是文章的全部内容请认真阅读。

主成分分析

填空题

1.主成分分析是通过适当的变量替换,使新变量成为原变量的___________,并寻求_________的一种方法。

2.主成分分析的基本思想是______________。 3.主成分的协方差矩阵为_________矩阵。

4.主成分表达式的系数向量是_______________的特征向量。

5.原始变量协方差矩阵的特征根的统计含义是________________。 6.原始数据经过标准化处理,转化为均值为____ ,方差为____ 的标准值,且其________矩阵与相关系数矩阵相等。

7.因子载荷量的统计含义是_____________________________。 8.样本主成分的总方差等于_____________。

9.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________________。 10.SPSS中主成分分析采用______________命令过程。

计算题

1.设三个变量(x1,x2,x3)的样本协方差矩阵为:

?s2?2?sr?0?s2rs2s2r0??s2r?s2???12?r?12

试求主成分及每个主成分的方差贡献率。 解特征方程:?????0

2.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长

(x1),2/3处宽(x2),1/3处宽(x3),1/2处宽(x4)。这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:

?1?2.920?2?1.024?3?0.049?4?0.007U1??(0.1485,?0.5735,?0.5577,?0.5814)??(0.9544,?0.0984,0.2695,0.0824)U2??(0.2516,0.7733,?0.5589,?0.1624)U3??(?0.0612,0.2519,0.5513,?0.7930)U4

(1) 写出四个主成分,计算它们的贡献率。

(2) 计算四个变量在前两个主成分上的载荷,由因子载荷矩阵,你认为这两个主 成分应该如何解释?你能给它们分别起个名字吗?

(3) 根据原始数据和(1)中的结果,可以计算出20株杨树叶的第一、二主成分得

分,试以这两个主成分y1和y2为坐标,在(y1,y2)平面上按因子得分为坐标描出这20个样本点。 4.对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率,x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:

?1?2.857U1??(0.464,0.457,0.470,0.421,0.421)

??2?0.809U2?(0.240,0.509,0.260,?0.526,?0.582)第 1 页 共 6 页

(1) 计算这两个主成分的方差贡献率。

(2) 能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。

例题:

1. 对我国人口素质水平进行统计分析:

(1)大专学历以上人口比重(x1) (2)文盲率(x2)

(3)高等学校数(x3) (4)招生数比例(x4) (5)科技从业人员数(x5) (6)死亡率(x6) (7)成年人口的比例(x7) (8)负担系数(x8) (9)每万人口的高等学校毕业生数(x9)

利用SPSS统计软件对30个省份的9个变量数据进行分析,以确定人口素质水平的综合指标。其结果如下:

(1) 可以提取几个主成分?为什么? (2) 写出主成分的表达式;

(3) 对主成分的意义作一个较合理的解释。

2.100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。

第 2 页 共 6 页

学生代码123456789…数学657767807478667783…物理6177636970847171100…化学727649758075675779…语文846465748462527241…历史817067748171658667…英语795557637464577150… 根据下面SPSS软件的输出信息,回答:

(1)这个数据的6个变量可以用几个综合变量(主成分)来表示? (2)这几个综合变量(主成分)包含有多少原来的信息? (3)写出这几个综合变量(主成分)的模型。

Total Variance ExplainedInitial Eigenvalues% of VarianceCumulative b.25462.25418.88781.1427.61988.7615.37694.1373.32097.4572.543100.000Extraction Sums of Squared LoadingsTotal% of VarianceCumulative %3.73562.25462.2541.13318.88781.142Component123456Total3.7351.133.457.323.199.153Extraction Method: Principal Component Analysis.aComponent Matrix mathphyschemliterathistoryenglishComponent12-.806.353-.674.531-.675.513.893.306.825.435.836.425Extraction Method: Principal Component Analysis.a. 2 components extracted. 因子分析

填空题

1.因子分析是把每个原始变量分解为两部分因素,一部分是______________,另一部分为_______________。

2.变量共同度是指因子载荷矩阵中_______________________。 3.公共因子方差与特殊因子方差之和为_______。

4. 求解因子载荷矩阵常用的方法有 和 。 计算题

第 3 页 共 6 页

1.设变量x1,x2和x3已标准化,其样本相关系数矩阵为:

0.630.45??1?

R??0.6310.35????0.450.351??(1)对变量进行因子分析。

(2)取m=2进行正交因子旋转。

2.为了考察学生的知识水平,常用学生的考试成绩来评定,某校对33个学生的3门功课进行分析,得相关系数矩阵:

1英语2数学3音乐?1.000.640.51??R??0.641.000.51??

??0.510.511.00??取两个公因子

(1)计算相关系数矩阵 (2)计算因子载荷矩阵

(3)计算各变量的公共因子方差和特殊因子方差 (4)写出因子模型

例题:

1.已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题: (1)什么是方差贡献率? 计算方差贡献率的目的何在?

(2)工业企业经济效益可以用几个公因子来表示?为什么?每个公因子包含哪些指标?为什么?

(3)写出因子得分函数。

(4)如何利用因子分析结果进行综合评价? 结合本例写出计算综合评价结果的公式。 表1

表2

第 4 页 共 6 页

表3

表4

表5

第 5 页 共 6 页