内容发布更新时间 : 2024/12/24 11:08:39星期一 下面是文章的全部内容请认真阅读。
图4.1 判别分析主界面
3. 单击Statistics…按钮,指定输出的描述统计量和判别函数系数。选中Function Coefficients栏中的Fisher’s:给出Bayes判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher’s,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请读者注意辨别。)如图4.2。单击Continue按钮,返回主界面。
图4.2 statistics子对话框
4. 单击Classify…按钮,弹出classification子对话框,选中Display选项栏中的Summary table复选框,即要求输出错判矩阵,以便实现题中对原样本进行回判的要求。如图4.3。
图4.3 classification对话框
5. 返回判别分析主界面,单击OK按钮,运行判别分析过程。
1) 根据判别分析的结果建立Bayes判别函数: Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下: Group1: Y1??81.843?11.689X1?12.297X2?16.761X3 Group2: Y2??94.536?10.707X1?13.361X2?17.086X3 Group3: Y3??17.449?2.194X1?4.960X2?6.447X3
将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。
Classification Function Coefficients x1 x2 x3 1 -11.689 12.297 16.761 group 2 -10.707 13.361 17.086 3 -2.194 4.960 6.447 (Constant) -81.843 -94.536 -17.449 Fisher's linear discriminant functions 表4.1 Bayes判别函数系数
根据此判别函数对样本进行回判,结果如表4.2。从中可以看出在4种畅销饮料中,有3种被正确地判定,有1种被错误地判定为平销饮料,正确率为75%。在3种平销饮料中,有2种被正确判定,有1种被错误地判定为畅销饮料,正确率为66.7%。3种滞销饮料均正确判定。整体的正确率为80.0%。 Classification Results a Original Count group 1 2 3 % 1 2 3 Predicted Group Membership 1 3 1 0 75.0 33.3 .0 2 1 2 0 25.0 66.7 .0 3 0 0 3 .0 .0 100.0 Total 4 3 3 100.0 100.0 100.0 a. 80.0% of original grouped cases correctly classified. 表4.2 错判矩阵
2) 该新饮料的X1?3.0,X2?8,X3?5,将这3个自变量代入上一小题得到的Bayes判别函数,Y2的值最大,
该饮料预计平销。也可通过在原样本中增加这一新样本,重复上述的判别过程,并在classification子对话框中同时要求输出casewise results,运行判别过程,得到相同的结果。
6.8利用主成分分析法,综合评价六个工业行业的经济效益指标。
单位:(亿元)
行业名称 煤炭开采和选业 石油和天然气开采业 黑色金属矿采选业 有色金属矿采选业 非金属矿采选业 其它采矿业 资产 总计 6917.2 5675.9 768.1 622.4 699.9 1.6 固定资产净值平均余额 3032.7 3926.2 221.2 248 291.5 0.5 产品销 售收入 683.3 717.5 96.5 116.4 84.9 0.3 利润 总额 61.6 33877 13.8 21.6 6.2 0 解:令资产总计为X1,固定资产净值平均余额为X2,产品销售收入为X3,利润总额为X4,用SPSS对这六个行业进行主成分分析的方法如下:
1. 在SPSS窗口中选择Analyze→Data Reduction→Factor菜单项,调出因子分析主界面,并将变量X1?X5移
入Variables框中,其他均保持系统默认选项,单击OK按钮,执行因子分析过程(关于因子分子在SPSS中实现的详细过程,参见7.7)。得到如表6.1所示的特征根和方差贡献率表和表6.2所示的因子载荷阵。 第一个因子就可以解释86.5%
表6.1 特征根和方差贡献率表
表6.2 因子载荷阵
2. 将表6.2中因子载荷阵中的数据输入SPSS数据编辑窗口,命名为a1。点击菜单项中的Transform→Compute,
调出Compute variable对话框,在对话框中输入等式:
z1=a1 / SQRT(3.46),计算第一个特征向量。点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。
表6.3 特征向量矩阵 x1 x2 x3 x4 根据表6.3得主成分的表达式:
z1 0.509 0.537 0.530 0.413 Y1?0.509X1?0.537X2?0.530X3?0.413X4
3. 再次使用Compute命令,调出Compute variable对话框,在对话框中输入等式:
y1?0.509*x1?0.537*x2?0.53*x3?0.413*x4
根据六个工业行业计算所的y1的大小可得石油和天然气开采业的经济效益最好,煤炭开采和选业其次,接着依次是黑色金属、非金属、有色金属和其他采矿业。
6.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用主成分分析法对这些地区进行分类。
解:用SPSS进行主成分分析的具体方法参见6.8,分析结果如下:
表6.7 特征根和方差贡献率表
表6.8 因子载荷阵
表6.6 特征向量矩阵 x1 x2 x3 x4 x5 x6 x7 x8 x9
根据表6.6得主成分的表达式:
z1 0.29 0.28 0.14 0.31 0.40 0.40 0.31 0.39 0.39 z2 0.47 0.48 -0.29 -0.37 -0.20 -0.27 0.39 0.12 -0.24 Y1?0.29X1?0.28X2?0.14X3?0.31X4?0.4X5?0.4X6?0.31X7?0.39X8?0.39X9 Y2?0.47X1?0.48X2?0.29X3?0.37X4?0.2X5?0.27X6?0.39X7?0.12X8?0.24X9
分别计算出以上三项后,利用公式Y??1?Y1?2Y2得到综合得分并排序如下表: ????y1 y2 y 170038.89 254204.05 197055.90 70185.88 34213.02 58638.59 50894.53 69593.93 56897.04 地区 深圳 上海 厦门 广州 杭州 宁波 北京 南宁 天津 海口 南京 青岛 大连 济南 福州 乌鲁木齐 沈阳 武汉 长春 成都 太原 郑州 兰州 海口 昆明 呼和浩特 长沙 石家庄 西安 南昌 哈尔滨 合肥 银川 贵阳 重庆 西宁 南宁 55849.21 42167.71 40552.85 45747.38 45747.38 39597.90 39597.90 36680.75 35237.27 31830.56 25149.73 22734.16 22284.54 23184.99 23909.27 21524.95 33808.79 19445.42 18561.81 16568.97 17666.70 18494.34 16128.60 18845.23 18229.33 16764.15 14598.40 15782.07 14319.85 12865.97 15339.90 27859.53 10450.62 11526.86 32174.58 29244.98 28367.34 11555.73 11555.73 21080.52 21080.52 25804.65 14552.46 17629.53 16499.39 16326.97 15284.68 12310.22 9770.56 14179.21 -17638.73 9809.99 9822.90 13769.80 11325.77 8579.72 13359.10 6252.54 7399.62 4871.97 9288.20 6297.20 8659.41 10960.08 4138.48 -22407.66 6144.51 2677.29 48249.65 38019.51 36641.30 34771.86 34771.86 33653.82 33653.82 33189.52 28597.44 27272.03 22372.97 20677.45 20037.59 19694.19 19370.75 19166.96 17294.14 16352.45 15756.62 15670.44 15631.26 15311.75 15239.59 14802.98 14752.99 12946.76 12893.83 12737.43 12502.85 12254.18 11744.24 11723.76 9068.36 8686.15
最后的分类可以根据最终得分Y的值来划分,由于没有给出具体的分类标准,具体分类结果根据各人的主观意愿可以有多种答案。
可以归为一类,属于文科学习能力的指标;第二个公共因子在前三个指标上有较大载荷,同样可以归为一类,这三个指标同属于理科学习能力的指标。根据表7.3易得:
F1?0.064X1?0.085X2?0.137X3?0.332X4?0.378X5?0.432X6 F2?0.439X1?0.400X2?0.484X3?0.014X4?0.073X5?0.169X6
表7.3 因子得分系数矩阵