应用统计学试题2006.6(B)(参考答案) 下载本文

内容发布更新时间 : 2024/6/27 0:47:32星期一 下面是文章的全部内容请认真阅读。

华东理工大学2005–2006学年第二学期

《 应用统计学 》课程期末考试试卷 B 2006.6(评分标准)

开课学院: 商学院 ,专业: 考试形式:开卷,所需时间: 120 分钟 考生姓名: 学号: 班级: 任课教师:

一、农药收率提高问题(20分) (1) 请完成表头设计。(5分)

表头设计 列号 试验号 A 1 B 2 A×B 3 C 4 5 6 D 7 (2)表2中有些数据没给出,请根据方差分析表的原理将其计算出来,给出计算过程。(5分)

源于因子B的误差平方和=0.01460-0.00080-0.00605-0.00045-0.00500-0.00050=0.00180

均方和VA×B=0.005/1=0.005

FC=0.006050/0.00025=24.200

(3)由表2分析哪些因子在什么显著性水平下是显著的,给出理由。(5分)

因子C在显著性水平0.05下是显著的,因为其P=0.039<0.05

因子A×B在显著性水平0.05下是显著的,因为其P=0.047<0.05

(4)由表2和表3找出最优生产条件,给出理由。(5分)

最优生产条件:A 2 B 1 C 2 因为

?C?0.878??C?0.933

12在因子A和B的组合中,?A2B1?0.935最大

二、学习程度分析(20分)

(1)由表5,请写出此聚类问题分析中样品间采取何种距离以及采取何种系统聚类的方法。(10分)

1

样品间采取欧氏距离;

系统聚类方法采取类平均法(组间连接法)。

(2)由图1,若将这15名学生按学习程度分成三类,应该如何进行分类,并给出每类的特性。(10分)

第1类为:{3,4,5,7},此类学生成绩最好;

第2类为:{1,2,6,8,10,11,13,15},此类学生成绩中等;

第3类为:{9,12,14},此类学生成绩最差。

三、某地区春旱预测问题(20分)

(1)请解释“Unstandardized Standardized canonical discriminant function”与“Fisher's linear discriminant functions”的差异所在。(5分)

① “Unstandardized Standardized canonical discriminant function”表示未标准化典型Fisher判别函数;

② “Fisher's linear discriminant functions”表示Bayes判别函数。

(2)请建立此问题的Canonical Discriminant Function判别函数。(5分)

u(x1,x2)??19.885?0.803x1?0.605x2

(3)若经观测,此地区今年的x1?25.7,x2??2.5,请运用表10预测今年有无春旱,并说明理由。(5分)

2

春旱

y1(x1,x2)??530.389?48.558x1?72.327x2??530.389?48.558?25.7?72.327?2.5?2408.645y2(x1,x2)??460.606?45.775x1?74.424x2??460.606?45.775?25.7?74.424?2.5?2294.378

无春旱

由于

y1?2408.645?y2?2294.378 则,今年属于春旱。

(4)对此判别问题的误判率进行分析。(5分)

由表11可知:

① 春旱的误判率为16.7%; ② 无春旱的误判率为0%; ③ 总的误判率为7.1%。

四、企业经济效益的分析(20分)

(1)在主成分分析中,对拟提取的m个主成分的两条基本要求是什么。(4分)

① 将原来p个指标所包含的n个个体的不十分明显的差异集中起来,使n个个体的主成分指标值差异尽可能大;

② 使主成分指标的数目尽可能少,还要求各主成分指标间互不相关。

(2)请写出前两个特征值及其对应主成分的贡献率。(4分)

第一个特征值?1?2.678,其对应主成分的贡献率为53.559%

第二个特征值?2?1.717,其对应主成分的贡献率为34.334%

(3)能否对未经旋转的主成分与旋转后的因子作比较,对这两个旋转后的因子的意义作一个合理的解释,并给两个因子命名。(4分)

① 第一主成分f1突出反映了经营能力的大小,可称为“经营能力”因子;

② 第二主成分f2突出反映了企业的盈利水平的高低,可称为“盈利水平”因子。

3

(4)请指出这里的因子分析所采用的方法。(4分)

① 提取因子采用了主成分分析;

② 旋转因子采用了方差最大化正交旋转的方法。

(5)根据因子得分系数矩阵,请写出所提取的两个因子的数学表达式。(4分)

f1?0.405?Zx1?0.077?Zx2?0.411?Zx3?0.354?Zx4?0.072?Zx5f2?0.014?Zx1?0.366?Zx2?0.019?Zx3?0.448?Zx4?0.389?Zx5上式中,Zx1,Zx2,Zx3,Zx4,Zx5为经过标准化处理的变量。

五、简答题(20分)

(1)简要说明“偏差平方和分解”的方法在双因素有交互作用方差分析、回归分析的运用中差异。(6分)

参考答案要点:

① “偏差平方和分解”的方法在双因素有交互作用方差分析中主要是将总偏差平方和分解为因子的偏差平方和、交互因子的偏差平方和与误差偏差平方和;

② “偏差平方和分解”的方法在回归分析的运用中主要是将总偏差平方和分解为残差平方和与回归平方和。

(2) 系统聚类法与有序样品聚类法的主要不同点。(7分) 参考答案要点:

① 系统聚类法是先将所有n个样品看成不同的n类,然后将性质最接近(距离最近)的两类合并为一类;再从这n-1类中找到最接近的两类加以合并,依次类推,直到所有的样品被合为一类。 ② 有序样品聚类法是先假定所有样品为一类,然后按照使得分类所产生的离差平方和增量达到最小的要求逐一分割。

(3) 简明说明Bayes判别的基本思想。(7分) 参考答案要点:

Bayes判别的基本思想:认为所有G个类别都是空间中互斥的子域,每个观测都是空间中的一个点。在考虑先验概率的前提下,利用Bayes公式按照一定准则构造一个判别函数,分别计算该样品落入各个子域的概率,所有概率中最大的一类就被认为是该样品所属的类别。

4