应用回归分析期中中作业 下载本文

内容发布更新时间 : 2024/11/8 0:52:18星期一 下面是文章的全部内容请认真阅读。

大学生在校成绩影响因素调查报告

摘要:为了了解大学生考研情况受何种因素影响,重点以南京师范大学为例进

行调研。调研发现其中大学生在校成绩成为其中重要影响因素。为了更进一步的分析出其中因素影响状况,特将大学生在校成绩作为研究对象,重点从获奖情况,经济支持和家庭经济状况对此问题进行回归分析,希望从中可以找出一些对于课题有价值的数据。

关键词:大学生在校成绩 支出 收入 专业满意度 回归分析 数据来源:南京师范大学数学科学学院2014年暑期社会实践团队——大学生

考因素影响暑期社会实践团队调查统计数据。此次数据共调查247,从中随机抽取25作为我们的研究数据,共涉及4个变量,即获得校级奖项次数,在校期间月支出,家庭人均年收入,和对其专业满意度(1-100)。

在校期间平均成获得校级奖项次在校期间月支家庭人均年

序号 绩y分 数x1次 出x2元 收入x3元 1 89 5 780 15000 2 77 2 950 28000 3 67 3 1030 20000 4 89 2 980 15000 5 93 6 1200 30000 6 73 1 1070 24000 7 68 0 1100 23000 8 87 4 1390 40000 9 78 3 1050 30000 10 71 1 990 25000 11 64 3 1400 40000 12 90 6 750 9000 13 55 0 1700 48000 14 84 4 780 14000 15 78 2 960 29000 16 85 3 1400 40000 17 68 3 870 13000 18 73 6 1420 34000 19 82 3 1100 30000 20 91 6 950 21000 21 87 8 1120 27000 22 76 1 1300 34000 23 90 4 1280 27000 24 85 2 890 20000 25 78 4 870 12000

专业满意度

x4 78 67 56 77 84 35 67 78 66 56 43 69 32 91 75 79 44 65 60 80 95 34 97 65 71

一、具体分析过程:

运用最小二乘法建立y与x1,x2,x3,x4的回归方程,运用spss如图 相关性 y Pearson 相关性 显著性(双侧) N x1 Pearson 相关性 显著性(双侧) N x2 Pearson 相关性 显著性(双侧) N x3 Pearson 相关性 显著性(双侧) N x4 Pearson 相关性 显著性(双侧) N y 1 x1 .479 .000 82 82 1 **x2 -.207 .062 82 .029 .793 82 82 1 x3 -.184 .098 82 -.070 .534 82 .920 .000 82 82 1 **x4 .758 .000 82 .579 .000 82 -.022 .845 82 -.032 .777 82 82 1 **** .479 .000 82 -.207 .062 82 -.184 .098 82 .758 .000 82 **** .029 .793 82 -.070 .534 82 .579 .000 82 ** .920 .000 82 -.022 .845 82 ** -.032 .777 82 82 **. 在 .01 水平(双侧)上显著相关。

有图表可知,根据相关系数和p值,这说明y与自变量线性相关,用y与自变量作多元线性回归是比较合适的。 模型汇总 模型 R 1 .816 ab标准 估计的误R 方 .666 调整 R 方 .599 差 6.27214 Durbin-Watson 2.287 a. 预测变量: (常量), 专业满意度x4, 家庭人均年收入x3元, 获得校级奖项次数x1次, 在校期间月支出x2元。 b. 因变量: 在校期间平均成绩y分 Anova 模型 1 回归 残差 总计 平方和 1567.844 786.796 2354.640 df 4 20 24 均方 391.961 39.340 F 9.963 Sig. .000 ab a. 预测变量: (常量), 专业满意度x4, 家庭人均年收入x3元, 获得校级奖项次数x1次, 在校期间月支出x2元。 b. 因变量: 在校期间平均成绩y分 系数 模型 非标准化系数 B 1 (常量) 获得校级奖项次数x1次 在校期间月支出x2元 家庭人均年收入x3元 专业满意度x4 a. 因变量: 在校期间平均成绩y分 .322 .093 .595 3.480 .002 .129 .515 .000 .000 .132 .403 .691 -.001 .001 -.012 .013 -.291 -.890 .384 -.040 .016 63.918 1.073 标准 误差 10.307 .816 标准系数 试用版 t 6.201 .222 1.315 Sig. .000 .203 B 的 95.0% 置信区间 下限 上限 a 42.418 85.418 -.628 2.774

回归方程为:

y=63.918+1.073x1-0.012x2+0*x3+0.322x4

残差图为

从残差图中可以看出其主要集中在第1,3象限,说明随机误差存在一阶正自相关,DW=2.287。因为2

置信水平为95%的置信区间:

由回归系数表可以看出:β1的置信区间为[-0.628,2.744]

β2的置信区间为[-0.040,0.16] β3的置信区间为[-0.001,0.001] β4的置信区间为[0.129,0.515]

复相关系数R=0.816,决定系数R=0.66,所以由决定系数看回归方程较为显著。 方差分析表,F=9.963,P值=0.00,表明回归方程高度显著,说明x1,x2,x3,x4,整体上对y有高度显著的线性影响。

异方差性检验 相关系数 2

Spearman 的 rho y 相关系数 Sig.(双侧) N y 1.000 . 25 x1 .630 .001 25 **x2 -.263 .204 25 x3 -.224 .282 25 x4 .811 .000 25 **x1 相关系数 Sig.(双侧) N .630 .001 25 -.263 .204 25 -.224 .282 25 .811 .000 25 ****1.000 . 25 -.142 .499 25 -.180 .390 25 .646 .000 25 **-.142 .499 25 1.000 . 25 .884 .000 25 -.187 .372 25 **-.180 .390 25 .884 .000 25 1.000 . 25 -.195 .351 25 **.646 .000 25 -.187 .372 25 -.195 .351 25 1.000 . 25 **x2 相关系数 Sig.(双侧) N x3 相关系数 Sig.(双侧) N x4 相关系数 Sig.(双侧) N **. 在置信度(双测)为 0.01 时,相关性是显著的。

由此可知其不存在异方差性。 异常值检验

残差e 标准化残差 学生化残差 删除学生化残差 库克距离 杠杆值

1.97 .37 .38 .38 .00 .02518 -4.26 -.80 -.84 -.84 .01 .06994 -8.43 -1.59 -1.62 -1.64 .02 .02778 6.11 1.15 1.23 1.23 .04 .10452 6.54 1.23 1.25 1.25 .01 .01358 6.29 1.19 1.25 1.25 .03 .08140

4.66 .88 .90 .90 .01 .03682 -2.31 -.44 -.45 -.44 .00 .03667 -4.78 -.90 -.93 -.93 .01 .04761 -4.59 -.87 -.91 -.91 .02 .08135 6.39 1.20 1.24 1.25 .02 .04911 -7.39 -1.39 -1.44 -1.45 .03 .04983 -6.29 -1.19 -1.25 -1.25 .03 .08467 2.83 .53 .55 .55 .00 .05217 -3.97 -.75 -.78 -.78 .01 .06993 -4.07 -.77 -.80 -.80 .01 .06316 4.58 .86 .88 .88 .01 .02457 4.12 .78 .79 .79 .00 .01479 -5.05 -.95 -.98 -.98 .01 .04855 11.20 2.11 2.24 2.30 .12 .09554 .87 .17 .18 .18 .00 .11777 4.83 .91 .93 .93 .01 .03105