统计学课后习题答案(全章节) 下载本文

内容发布更新时间 : 2024/12/23 0:11:40星期一 下面是文章的全部内容请认真阅读。

(1) 绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2) 计算产量与生产费用之间的相关系数。

(3) 对相关系数的显著性进行检验(?=0.05),并说明二者之间的关系强度。 解:(1)

200 生产费用 150 100 20 50 产量 产量与生产费用散点图 80 110 140 170 散点图表明产量与生产费用两变量之间为正线性相关。 (2)设产量为X,生产费用为Y,

?x?1025,?y?1921,?x?101835,

2?y?310505,?xy?1700942产量与生产费用之间的相关系数:

r?n?xy??x?yn?x?(?x)n?y?(?y)22222

12?170094?1025?192172103???0.9212?101835?102512?310505?1921783532两变量为高度正相关关系。 (3)相关系数的显著性检验如下: 第1步,提出假设。

原假设H0:??0;备择假设H1:??0 第2步,计算检验统计量。

t?rn?20.92?12?2??18.941?r1?0.9222

25

第3步,给定显著性水平??0.05,查表确定临界值t第4步,做出统计决策。由于t的线性关系显著。

2.设SSR?36,SSE?4,n?18。 要求:

(1)计算判定系数R2,并解释其意义。 解:R=

20.05/2(12?2)?2.228。

?t(10),则拒绝原假设,说明产量与生产费用之间

0.025SSR36

??90%SSR?SSE36?42其意义为: R=90%表示,在因变量y取值的变差中,有90%可以由x和y之间的线性关系来解释。

(2)计算估计标准误差se,并解释其意义。

s?eSSE4

??0.5n?218?2 其意义:se=0.5表示,当用x来预测y时,平均的预测误差为0.5.

3.一家物流公司的管理人员想研究货物的运送距离和运送时间的关系,为此,抽出了公司最

近10辆卡车运货记录的随机样本,得到运送距离(单位:公里)和运送时间(单位:天)的数据如下: 运送距离x 运送时间y 825 215 1070 550 480 920 1350 325 670 1215 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 (1) 绘制运送距离和运送时间的散点图,判断二者之间的关系形态。 解答:距离和运送时间的散点图:

6 5 4 时间 3 2 1 0 0 500 1000 1500 距离 货物运送距离与时间散点图

运送距离与时间大致呈正的线性相关关系。

(2) 计算相关系数,说明两个变量之间的关系强度。

26

相关系数:

?x?7620,?y?28.5,?x?y?99.75,?xy?2637022?7104300,

r??n?xy??x?yn?x2?(?x)2n?y2?(?y)210?26370?7620?28.510?7104300?7620210?99.75?28.52?46530?0.9549033.54

表明运输距离与运送时间之间有较强的正的线性相关关系。

(3) 利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

????x ?i??设两变量之间的线性回归方程为:y01i10?26370?7620?28.5?????0.0035851??10?7104300?7620?7620???1?28.5?1?7620?0.003585?0.11823 ??0?1010???0.11823?0.003585x 得到的回归方程为:y??0.003585表示运送距离每增加1公里,运送时间平均增加0.003583天。 回归系数?1(4) 计算判定系数,并解释其意义。

nnSST??(yi?y)=?yi2?ny2=99.75-10×2.852 =18.525

2i?1ni?12???i?y)=?SSR??(y0?yi??1?xiyi?ny=0.11823×28.5+0.003583×26370-10×

2i?1i?1i?1nn2.85=16.681

2

?)SSE??(yi?yi?1n2=

?yi???0?yi???1?xiyi=99.75-0.11823×28.5-0.003585×

2i?1i?1i?1nnn26370=1.843995 判定系数R2?SSR16.681??0.90 SST18.525判定系数等于90%表示,在因变量运送时间取值的变差中,有90%可以由运送距离和运输时间之间的线性关系来解释。

(5) 检验回归方程的线性关系 (?=0.05)。

第1步:提出假设

原假设H0:?1?0, 两个变量之间的线性关系不显著

27

备择假设H1:?1?0,两个变量之间的线性关系显著 第2步:计算检验统计量F。

F?SSR/116.681/1??72.369

SSE/(n?2)1.844/(10?2)第3步:做出决策。确定显著性水平??0.05,并根据分子自由度df1?1,分母自由度

df2?n?2?10?2?8,查F分布表,找到相应的临界值F0.05(1,10)?5.318。由于

F?F0.05(1,10),拒绝H0,表明运送距离与运送时间之间的线性关系是显著的。

(6) 如果运送距离为1000公里,预测其运送时间。

?0?0.11823?0.003585?1000?3.7(天) x0?1000时,y(7) 求运送距离为1000公里时,运送时间的95%的置信区间和预测区间。

运送距离为1000公里时,运送时间的95%的置信区间为:

se?SSE1.844??0.48,n=10, t0.5/2(n?2)?t0.025(10?2)?2.3646 n?210?2n22x7620?x???762,?(x?x)??x1010i?11?(?x)2?1297860 n运送时间95%的置信区间为:

1(1000?762)23.7?2.3646?0.48???3.7?0.43

101297860即3.27?E(y0)?4.13。这就是说,当运送距离为1000公里时,平均运送时间在3.27

天~4.13天之间。

如果运送距离为1000公里,运送时间的95%的预测区间为:

1(1000?762)23.7?2.3646?0.48?1???3.7?1.21

101297860?0?4.91。这说明,运送距离为1000公里时,运送时间95%的预测区间在3.49即3.49?y天~4.91天之间。

Excel输出的回归结果如下表:

回归统计

Multiple R R Square Adjusted R Square 标准误差 观测值

0.948943 0.900492 0.888054 0.480023

10

28