内容发布更新时间 : 2025/1/10 21:31:20星期一 下面是文章的全部内容请认真阅读。
实验二 一元线性回归分析
一、目的:
通过对一元线性回归分析程序设计及完成算例,掌握一元线性回归分析的基本原理和方法。
二、方法概要 1、原始数据预处理
对n?对原始数据(xi,yi)(i=0,1,…,n?)数据进行预处理(见实验一)。
2、数学模型建立
(1)作散点图
一元线性回归只能处理两个变量之间的关系,它又被称为直线拟合,假设x为自变量,y为因变量,对预处理后n对数据(xi,yi)(i=0,1,…,n;其中n?n?)如果把各个点数据画在坐标纸上(作散点图),各点近似分布呈一条直线,则可用一元现行回归。
(2)选择数学模型
散点图
z
y
??a?bx (2-1) y(3)参数a, b的估计
?为根据回归方程的得到的因变量y的计算值;a,b为回归方程中的系数;x为自变量。由于y测定结果中不可避免会有实验误差,因此用最小二乘法的原理估计回归直线中的系数a,b。
假设实验得到了n对数据(χ
i ,
??a?bx,则对于xy)(i=0,1,…,n)并得到了回归方程y的一系列变量x1 ,x2 ,…,xn,根据回归得到方程可得到因变量的一系列计算值
?1?a?bx1y?2?a?bx2y???n?a?bxny
?1(i=0,1,…,n)之间都有偏差,每一个实测值yi(i=0,1,…,n)与它相对应的一个计算值y也可称残差,计算公式:
?i?yi?(a?bxi) (2-2) vi?yi?y所有测试数据的残差平方和为
1
?]??[yi?(a?bxi)]2 (2-3) Qe??v??[yi?y2i2i?1i?1i?1nnn??a?bx是合理的a,b为最佳。则所得到的残差平方和应达到最小值。 如果回归方程y得
n?xiyi?nxyLxyi???1?b??n?Lxx?x2?n(x)2 (2-4)
i?i?1??a?y?bx列出回归方程
y?a?bx (2-5)
3、回归方程显著性检验
(1)将自变量n组试验数据依次代入回归方程(式3-8),求出因变量n个回归值
?i?a?bxi (i?1,2,?,n) (2-6) y(2)计算S总,S回和S剩:
S总??yi2?ny2 (2-7)
i?1nn?i2?ny2 (2-8) S回??yi?1S剩=S总?S回 (2-9)
(3)计算F统计量
S回1F? (2-10)
S剩n?2(4)计算相关系数r
r?(5)查表检验
LxyLxx?Lyy (2-11)
给定显著水平α,查表得F?(p,n?2),r?(n?2)。若F?F?(p,2)或r?r?(n?2),则证明回归方程显著;否则,回归方程无实用价值。
4、对因变量进行区间估计
(1)估计剩余标准值
??? (2-12)
2
(2)求出因变量估计值
?。 当自变量取定值x时,由回归方程可求得 因变量数学期望的估计值y(3)写出预测区间
??2??,y??2??) 95%置信区间:(y??3??,y??3??) 99.7%置信区间:(y三、算例
g(一)从某煤矿采集11个煤样,分别测定煤的发热量(QDT)和煤灰分(A)含量,获得如
g下表数据:
样品号 gQDT(千卡) 1 2 3 7.7 4 7.2 5 6.8 6 6.2 7 5.6 8 9 10 11 8.30 7.8 5.5 5.00 4.70 4.3 Ag 0.03 0.05 0.08 0.10 0.15 0.20 0.27 0.30 0.34 0.40 0.45 gg试建立煤的发热量(QDT)对煤灰分(A)的回归方程,并检验该回归方程的显著性。
(二)煤矿脉中13个相邻样本点处某种伴生金属的含量数据如下表:
样品号 距离x 含量y 样品号 距离x 含量y 1 2 106.42 8 11 110.59 2 3 108.20 9 14 110.60 3 4 109.58 10 15 110.90 4 5 109.50 11 16 110.76 5 7 110.00 12 18 111.00 6 8 109.93 13 19 111.20 7 10 110.49 试建立y对x的回归方程,并进行显著性检验。
3