线性回归是统计分析方法中最常用的方法之一如果所研究的现象有 下载本文

内容发布更新时间 : 2025/1/4 11:28:27星期一 下面是文章的全部内容请认真阅读。

线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象 (因变量)与影响因素(自变量)之间的线性函数关系式。由于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。这一节将专门介绍SPSS软件的线性回归分析的操作方法,包括求回归系数,给出回归模型的各项检验统计量值及相应的概率,对输出结果的分析等相关内容。

§6.1 线性回归模型假设条件与模型的各种检验

1、线性回归的假设理论

(1)正态性假设:即所研究的变量均服从正态分布; (2)等方差假设:即各变量总体的方差是相等的; (3)独立性假设, 即各变量之间是相互独立的;

(4)残差项无自相关性,即误差项之间互不相关,Cov(?i,?j)= 0 2、线性回归模型的检验项目 (1)回归系数的检验(t检验)。 (2)回归方程的检验(F检验)。 (3)拟合程度判定(可决系数R)。 (4)D.W检验(残差项是否自相关)。 (5)共线性检验(多元线性回归)。

(6)残差图示分析(判断异方差性和残差序列自相关)。 §6.2 线性回归分析的具体步骤

SPSS软件中进行线性回归分析的选择项为Analyze→Regression→Linear。如图3.9所示。下面通过例题介绍线性回归分析的操作过程。

2

图3.9 Regression 分析功能菜单

例3. 仍然用例2的数据,考察火柴销售量与各影响因素之间的相关关系,建立火柴销售量对于相关因素煤气户数、卷烟销量、蚊香销量、打火石销量的线性回归模型,通过对模型

的分析,找出合适的线性回归方程。 解:建立线性回归模型的具体操作步骤如下:

1、打开数据文件SY-9,单击Analyze ? Regression ? Linear打开Linear 对话框如图3.10所示。

2、从左边框中选择因变量Y进入Dependent 框内,选择一个或多个自变量进入

Independent框内。从Method 框内下拉式菜单中选择回归分析方法,有强行进入法(Enter),消去法(Remove),向前选择法(Forward),向后剔除法(Backward)及逐步回归法(Stepwise)五种。本例中选择逐步回归法(Stepwise)。

图3.10 Linear Regression对话框

3、单击Statistics,打开Linear Regression: Statistics对话框,可以选择输出的统计量如图3.11所示。

? Regression Coefficients栏,回归系数选项栏。

Estimates (系统默认): 输出回归系数的相关统计量:包括回归系数,回归系数标准误、标准化回归系数、回归系数检验统计量(t值)及相应的检验统计量概率的P值(sig)。本例中只选择此项。

Confidence intervals:输出每一个非标准化回归系数95%的置信区间。 Covariance matrix: 输出协方差矩阵。 ? 与模型拟合及拟合效果有关的选择项。

Model fit是默认项。能够输出复相关系数R、R及R修正值,估计值的标准误,方差分析表。

R squared change: 引入或剔除一个变量时,R的变化。 Descriptives: 基本统计描述。

Part and Partial correlations:相关系数及偏相关系数。

Collinearity diagnostics:共线性诊断。主要对于多元回归模型,分析各自变量的之

22

2

间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指数等。

本例中选择上面所有的统计项。 ? Residuals 残差栏 Durbin-Watson:D.W检验.

Casewise diagnostics: 奇异值诊断,有两个选项:

Outliers outside( )standard deviations:奇异值判据,默认项标准差≥3。 All case 输出所有观测量的残差值。

本例中选择D.W检验及奇异值诊断,选择标准差为2,即置信度约为95%。

图3.11 Linear Regression: Statistics

4、如果需要观察图形,可单击Plots按纽,打开Linear Regression:Plots对话框如图3.12所示。在此对话框中可以选择所需要的图形。

图3.12 Linear Regression:Plots对话框

在左上角的源变量框中,选择Dependent 进入X(或Y)轴变量框,选择其它变量进入Y(或X)轴变量框,除因变量外,其客观存在变量依次是:ZPRED:标准化预测值,ZRESID:标准化残差,DRESID:剔除残差,ADJPRED:修正后预测值,SRESID学生化残差,SDRESID:学生化剔除残差。

? Standardized Residual Plots栏,标准化残差图类型,有选择项: Histogram: 标准化残差直方图