内容发布更新时间 : 2024/11/5 19:30:32星期一 下面是文章的全部内容请认真阅读。
第二章 经典单方程计量经济学模型:一元线性回归模型
一、内容提要
本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析
例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为
kids??0??1educ??
1
(1)随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?
(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答:
(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2.已知回归模型E????N??,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项?的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释?和?。
?满足线性性、无偏性及有效性吗?简单陈述理由。 ?和?(2)OLS估计量?(3)对参数的假设检验还能进行吗?简单陈述理由。 解答:
(1)???N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为?,因此?表示没有接受过教育员工的平均起始薪金。?是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。
?满足线性性、无偏性及有效性,因为这些性质的的成立无需?和仍?(2)OLS估计量?随机扰动项?的正态分布假设。
(3)如果?t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在?的正态分布假设之上的。
例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答:
首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则
2
E?E*?100????N??
由此有如下新模型
E*?(?/100)?(?/100)N?(?/100)
或 E*??*??*N??*
这里?*??/100,?*??/100。所以新的回归系数将为原始模型回归系数的1/100。 再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度,则N*=12N,于是
E????N??????(N*/12)??
或 E???(?/12)N*??
可见,估计的截距项不变,而斜率项将为原回归系数的1/12。
例4、对没有截距项的一元回归模型
Yi??1Xi??i
称之为过原点回归(regrission through the origin)。试证明
(1)如果通过相应的样本回归模型可得到通常的的正规方程组
?e?0
?eX?0iii 则可以得到?1的两个不同的估计值:
~???XY??1?YX, ??ii1??X?。
2i?均为无偏估计量。 (2)在基本假设E(?i)?0下,?1与?1~~?X通常不会经过均值点(X,Y),但拟合线Y??? (3)拟合线Y??1X则相反。 1?是?的OLS估计量。 (4)只有?11解答:
(1)由第一个正规方程
~?et?0得
或 求解得
~(Y???t1Xt)?0 ~Y???t1?Xt
?1?Y/X
3
~
由第2个下规方程
?Xt?X)?0得 (Yt??1t
?XYtt2???1?Xt
??(求解得 ?1~?XY)/(?Xtt2t)
(2)对于?1?Y/X,求期望
11~E(?1)?E(YX)?E[(?1Xt??t)]Xn?X1 ?[E{1t)?E(?t)]
XnX??1??1X这里用到了Xt的非随机性。
??( 对于?1?XY)/(?Xtt2t),求期望
?)?E(XY/X2)E(??tt?t1?(?(11)E(XY)?()E[Xt(?1Xt??t)]tt2?2?XX?t?t112)?(X)?()XtE(?t)??11?t22?XX?t?t
?X??X必须等于Y。但??X通过点(X,Y),????(3)要想拟合值Y111?XY?Xt2ttX,
?X上。 ???通常不等于Y。这就意味着点(X,Y)不太可能位于直线Y1???X经过点(X,Y)。 相反地,由于?1X?Y,所以直线Y1(4)OLS方法要求残差平方和最小
Min RSS?~~?e2t?X)2 ??(Yt??1t?求偏导得 关于?1
?RSS?X)(?X)?0 ?2?(Yt??1tt???1即
?Xt?X)?0 (Yt??1t???XY???ii1
??X?
2i4