第三章、经典单方程计量经济学模型:多元线性回归模型 下载本文

内容发布更新时间 : 2024/5/19 2:45:16星期一 下面是文章的全部内容请认真阅读。

第三章、经典单方程计量经济学模型:多元线性回归模型

一、内容提要

本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。

本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。

本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。

本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然

2?原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的分布为检验统计

量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。

二、典型例题分析

例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

edu?10.36?0.094sibs?0.131medu?0.210fedu

R2=0.214

式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?

(2)请对medu的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 解答:

(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1

年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为 10.36+0.131?12+0.210?12=14.452 10.36+0.131?16+0.210?16=15.816

因此,两人的受教育年限的差别为15.816-14.452=1.364

例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:

Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046)

R2?0.099其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不随X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响? 解答:

(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即?Y=0.32?log(X1)?0.32(?X1/X1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。

(2)针对备择假设H1:?1?0,检验原假设H0:?1?0。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。

(3)对X2,参数估计值的t统计值为0.05/0.046=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。

例3、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:

??125.0?15.0X1?1.0X2?1.5X3 R?0.75 方程A:Y2??123.0?14.0X1?5.5X2?3.7X4 R?0.73 方程B:Y2其中:Y——某天慢跑者的人数 X1——该天降雨的英寸数 X2——该天日照的小时数

X3——该天的最高温度(按华氏温度) X4——第二天需交学期论文的班级数

请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?

答:方程B更合理些。原因是:方程B中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。

⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A和方程B中由于选择了不同的解释变量,如方程A选择的是“该天的最高温度”而方程B选择的是“第二天需交学期论文的班级数”,由此造成X2与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。 例4、.有如下生产函数:lnX?1.37?0.632lnK?0.452lnL

(0.257) (0.219)

R2?0.98 Cov(bK,bL)?0.055

其中括号内数值为参数标准差。请检验以下零假设: (1)产出量的资本弹性和劳动弹性是等同的; (2)存在不变规模收益,即????1 。

例5、假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):

??10.6?28.4X?12.7X?0.61X?5.9XYi1i2i3i4i¨ (2.6) (6.3) (0.61) (5.9) 括号内表示t值; R?0.63 ,n?35。要求: (1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说明。

2

答案并不唯一,猜测为:X1为学生数量,X2为附近餐厅的盒饭价格,X3为气温,X4为校园内食堂的盒饭价格;

⑵理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。 例5、考虑以下方程(括号内为估计标准差):

??8.562?0.364P?0.004P?2.560WUitt?1t (0.080) ,,,(0.072) (0.658) 2括号内为对应参数的估计标准差值 ;n?19 , R?0.873

其中:W——t年的每位雇员的工资和薪水

P——t年的物价水平 U——t年的失业率 要求:(1)对个人收入估计的斜率系数进行假设检验;(尽量在做本题之前不参考结果)