内容发布更新时间 : 2024/12/23 11:13:44星期一 下面是文章的全部内容请认真阅读。
(1)估计上述回归,并按照教材式(3-46)的形式报告回归结果。 (2)失业率的变化是实际GDP增长率的一个决定因素吗?为什么? (3)如何解释回归中的截距系数?它是否有经济意义? 答:该问题是练习17的延伸。
(1)根据回归模型的形式,我们首先要根据实际GDP(RGDP)和失业率 (UNRATE)计算新变量的值,具体数值见回归结果输出表。计算公式如下:
CHUNRATE=UNRATE-UNRATE??1?PCTCRGDP=??RGDP/RGDP?-1????100?100运用EViews进行回归,可得以下结果:
Dependent Variable:PCTCRGDP Sample(adjusted):1960 2006
Variable Coefficient Std Error t-Statistic Prob C 3.319 11 0.166 7341 9.906 54 0.0000 CHUNRATE -1.862 97 0.185 785 -10.027 58 0.0000 R-squared 0.695 6 注意:样本的起始时间从1960年变为1961年,这是因为我们计算变化率(RGDP和UNRATE)时损失了第一期的观测值。
(2)是的。因为斜率估计量的t值为-10.028,其相应的p值几乎为零。 (3)截距项的回归系数在统计上也是显著的。其经济学意义为当失业率为零时,实际GDP的增长率为3.3%,该数字可以理解为长期或稳态时的GDP增长率。
20.教材例2-3讨论了股票价格与利率之间的关系。教材式(2-24)给出的回归结果是统计显著的吗?给出必要的计算。
答:运用EViews软件进行回归,可得以下结果:
Dependent Variable:SP500 Sample:1980 1999 Variable Coefficient Std.Error t-Statistic Prob C 404.406 7 128.647 5 3.143 5 0.0041 1/MTB3 996.865 6 404.232 4 2.466 1 0.0206 R-squared 0.273968 斜率的回归系数在2%的显著水平下是显著的,截距的回归系数在0.4%的显著水平下也是显著的。由于留存误差的问题,此处的回归结果和书中的回归结果有微小的不同。
21.教材例2-5讨论了古董钟和它的价格。根据教材表2-14,得到了回归结果教材式(2-27)和教材式(2-28)。求每个回归结果的标准误、t值和r。检验两个回归的斜率系数是否是统计显著的。
答:运用EViews,可得教材式(2-27)的回归结果如下: Dependent Variable:PRICE Sample:1 32 Variable Coefficient Std Error t-Statistic Prob C -191.666 2 264.439 3 -0.724 802 0.4742 AGE 10.485 62 1.793 729 5.845 711 0.0000 R-squared 0.532509 回归模型斜率在统计上是高度显著的,因为零假设为真的条件下,令t统计量大于或等于5.8457的p值几乎为零。而截距项的p值却很高,因此其在统计上是不显著的。
同样,可得教材式(2-28)的回归结果为:
Dependent Variable:PRICE Sample:1 32 2
Variable Coefficient Std Error t-Statistic Prob C 807.950 1 231.092 1 3.496 226 0.0015 NOBIDDERS 54.572 45 23.266 05 2.345 582 0.0258 R-squared 0.154971 此时两个变量回归系数的p值都很小,因此其在统计上是显著的。
22.参考习题22。利用OLS回归回答问题(1)、(2)和(3)。 答:下表所呈现的回归结果同练习2.16的结果相同。 (1)EViews的回归结果如下: Dependent Variable:ASP Sample:1 64 Variable Coefficient Std Error t-Statistic Prob. C -882 20.49 766 38.60 -1.151 1 0.2541 GPA 552 27.44 226 97.53 2.433 2 0.0179 R-squared 0.087 2
可见,GPA对ASP存在正向影响,其回归系数在统计上是显著的,因为相应回归系数的p值非常小。 (2)ASP对CMAT的回归结果如下: Dependent Variable:ASP Sample:1 65 Variable Coefficient Std Error t-Statisfic Prob. C -241 386.6 29 464.86 -8.192 36 0.0000 GMAT 511.720 7 44.357 05 11.536 4 0.0000 R-squared 0.6822 GMAT回归系数的估计量在统计上是显著的,且其对ASP存在正向影响。 (3)ASP对学费的回归结果:
Dependent Variable:ASP Sample:1 65 Variable Coefficient Std Error t-Statistic Prob C 42 878.33 5 502.063 5 7.793 14 0.0000 TUITION 1.634784 0.156 924 10.417.7 0.0000 R-squared 0.6364 学费(在一定程度上反映了教学质量)对ASP存在显著的正向影响。同样,入学等级对ASP也存在显著的正向影响,这一点可以从以下的回归结果中看出:
Dependent Variable:ASP Sample:1 65 Variable Coefficient Std Error t-Statistic Prob C -29 943.60 10 973.495 -2.728 72 0.0089 RECRUITER 37 300.30 3 020.518 7 12.348 97 0.0000 R-squared 0.7644
23.表3-7给出了美国1959~2006年进口货物支出(Y)和个人可支配收入(X)的数据(见网上教材)。根据表中的数据,估计进口支出函数,给出常用的统计量,并检验假设:进口支出与个人可支配收入不相关。
答:回归结果如下:其中Y为进口货物支出,X为个人可支配收入。
Dependent Variable:Y Sample:19592006 Variable Coefficient Std Error t-Statistic Prob C -136.164 9 23.565 09 -5.778 25 0.0000
X 0.208 248 0.005 467 38.091 1 0.0000 R-squared 0.9693 不难发现,个人可支配收入同进口货物支出之间存在显著的正向关系。斜率项的p值几乎为零,因此可以拒绝零假设。
24.证明OLS估计量b1和b2是线性估计量,并证明这些估计量是误差项ui的线性函数。 (提示:b2?) ?xiyi/?xi??wiyi其中,wi?xi/?xi,注意X是非随机的。
22答:令wi?xi/?xi,则b2??wiyi,因此b2是一个线性的估计量,即b2是Y的线性函数,在推导过程
2中,我们将X设定为非随机的。类似的步骤可以证明b1也是线性的估计量。
因为
?xy??xY??x?B?BX?x?x?x?x?B?xX??xu?B?x?x?x?xu?B??x?xX?1。
推导过程中运用了?x???X?X??0和
?xb2?ii2ii2ii122ii1i2ii22ii2iii2ii2iiii?ui?
ii2i?xiui????B2。 因此有E?b2??E?B2?2??xi?????xiui?E??xiui?2??注意:E?,这是因为。类似的步骤x?i为常数且X和u不相关(OLS基本假定)2??x2??xii??可以推导出b1也是无偏的。
25.证明教材式(3-35)。(提示:把教材式(3-33)平方,然后利用OLS的性质。) 答:对式yi?b2xi?ei两边同时取平方再求和,因为
?xe?0,有:
ii22?y?b2
2i?b22?xi??ei?2b2?xiei2i22?x??ei
第四章 多元回归:估计与假设检验
4.1 复习笔记
一、三变量线性回归模型
1.三变量回归模型的函数形式
把双变量总体回归函数(PRF)一般化,即可写出三变量PRF的非随机形式:
E?Yt??B1?B2X2t?B3X3t (4-1)
随机形式为
Yt?B1?B2X2t?B3X3t?ut?E?Yt??ut (4-2)
其中,Y——应变量;X2,X3——解释变量;u——随机扰动项,在三变量模型或多元回归模型中,引入u的原因与双变量模型相同。B1是截距,表示了当X2,X3为零时得Y的平均值,B2,B3称为偏回归系数。
多元回归模型的随机形式式(4-2)表明,任何一个Y值可以表示成为两部分之和:
(1)系统成分或确定性成分B1?B2X2t?B3X3t,也就是Y的均值E?Yt?(即总体回归线上的点)。 (2)非系统成分或随机成分u。由除X2、X3以外其他因素决定。 2.偏回归系数的含义
B2,B3称为偏回归系数或偏斜率系数。B2度量了在X3保持不变的情况下,X2单位变动引起Y均值E?Y?的变化量。同样的B3度量了在X2保持不变的情况下,X3单位变动引起Y均值E?Y?的变化量。这是多元回归的一条特殊性质;在双变量情形下,由于仅有一个解释变量,因而无须担心模型出现其他解释变量。而在多元回归中,想要知道的是Y均值的变动有多大比例“直接”来源于X2,多大比例“直接”来源于X3。
二、多元线性回归模型的若干假定
假定1:回归模型是参数线性的,并且是正确设定的;
假定2:X2、X3与扰动项u不相关。如果X2、X3是非随机的(即X2、X3在重复抽样中取固定值),则这个假定将自动满足。
但是,如果变量X是随机的,那么它们必须独立分布于误差项u,否则无法得到回归系数的无偏估计值。
假定3:误差项均值为零,即:E?ui??0。 假定4:同方差假定,即u的方差为一常量:
var?ui???2
假定5:误差项ui和uj无自相关,即
cov?ui,uj?,i?j
假定6:解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系,这是相对于双变量回归模型一个新假定。
假定7:为了进行假设检验,假定随机误差u服从均值为零,(同)方差为?2的正态分布。即
ui~N?0,?2?
根据假定6,解释变量X2和X3之间不存在严格的共线性,这个假定也称为无共线性或无多重共线性假定。无完全共线性通俗的解释是,变量X2不能表示为另一变量X3的线性函数。因而,如果有:
X2i?3?2X3i
或
X2i?4X3i
则这两个变量之间是共线性的,因为X2和X3之间存在严格的线性关系。
在完全共线性的情况下,不能估计偏回归系数B2和B3的值;换句话说,不能估计解释变量X2和X3各自对应变量Y的影响,因为在模型中没有两个独立的解释变量。
三、多元回归参数的估计 1.普通最小二乘估计量
要求OLS估计量,首先写出与PRF式(4-2)相应的样本回归函数(SRF):
Yt?b1?b2X2t?b3X3t?et (4-3)
样本回归方程为:
??b?bX?bX (4-4) Yt122t33t即估计的总体回归线(实际上是一个平面)。 OLS原则是选择未知参数值使得残差平方和(RSS)
?e2t尽可能小。首先,把模型(4-3)写为:
et?Yt?b1?b2X2t?b3X3t (4-5)
将方程两边平方再求和,得:
RSS:?et2???Yt?b1?b2X2t?b3X3t? (4-6)
最小二乘法就是使RSS(Yt真实值与估计值之差的平方和)最小化。 利用微积分求最小值的方法,可得到得到如下(最小二乘)正规方程:
2Y?b1?b2X2?b3X3?YX?YXt2t3t?b1?X2t?b2?X2t2?b3?X2tX3t ?b1?X3t?b2?X2tX3t?b3?X3t2对上面方程做简单的代数变换,得到如下三个OLS估计量:
b1?Y?b2X2?b3X3 (4-7) yx???x????yx???x??b???x???x????xx?yx???x????yx???x??b???x???x????xx?2t2t2tt3t22222t3t2t3t2t3t2tt2t32222t3t2t3t2t3tx? (4-8) ? (4-9)
2t3tx