内容发布更新时间 : 2024/11/9 2:20:23星期一 下面是文章的全部内容请认真阅读。
??B?BXYi12ise?????t?????p?????r2???df???
第一行括号内的数值表示估计回归系数的标准误,第二行括号内的数值表示在零假设下(每个回归系数的真实值为零)估计的t值(即估计的系数与其标准误之比),第三行括号内的数值表示获得t值的p值。一般情况下,如果没有设定特殊的零假设,习惯地规定零假设为:总体参数为零。如果拒绝零假设(即检验统计量是显著的),则表示真实的总体参数值不为零。
用上述形式报告回归结果的一个优点是,可以一目了然地看到每个估计系数是否是统计显著的,即是否显著不为零。通过列出的p值能够确定t值的精确显著水平。
注:当判定拒绝或不拒绝零假设时,需要预先确定一个可以接受的p值水平(即临界p值),然后把计算的p值与临界p值进行比较。如果计算的p值小于临界p值,则拒绝原假设,如果计算的p值大于临界p值,则不能拒绝零假设。
八、正态性检验
双变量回归模型的经典假定是假定误差项ui服从正态分布,但是由于不能直接观察真实的误差项ui,因此需要用ui的替代量ei去检验ui的正态性。常用的检验方法如下:
1.残差直方图
残差直方图是用于获知随机变量概率密度函数(PDF)形状的一种简单图形工具。在横轴上,把变量值(例如OLS残差)划分为若干适当的区间,在每一个区间,建立高度与观察值个数(即频率)相一致的长方形。
如果把钟形正态曲线叠加在直方图上,就会对变量的概率分布有一直观了解。在实践中,常常通过回归残差的直方图粗略地了解其概率分布的形状。
2.正态概率图
另一种研究随机变量PDF的简单图形工具是正态概率图,这需要在专用的正态概率纸上作图。在横轴上(X轴)标出变量值(例如OLS残差值ei),在纵轴上(Y轴)标出如果服从正态分布变量所对应的期望值。因此,如果变量来自正态总体,则正态概率近似一条直线。 3.雅克-贝拉检验
常用的正态性检验方法是雅克-贝拉检验,它是建立在OLS残差基础上的一种渐近(或大样本)检验方法。首先计算出随机变量(例如OLS残差)的偏度系数S(PDF对称性的度量)和峰度系数K(PDF“胖瘦”的度量)。对于正态分布变量,偏度为0,峰度为3。
雅克和贝拉建立了如下检验统计量:
n?2?K?3?JB??S?6?4?其中,n为样本容量,S为偏度,K为峰度。
2?? ??2雅克和贝拉证明了:在正态性假设下,上式给出的JB统计量渐近服从自由度为2的?分布,用符号表示为
2 JBasy~?(2)其中,asy表示“渐近地”。
从统计量的表达式可以看出,如果变量服从正态分布,则S为0,?K?3?为0,因而JB统计量为零。但是如果变量不服从正态分布,则JB统计量为一个逐渐增大值。根据?分布表很容易计算出JB统计量的值。如果
2
在选定的显著水平下,计算的?值超过临界的?值,则拒绝正态分布的零假设;如果没有超过临界的?值,则不能拒绝零假设。当然,如果能够计算出?值的p值,则可以得知获此?值的精确概率。
九、预测
回归分析的目的之一是根据解释变量的值预测因变量的均值。给定样本观测值以外的一个样本X0,可以根
22222?,但对任一给定样本,Y?不可能等于其真实均值,因此需要求出真实据估计的回归方程得出预测值的估计值Y00?的置信区间就需要求出Y?的抽样分布。在CLRM假定下,可以证明Y?服从正态分均值预测值的一个区间。求Y000布,其均值、方差分别为
E?YX0??B1?B2X0?X0?X2?1?VarY0????nxi2???????2?
????其中,X——X的样本均值;
?x2i——X与X的离差平方和;
?2——ui的方差;
n——样本容量。
?服从自由度为?n?2?的t分布。因此,对于?2代替,则Y由于实践中?2是未知的,如果用其无偏估计量?0给定的X0,能够利用t分布建立一个Y的真实(总体)均值100?1???%的置信区间:
??B?BX?b?bX?tseY????1??? P?b1?b2X0?t?/2seY0120120?/20??
3.2 课后习题详解
一、问 题
1.解释概念
(1)最小二乘 (4)估计量的标准误 (7)自相关
????
(2)OLS估计量 (5)同方差性 (3)估计量的方差 (6)异方差性
(9)解释平方和(ESS) (12)估计值的标准误
(8)总平方和(TSS) (11)判定系数r
2(10)残差平方和(RSS)
(13)BLUE (14)显著性检验 (15)t检验 (16)单边检验 (17)双边检验 (18)统计显著 答:(1)在回归模型中,最小二乘法就是以残差(被解释变量的实际值同拟合值之间的差)平方和最小的原则对回归模型中的系数进行估计的方法。
(2)运用最小二乘法法计算出的总体回归参数的估计量。
(3)回归参数估计量是一个随机变量,其方差衡量了估计量同估计量均值的偏离程度。 (4)估计量方差的(正)平方根。 (5)方差相同。 (6)方差不同。
(7)一个随机变量与其滞后项之间的相关。
(8)在回归模型中,总离差平方和是指被解释变量同其均值之间差的平方和,即
??Yi?Y?2。
(9)ESS为总离差平方和(TSS)中解释变量所解释的那部分离差平方和。 (10)RSS为总离差平方和(TSS)中解释变量未解释的那部分离差平方和。 (11)它衡量了解释变量解释的那部分离差平方和占被解释变量总离差平方和的比例。简言之,它等于ESS同TSS之间的比值。
(12)Y的估计值的标准误。
(13)BLUE称为最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中其方差最小。 (14)对统计假设的检验过程。
(15)基于t分布的统计假设检验过程。
(16)当备择假设是单边假设时,称该检验为单边检验。例如零假设为H0:u?u0,而备择假设为H1:u?u0或u?u0,其中u为均值。
(17)在双边检验中,备择假设是双边假设。 (18)其为拒绝零假设的简称。
2.判断正误并说明理由。
(1)OLS就是使误差平方和最小化的估计过程。
(2)计算OLS估计量无须古典线性回归模型的基本假定。 (3)高斯一马尔柯夫定理是OLS的理论依据。
(4)在双变量回归模型中,若扰动项ui服从正态分布,则b2是B2更准确的估计值。 (5)只有当ui服从正态分布时,OLS估计量b1、b2才服从正态分布。 (6)r是TSS/ESS的比值。
(7)给定显著水平?及自由度,若计算得到的t值超过临界的t值,则接受零假设。 (8)相关系数r与斜率b2同号。 (9)p值和显著水平?是一回事儿。
答:(1)错误,其最小化的是残差平方和,即最小化
2?e2i。
(2)正确。 (3)正确。
(4)错误。在估计回归系数时,0LS对干扰项的概率分布没有任何要求。
(5)正确。OLS的估计量是ui的线性函数,且当ui服从正态分布时,OLS估计量也服从正态分布(任何服从正态分布的随机变量的线性组合依旧服从正态分布)。
(6)错误。应为
ESS。 TSS(7)错误。应该拒绝零假设。
(8)正确。两者计算公式中的分子都包含X与Y的相关系数,而X与Y的相关系数可正可负。
(9)不一定。p值就是当零假设为真时,检验统计量大干或等于实际观测值的概率,其为某统计量精确的显著水平,它可能与任意选择的显著性水平?不同。
3.填空。
(1)若B2?0,则b2/se?b2?=______。 (2)若B2?0,则t?b2/______。 (3)r2位于______与______之间。 (4)r位于______与______之间。
(5)TSS=RSS+______。
(6)TSS的自由度=______的自由度+RSS的自由度。
?称为______。 (7)?(8)(9)
?2i=∑(Yi-_________)。
222?y=b2(______)。
答:(1)t (2)se?b2? (3)0和1
(4)-1和1
(5)ESS (6)ESS
(7)估计量的标准差 (8)
??Yi?Y2i?2
2i(9)b22?x??e
4.考虑下面的回归模型:
???66.1058?0.0650XYiise??10.7509?t??n?20,????18.73?
r2?0.9460完成空缺。如果??5%,能否接受假设:真实的B2为零?你是用单边检验还是双边检验,为什么? 答:完整的回归结果如下:
???66.1058?0.0650XYiise??10.7509?R2?0.9460?0.0035?t???6.1489??18.73?n?20
自由度为18,显著性水平为5%的t分布临界值为2.101(双边)和1734(单边)。因为估计量的t统计量为18.73,远远超过t分布的临界值,所以拒绝零假设。此处用双边检验较为合适,因为先验的理论假设通常不会考虑系数的符号。
5.证明下列r的计算公式是恒等的:
2
r2?1?答:
?yi2?ei2??i2?y?yi2?b22?xi2?y2i??yy???
????y???y2ii22iir2???yi2??ei2?/?yi2??$yi/?yi2?b22?xi2/?yi2
之后运用
2?y??y??e2ii22i和
?y2i2?b2?xi2??ei2即可。最后一个等号运用了等式:
??yy
ii?b2?yixi。
6.证明:答:
?e?nY?nb?nbX?0。
i12?ei?nY?nY?b2X?nb2X?0,还可参见习题22的解答。
??二、习 题
7.戴尔(DaleBails)和拉里(LarryPeppers)根据美国1962~1977年的数据,得到如下汽车需求函数:
??5807?3.24XYiise??1.634?r?0.222
其中,Y=私家车零售数量(千辆),X=实际可支配收入(1972年美元价,10亿美元)。注:未给出b1的标准差。
(1)对B2建立一个95%的置信区间。
(2)检验假设:该置信区间包括B2?0。如果不包括,那么接受零假设吗?
(3)在H0:B2?0下,计算t值,在5%的显著水平下,它是统计显著的吗?选择双边t检验还是单边t检验?为什么?
答:(1)自由度为14,显著性水平为5%的t分布临界值为2.145,因此置信区间为:3.24±2.145(1.634)=(-0.2649,6.7449)
(2)上述置信区间包含B2,因此不能拒绝零假设。
(3)t=3.24/1.634=19829。私家车零售量应与实际可支配收入呈正相关,因此提出H0:B2?0和
H0:B2?0。由此可知,单边t检验较为合适。显著性水平为5%的单边t检验临界值为1.761,本例中计算出的t检验统计量为1.9829,大于临界值,因此拒绝零假设(有时单边检验和双边检验的结果可能不同)。
8.现代投资分析的特征线涉及如下回归方程:
rt?B1?B2rmt?ut
其中,r——股票或债券的收益率;
rm——市场有价证券的收益率(用市场指数表示,比如S&P500);
t——时间。
在投资分析中,B2称为债券的beta系数,用于度量市场的风险程度,即市场对公司财富的影响。