stata学习笔记-南京廖华答案网

stata学习笔记下载本文

内容发布更新时间 : 2025/7/19 7:41:18星期一下面是文章的全部内容请认真阅读。

. reg consumption temp price income Source SS df MS Number of obs = 30 F( 3, 26) = 22.17 Model .090250523 3 .030083508 Prob > F = 0.0000 Residual .035272835 26 .001356647 R-squared = 0.7190 Adj R-squared = 0.6866 Total .125523358 29 .004328392 Root MSE = .03683 consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0004455 7.76 0.000 .0025426 .0043743 price -1.044413 .834357 -1.25 0.222 -2.759458 .6706322 income .0033078 .0011714 2.82 0.009 .0008999 .0057156 _cons .1973149 .2702161 0.73 0.472 -.3581223 .752752 BG检验

. estat bgodfreyBreusch-Godfrey LM test for autocorrelation lags(p) chi2 df Prob > chi2 1 4.237 1 0.0396 H0: no serial correlation显著拒绝了原假设无自相关，则认为存在自相关 Q检验（略）、DW检验如下

. estat dwatsonDurbin-Watson d-statistic( 4, 30) = 1.021169DW=1.02 距离2很远可以认为存在自相关。

由以上的检验可以看出扰动项之间存在自相关，因此OLS提供的标准误是不准确的，应

四分之一

使用异方差自相关稳健标准误，由于样本为30个，n=2.34，故取NEWey-West估计量的滞后值为P=3，结果如下：

. newey consumption temp price income,lag(3)Regression with Newey-West standard errors Number of obs = 30maximum lag: 3 F( 3, 26) = 27.63 Prob > F = 0.0000 Newey-West consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0004002 8.64 0.000 .0026357 .0042811 price -1.044413 .9772494 -1.07 0.295 -3.053178 .9643518 income .0033078 .0013278 2.49 0.019 .0005783 .0060372 _cons .1973149 .3378109 0.58 0.564 -.4970655 .8916952

上图显示标准误与OLS标准误无多大区别，因此将滞后阶数增加为6，

. newey consumption temp price income,lag(6)Regression with Newey-West standard errors Number of obs = 30maximum lag: 6 F( 3, 26) = 52.97 Prob > F = 0.0000 Newey-West consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp .0034584 .0003504 9.87 0.000 .0027382 .0041787 price -1.044413 .9821798 -1.06 0.297 -3.063313 .9744864 income .0033078 .00132 2.51 0.019 .0005945 .006021 _cons .1973149 .3299533 0.60 0.555 -.4809139 .8755437

从上图可以看到无论截断参数是3还是6，标准误都变化不大，比较稳健。

此外，前面提到自相关存在可能是因为模型设定不正确，因此考虑在解释变量中加入temp的滞后值，然后再进行OLS回归：

. reg consumption temp L.temp price income Source SS df MS Number of obs = 29 F( 4, 24) = 28.98 Model .103387183 4 .025846796 Prob > F = 0.0000 Residual .021406049 24 .000891919 R-squared = 0.8285 Adj R-squared = 0.7999 Total .124793232 28 .004456901 Root MSE = .02987 consumption Coef. Std. Err. t P>|t| [95% Conf. Interval] temp --. .0053321 .0006704 7.95 0.000 .0039484 .0067158 L1. -.0022039 .0007307 -3.02 0.006 -.0037119 -.0006959 price -.8383021 .6880205 -1.22 0.235 -2.258307 .5817025 income .0028673 .0010533 2.72 0.012 .0006934 .0050413 _cons .1894822 .2323169 0.82 0.423 -.2899963 .6689607然后使用BG检验是否存在自相关：

. estat bgoBreusch-Godfrey LM test for autocorrelation lags(p) chi2 df Prob > chi2 1 0.120 1 0.7292 H0: no serial correlation

结果显示无自相关，而后DW值也改进为1.58，因此修改模型后扰动项基本不再存在自相关。

模型设定与数据问题

遗漏变量：被解释变量可能被加入到扰动项中

解决方式：加入尽可能多的控制变量；使用代理变量；工具变量法；使用面板数据；随机试验或自然实验。

其中代理变量应满足两个条件：多余性，仅通过影响遗漏变量而作用于被解释变量；剩余独立性，遗漏变量中不受代理变量影响的剩余部分与所有解释变量均不相关。

多重共线性：某一解释变量可以由其他解释变量线性表出，即存在多重共线性。检测：先回归，然后estat vif VIF低于10即不存在多重共线性。

工具变量，2SLS与GMM

工具变量的适用条件：OLS成立的最重要条件是解释变量与扰动项不相关，如出现相关可以使用工具变量法来解决。其中在计量经济学中，将所有与扰动项相关的解释变量成为内生变量，一个有效的工具变量应满足一下两个条件：1、工具变量与内生解释变量相关；2、工具变量与扰动项不相关。

过程：传统的工具变量法一般通过二阶段最小二乘法（2SLS或TSLS）来实现：1、用内生解释变量对工具变量进行回归，得到拟合值Pt（Pt实际上是内生变量中的外生部分，而另一部分是与扰动项相关）；2、用被解释变量对第一阶段的拟合值Pt进行回归。工具变量的检测：1、不可识别检验；2、弱工具变量检验；3、过度识别检验（estat overid）。豪斯曼检验：原假设为所有解释变量均为外生变量，若拒绝假设的话应该使用工具变量法，若接受的话使用OLS。豪斯曼过程：reg X1 x2

Estimates store ols(存储OLS的结果)

Ivregress 2sls y x1(x2=z1 z2)(假设怀疑X2为内生变量) Estimates store iv(存储2SLS结果)

Hausman iv ols,constant sigmamore(根据存储的结果进行豪斯曼检验)

若存在异方差的问题，则可以使用杜宾-吴-豪斯曼检验。它在异方差的情况下也适用。

在球形扰动项的假定下，2SLS最有效，但如果扰动项存在异方差或自相关，则存在GMM广义矩估计这一更有效的方法：首先使用2SLS得到残差，然后GMM，但是在实际操作中使

用迭代法。

GMM的命令：

ivregress gmm y x1(x2=z1 z2) 两步最优GMM

ivregress gmm y x1 (x2=z1 z2)，igmm 迭代GMM estat overid 过度识别检验

工具变量法的STATA命令和实例： Use grilic.dta,clear Sum

然后考察智商和受教育年限的相关关系（本文研究的是工资与受教育年限的关系）

. pwcorr iq s,sig iq s iq 1.0000 s 0.5131 1.0000 0.0000

具有较强的正相关关系。

然后作为一个参照系，进行OLS回归并使用稳健标准误。

. reg lw s expr tenure rns smsa,rLinear regression Number of obs = 758 F( 5, 752) = 84.05 Prob > F = 0.0000 R-squared = 0.3521 Root MSE = .34641 Robust lw Coef. Std. Err. t P>|t| [95% Conf. Interval] s .102643 .0062099 16.53 0.000 .0904523 .1148338 expr .0381189 .0066144 5.76 0.000 .025134 .0511038 tenure .0356146 .0079988 4.45 0.000 .0199118 .0513173 rns -.0840797 .029533 -2.85 0.005 -.1420566 -.0261029 smsa .1396666 .028056 4.98 0.000 .0845893 .194744 _cons 4.103675 .0876665 46.81 0.000 3.931575 4.275775

教育投资率10.26%，显然过高，可能是遗漏了变量能力，使得能力对工资的贡献也被纳入教育的贡献。

因此使用iq作为能力的代理变量，再进行OLS回归，可以发现加入iq作为能力的代理变量后，教育投资回报率降低了一些，但还是过高。（如下图）

Word文档下载：stata学习笔记.doc

搜索更多:stata学习笔记