stata学习笔记 下载本文

内容发布更新时间 : 2025/1/22 21:41:35星期一 下面是文章的全部内容请认真阅读。

alpha=0的原假设,也因此应使用负二项回归。

短面板

面板数据指的是一段时间内跟踪同一组个体数据,它既有横截面的维度又有时间维度。其中,如果每个时期在样本中的个体完全一样,则称为平衡面板数据,反之为非平衡面板数据。 固定效应还是随机效应:当不存在异方差的时候,使用hausman检验,如果假设成立,则

使用随机效应,如果拒绝假设,则使用固定效应。

而当存在异方差时候,使用辅助回归然后聚类稳健标准误来检验,

如果接受假设,则使用随机效应模型。

短面板的stata命令及实例:

Xtset panelvar timevar(xt说明数据为面板数据,panelvar取值必须为整数且不重复,相当于

进行编号,timevar为时间变量,假如panelvar为字串符,如国家,则使用encode country,gen(cntry))

Xtdes 显示面板的结构,是否为平衡面板 Xtsum 显示组内,组间与整体的统计指标

Xttab varname 显示组内,组间与整体的分布频率,tab指的是tabulate 交通死亡率:首先设定state与year为面板变量及时间变量。

上图显示这是一个平衡的面板数据(每个时期在样本中的个体完全一样),然后显示数据集

的结构:

n=48,T=7,n大而T小,说明这是一个短面板,然后作为参照系,首先进行混合回归: reg y x1 x2 x3,vce(cluster id)其中id用来确定每个个体的变量,vce(cluster state)表示

使用以state为聚类变量的聚类稳健标准误

由于每个州的情况不一样,可能存在不随时间变化的遗漏变量,故考虑使用固定效应: Xtreg y x1 x2 x3,fe r

LSDV法的stata命令为:reg y x1 x2 x3 i.id,r

其中r为使用聚类稳健标准误,vce(cluster id)也能达到这种效果,id表示用来确定个体的

变量,i.id表示根据变量id而生成的虚拟变量。

首先使用组内估计量:

在选择随机还是固定时:使用hausman检验:xtreg y x1 x2 x3,fe(固定效应估计)

Estimates store fe(存贮)

Xtreg y x1 x2 x3,re(随机效应估计) Estimates store re(存储) Hausman fe re,constant sigmamore(豪斯曼检验)

长面板与动态面板

在长面板中,T可能会比较大,因此可能存在组间异方差,组内自相关或组间同期相关的问题,主要有两种处理方式:1、使用OLS即LSDV来估计系数,只对标准误差进行矫正(即面板矫正误差);3、对异方差或自相关的具体形式进行假设,然后使用可行广义最小二乘法FGLS进行估计。

1、 矫正标准误差

即使扰动项存在组间异方差或组间同期相关等,LSDV也依然有效,此时,只要使用组间异方差、组间同期方差稳健的标准误差即可,即面板校正标准误差PCSE: Xtpvse y x1 x2 x3,hetonly,其中hetonly表示存在组间异方差,但不存在组间同期相关;

举例:inc为被解释变量,由于n=10,T=30,因此是一个长面板。为了考虑时间效应,生成时间趋势变量t,然后用LSDV法估计双向固定效应模型(作为对比先不考虑异方差等)

下图可以看出有些州虚拟变量显著,即存在固定效应,而时间效应则不太显著,p值为0.19.然后下表未考虑组间异方差等,因此使用面板校正标准误进行估计(下下图)

命令xtpcse与命令reg的估计系数完全一样,只是标准误不同。 2、 仅解决组内自相关的FGLS:xtpcse y x1 x2,corr(ar1)。无论是使用prais-winsten

还是OLS方法都在组间异方差与组间同期相关的情况下成立。

继续使用以上数据,考虑组内自相关的情形,但要求各组的自回归系数相同 3、 组间异方差的检验:如果拒绝假设,则存在组间异方差。

Ssc install xttest3(下载安装命令) Quietly xtreg lnc lnp i.state t,r fe xttest3

Quietly xtgls lnc lnp i.state t Xttest3

4、 组内自相关检验:如果拒绝假设,则存在组内自相关

Net install st0039

Xtserial y x1 x2 x3,output

5、 组间同期相关的检验:如果拒绝假设,即存在组间同期相关。

Ssc install xtest2

Quietly xreg inc inp inpmin iny t,fe Xttest2