第五章参数估计和假设检验Stata实现 下载本文

内容发布更新时间 : 2024/7/5 6:42:50星期一 下面是文章的全部内容请认真阅读。

-------------精选文档-----------------

第五章 参数估计和假设检验的Stata实现

本章用到的Stata命令有

可信区间计算 立即命令为 正态分布: cii 样本量 样本均数 样本标准差 率: cii 样本量 阳性数 Poisson分布均数: cii 观察单位数 观察值,p 原始数据的命令 正态分布:ci 变量 二项分布:ci 变量,b 假设检验 均数的检验 : 立即命令为: ttesti 样本量 样本均数 样本标准差 ?0(待检验的总体均数) 原始数据的命令: ttest 变量名 =?0 例5-1 随机抽取某地25名正常成年男子,测得其血红蛋白含量如下:

146 139 153 138 137 125 142 134 133 122 137 128 140 137 139 128 131 158 138 151 147 144 151 117 118

该样本的均数为137.32g/L,标准差为10.63g/L,求该地正常成年男子血红蛋白含量总体均数的95%可信区间。

数据格式为 x 可编辑

-------------精选文档-----------------

1 146 2 139 3 153 4 138 5 137 6 125 7 142 8 134 9 133 10 122 11 137 12 128 13 140 14 137 15 139 16 128 17 131 18 158 19 138 20 151 21 147 22 144 可编辑

-------------精选文档-----------------

23 151 24 117 25 118

计算95%可信区间的Stata命令为:

ci x 计算95%可信区间 结果为

Variable | Obs Mean Std. Err. [95% Conf. Interval] -------------+--------------------------------------------------------------- x | 25 137.32 2.126594 132.9309 141.7091 该地正常成年男子血红蛋白含量总体均数的95%可信区间为(132.93~141.71)

例5-2 某市2005年120名7岁男童的身高X=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。

在Stata中有即时命令可以直接计算仅给出均数和标准差时的可信区间。

cii 120 123.62 4.75,level(90)

结果为:

Variable | Obs Mean Std. Err. [90% Conf. Interval] -------------+--------------------------------------------------------------- | 120 123.62 .4336137 122.9012

可编辑

-------------精选文档-----------------

124.3388 该市7岁男童总体均数90%的可信区间(122.90~124.34)。

例5-3 为研究铅暴露对儿童智商(IQ)的影响,某研究调查了78名铅暴露(其血铅水平≥40

g/100ml)的6岁儿童,测得其平均IQ为88.02,标准差为

12.21;同时选择了78名铅非暴露的6岁儿童作为对照,测得其平均IQ为92.89,标准差为13.34。试估计铅暴露的儿童智商IQ的平均水平与铅非暴露儿童相差多少,并估计两个人群IQ的总体均数之差的95%可信区间。

本题也可以应用Stata的即时命令:

ttesti 78 92.88 13.34 78 88.02 12.21 结果:

Two-sample t test with equal variances ------------------------------------------------------------------------------ | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x | 78 92.88 1.510458 13.34 89.87229 95.88771 y | 78 88.02 1.38251 12.21 85.26707 90.77293 ---------+-------------------------------------------------------------------- combined | 156 90.45 1.039008 12.97721 88.39756

可编辑

-------------精选文档-----------------

92.50244 ---------+-------------------------------------------------------------------- diff | 4.86 2.047637 .8149179 8.905082 ------------------------------------------------------------------------------ 差值为4.86,差值的可信区间为0.81~8.90。

例5-4 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的灵敏度,随机抽取140例确诊为肺癌患者,用CEA进行检测,结果呈阳性反应者共62人,试估计肺癌人群中CEA的阳性率。

Stata即时命令为

cii 140 62 结果为

-- Binomial Exact -- Variable | Obs Mean Std. Err. [95% Conf. Interval] -------------+--------------------------------------------------------------- | 140 .4428571 .0419808 .3590149 .5291687 肺癌人群中CEA的阳性率为44.28%,可信区间为35.90%~52.82%。 例5-5 某医生用A药物治疗幽门螺旋杆菌感染者10人,其中9人转阴,试估计该药物治疗幽门螺旋杆菌感染者人群的转阴率。

Stata即时命令为

可编辑