抽样调查习题集 下载本文

内容发布更新时间 : 2024/12/23 13:10:58星期一 下面是文章的全部内容请认真阅读。

《抽样调查》复习题

一 概述

1.1 结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由; 1.研究居住在某城市所有居民的食品消费结构;

2.调查一个县各村的粮食播种面积和全县生猪的存栏头数; 3.为进行治疗,调查一地区小学生中患沙眼的人数; 4.调查一地区结核病的发生率; 5.估计一个水库中草鱼的数量;

6.某企业想了解其产品在市场的占有率; 7.调查一个县中小学教师月平均工资。 1.2 结合习题1.1的讨论,你能否概括在什么场合作全面调查,什么场合适合做抽样调查。 1.3 讨论以下所列情况是否属于概率抽样,并说明理由:

1.从一个包含有100只兔子的实验室大笼子里抓10只兔子做实验。研究人员不经任何挑选抓到哪只就算那一只,抓满10只为止。

2.将笼中的100只兔子编上1~100号,任意列出10个不重复的数字(为1~100之间的整数),以相应的兔子作为抽中作试验的样本; 3.从钱包中随便抽出一纸币,凡兔子号码尾数与该纸币编号尾数相同者及作为抽中的样本。 1.4 某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。试问这是不是一项抽样调查?样本抽取是不是属于概率抽样?为什么?

1.5 结合习题1.3与1.4的讨论,根据你的理解什么是概率抽样?什么是非概率抽样?它们各有什么优点?

1.6 怎样理解抽样调查的科学性? 1.7 抽样调查基础理论及其意义; 1.8 抽样调查的特点。

二 抽样调查基本原理

2.1 试说明以下术语或概念之间的关系与区别; 1.总体、样本与个体; 2.总体与抽样框;

3.个体、抽样单元与抽样框。

2.2 试说明以下术语或概念之间的关系与区别; 1.均方误差、方差与偏倚; 2.方差、标准差与标准误;

3.无偏估计、祥和估计量与可用估计量;

4.绝对误差限、置信限(置信区间)与置信度。 2.3 样本可能数目及其意义; 2.4 影响抽样误差的因素; 2.5 抽样分布及其意义; 2.6 抽样估计的基本原理; 2.7 置信区间的确定。

三 简单随机抽样

3.1 设总体N=5,其指标值为{3,5,6,7,9} 1.计算总体方差?2和S2;

2.从中抽取n=2的随机样本,分别计算放回抽样和不放回抽样的方差V(y); 3.按不放回抽样列出所有可能的样本并计算y,验证E(y)=Y;

4. 按不放回抽样的所有可能的样本,计算其方差V(y),并与公式计算的结果进行比较; 5.对所有的可能样本计算样本方差s2,并验证在不放回的情况下:E(s2)= S2。 3.2 在一森林抽样调查中,某林场共有1000公顷林地,随机布设了50块面积为0.06公顷

33

的方形样地,测得这50块样地的平均储蓄量为9m,标准差为1.63 m,试以95%的置信度估计该林场的木材储蓄量。

3.3 某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,得y=12.5,s2=1252。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本?

3.4 某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间。

3.6 某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为

名称 粮食 棉花 大豆 变异系数 0.38 0.39 0.44

若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少?

3.7 假设总体中每个单元有两个指标值Yi和Xi,i=1,…,N,记y,为相应的简单随机样本的均值。试证: (1)样本均值y?1nn?i?1yi是总体均值的无偏估计;

(2)Var(y)?1?fnS, 其中,S22?1NN??1(Yi?Y).

2i?13.8 简单随机抽样在抽样技术中的地位;

3.9 简单随机抽样中样本量确定的原则及主要考虑因素。

四 分层抽样

4.1 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料: 工人 N1=132 S12=36 技术人员 N2=92 S22=25 行政管理人员 N3=27 S32=9 若样本量n=30,试用Neyman分配确定各层的样本量。 4.2 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下: 工人 8,24,0,0,16,32, 6,0,16,7,4,4,9,5,8,18,2,0 技术人员 行政管理人员 4,5,0,24,8,12,3,2,1,8 1,8 试估计总的工时损失数并给出它的置信度为95%的置信区间。 4.3 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据 层 1 2 3 4 村总数 1411 4705 2558 14997 样本村养牛头数 1 2 3 4 5 6 7 8 9 10 43 84 98 0 10 44 0 124 13 0 50 147 62 87 84 158 170 104 56 160 228 262 110 232 139 178 334 0 63 220 17 34 25 34 36 0 25 7 15 31 要求: (1) 估计该地区养牛总头数Y及其估计量的相对标准误差s(Y?)Y? (2) 讨论分层抽样与不分层抽样比较效率有否提高。 (3) 若样本量不变采用Neyman分配可以减少方差多少? 4.4 怎样分层能提高精度?

4.5 总样本量在各层间分配的方法有哪些? 4.6 分层的原则及其意义。

五 比估计与回归估计

5.1 对以下假设总体(N=6) Xi Yi U1 U2 U3 U 4 U 5 U6 0 1 3 5 8 10 1 3 11 18 29 46 (1) 用简单随机抽样抽取n=2的样本,列出所有可能的样本计算每个样本的R。R是不是无偏的?若有偏,偏倚多大?

(2) 若用n=2的简单样本去估计总体总量Y,试比较比估计与简单估计的方差。

5.2 欲估计某小区居民的食品支出占总收入的比重,该地区共有150户,现用简单随机抽样抽取14户为样本,经调查每户的食品支出yi与总收入xi的数据如下表:

样本户 1 2 3 4 5 6 7 8 9 10 11 12 13 14 总收入xi 25100 32200 29600 35000 34400 26500 28700 28200 34600 32700 31500 30600 27700 28500 食品支出yi 3800 5100 4200 6200 5800 4100 3900 3600 3800 4100 4500 5100 4200 4000 要求估计食品支出占收入比重的95%置信度的置信区间。

5.3 某养兔专业户购进100只兔子,平均重量为3.1磅,随机抽取了10只兔子为样本,记录其重量,经过两个月的饲养,现欲了解其平均重量,经过称重,其资料如下:

样本 1 2 3 4 5 6 7 8 9 10 原重(磅) 3.2 3.0 2.9 2.8 2.8 3.1 3.0 3.2 2.9 2.8 现重(磅) 4.1 4 4.1 3.9 3.7 4.1 4.2 4.1 3.9 3.8 要求:

(1) 用回归估计法估计每只兔现有的重量,并计算其方差的近似估计量。

(2) 若每只兔的平均重量允许最大误差为0.05磅,置信度为95%,应该取多少只兔为

样本?

5.4 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分平原和山区两层采用分层抽样。同时当年产量与去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下: 平原 山区 样本 1 2 3 4 去年产量 (百斤) 204 143 82 256 当年产量 (百斤) 210 160 75 280 5 6 275 198 300 190

样本 1 2 3 4 5 6 7 8 9 去年产量 (百斤) 137 189 119 63 103 107 159 63 87 当年产量 (百斤) 150 200 125 60 110 100 180 75 90

试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上述两种结果进行比较和分析。

5.5 回归估计、比估计与简单估计间的区别; 5.6 辅助变量的选择原则;

六 整群抽样

6.1 若欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适你认为采用什么抽样方式好。 (1) 少数民族的居住比较集中;

(2)少数民族比较均匀得分布在各街道; (3)少数民族分散在各街道但比重不同。

6.2 汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽取了25辆,其不安全轮胎数如下: 不安全轮胎数 0 1 2 3 4 汽车数 5 8 7 2 3 要求估计该运输公司的汽车中不安全轮胎的比例及其估计的标准误。

七 多阶抽样

7.1 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽取10块地,再从每块抽中的地块中抽10%的树苗,对抽中的苗木测量其高度取得资料如下: 地块(i) 秧苗数(Mi) 抽样数(mi) 苗木高度yij