统计学教案(第6章抽样推断) 下载本文

内容发布更新时间 : 2024/12/23 23:38:58星期一 下面是文章的全部内容请认真阅读。

统计学

授课题目 授课方式 教学目的: 通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本单位数的确定方法。 教学重点及难点提示: 重点:区间估计 难点:抽样平均误差的计算 案例导入:大学生消费调查:一个月你花多少? 第一节抽样推断概述 一、抽样推断的概念及特点 (一)概念 按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进行科学估计与推断的方法。 包括抽样调查和统计推断 抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相 关资料,以推断总体 统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估 计和推断。 (二)特点 1.按随机原则(等可能性原则)抽取调查单位.随机抽样的目的是为了排除人的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性原则是保证抽样推断正确性的一个重要前提条件。随机抽样不是随便抽样。 2.根据部分推断总体的数量特征 3.抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制 其他特点有经济性、时效性、准确性、灵活性等 (三)抽样推断的应用 1.不可能进行全面调查时 2.不必要进行全面调查时 3.检查生产过程正常与否 4.对全面调查资料进行补充修正时 二、抽样的几个基本概念 1.样本容量与样本个数 (1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样

第6章抽样推断 讲授 课次 课时安排 第8-9次 第8教学周-第9教学周,共4课时 教法提示: 多媒体教学 案例教学 列举法 1

本称为大样本,不超过30个的样本称为小样本。 (2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。 2.总体参数与样本统计量 (1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总 体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。 (2)样本统计量:与总体参数对应的是样本统计量。 设(X1,X2?,Xn)是总体X容量为n的样本,若样本函数 T?T(X1,X2?,Xn) 中不含任何未知参数,则称T为一个统计量。 例如 1nX??Xini?1 就是一个统计量,称为样本均值(Sample mean), 1nS??(Xi?X)2ni?1 2也是统计量,称为样本方差(Sample variance), 3.重复抽样与不重复抽样 (1)重复抽样:是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一次样本单位的抽取。 (2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一次抽样。 第二节 抽样推断的方法 一、点估计 (一)点估计的概念及特点 参数估计:以样本统计量对总体参数进行估计,有点估计和区间估计两种。 点估计:直接以样本统计量作为相应的总体参数的估计量。 优点:直接给出了总体参数的具体数值 缺点:未能反映误差的大小 参数点估计有: (1)样本均值估计总体均值 (2)样本成数估计总体成数 ?2?S2?(3)样本方差估计总体方差 (二)估计的评价标准: (1)无偏性: ??x???pP

2

???(X1,X2,?,Xn)是未知参数?的一个点估计量, 设??T若?满足E??? 即估计量的数学期望等于被估计参数则称?是?的无偏估计量,否则称为有偏估计量。 需要注意的是,由于估计量?是样本量,所以对?求平均是按样本??(X1,X2,?,Xn)的函数,样本量是n维随机变?(X1,X2,?,Xn)的概率分布求平均。 无偏性是我们衡量点估计量好坏的一个评价标准,这个评价标准的直观意义如下:由于样本的出现带有随机性,所以基于一次具体抽样所得的参数估计值未必等于参数真值,这是由样本的随机性造成的。我们希望当大量使用这个估计量对参数进行估计时,一系列估计值的平均值应该与待估参数真值相等。这就从平均效果上对估计量的优劣给出一个评价标准。 (2)有效性: ??T(X,X,?,X)???T(X,X,?,X)?12n12n均为未知参数?的无偏估计112设,2?)??2(??),则称无偏估计量量,如果对参数?的一切可能取值有?2(?12???1比?2有效 一个无偏估计量并不意味着他就非常接近被估计的参数,他还必须与总体参数的离散程度比较小。对同一总体参数的两个无偏点估计量,方差小者更有效。 (3)一致性: 指随着样本单位数n的增大,样本估计量将在概率意义下越来越接近于总体真实值 若对于任意ε>0,有 ??????1P ? n?? 二、区间估计法 在参数估计中,虽然点估计可以给出未知参数的一个估计,但不能给出估计的精度。为此人们希望利用样本给出一个范围,要求它以足够大的概率包含待估参数真值。这就是导致区间估计问题。 所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。 lim??设?是未知参数,(X1,X2,?,Xn)是来自总体的样本,构造两个统计量??T(X,X,?,X),???T(X,X,?,X),对于给定的?(0<?<1),若??1、?12n12n1122?满足 ?2?P??1????2???1?? ?]是参数?的置信水平为1??的置信区间, 1??称为[??,则称随机区间[??1,?21?]的置信度,??,??称为置信限。 ?212这里有几点需要说明:

3

?]的端点??,??及长度??-??都是样本的函数,从而都是随机(1)区间[??1,?21221?]是一个随机区间。 变量,因此[??1,?2??????(2)P?12???1??是说随机区间?]以1??的概率包含未知参[??1,?2?-??描述估计的精度,置信水平1??描述了估计的可靠度。 数真值,区间长度?21?]的概率是(3)因为未知参数?是非随机变量,所以不能说?落入区间[??1,?2?]包含?的概率是1??。 1??,而应是随机区间[??1,?2通俗地说,在点估计的基础上,给出总体参数的一个范围称为区间估计。 (二)总体均值的区间估计 1.正态总体且方差已知;或非正态总体、方差未知、大样本情况下 在这种情况下,样本均值的抽样分布呈正态分布,其数学期望为总体均值?,方差?2?为。则X?Z??称为总体均值在1??置信水平下的置信区间。 nn2? 区间估计步骤: 1.计算样本统计量 x,p?p(1?p)2.计算抽样平均误差 ?x?,?p? nn 3.计算极限误差 ?x????x?p????p22 x??x,x??xp??p,p??p4.确定置信区间 NP5.估计总量指标 NX ? 注意抽样方法的不同 ????[例]保险公司从投保人中随机抽取36人,计算得36人的平均年龄X?39.5岁,已知投保人平均年龄近似服从正态分布,标准差为7.2岁,试求全体投保人平均年龄的置信水平为99%的置信区间。 解:1???0.99,??0.01,查N(0,1)表得Z??2.575 2X?Z??n2?39.5?2.575?7.2?36.41 36

4

X?Z??n2?39.5?2.575?7.2?42.59 36故全体投保人平均年龄的置信水平为99%的置信区间为[36.41,42.59] ? 若总体方差?2未知,可用样本方差S代替 2 即39.5±2.13=(37.37,41.63),投保人平均年龄在90%的置信水平下的置信区间为37.37岁~41.63岁。 2.正态总体、方差未知、小样本情况下 如果总体服从正态分布,无论样本容量大小,样本均值的抽样分布都服从正态分布。只要总体方差已知,即使在小样本情况下,也可以计算总体均值的置信区间。如果总体方差?2未知,需用样本方差S代替,在小样本情况下,应用t分布来建立总体均值的置2信区间。 t分布是类似正态分布的一种对称分布,他通常要比正态分布平坦和分散。随着自由度的增大,t分布逐渐趋于正态分布。 正态总体、方差未知、小样本情况下,总体均值在1??置信水平下的置信区间为: X?t?2?s (重复抽样条件下) (6.18) nX?t?2?snN?n (不重复抽样条件下) (6.19) N?1其中t?(n?1)为t分布临界值,可以查t分布临界值表得到 2(三)成数的区间估计 在大样本(一般经验规则:np?5和n(1?p)?5)条件下,样本比例的抽样分布可用正态分布近似。在这种情况下,数理统计已经证明如下结论: 置信水平为1??的置信区间为: p?Z??2p(1?p) (重复抽样) np(1?p)N?n() (不重复抽样) nN?1p?Z??2[例]某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性所占比例的置信区间。 解:已知n?100,z??1.96,p?265?65% 100根据公式得:

5