内容发布更新时间 : 2024/12/24 0:43:46星期一 下面是文章的全部内容请认真阅读。
它反映了该厂工人周工资的一般水平. 试计算其样本方差与样本标准差.
例8 (分组样本均值的近似计算) 如果在例7中收集得到的样本观察值用分组样本形式给出(见表4.2.1), 此时样本均值可用下面方法近似计算: 以xi表示第i个组的组中值(即区间的中点), ni为第i组的频率, i?1,2,,k,?ni?n, 则
i?1k1kx??nixi (4.2.3)
ni?1表4.2.1 某厂30名工人周平均工资额 周工资额区间工人数ni(120,130]1(130,140](140,150](150,160](160,170](170,180](180,190](190,200]合计3614410130组中值xi125135145155165175185195nixi125405870217066017501954600
则本例中
x?4600?153.33 30这与例4.2.2的完全样本结果差不多.
注:在样本容量较大时,给出分组样本是常用的一种方法,虽然会损失一些信息,但对总体数学期望给出的信息还是十分接近的.
例9设我们获得了如下三个样本:
样本A: 3,4,5,6,7;样本B: 1,3,5,7,9; 样本C: 1,5,9
如果将它们画在数轴上(图5-1-3), 明显可见它们的“分散”程度是不同的: 样本A在这三个样本中比较密集, 而样本C比较分散.
这一直觉可以用样本方差来表示. 这三个样本的均值都是5, 即xA?xB?xC?5, 而样
本容量nA?5,nB?5,nC?3, 从而它们的样本方差分别为:
1102sA?[(3?5)2?(4?5)2?(5?5)2?(6?5)2?(7?5)2]??2.55?14
1402sB?[(1?5)2?(3?5)2?(5?5)2?(7?5)2?(9?5)2]??105?141322sC?[(1?5)2?(5?5)2?(9?5)2??16.
3?12222?sB?sA由此可见sC,这与直觉是一致的, 它们反映了取值的分散程度. 由于样本方差
的量纲与样品的量纲不一致, 故常用样本标准差表示分散程度, 这里有
sA?1.58,sB?3.16,sC?4, 同样有sC?sB?sA. 由于样本方差(或样本标准差)很好地反映了总体方差(或标准差)的信息, 因此若当方差?2未知时, 常用S2去估计, 而总体标准差?常用样本标准差S去估计.
思考题
46
1. 一组工人完成某一装配工序所需的时间(分)分别如下:
35 38 44 33 44 43 48 40 45 30 45 32 42 39 49 37 45 37 36 42 35 41 45 46 34 30 43 37 44 49 36 46 32 36 37 37 45 36 46 42 38 43 34 38 47 35 29 41 40 41
(1) 将上述数据整理成组距为3的频数表,第一组以27为起点; (2) 绘制样本直方图; (3) 写出经验分布函数.
第二节 常用统计分布
取得总体的样本后, 通常是借助样本的统计量对未知的总体分布进行推断, 为此须进一步确定相应的统计量所服从的分布, 除在概率论中所提到的常用分布外, 本节还要介绍几个在统计学中常用的统计分布:
?2分布 t分布 F分布
一、分位数
设随机变量X的分布函数为F(x), 对给定的实数?(0???1), 若实数F?满足不等式
P{X?F?}??,
则称F?为随机变量X的分布的水平?的上侧分位数.
若实数T?满足不等式
P{|X|?T?}??,
则称T?为随机变量X的分布的水平?的双侧分位数.
二、?2分布
定义1 设X1,X2,?,Xn是取自总体N(0,1)的样本, 则称统计量
2?2?X12?X22???Xn (1)
服从自由度为n的?2分布,记为?2~?2(n).
这里, 自由度是指(1)式右端所包含的独立变量的个数. ?2(n)分布的概率密度:
n1??1?x122?f(x)??2n/2?(n/2)xe,x?0.
?0,x?0?其中?(?)为Gamma函数,f(x)的图形如5-2-3.
1.?2分布的数学期望与方差:
若?2~?2(n), 则 E(?2)?n,D(?2)?2n. 2.?2分布的可加性:
222~?2(m?n). ~?2(n),且?12,?2若?12~?2(m),?2相互独立,则 ?12??23.?2分布的分位数:
2(n),对给定的实数?(0???1), 称满足条件 设?2~??2P{?2???(n)}????2??(n)f(x)dx??
2(n)为?2(n)分布的水平?的上侧分位数. 简称为上侧?分位数. 对不同的?与n, 分的点??位数的值已经编制成表供查用(参见附表).
三、t分布
47
定义2 设X~N(0,1),Y~?2(n),且X与Y相互独立,则称
X t?Y/n服从自由度为n的t分布, 记为t~t(n),
t(n)分布的概率密度:
f(x)??[(n?1)/2]?x??1??n??n?(n/2)???2?n?12,???t???
t分布具有如下性质:
1.f(x)的图形关于y轴对称,且limf(x)?0;
x??2.当n充分大时,t分布近似于标准正态分布; 3.t分布的分位数:
设T~t?(n),对给定的实数?(0???1), 称满足条件
P{T?t?(n)}????t?(n)f(x)dx??
的点t?(n)为t(n)分布的水平?的上侧分位数. 由密度函数f(x)的对称性,可得 t1??(n)??t?(n).
类似地,我们可以给出t分布的双侧分位数
P{|T|?t?/2(n)}???t?/2(n)??f(x)dx????t?/2(n)f(x)dx??,
显然有
2对不同的?与n, t分布的双侧分位数可从附表查得.
P{T?t?/2(n)}??;P{T??t?/2(n)}??2.
四、F分布
定义3 设X~?2(m),Y~?2(n),且X与Y相互独立, 则称
X/mnX F??Y/nmY服从自由度为(m,n)的F分布, 记为F~F(m,n).
F(m,n)分布的概率密度:
m1??1?(m?n)m??m?2?m?2??[(m?n)/2]?,x?0 ???x??1?x?f(x)???(m/2)?(n/2)?n??n??n??x?0?0,F分布具有如下性质:
1.若X~t(n),则X2~F(1,n);
12.若F~F(m,n), 则 ~F(n,m).
F3.F分布的分位数:
设F~F?(n,m),对给定的实数?(0???1),称满足条件
P{F?F?(n,m)}????F?(n,m)f(x)dx??
的点F?(n,m)为F(n,m)分布的水平?的上侧分位数. F分布的上侧分位数的可自附表查得.
4.F分布的一个重要性质:
1F?(m,n)?.
F1??(n,m)
48
此式常常用来求F分布表中没有列出的某些上侧分位数.
分位数
例1设??0.05, 求标准正态分布的水平0.05的上侧分位数和双侧分位数.
?2分布
例2设X1,?,X6是来自总体N(0,1)的样本, 又设
Y?(X1?X2?X3)2?(X4?X5?X6)2
试求常数C, 使CY服从?2分布.
t分布
例3设随机变量X~N(2,1), 随机变量Y1,Y2,Y3,Y4均服从N(0,4), 且X,Yi(i?1,2,3,4)都相互独立, 令
4(X?2)T?,
?Yi?14i2试求T的分布, 并确定t0的值, 使P{|T|?t0}?0.01.
F分布
例4设总体X服从标准正态分布, X1,X2,?,Xn是来自总体X的一个简单随机样本, 试问统计量
?n?5252Y???1??Xi?Xi,n?5
?5?i?1i?1服从何种分布?
思考题
1.设X1,X2,X3,X4,X5是来自正态总体N(0,22)的样本. C(X1?X2)(1) 求C使统计量Y1?服从t(m)分布.
222X3?X4?X5(X1?X2)2(3) 求Y2?所服从的分布.
(X4?X3)2第三节 抽样分布
一、抽样分布
有时, 总体分布的类型虽然已知, 但其中含有未知参数,此时需对总体的未知参数或对总体的重要数字特征(如数学期望、分差等) 进行统计推断, 此类问题称为参数统计推断.在参数统计推断问题中, 常需利用总体的样本构造出合适的统计量, 并使其服从或渐近地服从已知的总体分布. 统计学中泛称统计量分布为抽样分布.
讨论抽样分布的途径有两个. 一是精确地求出抽样分布, 并称相应的统计推断为小样本统计推断; 另一种方式是让样本容量趋于无穷, 并求出轴样分布的极限分布.然后,在样本容量充分大时, 再利用该极限分布作为抽样分布的近似分布, 进而对未知参数进行统计推断, 称与此相应的统计推断为大样本统计推断. 这里重点讨论正态总体的抽样分布, 属小样本统计范畴;此外, 也简要介绍一般总体的某些抽样分布的极限分布, 属大样本统计范畴。
二、单正态总体的抽样分布 设总体X的均值?,方差为?2,X1,X2,?,Xn是取自X的一个样本,X与S2分别为该样本的样本均值与样本方差, 则有
E(X)??,D(X)??2,
49
?1?n2????Xi?nX2?? 而 E(S)?E???????n?1?i?1?1?n1?n22?2222??E(X)?nE(X)?(???)?n(?/n??)???2. ?????in?1?i?1?n?1?i?1?故有下列定理:
定理1 设总体X~N(?,?2), X1,X2,?,Xn是取自X的一个样本, X与S2分别为该样本的样本均值与样本方差, 则有
2(1) X~N(?,?2/n); (2) U?X??~N(0,1). ?/n定理2 设总体X~N(?,?2), X1,X2,?,Xn是取自X的一个样本, X与S2分别为该样本的样本均值与样本方差, 则有 (1) ?=
2n?1?2S?2?(Xi?2i?11n?X)2~?2(n?1);
(2) X与S2相互独立.
定理3 设总体X~N(?,?2),X1,X2,?,Xn是取自X的一个 样本, X与S2分别为该样本的样本均值与样本方差, 则有
(1) ??(2) T?21?2?(Xi?1ni??)2~?2(n)
X??S/n~t(n?1).
三、双正态总体的抽样分布
2)是两个相互独立的正态总体, 又设定理4 设X~N(?1,?12)与Y~N(?2,?2X1,X2,?,Xn是取自总体X的样本, X与S12分别为该样本的样本均值与样本方差.
1Y1,Y2,?,Yn是取自总体Y的样本, Y与S22分别为此样本的样本均值与样本方差. 再记Sw2是
22S12与S2的加权平均, 即
Sw22(n1?1)S12?(n2?1)S2?.
n1?n2?2则 (1) U?(X?Y)?(?1??2)?122/n1??2~N(0,1);
/n2??2?S12(2) F??????S2~F(n1?1,n2?1);
?1?2(X?Y)?(?1??2)2??2时, T?~t(n1?n2?2). (3) 当?12??2Sw1/n1?1/n22
四、一般总体抽样分布的极限分布
定义1 设Fn(x)为随机变量Xn的分布函数, F(x)为随机变量X的分布函数,并记C(F)为由F(x)的全体连续点组成的集合, 若
limFn(x)?F(x),?x?C(F),
n??则称随机变量Xn依分布收敛于X, 简记为
ddXn???X或Fn(x)???F(x).
50