试验统计方法(生物统计)复习考试总结盖钧镒主编全 下载本文

内容发布更新时间 : 2024/10/25 11:19:13星期一 下面是文章的全部内容请认真阅读。

第一章

试验因素:被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应). 试验处理:单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。 试验水平:试验因素内不同的级别或状态

简单效应:在同一因素内两种水平间试验指标的差异。 主要效应:一个因素内各简单效应的平均数。

交互作用效应:简称互作: 因素内简单效应间差异的平均。

什么是试验方案,如何制订一个正确的试验方案?试结合所学专业举例说明之。 根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。

制订试验方案的要点:1. 目的明确。2. 选择适当的因素及其水平。3. 设置对照水平或处理。4. 应用唯一差异原则。

试验误差的概念:试验结果与处理真值之间的差异 系统误差影响力数据的准确性,偶然误差影响了数据的精确性,共同影响了实验处理间比较的可靠性。

来源:(1)试验材料固有的差异(2)试验时农事操作和管理技术的不一致所引起的差异(3)进行试验时外界条件的差异

控制途径:(1)选择同质一致的试验材料(2) 改进操作和管理技术,使之标准化(3) 控制引起差异的外界主要因素,(选择条件均匀一致的试验环境;,试验中采用适当的试验设计和科学的管理技术;应用相应的科学统计分析方法。)

第二章

试验设计的三个基本原则1.重复 2.随机排列 3.局部控制 重复的作用: 估计试验误差 ;降低试验误差 。

随机的主要作用:无偏估计试验误差;研究随机事件----获得随机变量-----概率的性质------进行统计分析(统计推断)!

局部控制就是分范围分地段或分空间地控制非处理因素,使之对各试验处理的影响在较小空间内达到最大程度的一致,从而有效地降低试验误差。 这是降低误差的重要手段之一

第三章

总体:具有共同性质的个体所组成的集团. 有限总体-由有限个个体构成的总体.

无限总体-总体所包含的个体数目有无穷多个 . 样本:从总体中抽取若干个个体的集合称为样本。

参数:由总体中全部个体观察值计算得总体特征值. 统计数:测定样本中的各个体而得的样本特征数,如平均数等,称为统计数 关系:试验研究的目的是为了获得总体的信息或特征;

试验研究的方法则是抽样研究;

利用样本的结果(统计数)推断或估计总体特征 (参数). 平均数的意义:平均数是数据的代表值,表示资料中观察值的中心位置(集中趋势),并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差的情况。

算术平均数-一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均

1 / 6

算术平均数的两个重要特性:(1)离均差之和为零(2)离均差平方的总和最小

变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性.

变异数的种类: 一、极差 二、方差 三、标准差 四、变异系数

计算方法:1.极差-是资料中最大观察值与最小观察值的差数。2.样本均方为S2,总体方

2差用 ? 2表示。 2

样本标准差公式: s ? 总体标准差公式:

?(y?y)n?1??变异系数-样本的标准差对均数的百分数:

变异系数是一个不带任何单位的平均一个单位纯数离均程度,其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。

CV?s?100%y?(y??)N第四章

统计概率:统计学上用n较大时稳定的频率近似代表概率。通过大量实验而估计的概率称为实验概率或统计概率,以p表示。

(y??)标准正态离差: u??正太分布曲线特征的第五点?

正态曲线与横轴之间的总面积等于1,因此在曲线下横轴的任何定值,例如从y=y1到y=y2之间的面积,等于介于这两个定值间面积占总面积的成数,或者说等于y落于这个区间内的概率。正态曲线的任何两个y定值ya与yb之间的面积或概率乃完全以曲线的μ和σ而确定的。

小概率原理--若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。

小概率事件实际不可能性原理在统计假设测验中的应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)。 抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 单个样本平均数抽样分布及其参数?

n如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到 N 个样本(所有可能的样本个数)。 抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。

?y(1) 该抽样分布的平均数 ? y与母总体的平均数相等:

(2) 该抽样分布的方差与母总体方差间存在如下关系:

??                  ?y2??2n?? ?相应地,             ???n?y?两个样本平均数差数抽样分布及其参数?

如果从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一个总体抽取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本,这两个独立随机抽取的样本平均数间差数( y 1 ? y 2 )的抽样分布参数与两个母总体间存在如下关系:

?y?y??1??2122 / 6

(1) 该抽样分布的平均数与母总体的平均数之差相等: 2?12?2222?(2) 该抽样分布的方差与母总体方差间的关系为: ?y1?y2??y1??y2?n1n2第五章

区间估计:在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间.

置信区间:在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间.区间的上、下限称为置信限。一般以L1和L2分别表示置信下限和上限。

置信系数或置信度:保证总体参数位于置信区间的概率以P=(1- )表示。

统计假设 :对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个,在后面有说明)。

无效假设:记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.

备择假设:记作HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.

假设测验时直接测验的统计假设是无效假设,因为只有无效假设相当于总体已知,这样才能从已知的总体中进行抽样分布,才能进一步计算样本在无效假设中出现的概率。 区间估计与统计假设测验的关系为:

1.如果无效假设位于置信区间内,就接受无效假设,称为差异不显著;

2.如果无效假设位于置信区间外,就否定无效假设,接受备择假设,称为差异显著;

什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?

用来测验假设的小概率标准5%或1%等,称为显著水平 由于显著水平不同可能直接影响到推断结果.本例题如果 用0.01水平就要接受无效假设,所以必须事先确定显著水平. 选用显著水平的原则:统计上达显著,实际上有应用价值.

选用显著水平的原则:试验误差小的,选高水平0.01;

试验误差大的,选低水平0.05.

什么叫统计推断?它包括哪些内容?什么是统计假设测验,它的原理和方法?

统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数). 它有两条路:一是统计假设测验,二是参数的区间估计.

统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 H 0 ,备择假设H A )然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设 具体有以下三大步:

(一)提出统计假设:对所研究的总体首先提出统计假设

(二)计算概率: 在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率

(三) 推断: 根据“小概率事件实际上不可能发生”原理接受或否定无效假设

?

第六章

方差分析的思想:任何事物的数量特征都是受多种因素的影响,其中起重要作用的因素所引起的变异量(方差)就大;起次要作用的因素所引起的变异量就小;不起作用的因素其变异量(方差)就不能显著大于试验误差的变异量(方差).

3 / 6