内容发布更新时间 : 2025/1/24 1:26:47星期一 下面是文章的全部内容请认真阅读。
建立检验假设,确定检验水准时应注意什么?
①假设检验总是相对于总体而言②相互对立,缺一不可。③不仅考虑有无差异,还反映了差异的方向——单双侧。假设检验的单双侧应该结合专业知识进行判断。若无充分的理由选择单侧,应采用双侧检验较为稳妥。 什么是假设检验中的两类错误?什么是检验效能?其大小与哪些因素有关?
答:假设检验中的第一类错误是指“拒绝了实际上成立的H0假设”时所犯的错误,当H0成立时犯第一类错误的概率等于检验水准α。假设检验中的第二类错误是指“不拒绝实际上不成立的H0假设”时所犯的错误,其概率通常用β表示,其大小与抽样误差大小及设定的检验水准α有关。1-β为假设检验的检验效能,也就是两个总体确实有差别时检出该差别的能力。
假设检验的两类错误之间的区别与联系是什么?了解这两类错误有何实际意义?
答:假设检验时,拒绝实际上成立的H0,犯第Ⅰ类错误,俗称“弃真”错误;不拒绝实际上并不成立的H0,犯第Ⅱ类错误,俗称“存伪”错误。犯第Ⅰ类错误的概率用α表示,假设检验时,根据研究者的要求来确定;犯第二类错误的概率用β表示,它只有与特定的H1结合起来才有意义。对于某一具体的检验来说,当样本含量n一定时,α越小,β越大;α越大,β越小。
了解这两类错误的实际意义在于,若在应用中要重点减少α(如一般的假设检验),则取α=0.05;若在应用中重点减少β(如方差齐性检验、正态性检验或想用一种方法代替另一种方法的检验等),则取α=0.10或0.20甚至更高。 减少I型错误的主要方法:假设检验时设定? 值 减少II型错误的主要方法:提高检验效能。 提高检验效能的最有效方法:增加样本量。 如何选择合适的样本量:实验设计
试述假设检验中 I 型错误与 II 型错误的意义及关系。
答:拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误(typeⅠerror)或第一类错误;不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误(typeⅡerror)或第二类错误。Ⅰ型错误的概率用α表示,是根据研究者的要求在计算检验统计量之前设定的。Ⅱ型错误的概率用β表示,一般地,β的大小和样本例数、α值、两总体的实际差距有关,它只有与特定的H1结合起来才有意义,而通常的检验假设其总是非特定的,所以β值的大小很难确切估计。仅知道样本例数确定时,α越小,β越大,反之,α越大,β越小。所以α和β是相互制约的,可以根据研究要求适当控制。要同时减少α及β,唯一的方法是增加样本例数,当样本例数确定后,可以通过选定α来控制β。若重点减少α,一般取较小的α;若重点减少β,一般取α=0.05,α=0.1或更高,因为虽属未知,但估计比取α=0.01时小些。 假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?
答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t值或u值)的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯Ⅰ型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。
假设检验中?和P的区别何在?
答:?和P均为概率,其中?是指拒绝了实际上成立的H0所犯错误的概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与?对比来得到结论,若P≤?,则拒绝H0,接受H1,有统计学意义,可以认为??不同或不等;若P> ?,则不拒绝H0,无统计学意义,还不能认为??不同或不等。 检验假设中P值的意义是什么?
答:如果总体状况与H0一致,统计量获得现有数值以及更不利于H0的数值的概率。 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?
答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
P值越小,不能说差异越显著或者是差异越大,只能说统计学结论越可靠,发现差异的把握越好。统计学结论值说明总体的参数之间有无差异,以及得出这种结论的可靠程度。具体差异的大小,要经专业判,统计学结论要和专业结论结合起来,才能做出最终的判断。 请你谈谈对假设检验结论的认识。
由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
如何确定检验水准?
答:检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。 怎样正确选用单侧检验和双侧检验?
答:单双侧检验首先应考虑所要解决的问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。 t检验的应用条件是什么? 答:(1)随机事件,(2)来自正态分布总体,(3)均数比较时,要求两总体方差相等。
对单样本t检验要求资料服从正态分布;对配对t检验要求差值服从正态分布;对两样本t检验则要求两组数据均服从正态分布,且两样本对应的两总体方差相等,对两小样本尤其要求方差齐性。 简述t检验的具体步骤,如何进行检验结果判断?
步骤:(1)建立假设和确定检验水准α;(2)计算统计量;(3)确定P值;(4)判断结果。结果的判断:P >α,接受H0,差异无显著性,可认为差异是由抽样误差所致。P ≤α,拒绝H0,差异有显著性,可认为样本间存在差异。 简述假设检验的注意事项。
答:假设检验的注意事项:①假设检验时可能犯两类错误;②选择检验方法要注意符合其应用条件;③正确理解假设检验的结论;④当差别无显著性时,有两种可能;⑤统计学的显著性与否和日常生活中的显著性概念不同;⑥单侧检验与双侧检验
1、严密的研究设计2、根据设计要求和资料的类型选择适当的检验方法 3、正确理解P值的含义 4、正确理解和解释统计学结果
第八章 方差分析
方差分析的基本思想是什么?
答:方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各个部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。 方差分析的应用条件是什么? 答:(1)各样本是相互独立的随机样本,(2)都采自正态总体,(3)各个总体方差相等。 方差分析的用途有哪些?
方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分析。
试比较完全随机设计和随机区组设计资料的方差分析基本思想。 (1)完全随机设计资料的方差分析 完全随机设计(completely random design):亦称成组设计。该设计仅涉及一个研究因素,k个不同的水平(k个分组)。用单因素方差分析(one-way ANOVA)。三种变异:SS总=SS组间+SS组内 (2)随机区组设计资料的方差分析
随机区组设计(random block design):又称配伍设计,是配对设计的扩展。 四种变异:SS总= SS处理+ SS区组+ SS误差,ν总=kb-1
在完全随机设计方差分析中SS组间、SS组内各表示什么含义?
答:SS组间表示组间变异,指各处理组样本均数大小不等,是由处理因素作用(如果有)和随机误差造成的;SS组内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。 方差分析存在问题
方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。 重复测量设计与随机区组设计的区别
在于重复测量的时点不能随机分配给受试对象,时间因素仅为受试对象的伴随因素;各时点之间的效应指标存在相关关系。而随机区组设计的特征是区组内受试个体同质且彼此独立,只是接受的处理不同。 重复测量设计的优缺点 1、优点:
(1)每一个体作为自身的对照,克服了个体间的变异。分析时可更好地集中于处理效应。
(2)因重复测量设计的每一个体作为自身的对照,所以研究所需的个体相对较少,因此更加经济。
2、缺点:
(1)滞留效应(carry-over effect) :前面的处理效应有可能滞留到下一次的处理。 (2)潜隐效应(latent effect):前面的处理效应有可能激活原本以前不活跃的效应。 (3)学习效应(learning effect):由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高。 重复测量资料方差分析的前提条件
1、正态性,处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布 (个体内不独立);
2、方差齐性,相互比较的各处理水平的总体方差相等,即具有方差齐同; 3、各时间点组成的协方差阵(covariance matrix)具有球形性(sphericity/circularity)特征或复合对称性(compound symmetry)。
多个样本均数的两两比较能否用t检验或u检验?
每次犯第一类错误的概率0.05,10次都犯的概率不是0.05,而是:5/45≈0.11远大于0.05,不是小概率事件,会把本来无差别的两个总体均数判断为有差别。应用方差分析 两两比较的方法很多:有多重比较(multiple)、线性对比(linear contrast)、正交对比(orthogonal contrasts)等。常用的是多重比较,进一步又可分为以下两种情况: (1)探索性研究(exploratory research),涉及每两个均数的比较。可采用SNK(Student-Newman-Keuls)法、Bonfferoni t 检验、??。
(2)证实性研究(confirmatory research),如多个处理组与对照组的比较,某一对或几对在专业上有特殊意义的均数间的比较等。可采用Dunnett-t检验、LSD-t检验(Fisher’s least significant difference t test)等,也可以用Bonfferoni t 检验。 数据变换的目的和方法:
目的:将原始资料变换成适用于检验方法的资料 方法:对数变换、平方根变换、倒数变换等。
为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法?
答:方差分析的备择假设H1是g个总体均数不全相等,拒绝H0,接受H1,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。 两因素析因设计和随机区组设计的区别。书P151 小结4
对不符合方差分析假定条件的资料的分析方法。书P152 小结8 书P152课后简答:
1、方差分析师用于研究哪种数据的统计方法
2、方差分析的基本思想是什么?总离均差平方和以及总自由度怎样计算? 3、两样本t检验与完全随机设计资料的方差分析有何关系?配对样本t检验与随机区组设计资料的方差分析又有何关系?
4、举例说明何谓交互效应?并绘制交互效应图。
5、SNK-q检验Dunnett-t检验都可用于均数的多重比较,它们有何不同? 6、数据变换在资料处理中有什么作用?
第九章 x2检验
完全随机设计的两样本率比较时,如何正确选择统计分析方法(写出相应的计算公式)。
22
(1)当总例数n≥40且所有格子的T≥5时,用x检验的基本公式或四格表资料x检验的专用公式;当P ≈α时,改用四格表资料的Fisher确切概率法。公式为: ,v=(行数-1)(列数-1)
2
(2)当n≥40但有1≤T<5时,用四格表资料x检验的校正公式 ;或改用四格表资料的Fisher确切概率法的连续性校正法: ,
(3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 2
x检验的基本思想是什么?
22
答:①x检验的基本思想:其计算公式为 ,式中A代表实际频数;T代表理论频数;而x值反映了实际频数与理论频数的吻合程度,其中 反映了某个格子实际频数与理论频数的吻合程度。若检验假设H0成立,实际频数与理论
22
频数的差值会小,则x值也会小;反之,若检验假设H0不成立,实际频数与理论频数的差值会大,则x值也会大。
2
说明x检验的用途。
2
答:x检验的用途较广。通常多用于①推断两个总体率或构成比之间有无差别;②推断多个总体率或构成比之间有无
2
差别;③多个样本率的多重比较;④两个分类变量之间有无关联性;⑤频数分布拟合优度的x检验。
两样本率比较的u检验与x检验有何异同?
22
答:两样本率比较时,若对同一资料同时进行u检验与x检验,在不校正的情况下,x=u2;但u检验通常用于大样本,
2
而x检验可用于大样本或小样本。
对于四格表资料,如何正确选用检验方法?
答:(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。 (2)对于两样本率比较的四格表资料(独立样本2X2列联表资料),应根据各格的理论值T和总例数n的大小选择不同的222
x计算公式:①当n≥40且所有的T≥5时,用x检验的基本公式 或四格表资料x检验的专用公式 ,②
2
n≥40,且任一理论频数T有1≤T<5,用四格表资料x检验的校正公式 或 (或用四格表资料的Fisher确切概率法);③当n<40,或T<1时,用四格表资料的Fisher确切概率法。 若资料满足两样本率u检验的条件,也可用u检验。
(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时:①(b+c) ≥40, ;②(b+c) <40, 。
2
说明行×列表资料x检验应注意的事项。(书P164)
答:(1)行×列表中的理论频数不应小于1,或1≤T<5的格子数不宜超过格子总数的1/5。
(2)多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任
2
两个总体率之间皆有差别。要进一步推断哪两个总体率之间有差别,需进一步做多个样本率的x分割或多重比较。
2
(3)对于有序的R×C表资料不宜用x检验。对于R×C表的资料要根据其分类类型和研究目的选用恰当的检验方法。 说明R×C表的分类及其检验方法的选择。
答:(1)分类:R×C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。
2
(2)检验方法的选择:①双向无序R×C表:若研究目的为多个样本率(或构成比)的比较,可用行×列表资料的x检验;
2
若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行×列表资料的x检验以及Pearson列联系数进行分析。②单向有序R×C表:若R×C表中的分组变量是有序的,而指标变量是无序的,此种单向有序R×C
2
表资料可进行行×列表资料的x检验分析其构成情况;若R×C表中的分组变量为无序的,而指标变量是有序的,此种单向有序R×C表资料宜用秩和检验分析。③双向有序属性相同的R×C表:宜用一致性检验分析两种检测方法的一致性。④双向有序属性不同的R×C表:若研究目的如为分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序R×C表资料,选用秩和检验;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。
2
两组或多组等级资料的比较,为什么不能用x检验,而用秩转换的非参数检验?
2
答:若选行×列表资料的x检验,只能推断两个或多个总体的等级构成比差别,这一般不是推断目的;而选秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。 课后简答题:
卡方检验的应用条件有哪些?课本P174小结3
比较两个独立样本频率分布的χ2检验,和比较两个配对样本频率分布的χ2检验在设计方法、资料整理、假设检验等方面的差别是什么?
答:前面针对的是“两独立样本”,行合计是事先固定的;而后者实质上是一组样本,及时可以看成两个样本,也是“两个互不独立的样本”,样本含量都是n,是固定的,而行合计与列合计却是事先不确定的。
前者原始数据可以表示为教材中表9-3所示的四格表形式,而后者原始数据表示为表9-9所示的四格表形式。检验统计量,前者用教材中公式9-5和公式9-7,而后者用9-9和9-10。
如果实验效应应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用χ2检验?请举例说明。 答:关键在于此时χ2检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。 为什么有些四个表必须要计算确切概率?
第十一章 两变量关联性分析
相关系数的特点:
参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数没有单位,其值为-1≤r≤1,r绝对值越大,相关关系越密切;相关系数的正负号反映相关关系的方向,r值为正表示正相关,r值为负表示负相关,r值等于零为零相关,r值的绝对值等于1为完全相关;计算相关系数的两个变量都是随机变量。 积差相关系数的适用条件
两个变量的测量值应来自于同一总体或同一样本中n个个体的测量,或者是来自于对两个有意义配对的总体或样本的测量;两个变量的分布应近似于正态分布;样本量不能太小,样本量太小时所计算出的相关系数不够稳定。
2