李春喜《生物统计学》第三版--课后作业答案. 下载本文

内容发布更新时间 : 2024/12/26 14:28:06星期一 下面是文章的全部内容请认真阅读。

《生物统计学》第三版 课后作业答案

(李春喜、姜丽娜、邵云、王文林编著)

第一章 概论(P7)

习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么?

答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象

和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。

(2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用表现在以下四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。

习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互

作、随机误差、系统误差、准确性、精确性。

答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。

(2)个体(individual)是组成总体的基本单元。

(3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。

(5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。

(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。

(8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。

(10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随机误差和系统误差。

(11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。

(12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所产生的倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接近的程度。

(14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测

值彼此接近程度的大小。

(15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡

量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。

习题1.3 误差与错误有何区别? 答:误差是指实验中不可控制因素所引起的观测值偏离真值的差异,其中随机误差只可以设

法降低,但不能避免,系统误差在某种程度上可控制、可克服的;而错误是指在实验过程中,人为的作用所引起的差错,是完全可以避免的。

第二章 实验资料的整理与特征数的计算(P22、P23)

习题2.1 什么是次数分布表?什么是次数分布图?制表和绘图的基本步骤有哪些?制表

和绘图时应注意些什么?

答:(1)对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其数值大小

列入各个相应的组别内,便可以出现一个有规律的表式,这种统计表称之为次数分布表。

(2)次数分布图是指把次数分布资料画成图状,包括条形图、饼图、直方图、多边形图和散点图。

(3)制表和绘图的基本步骤包括:①求全距;②确定组数和组距;③确定组限和组中值;④分组,编制次数分布表。

(4)制表和绘图时需要注意的是事先确定好全距、组数、组距、各组上下限,再按观测值的大小来归组。

习题2.2 算数平均数与加权数形式上有何不同?为什么说它们的实质是一致的? 答:(1)形式不同在于计算公式的不同:算数平均数的计算公式为M =

x1?x2?...?xn;

n加权平均数的计算公式为M =

x1f1?x2f2?...?xmfm。

f1?f2?...?fm(2)因为它们反映的都是同一组数据的平均水平。

习题2.3 平均数与标准差在统计分析中有什么作用?它们各有哪些特性?

答:(1)平均数(mean)的用处:①平均数指出了一组数据资料内变量的中心位置,标志着资料

所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其它资料进行比较。

(2)平均数的特性:①离均差之和等于零;②离均差平方和为最小。

(3)标准差(standard deviation)的用处:①标准差的大小,受实验或调查资料中多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小;②在计算标准差时,如果对各观测值加上火减去一个常数a,标准差不变;如果给各观测值乘以或除以一个常数a,则所得的标准差扩大或缩小了a倍;③在正态分布中,一个样本变量的分布可以作如下估计: x±s内的观测值个数约占观测值总个数的68.26%,x±2s内的观测值个数约占总个数的95.49%,x±3s内的观测值个数约占观测值总个数的99.73%。 (4)标准差的特性: ①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的大小判断平均数代表性的强弱;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准误,在计算平均数的标准误时,可根据样本标准差代替总体标准差进行计算;④进行平均数区间估计和变异系数的计算。

习题2.4 总统和样本的平均数、标准差有什么共同点?又有什么联系和区别?

答:(1)总体和样本的平均数都等于资料中各个观测值的总和除以观测值的个数所得的商。

二者区别在于,总体平均数用μ表示,μ=

?x,公式中分母为总体观测值的个数N,

Nx?x样本平均数用=,公式中的分分母为样本观测值的个数n。样本平均数x是总

n体平均数μ的无偏估计值。

(2)总体和样本的标准差都等于离均差的平方和除以样本容量。二者的区别在于,总体标准差用σ表示,

,分母上总体观测值的个数N;标准差用s表示,

,分母上是样本自由度n-1。样本标准差s是总体标准差σ的无偏估

计值。

习题2.5

答:见下图——

100例30-40岁健康男子血清总胆固醇(mol/L)的次数分布表

组限(mol/L) 组中值(mol/L) 次数 频率 累积频率 2.60- 3.10- 3.60- 4.10- 4.60- 5.10- 5.60- 6.10- 6.60- 7.10-

习题2.6

答:见下图——

2.870 3.370 3.850 4.375 4.845 5.325 5.825 6.345 0.000 7.220 2 8 12 24 20 18 7 8 0 1 0.02 0.08 0.12 0.24 0.20 0.18 0.07 0.08 0.00 0.01 0.02 0.10 0.22 0.46 0.66 0.84 0.91 0.99 0.99 1.00 100例男子总胆固醇2010FrequencyStd. Dev = .87 Mean = 4.7402.753.253.754.254.755.255.756.256.757.253.003.504.004.505.005.506.006.507.00N = 100.00100例男子总胆固醇 这100例男子的血清总胆固醇基本呈正态分布,中间4.1-5.1mol/L的最多,两边少,但6.6-7.1 mol/L的没有。

习题2.7

答:见下图——

Statistics100例男子总胆固醇NMeanStd. Error of MeanMedianModeStd. DeviationVarianceSkewnessStd. Error of SkewnessKurtosisStd. Error of KurtosisRangeMinimumMaximumSumPercentilesValidMissing10004.7389.086674.6600a4.79b.86665.75108.276.241.055.4784.522.707.22473.893.5850c4.08334.20004.31004.49004.66004.85005.16005.21005.38505.93251020253040506070758090a. Calculated from grouped data.b. Multiple modes exist. The smallest value is shownc. Percentiles are calculated from grouped data. Std.DeviationStatistic.86665VarianceStatistic.751Descriptive StatisticsNStatistic100100RangeStatistic4.52MinimumStatistic2.70MaximumStatistic7.22MeanStatisticStd. Error4.7389.0867100例男子总胆固醇Valid N (listwise) 由上表可知:平均数μ=4.7389,标准差s=0.86665,而CV=s /μ* 100% =18%

习题2.8

答:由习题2.7的表可知:中位数Median=4.6600,平均数μ=4.7389,两数相差0.0789,符

合正态分布。

习题2.9

答:分析见下图: