内容发布更新时间 : 2024/12/23 9:32:34星期一 下面是文章的全部内容请认真阅读。
习题答案
第一章
一、是非题
1. 家庭中子女数是离散型的定量变量。 答:对。
2. 同质个体之间的变异称为个体变异。 答:对。
3. 学校对某个课程进行 1 次考试,可以理解为对学生掌握该课程知识的一次随机抽样。 答:对。
4. 某医生用某个新药治疗了 100 名牛皮癣患者,其中55 个人有效,则该药的有效率为 55%。
答:错。只能说该样本有效率为55%或称用此药总体有效率的样本估计值为55%。
5.已知在某个人群中,糖尿病的患病率为8%,则可以认为在该人群中,随机抽一个对象, 其患糖尿病的概率为8%。
答:对,人群的患病率称为总体患病率。在该人群中随机抽取一个对象,每个对象均有相 同的机会被抽中,抽到是糖尿病患者的概率为8%。 二、选择题
1. 下列属于连续型变量的是 A 。 A 血压 B 职业 C 性别 D 民族
2. 某高校欲了解大学新生心理健康状况,随机选取了1000 例大学新生调查,这1000 例大 学生新生调查问卷是 A 。
A 一份随机样本 B 研究总体 C 目标总体 D 个体
3. 某研究用 X 表示儿童在一年中患感冒的次数,共收集了1000 人,请问:儿童在一年中 患感冒次数的资料属于 C 。
A 连续型资料 B 有序分类资料 C 不具有分类的离散型资料 D 以上均不对 4. 下列描述中,不正确的是 D 。 A 总体中的个体具有同质性 B 总体中的个体大同小异
C 总体中的个体在同质的基础上有变异
D 如果个体间有变异那它们肯定不是来自同一总体
5.用某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查的研究结果得 到该药的降糖有效率为85%的结论,请问降糖有效率是指 D 。
A 每治疗100 个糖尿病患者,正好有85 个人降糖有效,15 个人降糖无效 B 每个接受该药物治疗的糖尿病患者,降糖有效的机会为85% C 接受该药物治疗的糖尿病人群中,降糖有效的比例为85%
D 根据该研究的入选标准所规定的糖尿病患者人群中,估计该药降糖有效的比例为 85%
三、简答题
1. 某医生收治 200 名患者,随机分成2 组,每组100 人。一组用A 药,另一组用B 药。 经过2 个月的治疗,A 药组治愈了90 人,B 组治愈了85 名患者,请根据现有结果评议 下列说法是否正确,为什么? a)A 药组的疗效高于B 药组。
b)A 药的疗效高于B 药。
答:a)正确,因为就两组样本而言,的确A 组疗效高于B 组。
b) 不正确,因为样本的结果存在抽样误差,因此有可能人群的A 药疗效高于B 药,也 可能人群的两药的疗效相同甚至人群B 药的疗效高于A 药,
2. 某校同一年级的 A 班和B 班用同一试卷进行一次数学测验。经过盲态改卷后,公布成 绩:A 班的平均成绩为80 分,B 班的平均成绩为81 分,请评议下列说法是否正确,为 什么?
a)可以称A 班的这次考试的平均成绩低于B 班,不存在抽样误差。 b)可以称A 班的数学平均水平低于B 班。
答:a) 正确,因为此处将A 班和B 班作为研究总体,故不存在抽样误差。
b)不正确,因为这一次数学平均成绩只是两班数学成绩总体中的两个样本,样本的差异 可能仅仅由抽样误差造成。
3. 在某个治疗儿童哮喘的激素喷雾剂新药的临床试验中,研究者收集了300 名哮喘儿童患 者,随机分为试验组和对照组,试验组在哮喘缓解期内采用激素喷雾剂,在哮喘发作期 内采用激素喷雾剂+扩展气管药;对照组在哮喘缓解期不使用任何药物,在哮喘发作期 内采用扩展气管药物。通过治疗3 个月,以肺功能检查中的第1 秒用力呼吸率
(FEV1/FRC1)作为主要有效性评价指标,评价两种治疗方案的有效性和安全性。请阐 述这个研究中的总体和总体均数是什么?
答:试验组的研究总体是接受试验组治疗方案的全体哮喘儿童患者在治疗3 个月时的 FEV1/FRC1 值的全体。对照组的研究总体是接受对照组治疗方案的全体哮喘儿童患者 在治疗3 个月时的FEV1/FRC1 值的全体。
试验组对应的总体均数是接受试验组治疗方案的全体哮喘儿童患者在治疗3 个月时的 FEV1/FRC1 的平均值;对照组对应的总体均数是接受对照组治疗方案的全体哮喘儿童 患者在治疗3 个月时的FEV1/FRC1 的平均值。
4. 请简述什么是小概率事件?对于一次随机抽样,能否认为小概率事件是不可能发生的? 答:在统计学中,如果随机事件发生的概率小于或等于0.05,则通常可以认为是一个小 概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概率事件在一次随机 抽样中不会发生,这就是小概率事件原理。小概率事件原理是统计学检验的基础。 5. 变量的类型有哪几种?请举例说明,各有什么特点?
答:(1) 连续型变量,可以一个区间中任意取值的变量,即在忽略测量精度的情况下, 连续型变量在理论上可以取到区间中的任意一个值,并且通常含有测量单位。观察连续型变 量所得到的数据资料称为计量资料(measurement data)。如例1-1 中的身高变量就是连续型变 量,身高资料为计量资料。.(2) 离散型变量, 变量的取值范围是有限个值或者为一个数 列。离散型变量的取值情况可以分为具有分类性质的资料和不具有分类性质的资料,表示分 类情况的离散型变量亦称分类变量(categorical variable)。观察分类变量所得到的资料称为分 类资料(categorical data)。分类资料可以分为二分类资料和多分类资料,而多分类资料又分成 无序分类资料和有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料 (nominal data) 如血型可以分为A、B、AB 和O 型,有序多分类资料(ordinal data) 如病情指 标分为无症状、轻度、中度和重度。
第二章
一、是非题
1.不论数据呈何种分布,都可以用算术均数和中位数表示其平均水平。
答:错。只有资料满足正态或近似正态分布时计算算术均数是比较有统计学意义的。
2.在一组变量值中少数几个变量值比大多数变量值大几百倍,一般不宜用算术均数表示其 平均水平。
答:对,可以采用中位数表示。
3.只要单位相同,用s 和用CV 来表示两组资料的离散程度,结论是完全一样的。
答:错,标准差S 是绝对误差的一种度量,变异系数CV 是相对误差的一种度量,对于两组 资料离散程度的比较,即使两组资料的度量单位相同,也完全有可能出现两个指标的结论是 不同的。在实际应用时,选择离散程度的指标时,考虑其结果是否有研究背景意义。例如: 一组资料为成人的身高观察值,另一组资料为2 岁幼儿的身高观察值,虽然可以用标准差S 比较两组的离散程度,也不能认为这是错误的,但根本没有研究背景意义,相反选择变异系 数CV 比较两组资料的相对变异程度,这就有一定的研究背景意义。 4.描述200 人血压的分布,应绘制频数图。 答:对。
5. 算术均数与中位数均不容易受极值的影响。 答:错。算术均数比中位数容易受到极值的影响。 二、选择题
1.中位数是表示变量值 A 的指标。 A. 平均水平 B. 变化范围 C. 频数分布
D. 相互间差别大小
2.对于最小组段无确定下限值和(或)最大组段无确定上限值的频数分布表资料,宜用下 列哪些指标进行统计描述? C ____
A 中位数,极差 B 中位数,四分位数间距 C 中位数,四分位数范围 D 中位数,标准差
3.描述年龄(分8 组)与疗效(有效率)的关系,应绘制 A 。 A.线图 B. 圆图 C. 直方图 D. 百分条图
4、为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为 D 。 A 频数 B 频率 C 频率密度(频率/组距) D 都可以 三、简答与分析题
1. 100 名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。 表2-12 100 名成年健康女子血清总蛋白含量(g/L) 73.5 74.3 78.8 78.0 70.4 80.5 84.3 68.8 69.7 71.2 72.0 79.5 75.6 78.8 72.0 72.0 72.7 75.0 74.3 71.2 68.0 75.0 75.0 74.3 75.8 65.0 67.3 78.8 71.2 69.7 73.5 73.5 75.8 64.3 75.8 80.3 81.6 72.0 74.3 73.5 68.0 75.8 72.0 76.5 70.4 71.2 67.3 68.8 75.0 70.4 74.3 70.4 79.5 74.3 76.5 77.6 81.2 76.5 72.0 75.0 72.7 73.5 76.5 74.7 65.0 76.5 69.7 73.5 75.4 72.7 72.7 67.2 73.5 70.4 77.2 68.8 74.3 72.7 67.3 67.3 74.3 75.8 79.5 72.7 73.5 73.5 72.0 75.0 81.6 74.3 70.4 73.5 73.5 76.5 72.7 77.2 80.5 70.4 75.0 76.5 答:制作频数表如下:
_____________________________________________________________________
组段 频数 百分比 累积频数 累积百分比
____________________________________________________________________
64~ 3 3.00 3 3.00 66~ 5 5.00 8 8.00 68~ 8 8.00 16 16.00 70~ 11 11.00 27 27.00 72~ 25 25.00 52 52.00 74~ 24 24.00 76 76.00 76~ 10 10.00 86 86.00 78~ 7 7.00 93 93.00 80~ 6 6.00 99 99.00 84~ 1 1.00 100 100.00
变量 例数 均数 标准差 最小值最大值中位数25 百分位数75 百分位数 x 100 73.7 3.925 64.3 84.3 73.5 71.2 75.8
2.某医师测得300 名正常人尿汞值(ng/L)如表2-15,试描述资料。 表2-13 300 名正常人尿汞值(ng/L)
尿 汞 例 数 累计例数 累计百分数(%) 0~ 49 49 16.3 4~ 27 76 25.3 8~ 58 134 44.7 12~ 50 184 61.3 16~ 45 229 76.3 20~ 22 251 83.7 24~ 16 267 89.0 28~ 10 277 92.3 32~ 7 284 94.7 36~ 5 289 96.3 40~ 5 294 98.0 44~ 0 294 98.0 48~ 3 297 99.0 52~ 0 297 99.0 56~ 2 299 99.7 60~ 1 300 100.0 合计 300 — —
答:根据资料给出统计描述的指标如下: 例数 均数 标准差 最小值 最大值 16 15.053 49.014 2 62
3.对于同一的非负样本资料,其算数均数一定大于等于几何均数。 答:根据初等数学中的不等式1 2
1 2 n n n
a a a a a a n
+ + +