内容发布更新时间 : 2024/11/17 15:34:19星期一 下面是文章的全部内容请认真阅读。
- 合 计
15 74
37 73
52 147
第十章 线性相关与回归
一、选择题
1. 回归系数的最小二乘估计使其平方和最小的是
A. 各点到X均数直线的横向距离 B. 各点到X轴的横向距离 C. 各点到回归直线的垂直距离 D. 各点到Y均数直线的垂直距离 E. 各点到Y轴的垂直距离 2. 两数值变量相关关系越强,表示
A. 相关系数越大 B. 相关系数的绝对值越大 C. 回归系数越大 D. 回归系数的绝对值越大 E. 相关系数检验统计量的t值越大 3. 回归分析的决定系数R2越接近于1,说明
A. 相关系数越大 B. 回归方程的显著程度越高 C. 应变量的变异越大 D. 应变量的变异越小 E. 自变量对应变量的影响越大
4. 两组资料作回归分析,直线回归系数b 较大的一组,表示
A.两变量关系密切的可能性较大 B.检验显著的可能性较大 C.决定系数R2较大 D.决定系数R2可能大也可能小 E.数量依存关系更密切
??14?4X,若将体重换成国际单5. 1—7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为Y位kg,则此方程
A.常数项改变 B.回归系数改变
C.常数项和回归系数都改变 D.常数项和回归系数都不改变 E.决定系数改变
6.直线回归中,如果散点分布呈直线趋势,X增加时Y减少,则可初步推断为
A.两变量呈正相关关系 B.两变量呈负相关关系
C. 两变量无相关关系 D.b>0 E. b<0
第十二章 统计表与统计图
一、选择题
1.统计表的主要作用是
A. 便于形象描述和表达结果 B. 客观表达实验的原始数据
C. 减少论文篇幅 D. 容易进行统计描述和推断 E. 代替冗长的文字叙述和便于分析对比
2.描述某疾病患者年龄(岁)的分布,应采用的统计图是
A.线图 B.条图 C.百分条图 D.直方图 E.箱式图
3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是
A.半对数图 B.线图 C.条图 D.直方图 E.百分条图
4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是
A. 复式条图 B. 复式线图 C. 散点图 D. 直方图 E. 箱式图
5. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制
A. 直方图 B. 箱式图 C. 线图 D. 散点图 E. 条图
6.描述5个地区居民某病患病率的差别,宜用_______ 。
A 直方图 B 直条图 C 百分条图 D 普通线图 7.描述两种病人的血型构成差别,宜用_______ 。
A 直方图 B 直条图 C 百分条图 D 普通线图 8.描述某病患病率的逐年变化趋势,宜用_______ 。
A 直方图 B 直条图 C 百分条图 D 普通线图 9.描述年龄(分8组)与疗效(有效率)的关系,应画 。
A.线图 B. 圆图 C. 直方图 D. 百分条图 10.比较某地1990~1997年肝炎发病率宜绘制
A.直条图 B.构成图 C.普通线图 D.直方图 E.统计地图 11.关于统计资料的列表原则,错误的是
A.横标目是研究对象,列在表的左侧;纵题目是分析指标,列在表的右侧 B.线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 E.标题在表的上端,简要说明表的内容
12.比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用
A.直条图 B. 线图 C. 直方图 D. 圆形图 E. 百分条图 13.描述某地某地210名健康成人发汞含量的分布,宜绘制
A.直条图 B.直方图 C.线图 D.百分条图 E.散点图 二、填空题
1、直条图适用于描述___________资料,用___________来反映数量间关系。 2、直方图适用于描述_____________,表明某事物现象各组段的_____________。 3、百分条图适用于______________,表明某事物内部各_______________。 4、某医院分析1984~1989年冠心病发病率的变动趋势宜绘制____________。
三、改表和绘图
1. 试根据下表资料绘制适当统计图形。
表 某地1975年839例正常人发汞值分布资料(μg/g)
组段 0~ 例数 133 0.2~ 0.4~ 0.6~ 0.8~ 1.0~ 193 190 111 83 34 1.2~ 43 1.4~ 1.6~2.2 16 36 合计 839 2. 根据下表分别绘制普通线图,并说明统计图型的意义。
某地某年食管癌年龄别发病率(1/10万)
年龄(岁)
40~ 45~ 50~ 55~ 60~ 65~ 70~ 75~ 80~
男 4.4 7.2 7.3 6.9 19.3 50.2 68.5 86.2 97.0
女 2.1 3.3 4.5 5.5 6.7 16.4 12.5 19.9 15.2
参考答案:
第一章
一、名词解释
1、根据研究目的确定的同质的所有观察单位(某种变量值)的集合。 2、从总体中随机抽取的有代表性的部分个体的集合。
3、统计研究中对观察单位进行测量和观察的某项特征,即研究中我们感兴趣的特征。 4、某事件发生的可能性的大小。
5、每个观察单位某项指标的具体数值形成的数据资料。
6、观察单位的变量值没有具体数值,只能将观察单位按某种属性或类别进行分组,再分组汇总各组观察单位数而得到的数据资料。
7、计数资料分组的类别之间有程度上的差别。 8、在一定的可信度下由样本信息推断总体信息。 二、选择题
1.E 2.E 3.D 4.E 5.A 6.A 7.B 8.C 9.D 10.B 11.E 12.C 13.D 三、填空题
1. 统计设计、收集资料、整理资料和分析资料
2.日常医疗卫生工作原始记录、统计报表、专门报告卡 3.准确、完整、可靠 4.统计描述 统计推断 四、简答题
1. 常见的三类误差是:
(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
2.从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。
3.可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
第二章 集中趋势的统计描述
一、选择题
1.A 2.B 3.D 4.E 5.B 6.C 7.B 8.C 9.C 10.C 二、计算与分析
1.
X?3.43+2.96+4.43+3.03+4.53+5.25+5.64+3.82+4.28+5.25?4.26 (mmol/L)
10M?4.28+4.43?4.36 (mmo l/L)22. (1)编制频数表:
某地100例30-40岁健康男子血清总胆固醇值的频数表
甘油三脂(mg/dL)
(1) 110~ 125~ 140~ 155~ 170~ 185~ 200~ 215~ 230~ 245~ 合计
画直方图:
频数 (2) 2 4
11 16 27 12 13 7
5 3 100
累积频数 (3)
2
6 17 33 60 72 85 92 97 100
—
累积频率 (4) 2 6 17 33 60 72 85 92 97 100
—
302520频数151050110125140155170185胆固醇含量200215230245
某地100例30-40岁健康男子血清总胆固醇值的频数分布
(2)计算均数和中位数:
X?(110 +7.5)?2 +(125 +7.5)?4 ?+(245 +7.5)?3?182.9(mg/dl)
100M?P50?170?100?0.5?33?15?179.4(mg/dl)27
从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。 (3)计算百分位数:
P5?125?100?0.05?2?15?136.25(mg/dl)??4 100?0.25?17?15?162.5(mg/dl)16
P25?155?