内容发布更新时间 : 2024/12/24 1:13:40星期一 下面是文章的全部内容请认真阅读。
第三章 数据的整理
一、填空题
1、对于数值型数据的排序只有两种,即________和________。
2、频数分布反映了总体所有个体在________的分布状态和分布特征。
3、在数据分组中,________变量可以进行单变量值分组,也可以进行组距分组,而________变量只能进行组距式分组。 4、箱线图是由一组组数据的________、________、________、________和________5个特征值绘制而成的,反应原始数据分布的图形。
5、组距数列中,每一组的下限与上限之间的中点值称为组中值,它通常作为该组数据的一个________。 6、从外表形式看,统计表一般由4个主要部分组成,即________、________、________和________。 7、对分类数据的显示可选用的图形有 、____________和______________等。 8、统计分组包括 与 两层含义。
9、统计表依主词是否分组有 、 和 。 10、对原始数据的审核时审核的内容主要是 、 。
11、对未分组数据的显示可选用的图形有____________和_________________等。 12、分类数据、顺序数据和数值型数据都可以用 图来显示。 13、__________是由“茎”和“叶”两部分构成,其图形是由数字组成的。 14、全距是数列中的_______________和_______________之差。
15、_________是用圆形及圆内扇形的角度表示数值大小的图形。
16、统计分组中当相邻两组的上下限重叠时,习惯上遵循__________的原则。
二、单项选择题 1、( ) =频数÷组距,它能准确反映频数分布的实际情况。
A、组中值 B、组数 C、频数密度 D、频率密度 2、对连续型变量分组,相邻组的组限必须( )。
A、重叠 B、间断 C、相等 D、相离
3、将某地区100个工厂按产值多少分组而编制的频数分布中,频数是( )。
A、各组的产值数 B、各组的工人数 C、各组的工厂数 D、各组职工人数 4、某管理局对其所属企业的生产计划完成百分比采用如下分组,指出哪项是正确的。( )。
A、80%~90% 90%~99% 100%~109% 110%以上 B、80%以下 90%~100% 89%~100% 100%~110% C、90%以下 90%~100% 100%~110 110%以上 D、90% 90%~105% 100%~110 115%以上 5、频数分布中,靠近中间的变量值分布的频数少,靠近两端的变量值分布频数多,这种分布的类型是( )。
A、钟形分布 B、U形分布 C、J形分布 D、均匀分布. 6、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。 A、 520 B、510 C、 500 D、 490
7、在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是( )。 A、将此值归入上限所在组 B、将此值归入下限所在组 C、此值归入两组均可 D、另立一组 8、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。描述该组数据的集中趋势宜采用 ( )。 A、均值 B、四分位数 C、众数 D、中位数
9、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的
图形,称为 ( )。
A、条形图 B、茎叶图 C、直方图 D、箱线图 10、下面哪一个图形最适合描述结构性问题 ( )。
A、条形图 B、饼图 C、雷达图 D、直方图 11、对于小批量的数据,最适合描述其分布的图形是 ( )。
A、条形图 B、饼图 C、茎叶图 D、直方图 12、为描述身高与体重之间是否有某种关系,适合采用的图形是 ( )。
A、条形图 B、对比条形图 C、散点图 D、箱线图 13、气泡图主要用于描述 ( )。
A、两个变量之间的相关关系 B、三个变量之间的相关关系
C、两个变量的对比关系 D、三个变量的对比关系 14、落在某一特定类别或组中的数据个数称为( )。 A、频数 B、频率 C、频数分布表 D、累计频率 15、下面的那种图形适合于描述一组数据分布的图形是( )。 A、环形图 B、饼图 C、直方图 D、茎叶图
16、下面的图形中最适合于比较研究两个或多个样本或总体的结构性问题( )。 A、条形图 B、箱线图 C、环形图 D、饼图
17、对于时间序列数据,最适合描述其变化趋势的图形是( )。
A、条形图 B、直方图 C、箱线图 D、线图
18、10家公司月销售额数据(万元)分别为:72,63,54,54,29,26,25,23,23,20。下列哪个图形适合描述这些数据( )。
A、茎叶图 B、直方图 C、散点图 D、饼图 19、下面那个图形不适合描述分类数据( )。
A、条形图 B、茎叶图 C、饼图 D、帕累托图
三、多项选择题
1、数据的预处理的内容主要包括( )。
A、数据审核 B、数据筛选 C、数据排序 D、数据的统一性检查 E、数据的相对而可靠性检查 2、反映分类数据的图形可选用的有( )。
A、条形图 B、环形图 C、累积频数分布图 D、饼图 E、直方图 3、对连续变量与离散型变量组限的划分在技术有不同要求。如果对企业按工人数分组,正确的方法是( )。
A、300人以下;300~500人 B、300人以下;300~500人(不含300人)
C、300人以下;301~500人 D、300人以下;310~500人 E、299人以下;300~499人 4、在组距分组中,组距的大小,( )。
A、同组数的多少无关 B、同组数的多少成正比 C、同组数的多少成反比 D、同全距的大小成正比 E、同全距的大小成反比 5、下面适宜于编制组距式频数分布表的有( )。
A、工业企业总产值计划完成程度 B、工人看管机器台数(最多10台,最少5台)
C、企业实现利税总额 D、学校的学生人数 E、工人的文化程度 6、分类数据、顺序数据和数值型数据都可以用( )图来显示。
A、条形图 B、环形图 C、累积频数分布图 D、饼图 E、直方图
7、有二十个工人看管机器台数资料如下:2,5,4,2,4,3,4,3,4,4,2,2,2,4,3,4,6,3,4,
按上述资料编制变量数列,宜采用:
A、单项分组 B、等距分组 C、异距分组 D、单项分组或等距分组均可 E、单项分组或异距分组均可 8、在组距数列中,组距数列的表现形式有( )。
A、闭口式 B、开口式 C、等距 D、不等距 E、组中值 9、下列可以表示连续型变量的统计图有( )。
A、条型图 B、直方图 C、折线图 D、饼图 E、茎叶图 10、组中值的计算公式有( )。
A、组中值=上限+下限/2 B、组中值=(上限+下限)/2
C、组中值=上限/2+下限 D、组中值=下限+(上限—下限)/2 E、组中值=上限-(上限-下限)/2 11、指出下列分组哪些是按数量标志分组( )
A、企业按所有制分组 B、家庭按人口多少分组 C、家庭按收入水平分组 D、产品按合格与不合格分组 E、职工按工资水平分组 12、形成一个组距分布数列的要素为( )。
A、变量的性质 B、变量的大小 C、组限和组中值 D、组距和组数 E、选择分组标志的内容 13、编制次数分布数列的基本步骤包括( )。
A、通过调查取得原始资料 B、确定组数和组距 C、确定组中值 D、确定组限 E、计算频数和频率 14、组距数列中,组距的大小与( )。
A、组数的多少与正比 B、组数的多少成反比 C、总体单位数多少成反比 D、全距的大小成反比 E、全距的大小成正比
15、对统计总体进行分组时,采用等距分组还是异距分组,决定于( )。
A、现象的特点 B、变量值的多少 C、次数的大小 D、数据分布是否均匀 E、组数的多少 16、分配数列中,各组标志值与频数的关系是( )。
A、各组标志值作用大小从频数大小中反映出来
B、频数愈大的组,标志值对于总体标志水平所起的影响也愈大 C、频数愈大,则组标志值也愈大 D、标志值很小的组,相应的频数也就小
E、组标志值相应的频数很小,对于总体标志水平所起的作用就小
四、简答题
1、统计数据为什么必须经过预处理?简述数据的预处理包括的内容。 2、分类数据和顺序数据的整理和图示方法各有哪些? 3、数值型数据的分组方法有哪些?简述组距分组的步骤。 4、数据的预处理包括哪些内容? 6、直方图与条形图有何区别?
五、计算题
1.2005年第四季度某公司下属40个企业利润计划完成程度百分比资料如下:(%) 79 88 123 115 119 158 112 146 113 126 117 108 105 110 107 137 120 136 107 108 125 127 142 118 103 87 115 114 119 105 117 124 129 138 100 103 92 95 127 104
①利用计算机对数据进行排序;
②以组距为10进行组距分组并绘制直方图; ③制作茎叶图。
2、某商品元月份逐日销售额(元)资料如下:
257 265 267 373
276 278 280 282
297 271 291 263
252 292 258 322
228 261 272 247
310 281 284 249
240 301 268 269
228 274 303 290
要求:
1)试以10元为组距对该资料进行分组,分为10组,并画出直方图、频数多边形及累计频数图。 2).按斯塔奇斯公式对该资料分组,并画出直方图、频数多边形及累计频数图。 3).比较1)和2)的结果。
3、下面是某公司40天的商品销售资料:(单位:万元)
41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 试按要求完成:
(1) 指出上面数据的类型;
(2) 根据你所学的知识对上面的数据适当分组,编制频数分布表; (3) 按照分组后的数据,计算平均每天销售额以及标准差。(11分)
4、某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):
152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 试按要求完成:
(4) 指出上面数据的类型;
(5) 根据你所学的知识对上面的数据适当分组,编制频数分布表; 按照分组后的数据,计算平均每天销售额以及标准差。