内容发布更新时间 : 2024/12/22 14:38:03星期一 下面是文章的全部内容请认真阅读。
第一步:对资料进行分析:A、计算全距(R);B、变量的性质;C、变量值变动是否均匀。通过全距的计算以及变量是离散型还是连续型来确定编制单项数列还是组距数列,根据变量值的变动是否均匀确定编制等距还是异距数列。 第二步:在编制组距数列时,还需确定组距和组数,其原则是能真正反映总体的分布特征。 第三步:确定各组的组限。离散型变量的组限可不重叠,连续型变量的组限必须重叠。 第四步:将总体各单位分布到各组、计算次数、颁率、变量数列就编制而成。 5、简述组距分组的步骤?
1确定组数2确定各组组距3根据分组整理成频数分布表 6、数据的预处理包括哪些内容? 数据审核、数据筛选和数据排序。 7、直方图与条形图有何区别?
首先,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;
直方图是用面积表示各组频数的多少,矩形的高度表示每一组频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。 其次,由于分组数据具体有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 最后,条形图主要用于展开分类数据,而直方图则主要用于展示数值型数据。 第四章 综合指标 一、填空题
1、一组数据向某一中心值靠拢的倾向反映了数据的 集中趋势 。 2、 众数 是一组数据中出现次数最多的变量值。
3、一组数据排序后处于中间位置上的变量值称 中位数 。
4、不受极端值影响的集中趋势度量指标有 众数 、 中位数 和 分位数 。 5、一组数据的最大值与最小值之差称 极差 。
6、 离散系数 是一组数据的标准差与其相应的平均数之比。 7、数据分布的不对称性是 偏度 。 8、数据分布的平峰或尖峰程度称 峰态
9、计算比率的平均数一般用 几何平均法 ,它实际上是各变量值对数的 算术平均数 。 10、Excel中计算中位数时选用的函数为 MEDIAN函数 .
11、某工厂13名工人某日生产零件数分别为(单位:件)10、11、13、11、14、11、12、11、15、16、12、12、13 ,则中位数为 12 ;众数为 11 。
13、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是 238.5 。 14、一组数据分布的最高峰点所对应的变量值即为_众数________。 15、当平均数大于中位数时,数据呈__右偏_______分布。
16、根据组距数列计算平均数,一般用组中值代表各组标志值的水平,其假定前提是假定各组数据在组内是均匀分布的____ 。 17、若一组数据的X?Me?Mo,则其属于____左偏___________分布。 18、如果一组数据服从标准正态分布,则峰态系数为__0_________。
19、__中位数________是一组数据中间位置上的代表值,不受数据极端值的影响。
20、假定一个总体由5个数据组成:3、7、8、9、13,该总体的方差为 13 。
21、某班共有25名学生,期末统计学课程的考试分数分别为:68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,该班考试分数的下四分位数和上四分位数分别是 64.5 和 78.5 。 22、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别为72、63.1、54.7、54.3、29、26.9、25、23.9、23、20,该组数据的极差为 52 。 二、单项选择题
1、对于对称分布的数据,众数、中位数和平均数的关系是:(B )。 A、众数>中位数>平均数 B、众数=中位数=平均数 C、平均数>中位数>众数 D、中位数>众数>平均数 2、可以计算平均数的数据类型有:( C )。
A、分类型数据 B、顺序型数据 C、数据型数据 D、所有数据类型 3、顺序数据的集中趋势测度指标有:( B )。
A、众数 B、中位数 C、四分位差 D、标准分数 4、数据型数据的离散程度测度方法中,受极端变量值影响最大的是( A )。 A、极差 B、方差 C、均方差 D、平均差
5、当偏态系数为正数时,说明数据的分布是( C )。
A、正态分布 B、左偏分布 C、右偏分布 D、双峰分布 6、下列指标中,不属于平均数的是(A )。
A、某省人均粮食产量 B、某省人均粮食消费量 C、某企业职工的人均工资收入 D、某企业工人劳动生产率
7、一组变量数列在未分组时,直接用简单算术平均法计算与先分组为组距数列,然后再用加权算术平均法计算,两种计算结果(C )。 A、一定相等 B、一定不相等 C、在某些情况下相等 D、大多数情况下相等 8、加权算术平均数的大小( D )。
A、受各组标志值的影响最大 B、受各组次数影响最大
C、受各组权数比重影响最大 D、受各组标志值与各组次数共同影响 9、在变量数列中,当标志值较大的组权数较小时,加权算术平均数(A )。 A、偏向于标志值较小的一方 B、偏向于标志值较大的一方 C、不受权数影响 D、上述说法都不对 10、平均差的主要缺点是( C )。
A、与标准差相比计算复杂 B、易受极端数值的影响 C、不符合代数演算方法 D、计算结果比标准差数值大
11、把全部产品分为一级品、二级品和三级品,其中一级品占全部产品比重为70%,则这个70%属于(C )。 A、平均数 B、结构相对数
C、具有某一属性的单位数在总体中的成数p D、不具有某一属性的单位数在总体中的成数q 12、计算离散系数是为了比较( B )。
A、不同分布的数列的相对集中程度 B、不同分布的数列的标志变动度大小 C、相同分布的数列的标志变动度大小 D、两个数列平均数的绝对差异
13、主要用于测度分类数据的集中趋势,同时也适用于数值型数据、顺序数据的集中趋势描述的概括性度量是( A )。 A、众数 B、中位数 C、异众比率 D 、平均数 14、随机抽查了某班的10名同学英语、数学成绩,计算得而言,两者的离散程度( B )。
A、英语的大于数学的 B、英语的小于数学的 C、相当 D、无法确定
15、某寝室11名同学的英语成绩分别为70、71、76、78、83、86、85、81、90、93、97,则英语成绩的上四分位数为(C )。 A、76 B、74、75 C、90 D、85
16、比较两组工作成绩发现?甲>?乙,x甲>x乙,由此可推断 ( D )。 A、乙组x 的代表性高于甲组 B、甲组x 的代表性高于乙组 C、甲、乙组的工作均衡性相同 D、条件不充分,不能确定
17、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为( C )。 A、算术平均数 B、中位数 C、几何平均数 D、调和平均数
18、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为 ( C )。 A、40 B、43 C、44 D、 45 19、当分布数列中各变量值的频率相等时 ( B )。
A、该数列众数等于中位数 B、该数列众数等于算术均值 C、该数列无众数 D、该数列众数大于算术均值
20、某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为 ( B )。 A、50% B、25% C、20% D、10%
21统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有( ACD )。 A、算术平均数 B、移动平均数 C、调和平均数 D、几何平均数 E、以上都是 22、变异指标反映了总体分布的( A )。
A、集中趋势 B、离中趋势 C、长期趋势 D、基本趋势 23、已知一组变量值为38, 24, 69, 109, 15, 43, 56,则这组变量值的中位数为( B )。 A、85 B、43 C、94 D、18
x英语?80分、 x数学?75分,标准差分别为s英语=8,s数学=8,则比较
24、若已知某地120家企业按年产值(万元)分成以下5组:500-1000;1000-1500;1500-2000;2000-2500;2500以上,则最后一组的组中值为( C )。
A、5000 B、3000 C、2750 D、2600 25、下列变异指标中,最容易受极端值影响的是( B )。
A、平均差 B、全距 C、标准差 D、标准差系数 26、当偏态系数为2,此时数据( A E )。
A、呈右偏分布 B、呈左偏分布 C、X?Me?M0 D、X?Me?M0 E、X?Me?M0
27、对比分析不同性质的变量数列之间的变异程度时,应使用( D )。 A、全距 B、平均差 C、标准差 D、离散系数 28、在下列成数数值中,哪一个成数数值的方差最小( D )。 A、0.8 B、0.5 C、0.3 D、0.1
29、如果偏态系数a小于零,峰态系数β小于3,可判断次数分布曲线为(A )。 A、左偏分布,呈尖顶峰度 B、右偏分布,呈尖顶峰度 C、左偏分布,呈平顶峰度 D、右偏分布,呈平顶峰度 30、在频数分布中,众数是( C )。 A、最大的那个频数
B、最大的标志值
D、把频数分布分成两个相等部分的那个标志值
C、频数最大的那个标志值
31、平均数指标反映了总体分布的( A )。
A、集中趋势 B、离中趋势 C、长期趋势 D、基本趋势 32、现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( D )。 A、算术平均数 B、分位数 C、几何平均数 D、中位数 33、若两数列的标准差相等而平均数不等,则(B )。
A、平均数小代表性大 B、平均数大代表性大 C、代表性也相等 D、无法判断 34、在频数分布中,众数是( C )。
A、最大的那个频数 B、最大的标志值 C、频数最大的那个标志值 35、在频数分布中,众数是( C )。 A、最大的那个频数
B、最大的标志值
D、把频数分布分成两个相等部分的那个标志值
C、频数最大的那个标志值
D、把频数分布分成两个相等部分的那个标志值
36、假定一个样本由5个数据组成:3、7、8、9、13,该样本的方差为( B )。 A、8 B、13 C、9.7 D、10.41 37、对于右偏分布,均值、中位数和众数之间的关系是 ( A )。 A、均值>中位数>众数 B、中位数>均值 >众数 C、众数>中位数>均值 D、众数>均值> 中位数
38、在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状( B )。 A、对称的 B、左偏的 C、右偏的 D、无法确定
39、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是 ( A )。 A、赞成 B、69 C、中立 D、22
40、某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数的需按四分位数和上四分位数分别是(A )。 A、64.5和78.5 B、67.5和71.5 C、64.5和71.5 D、64.5和67.5 41、对于右偏分布,平均数、中位数和众数之间的关系是( A )。 A、平均数>中位数>众数 B、中位数>平均数>众数 C、众数>中位数>平均数 D、众数>平均数>中位数
42、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20该组数据的中位数为( C )。
A、28.46 B、30.20 改组数据的标准差为( B )。
C、27.95 D、28.12
43、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72,63.1,54.7,54.3,29,26.9,25,23.9,23,20.
A
A、28.46 B、19.54 C、27.95 D、381.94
44、某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是( B )。 A、方差 B、极差 C、标准差 D、变异系数
45、某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断成绩在70~90分之间的学生大约占( C )。
A、95% B、89% C、68% D、99%
46、在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分。假设新员工得分的分布是未知的,则得分在65~95分的新员工至少占(B )。
A、75% B、89% C、94% D、95%
47、对某个高速路段行驶过的120辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差是4公里/小时,下列哪个车速可以看作是异常值( D )。
A、78公里/小时 B、82公里/小时 C、91公里/小时 D、98公里/小时 48、一组样本数据为3,3,1,5,13,12,11,9,7。这组数据的中位数是( D )。 A、3 B、13 C、7.1 D、7 49、一组数据的离散系数为0.4,平均数为20,标准差为( D )。
A、80 B、0.02 C、4 D、8
50、在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。 A、标准差不同 B、方差不同 C、数据个数不同 D、计量单位不同 60、两组数据的平均数不等,但标准差相等,则( A )。
A、平均数小的,离散程度大 B、平均数大的,离散程度大 C、平均数小的,离散程度小 D、两组数据的离散程度相同 三、多项选择题
1、数据的分布特征可以从哪几个方面测度和描述(ABCD )。
A、集中趋势 B、分布的偏态 C、分布的峰态 D、离散程度 E、长期趋势 2、受极端变量值影响的集中趋势度量指标是(CDE )。
A、众数 B、中位数 C、算术平均数 D、调和平均数 E、几何平均数 3、加权算术平均数大小的影响因素有( AC )。
A、变量值 B、样本容量 C、权数 D、分组的组数 E、数据的类型 4、数据型数据离散程度的测度指标有( ABCE )。
A、异众比率 B、极差 C、标准差 D、四分位数 E、离散系数 5、离散系数的主要作用是(BD )。
A、说明数据的集中趋势 B、比较不同计量单位数据的离散程度 C、说明数据的偏态程度 D、比较不同变量值水平数据的离散程度 E、说明数据的峰态程度
6、利用四分位差说明标志的变异程度( AC )。
A、 没有考虑总体所有单位标志值的差异程度 B、 与总体单位的分配无关
C、 能反映四分位数中间两个分位数之差 D、 反映总体最大标志值与最小标志值之差 E、 取决于平均数的大小
7、标准差和平均差的共同点是( ABC )。
A、两者都以平均数为中心来测定总体各单位标志值的离散程度 B、两者在反映总体标志变异程度方面都比全距准确 C、两者都考虑了总体的所有变量值的差异程度 D、两者都受极端值较大影响 E、两者都计算方便 8、下列各项中属于交替标志具体表现的是( ABCD )。
A、产品中的合格品、不合格品 B、农作物中的受灾面积、非受灾面积 C、稻种中的发芽种子、不发芽种子 D、人口性别中的男、女 E、产品中的一等品、二等品、三等品
9、 下列指标中,属于平均指标约有( CDE )。
A、某省人均国民收入 B、某省人均粮食产量 C、某省人均粮食消费量 D、某企业工人劳动生产率 E、某企业职工的人均工资收入
10、下列情况中,应采用调和平均数的有( ABCDE )。 A、已知各企业计划完成百分比及实际产值,求平均的计划完成程度 B、已知各商品的单价和销售额,求平均价格
C、已知分组的粮食单位产量及各组粮食总产量,求总的平均单位产量 D、已知三种产品的单位成本及总生产费用,求平均单位产品成本 E、某采购站某月购进三批同种农产品的单价及收购额,求平均采购价格 11、对于数值型数据,描述集中趋势可选用的度量值有( ABC )。 A、众数 B、中位数 C、算术平均数 D、四分位数 E、标准差 12、数值平均数主要包括( AB )。
A、算术平均数 B、几何平均数 C、众数 D、分位数 E、中位数 13、在什么条件下,加权算术平均数等于简单算术平均数( ADE )。
A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为1 E、各组次数占总次数的比重相等 14、能反映总体标志变异程度的指标有( ACD )。
A、方差 B、偏度与峰度 C、标准差 D、全距 E、中位数与众数 15、位置平均数主要包括( CDE )。
A、算术平均数 B、几何平均数 C、众数 D、分位数 E、中位数
16、平均差的计算公式有( AB C )。
x?xfx?xx?x???A、A.D? B、A.D? C、A.D?nn?fx?x?x?x???D、A.D? E、A.D? fn?17、当偏态系数为2,此时数据( AE )。
A、呈右偏分布 B、呈左偏分布 C、X?Me?M0 D、
X?Me?M0 E、X?Me?M0
18、平均数与离散系数(标准差系数)的关系是( AC )。
A、离散系数愈大,平均数代表性愈小 B、离散系数愈大,平均数代表性愈大 C、离散系数愈小,平均数代表性愈大 D、离散系数愈小,平均数代表性愈小 E、无法确定
19、计算标准差系数是因为(ABCE )。
A、不同水平的数列,标准差不能直接对比 B、不同性质的数列,标准差不能直接对比 C、当平均差系数不可比时,可以比较标准差系数 D、标准差系数能够反映数据的分布特征 E、标准差系数可以抽象不同数列的性质和水平 四、简答题
1、什么是数据的集中趋势?反映数据集中趋势的指标有哪些? 数据的集中趋势指一组数据向某一中心值靠拢的倾向。
反映数据集中趋势的指标主要有:众数、中位数、分位数、平均数等。 2、什么是数据的离散程度?常用的测度离散程度的指标有哪些? 离散程度反映的是各变量值远离其中心值的程度。
反映数据离散程度的指标主要有:四分位差、方差、标准差、极差、离散系数等。 3、怎样理解平均数在统计学中的地位?
平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础;平均数作为代表值,是误差相互抵消的结果,反映了事物必然性的数量特征。
4、简述众数、中位数和均值的特点和应用场合。
众数是一组数据分布的峰值,是一种位置代表值,不受极端值的影响,其缺点是不具有唯一性。虽然对数据型数据和分类数据也适用,