统计学简答题完整版 下载本文

内容发布更新时间 : 2024/6/27 3:57:08星期一 下面是文章的全部内容请认真阅读。

一、统计的含义和本质是什么?P2

含义:“统计”一词可以有三种含义:统计活动、统计数据和统计学。统计活动是对各种统计数据进行搜集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理和统计分析三个阶段;统计数据是通过统计活动获得的、用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何搜集、整理和分析统计数据的科学。

本质:统计的本质就是关于为何统计,统计什么和如何统计的思想。 二、统计数据有哪些分类?不同类型数据有什么不同特点?P7

1. 统计数据按照所采用的计量尺度不同,可以分为定性数据与定量数据。定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据两种。定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。

2. 统计数据按照其表现形式不同,可以分为绝对数、相对数和平均数。绝对数是用以反映现象或事物绝对数量特征的数据,有明确的计量单位。相对数是用以反映现象或事物相对数量特征的数据,它通过另外两个相关统计数据的对比来体现联系关系。平均数是用以反映现象或事物平均数量特征的数据,体现现象某一方面的一般数量水平。 3. 统计数据按照其来源不同,可以分为观测数据与实验数据两类。观测数据是通过统计调查或观测的方式而获取的反映研究现象客观存在的数量特征的数据。实验数据是在人为控制的条件下,通过实验的方式而获得的关于实验对象的数据。 4. 统计数据按照其加工程度不同,可以分为原始数据与次级数据两类。原始数据是指直接向调查对象搜集的、尚待加工整理、只反映个体特征的数据。次级数据也称为加工数据或二手数据,是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 5. 统计数据按照其时间或空间状态不同,可以分为时序数据与截面数据。时序数据是对同一现象在不同时间上搜集到的数据(即空间状态相同,时间状态不同)。截面数据是对一些同类现象在相同或近似相同的时间上搜集到的数据(即空间状态不同,时间状态相同)。 三、总体和样本概念以及它们之间的关系如何?P14

概念:总体,就是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体。样本,就是从总体中抽取的一部分个体所组成的集合。

关系:1.总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影。 2.样本是用来推断总体的。对样本进行观测的目的是要对总体数量特征做出估计或判断,即通常所说的以样本推断总体。 3.总体和样本的角色是可以改变。随着考察角度的改变,一定的研究总体也可成为另一意义上总体的一个样本,这说明总体与样本的角色是可以改变的。 四、标志和指标之间的关系如何?P17

区别:1.指标和标志说明的对象不同,指标说明总体的特征,标志则说明个体的特征。 2.指标和标志的表现形式不同,指标是用数值来表现的,而标志则既有只能用文字来表现的品质标志,又有用数值来表现的数量标志。

联系:1.标志是计算统计指标的依据,即统计指标数值是根据个体的标志表现综合而来的。 2.由于总体与个体的确定是相对的、可以换位的,因而指标与标志的确定也是相对的、可以换位的。

五、统计数据收集方案包括哪些内容?P25

数据收集目的(why)、数据及其类型(what type)、数据收集对象与观测单位(whom)、观测标

志与调查表(what)、数据收集方式与方法(how)、数据所属时间和数据收集期限(when)、数据收集地点(where)、数据收集的组织(who) 六、概率抽样特点是什么?P27

1. 在样本的抽取上遵循随机原则,即总体中的个体是否被抽中不受主观因素的影响,而是

由可知的、非零的概率来确定。

2. 在调查的功能上能以部分推断总体,以样本的观测结果去推断总体的数量特征。 3. 在推断的手段上运用概率估计的方法。

4. 在推断的理论上,以大数定律和中心极限定理为依据。

5. 在推断的效果上,抽样误差可以计算并加以控制。抽样标准误是可以计算的,并能通过

各种有效的办法把它控制在要求的范围内。 七、抽样调查的适用范围有什么特点?

1. 用于认识那些不能或难以进行全面调查的总体的数量特征。

2. 用于认识那些发展变化比较稳定和有规律性而不必进行全面调查的现象总体的数量特

征。

3. 用于收集灵敏度高、时效性强或时间要求紧迫的统计数据。

4. 用于与其他数据收集方式相结合,相互补充和核对(例如与普查相结合,既可以取得普

查未能取得的数据。

5. 用于对总体特征的某种假设进行检验,判断这种假设的真伪,决定方案的取舍,为行动

决策提供依据。 八、统计数据收集过程中,可能有哪些误差?如何规避这些误差?

两种误差:观测性误差和代表性误差。

观测性误差是在调查观测的各个环节因工作粗心或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差。这种误差,在全面调查和非全面调查中都会产生,并且一般地,调查范围越广越大,观测的个体越多,则产生的可能性越大。代表性误差是指在抽样调查中,因样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差,又分为系统性误差和偶然性误差两种。系统性误差通常是难以计算和控制的,偶然性误差虽不可避免但可以计算和控制。 九、统计分组的性质? 1. 2. 3. 4.

统计分组兼有分与合的双重功能,是分与合的对立统一。 统计分组必须遵循“穷尽原则”和“互斥原则”。

统计分组的目的是要在同质性的基础上研究总体的内在差异性。 统计分组在体现分组标志的组间差异的同时,却可能掩盖了其他标志的组间差异,因此,任何统计分组的意义都有一定的限定性。

5. 统计分组的关键是分组标志的选择和分组界限的确定。 十、什么是集中趋势指标?常用的平均指标有哪些?

集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。平均指标的具体表现称为平均数,平均数因计算方法不同可分为数值平均数和位置平均数。数值平均数主要包括算术平均数、调和平均数和几何平均数,位置平均数主要包括中位数和众数。 十一、什么是离中趋势指标?常用的离散指标有哪些?

离中趋势,就是变量分布中各变量值背离中心值的倾向。离散指标就是反映变量值变动范围和差异程度的指标。常用的离散指标主要有:全距、四分位差、异众比率、平均差、标准差、

离散系数等。

十二、什么是抽样分布?抽样分布的影响因素有哪些?

抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。

影响因素:1.总体分布:一般地总体分布越集中则抽样分布也越集中。 2.样本容量:样本容量越大则抽样分布越集中。

3.抽样方法:考虑样本单位抽取顺序与不考虑的抽样分布有别。 4.抽样组织形式:不同抽样组织形式有不同的样本结构和样本个数。 5.估计量构造:估计量构造不同,估计值就不一样,抽样分布就不同。 十三、简述简单随机抽样的参数估计过程。 十四、相关分析和回归分析的关系?

联系:1. 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。回归和相关都是研究两个变量相互关系的分析方法。

2. 在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

区别:1.在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位。

2.相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。

3. 在相关分析中,两个变量要求都是随机的;而在回归分析中,要求因变量是随机的,而自变量的值则是给定的。 十五、简述最小二乘法的基本原理。

最小二乘法的原理是使实际值y 与估计值c y 的离差平方和最小。用直线方程y =a +bx代人公式

十六、时期数列和时点数列的区别?

1.时期数列中各指标的数值是可以相加的,而时点数列中各指标的数值是不能相加的; 2.时期数列中每一个指标数值的大小与所属的时期长短有直接的联系,而时点数列中每一个指标数值的大小与其时间间隔长短没有直接联系; 3.数列中每个指标的数值,通常是通过连续不断的登记取得的,而时点数列中每个指标的数值,通常是通过一定时期登记一次而取得的 十七、简述序时平均数和静态平均数的区别和联系。

动态平均数和静态平均数的共同之处在于:两者都是把现象的个别数量差异抽象化了,反映现象的一般水平。 动态平均数和静态平均数的的区别在于:

(1)静态平均数是将同一时期的标志总量与总体单位数对比求得;而动态平均数则是将不同时期的指标值加以平均而得到;

(2)静态平均数是总体各单位之间标志值的平均;而动态平均数则是动态数列中各时间单