2003-2016年中国人民大学统计学805考研真题集 下载本文

内容发布更新时间 : 2024/6/4 21:57:58星期一 下面是文章的全部内容请认真阅读。

人大统计学考研 历年真题精华版 (03- 16)

1

2016年人大学统计学考研真题(完整版)

1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。

4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。

5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。 6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。

7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。 8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2

2013年人大805统计学真题

一、证明题:(20分)每题10分

1.袋子里有两种颜色的球 红球a个 白球b个 第一步 从袋子里取出一个球观察其颜色然后丢掉

第二步 从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明 取出的最后一个球是红球的概率是1/2。

2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。

二、简述:(30分)每题10分

1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求 中位数x(n+1)的分布

3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少?

三、已知Y1,……,Yn是相互独立的随机变量,且均服从并求他们的均方误差

四、X和Y是两个相关的随机变量:

求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分)

五、谈谈你对双因素方差分析的理解和认识。(25分)

六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

。(25分) 。求的矩估计和最大似然估计,

3

2012年人大805统计学真题

一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据: 10~20万 20~30万 30~40万 40~50万 东部地区 60 20 30 10 西部地区 40 30 30 20 中部地区 50 30 50 40 对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。 对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。

二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500 现在抽取了部分的样品进行检验。 若检验结果拒绝H0,则意味着什么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样本证明H0:u=500成立?为什么?若检验的P=0.03,则意味着什么?P值的真实含义是什么? 三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表:

表1:整体拟合程度:R,R方,调整的可绝系数。 表2:整体线性关系的F检验

表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性) 请对上述回归模型进行综合评价。

四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并简要叙述可种方法的基本原理。 五、说明距离判别法与贝叶斯判别法的联系。 六、说明大数定律与中心极限定理的内容和应用?

七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法:以比例p的人回答敏感性问题

(1):你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答问题 (2):比如你的手机号尾数是奇数吗?回答是的比例为t。 假设总体具有特征A的人数比例为q,样本中回答是的比例为R。 1.试提出q的一个估计。2.证明该估计是q的一个无偏估计。 求出q的方差的表达式。

4

2011年人大805统计学真题

一、简答题(50分)

1.简述加权最小二乘估计的基本思想。

2.进行主成分分析需是否要知道数据的具体分布,请说明原因。 3.k-均值聚类对比分层聚类,优点在哪里。

4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。 5.简述方差分析和回归分析的异同。 二、已知X与W相互独立(30分)。

1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。

2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方)+W,当X=x时求Y的条件期望。

三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分)

1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。 2.指出CPI的调查过程中误差的可能来源。

3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。

4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。

四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分) 五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

5