内容发布更新时间 : 2024/11/7 13:45:39星期一 下面是文章的全部内容请认真阅读。
《数据模型与决策》复习(附参考答案)
2018.9
一、填空题(五题共15分)
1. 已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是 ① 。 解:N(167.48,0.609)
考查知识点:已知总体服从正态分布,求样本均值的分布。
2. 某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为 ② 。 解:[1040,1936]
考查知识点:区间估计的求法。正态总体均值的区间估计是[X?Z1??其中X是样本平均数,s是样本的标准差,n是样本数。 详解:直接带公式得:区间估计是 [X?Z1??22402240ss,X?Z1??]= [1488?2,1488?2]
100100nnss,X?Z1??] nn =[1040,1936]
3. 从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。已知小李第一胎是女孩,那么她的第三胎生男孩的概率是 ③ 。 解 p=0.4653
考查知识点:离散概率计算方法。
详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩 G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩
P(B3)=P(B3B2)+P(B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P(B3))
1
= P(B3|B2)P(B2)+P(B3|G2)P(G2) =0.48×(1-0.55)+(1-0.55) ×0.55 =0.4653
4. 调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是 ④ 。 解 p=0.5
考查知识点:了解正态分布概率含义。
5. 结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是 。(请在0.3、0.6和0.9中选一个) 考查知识点:了解相关系数。
本题答案:孩子与父母平均身高的相关性比较高,应该选0.9 6. 简述模拟仿真的关键步骤。 考查知识点:模拟仿真的思想
二、单项选择题(五题共15分)
1. 下列事件中,属于小概率事件的随机事件是( ) A. 抛一枚均匀的硬币2次,结果全是正面 B. 抛一枚均匀的硬币3次,结果全是正面 C. 抛一枚均匀的硬币4次,结果全是正面 D. 小王某天上班路上捡到10元钱 解: D
考查知识点:认识哪些事件是小概率事件? 2. 关于假设检验,下列说法正确的是( )。
A. P值<0.05,拒绝原假设 B. P值<0.05,接受原假设 C. P值>0.05,拒绝原假设 D. P值>0.05,接受原假设
解: A
考查知识点:假设检验的思想
3. 天气预报常常用区间表示一天温度的变化,比如明天温度在[a,b]之间,这种预 报其实是一个置信度为95%的区间。描述置信度与精确度的关系。
2
4. 不确定型决策方法。
5. 检验两个变量之间是否有关系,如“吸烟与患肺病有关系吗?”应采用( )。
A. U检验 B. t检验 C. ?2检验 D. F检验 解 C
考查知识点:分组数据检验方法。
三、简答题(两题共40分)
1. 货车的行驶时间与行驶距离的远近及运送货物的次数有关,表2给出的资料是从上海市某运输队收集来的:
表2 货车的行驶时间与行驶距离的远近及运送货物的次数统计
Y:小时 X1:100公里 X2:次数 7.3 4.8 9.5 5.2 7.2 6.2 7.4 6.6 7.6 6.3 1 4 0.6 1.5 0.7 0.5 0.8 0.75 0.75 0.9 0.9 2 4 2 4 2 3 4 4 2 利用Excel,得到下列输出结果,回答后面的三个问题。
回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归分析 残差 总计
0.913 0.833 0.785 0.616 10 df 2 7 9
SS 13.253 2.656 15.909
MS
F
Sig F
6.626 17.464 0.002 0.379
3
Intercept
Coefficients 标准误差 t Stat P-value
A
0.802 0.792 0.109
Lower Upper 95%
95%
2.762 0.028 0.318 4.110 3.395 0.012 0.816 4.560 3.449 0.011 0.119 0.635
X Variable 1 2.688 X Variable 2 0.377
(1) 从上述输出结果看,这个模型拟合效果如何? (2) 上表中的截距A为多少?
(3) 写出货车的行驶时间与行驶距离的远近及运送货物的回归方程。 (4) 倘若某次行驶距离为50公里,跑4次,估计花费多少时间?
解:(1) 从模型检验的F值为17.464对应的p值等于0.002小于5%看模型拟合效果很好,另外,R2=0.833也表明模型的解释能力达到83.3%,说明模型拟合效果不错。 (2) 上表中的截距A=(0.318+4.11)/2=2.214.
(3)货车的行驶时间与行驶距离的远近及运送货物的回归方程为:
??2.214?2.688x1?0.377x2 y??2.214?2.688x1?0.377x2,得花费时间约为 (4) 将x1=0.5,x2=4次带入回归方程y5.07小时。
考查知识点:回归方法的操作、模型选择、估计和预测。
2.(10分) Westdata公司正在考虑如何管理其数据处理操作系统,它有两种方案选择,一是继续让自己的员工管理(自营),二是聘请供应商管理(外包)。管理数据处理操作系统的费用取决于未来的需求,市场部经理预测未来需求有高、中、低三个等级,并且预测当未来的需求高时,自营的费用是1300,外包的费用1800,当未来的需求中时,自营的费用是1300,外包的费用1200,当未来的需求低时,自营的费用是1200,外包的费用600,请回答问题:
(1)给出Westdata公司决策问题的支付矩阵(收益表);
自营
高 中 底 -1300 -1300 -1200 4
外包
-1800 -1200 -600 (2)请您利用最大风险最大化方法(乐观法)、最大风险最小化方法(悲观法)和最小最大后悔值法给Westdata的决策者推荐方案。 解: 乐观法:
自营 外包 决策:选择外包。 悲观法:
自营 外包 决策:选择自营。
最小最大后悔值法:
自营 外包 决策:选择外包。
考查知识点:不同决策准则下的决策方法
高 0 500 中 100 0 底 600 0 高 中 底 -1300 -1300 -1200 -1800 -1200 -600 高 中 底 -1300 -1300 -1200 -1800 -1200 -600 四、计算题(三题共30分)
1. (10分)某开发商面临有两种选择,投资建设百货商场(T),放弃建设百货商场(Q)。但建设百货商场可能面临未来人流量太少(X),也可能面临未来人流量大(D)。利润矩阵见下表(单位:万元)。开发商现在犹豫是否需要进行市场调研。调研成本是5万元。咨询将产生两种结果,认为人流量大(Y)和人流量小(N)。相关概率如下所示:P(X)=0.4,P(D)=0.6,P(Y)=0.8,P(N)=0.2,P(X|Y)=0.1,P(D|Y)=0.9,P(X|N)=0.8,P(D|N)=0.2
表3 某市物流中心建设与未来经济形势关系分析 建设T 未来人流量太小X -495 未来人流量大D 1005 5