第三章习题 下载本文

内容发布更新时间 : 2024/6/24 19:41:56星期一 下面是文章的全部内容请认真阅读。

1. 从1到100个自然数中随机不放回低抽取5个数,并求它们的和。

答:sum(sample(1:100,5)) 注意 sample()

Arguments: sets,size,replace,prob 注意到R自带的帮助文档格式:

DUADVRSE(Description, usage, arguments, details ,value,reference ,see also, examples) 真的非常有用 2. 从一幅扑克牌52张种随机抽取5张,求下列概率

a. 抽到的是 10, J,Q,K,A; b. 抽到的是同花顺

答:a 4*4*4*4*4*4/choose(52,5)

b 4*choose(13,5)/choose(52,5)

可以看见的是 后者远远小于前面的.

如果应用样本点的观点,也可以得到同样的结果。 prod(1:5)*4^5/prod(52:48) 4*prod(13:9)/prod(52:48)

PS: 排列应用的函数是 prod(),从n1:n2的个数是 n1-n2+1个 组合要用到得函数是 choose(total,size)

可以使用 样本点 样本空间的观点,也可以改变下 样本点的概率,使其不考虑顺序,这样就可以使用组合。

本质上只是选择的样本点的不同而已。 不考虑 顺序的样本点 考虑顺序的样本点 3. 从正态分布N(100,100)中随机产生1000个随机数,

a. 作出这1000个正态随机数的直方图

b. 从这1000个随机数中随机有放回地抽取500个,作出其直方图 c. 比较它们的样本均值和样本方差 答:rnorm(1000,mean=100,sd=100)->x sample(x,500) hist() mean() sd()

PS:注意下面四个函数就可以了

pnorm() qnorm() dnorm() rnorm() 应该传入什么参数,完成什么效果. P代表 累积概率,q代表分位数,d代表 核(密度),r代表随机数. 以及如何利用相应的分布生成 函数

-----一个插曲题目:实验的模拟 进行下面的抽样。

每一个物种的本底值为1。 病原菌效益:N(u1,sd) 抽样10次,N(u2,sd)…N(u3,sd)每个抽样一次,共进行10个抽样,表示不同病原菌的效益,都为负值。

土壤的效益:假设土壤理化性质的效益在每个物种间是随机分布的,都为正值。 最后得到的结果是这样的,土壤理化效益+病原菌效益 以及 土壤理化效益。 问 该如何处理这样的数据。 物种类型 1 1 1 1 1 1 处理 对照 对照 对照 杀菌 杀菌 杀菌 土壤类型 1 2 3 1 2 3 生物量 TV+N(u1,sd)+N(u1’,sd’) TV+N(u2,sd)+N(u2’,sd’) TV+N(u3,sd)+N(u3’,sd’) TV+N(u1’,sd’) TV+N(u2’,sd’) TV++N(u3’,sd’) 生物量 受两个因素影响,在这里将因素的影响随机化了。 为了简单,可以认为是 因素影响为定值,而其它影响包含一个随机因素.但是 目前不知道该如何设置 随机因素的均值(太小的话,体现不出效益),所以就采取目前这种方式 duizhaoiIn1表示 对照组 中 生长在自己土壤中的10个重复生物量值 duizhaoiInO表示 对照组中 生在其它10种土壤中的 10个 生物量值 shajuniIn1表示 杀菌组的 shajuniInO表示是 对照组中的情况 基准值为10, 本土土壤中 理化性质均值为 0,其它的为-.25 本土土壤中病原菌的 均值 为-.5 ,其它土壤中病原菌的均值为 0 方差都为2

4. 模拟随机游动:从标准正态分布中产生1000个随机数,并用cumsum()作出累积和,最

后使用命令plot()作出随机游动的示意图。

答:如果设置了x,y两个方向,则为布朗运动。

随机游动 则为在y轴上下的游动,围绕0左右游动。 Plot(x) 其中 x=cumsum(rnorm(500))

5. 从标准正态分布中随机产生100个随机数,由此数据求总体均值的95%置信区间,并与

理论值进行比较. 答:

使用一般情况下:即方差未知时的检验和置信区间估计。使用函数t.test(x)可以直接求置信区间。求的的置信区间同理论值相比 会窄一些,并且不怎么对称,左短右长。

> qnorm(.025) [1] -1.959964 > qnorm(.975) [1] 1.959964 > x=rnorm(1000) > t.test(x)

6. 用本章给出的函数limite.central(),从图形上验证 当样本容量足够大时,从贝塔分布

beta(1/2,1/2)抽取的样本的样本均值近似 服从 正态分布。 答:

a=matrix(,nc=10,nr=1000) for(i in 1:1000){

a[I,]=rbeta(10,1/2,1/2) }

Apply(a,MARGIN=1,mean)->b hist(b)

PS: beta分布 一般都可以由下面这个过程推到而来:

A. X的均值 固定 B. 1-x的均值固定 C.积分为1 D:符合最复杂原理 则该分布为 beta分布.

想问一下,最复杂原理是什么意思?

B. 有一个问题就是本图相关的for(I in 1:xx)只有这种形式,并且 矩阵的第一行索引为1,

而非0.

C. 不同维数的数据声明。 用到单行数据 定义为numeric(),二维数据定义为matrix(),

多维数据为array().

7. 除本章给出的标准发布外,非标准的随机变量X的抽样可以通过 格式点离散化方法实

现,设p(x) 为X的密度函数,其抽样步骤如下:

A. 在X的取值范围内等间隔地选取N个点,x1,x2,…xN,例如N为1000 B. 计算P(xi),i=1,2,…N

C. 正则化p(xi),i=1,2,…N,使其成为离散的分布律

D. 按离散分布的抽样方法使用命令sample()从{xi}中间有放回的抽取n个数,如n=1000 试以标准正态分布为例实现上述分布,并与R中的正态分布rnorm()进行比较,将作图区域分为左右两部分

? 使用rnorm()抽取n=1000个标准正态分布随机数,并在左侧区域画出相应的直

方图和核密度估计曲线

? 用格式化离散点抽样化方法完成抽样,并在右侧区域画出相应的直方图和核密度估

计曲线,离散化所有的N=1000,n=1000,取点范围为[-4,4]. 答:N1000=seq(-4,4,length=1000)