万变不离其宗:2017高中数学课本典例改编之必修二、三:专题五 统计 Word版含解析 下载本文

内容发布更新时间 : 2024/11/10 12:43:01星期一 下面是文章的全部内容请认真阅读。

一、题之源:课本基础知识

1.简单随机抽样

(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样. (2)常用方法:抽签法和随机数法. 2.系统抽样

(1)步骤:①先将总体的N个个体编号;

②根据样本容量n,当是整数时,取分段间隔k=; ③在第1段用简单随机抽样确定第一个个体编号l(l≤k); ④按照一定的规则抽取样本.

(2)适用范围:适用于总体中的个体数较多时. 3.分层抽样

(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. (2)适用范围:适用于总体由差异比较明显的几个部分组成时. 4.三种抽样方法的比较

类别 简单随机抽从总体中逐个抽取 样 将总体平均分成几部在起始部分抽样分,按事先确定的规系统抽样 则分别在各部分中抽机抽样 取 性相等 各层抽样时采用将总体分成几层,按分层抽样 各层个体数之比抽取 系统抽样

5.统计图表的含义

分组成 简单随机抽样或明显的几部总体由差异时,采用简单随体数较多 抽到的可能总体中的个每个个体被抽样过程中法 体数较少 各自特点 相互联系 最基本的抽样方适用范围 总体中的个共同点 NnNn(1)频率分布表

①含义:把反映总体频率分布的表格称为频率分布表. ②频率分布表的画法步骤:

极差

第一步:求极差,决定组数和组距,组距=;

组数

第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.

(2)频率分布直方图:能够反映样本的频率分布规律的直方图.

(3)频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.

(4)总体密度曲线:如果将样本容量取得足够大,分组的组距足够小,则相应的频率折线图将趋于一条光滑曲线,即总体密度曲线. (5)茎叶图的画法步骤

第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 6.样本的数字特征

(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.

(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据叫做这组数据的中位数. (3)平均数:把

a1+a2+…+an称为a1,a2,…,an这n个数的平均数.

n(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是

s= s2=

n1

1222[(x1-x)+(x2-x)+…+(xn-x)]

n7.变量间的相关关系

(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.

(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相

关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 8.两个变量的线性相关

(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.

--

∑ x i y i-nxyi=1

-22∑x i -nx i=1

nn^^^^

(2)回归方程为y=bx+a,其中b=^-^- ,a=y-bx.

n(3)通过求Q=∑ (yi-bxi-a)的最小值而得出回归直线的方法,即求回归直线,使得样本数

i=1

2

据的点到它的距离的平方和最小,这一方法叫做最小二乘法. (4)相关系数:

当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变

量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性. 9.独立性检验

假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:

x1 x2 总计 2

y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d n(ad-bc)2K=(其中n=a+b+c+d为样本容量).

(a+b)(a+c)(b+d)(c+d)

二、题之本:思想方法技巧

1.简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,它的特点是: (1)它要求总体个数较少; (2)它是从总体中逐个抽取的; (3)它是一种不放回抽样.

2.系统抽样又称等距抽样,号码序列一旦确定,样本即确定好了.但要注意,如果编号的个体特