内容发布更新时间 : 2024/11/17 1:38:42星期一 下面是文章的全部内容请认真阅读。
回归分析的基本思想及其初步应用
学习目标:1.利用散点图认识变量间的相关关系. 2.通过求线性回归方程,探究相关性检验的基本思想. 1.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关指数和残差分析. 2.教学难点:解释残差变量的含义,回归直线系数的计算求解. 方 法:合作探究 新知导学: 知识点1:相关关系 下列图中的y与x相关吗? 课堂随笔: 1.当一个变量取值改变时,另一个变量的取值随之改变,但带有__________,这样的两个变量之间的关系叫做相关关系. 知识点2:线性回归分析 2.回归分析是处理两个变量之间__________常用的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回归分析为______________. 3^^^^回归直线方程为y=bx+a,其中b=^__________________ a=__________,__________称为样本点的中心. 4.线性相关关系强与弱的判断:用相关系数r来描述线性相关关系的强弱.当r>0时,表明两个变量__________;当r<0时,表明两个变量__________.r的绝对值越接近1,表明两个变量的线性相关性越_______;r的绝对值接近于0时,表明两个变量之间______________线性相关关系.通常当|r|大于______时,认为两个变量有很强的线性相关关系. 5.随机误差的概念:当样本点散布在某一条直线的附近,描述两个变量之间的关系是用线性回归模型____________来表示,其中________为模型的未知参数,______称为随机误差.
6.随机误差的概念:当样本点散布在某一条直线的附近,描述两个变量之间的关系是用线性回归模型____________来表示,其中__________为模型的未知参数,________称为随机误差. 7.回归效果的刻画 我们也可以用相关指数R2来刻画回归的效果,其计算公式是R2=________________. 在线性回归模型中,R2表示解释变量对预报变量变化的__________. R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越________. 知识点3:残差分析 8.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后,通过残差________________来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析. 9.利用图形来分析残差特性,作图时纵坐标为_____,横坐标可以选为________,这样作出的图形称为残差图.如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在_______ _________中,说明选用的模型比较合适.这样的带状区域的宽度越____,说明模型拟合精度越高,回归方程的预报精度越高. 回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法转化为线性回归问题. 牛刀小试1.设有一个回归方程为y=2-2.5x,当变量x增加一个单位时( )A.y平均增加2.5个单位 B.y平均增加2个单位C.y平均减少2.5个单位 D.y平均减少2个单位 ^2.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 3.(2015·湖北文)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关
4.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( ) A.l1和l2有交点(s,t) B.l1与l2相关,但交点不一定是(s,t) C.l1与l2必定平行 D.l1与l2必定重合 5.(2015·山东沂水县高二期中)已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是__________. 典例分析 类型一:概念的理解和判断 例1:有下列说法: ①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表 后记与感悟: ^^^③通过回归方程y=bx+a可以估计观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验. 其中正确命题的个数是( )A.1 B.2 C.3 D.4 示; 跟踪训练1: 下面变量关系是相关关系的是( ) ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A.①② B.①③ C.②③ 类型二:回归直线方程 例2:假设关于某设备的使用年限x和所支出的维修费y(万元)有如下的统计:x y 2 2.2 3 3.8 4 5.5 5 6.5 6 7.0 D.②④ 若由资料可知,y对x呈线性相关关系. (1)求线性回归方程; (2)估计使用年限为10年时,维修费用是多少万元?