数学建模报告公司的销售额预测汇编 下载本文

内容发布更新时间 : 2024/12/24 9:57:08星期一 下面是文章的全部内容请认真阅读。

公司的销售额预测

一、问题重述

某公司想用全行业的销售额作为自变量来预测公司的销售量,下表给出了1977—1981年公司的销售额和行业销售额的分季度数据(单位:百万元)

年 季 t 1 2 3 4 5 6 7 8 9 10 公司销售额y 20.96 21.40 21.96 21.52 22.39 22.76 23.48 23.66 24.10 24.01 行业销售年 额x 127.3 130.0 132.7 129.4 135.0 137.1 141.2 142.8 145.5 145.3 季 t 11 12 13 14 15 16 17 18 19 20 公司销售额y 24.54 24.30 25.00 25.64 26.36 26.98 27.52 27.78 28.24 28.78 行业销售额x 148.3 146.4 150.2 153.1 157.3 160.7 164.2 165.6 168.7 171.7 1977 1 2 3 4 1978 1 2 3 4 1979 1 2 1979 3 4 1980 1 2 3 4 1981 1 2 3 4 表1 公司的公司销售额和行业销售额的分季度数据(单位:百万元)

(1)画出数据的散点图,观察用线性回归模型拟合是否合适.

(2)建立公司销售额对全行业的回归模型,并用DW检验诊断随机误差项的自相关性.

(3) 建立消除了随机误差项自相关性之后的回归模型.

二、问题分析与假设

销售收入预测的方法主要有时间序列法、因果分析法和本量利分析法等. 时间序列法,是按照时间的顺序,通过对过去几期实际数据的计算分析,确定预测期产品销售收入的预测值.

表1 的数据是以时间顺序为序列的,称为时间序列.由于公司销售额和行业销售额等经济变量均有一定的滞后性,因此,在这样的时间序列数据中,同一变量的顺序观测值之间出现相关现象是很自然的.然而,一旦数据中存在这种自相关序列,如果仍采用普通的回归

1

模型直接处理,将会出现不良后果,其观测也会失去意义,为此,我们必须先来检验数据是否存在自相关,一旦存在,就要考虑自相关关系,建立新的模型.

定义与符号说明

xt yt ?t y 行业销售额 公司销售额 公司销售额的估计值 三、模型建立与求解

一、基本统计回归模型建立

以行业销售额xt为自变量、以公司销售额yt为因变量的散点图,其中t?1,2?20

图1 yt对xt的散点图

从图1可以看出,随着行业销售额的增加,公司销售额也增加,而且两者有很强的线性关系,因此可以建立线性回归模型

yt??0??1xt??t,?t为随机误差 ?1? 假设?t与xt是相互独立的,且?t服从均值为零的正态分布.

由表1的数据以及上述线性回归模型的假设,进行数据处理,得到回归系数估计值及其置信区间和检验统计量,见表2.

2

参数 ?0 参数估计值 -1.45475 0.176283 表2 模型?1?的计算结果

置信区间 [-1.90465 -1.00485] [0.173248 0.179318] ?1 R2?1 F?14888 p?0.00000 将参数估计值代入?1?得到,

?t??1.45475?0.176283xt ?2? y由表2知R2?1,yt几乎处处可由?2?确定.用Matlab作出其交互式画面,由此可以给出不同水平下的预测值及其置信区间,通过左方的Export下拉式菜单,可以输出模型的统计

结果,见图2.

图2 回归分析中的交互式画面

二、自相关性的判别

我们可以看到模型?2?的拟合度很高(R2?1),即可认为yt可由模型确定.但此模型并未考虑到我们的数据是一个时间序列.在对时间序列数据做回归分析时,模型的随机误差项可能存在相关性,违背于模型对t独立的基本假设.现在我们考虑如下模型:

yt??0??1xt??t ?3?

?t???t?1?ut其中?是自相关系数,??1,ut相互独立且服从均值为0的正态分布.

模型?3?中,若??0,则退化为普通的回归模型;若??0,则随机误差?t存在正的自相关;若??0,则随机误差?t存在负的自相关.大多数与经济有关的时间序列数据,在经济规律作用下,一般随着时间的推移有一种向上或向下的变动趋势,其随机误差表现出正相关性.

D?W检验是一种常用的诊断自相关现象的统计方法.首先根据模型?2?得到的残差,计算DW统计量如下:

3

DW??(e?ett?2nt?1)2?et?1n ?4?

2t?t为随机误差项的估计值.当n较大时, 其中n是观察值个数,残差et?yt?yn??ee??tt?1?? DW?2?1?t?2n?et2????t?1??

?5?

而?5?式的右端

?eet?2ntt?1?et?1n?,于是 正是自相关系数?的估计值?2t?) ?6? DW?2(1????1,所以0?DW?4,并且若??在0附近时,则DW在2附近,?t的自相关性由于?1???在?1附近时,则DW在0或4附近,?t的自相关性很强. 很弱(或不存在自相关性);若?要根据DW的具体数值来确定是否存在自相关性,应该在给定的检验水平下依照样本容量和回归变量数目,查D?W分布表,得到检验的临界dL和dU,然后由表3中DW所在的区间来决定. 0~dL dL~dU 4?dU~4?dL 4?dL~4 2 正自相关 不能确定 无自相关 不能确定 负自相关 表3 与DW值相对应的自相关状态 三、加入自相关后的模型

根据?4?式可计算出DW?0.73465,对于显著性水平??0.01,n?20,q?1,查D?W分布表,得到检验的临界值dL?0.95和dU?1.15,现在DW?dL,由表3可以认为随机误

??0.63268. 差存在正自相关,且?的估计值可由?6?式得?作变换,

yt'?yt??yt?1,xt'?xt??xt?1, ?7? 则模型?3?化为

' yt'??0'??1'xt'?ut,其中?0??0?1???,?1'??1 ?8?

以?的估计值代入?7?式作变换,利用变换后的数据yt'、xt'估计模型?8?的参数,得到的结果见表4,可以得到其剩余标准差为0.067. 变换变量yt'?yt??yt?1和xt'?xt??xt?1 回归系数 ?0' 估计回归系数 'b0??0.39141 置信区间 [-0.74396 -0.03887] [0.16748 0.18000] ?1' b1'?0.17374 R2?1 F?3431.16 p?0.0000 表4 模型?8?的计算结果 对模型?8?也做一次自相关检验,即诊断随机误差ut是否还存在自相关,从模型?8?的残差

4

可计算出DW?1.65199,对于显著性水平??0.01,q?1以及n?19时,检验的临界值为dL?0.93,dU?1.13,故dU?DW?4?dU,所以可以认为随机误差不存在自相关.因此经变换?7?得到的回归模型?8?是适用的.

最后,将模型?8?中的yt'和xt'还原为原始变量yt和xt,得到结果为:

?t??0.39141?0.63268yt?1?0.17374xt?0.10992xt?1 ?9? y四、结果分析与预测

从机理上看,对于带滞后性的经济规律作用下的时间序列数据,加入自相关的模型

?9?更为合理,而且在本例中,衡量与实际数据拟合程序的指标——剩余标准差从模型?2?的0.081减少到0.0671.当用模型?9?对公司的销售额yt作预测时,先估计未来的全行业销

?t=29.1860. 售额xt,比如,设t=21时,xt=174.1,容易由模型?9?得到y

四 、模型的评价

一、模型的优点

经D?W检验认为普通回归模型?1?的随机误差存在自相关,由?4?,?7?式估计出自

相关系数?后,采用变换?8?的方法得到模型?9?,成称为广义差分法.这种方法消除了原模型随机误差的自相关性,得到的?9?式是一阶自相关模型.

二、模型的缺点

D?W检验和广义差分法在经济数据建模中有着广泛的应用,但是也存在着明显的不足:若DW的数值落在无法确定自相关性的区间,则只能设法增加数据量,或选用其他方法;如果原始数据序列存在高阶自相关性,则需要反复使用D?W检验和广义差分,直至判定不存在自相关为止.另外,D?W分布表中数据容量n的下限是15.

参考文献

[1] 徐金明,张孟喜,丁涛,《MATLAB实用教程》,北京:清华大学出版社;北京交通大学出版社,2005.7(2007.8重印).

[2]. 姜启源,谢金星、叶俊,《数学模型(第四版)》,北京:高等教育出版社,20011.1(2012.5重印).

5