通过统计分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量进行科学评价 下载本文

内容发布更新时间 : 2024/5/26 2:30:44星期一 下面是文章的全部内容请认真阅读。

龙源期刊网 http://www.qikan.com.cn

通过统计分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量进行科学评价

作者:王艺淳 吕宏伟 武采怡

来源:《中国科技博览》2013年第32期

摘要:本论文目的在于解决2012 年中国大学生数学建模比赛A题中的二题。分析过程是以红葡萄为样本,白葡萄的相关结论类似方法可得。论文的数据处理借助SPSS 统计软件。我们采用聚类分析的统计方法,使用K-Means Cluster 分类法将葡萄酒成为3 组,采用Wilks’ Lambda方法对分类的葡萄进行判别,判别标准采用F值判别法。

关键字:葡萄酒质量与等级 理化性质 相关分析 聚类分析与判别分析 回归分析 中图分类号:F426.31 文献标识码:A 文章编号:1009-914X(2013)32-005-01 一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论:

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 二、模型建立与求解

我们了解到葡萄的某些理化指标反应了葡萄酒的质量,其质量与附件一的列表中葡萄酒评分员评分情况有一定关联。使用Excel表格计算出每项酿酒葡萄理化指标的平均值,用SPSS软件计算出酿酒葡萄的理化指标与其质量的相关性,以决定对葡萄酒质量影响最大的理化指标。取定理化指标后,用SPSS软件将葡萄酒按照理化指标进行聚类分析以得到葡萄酒的分级情况,再对葡萄酒的分级依据(包括Fisher判别函数,典则判别函数散点图)进行说明。 2.1 根据相关性矩阵(如图1)找出和葡萄酒质量最相关的三个红葡萄理化指标,它们分别是DPPH自由值、总酚和葡萄糖总黄酮。

澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 平衡/整体评价

DPPH自由基 Pearson 相关性 -.104 .622** .585** .509** .564** .453* .394* .300 .165 .407* 显著性(双侧) .606 .001 .001 .007 .002 .018 .042 .129 .411 .035

龙源期刊网 http://www.qikan.com.cn

N 27 27 27 27 27 27 27 27 27 27

总酚 Pearson 相关性 -.389* .589** .390* .529** .496** .535** .640** .406* .386* .448* 显著性(双侧) .045 .001 .045 .005 .009 .004 .000 .036 .047 .019 N 27 27 27 27 27 27 27 27 27 27

葡萄总黄酮 Pearson 相关性 -.196 .544** .459* .577** .652** .594** .642** .356 .376 .504** 显著性(双侧) .328 .003 .016 .002 .000 .001 .000 .068 .054 .007 N 27 27 27 27 27 27 27 27 27 27 图 1

2.2 根据过程1中分析出的与葡萄酒质量最相关的葡萄理化指标,将红葡萄和白葡萄使用K-Means Cluster分类成为3组,供以后的判别分析使用,最终分类如图2(红葡萄) 样品编号 分类 样品编号 分类 样品编号 分类 葡萄样品1 1 葡萄样品10 3 葡萄样品19 1 葡萄样品2 2 葡萄样品11 3 葡萄样品20 3 葡萄样品3 1 葡萄样品12 3 葡萄样品21 1 葡萄样品4 3 葡萄样品13 1 葡萄样品22 1 葡萄样品5 1 葡萄样品14 1 葡萄样品23 2 葡萄样品6 3 葡萄样品15 3 葡萄样品24 3 葡萄样品7 3 葡萄样品16 3 葡萄样品25 3 葡萄样品8 1 葡萄样品17 1 葡萄样品26 3 葡萄样品9 2 葡萄样品18 3 葡萄样品27 3 图2

2.3 采用Wilks’ Lambda方法对图2中分类的葡萄进行判别,判别标准采用F值判别法,输出Fisher判别函数,用于对新样本的判别(以红葡萄为例)。

龙源期刊网 http://www.qikan.com.cn

红葡萄: 特征值

函数 特征值 方差的 % 累积 % 正则相关性 1 7.579a 96.7 96.7 .940 2 0.259a 3.3 100.0 .453 图3

图3列出了红葡萄的判别函数。

判别函数的特征值越大,表明该函数越具有区别力。红葡萄第一个判别函数的特征值为7.579,第二个判别函数的特征值为0.259。最后一列为典型相关系数,表示判别函数分数与组别间的关联程度。

下面在用Wilks 的 Lambda方法判断函数显著性: Wilks 的 Lambda

函数检验 Wilks 的 Lambda 卡方 df Sig. 1到22 .093 55.916 4 .000 .794 5.406 1 .020 图4

2.4 分级判断标准的Fisher判定函数。 分类函数系数 案例的类别号 1 2 3

葡萄总黄酮 .223 1.651 .231 总酚 2.791 4.086 1.545 (常量) -26.159 -76.266 -9.328