葡萄酒_数学建模_第1页
葡萄酒_数学建模_第2页
葡萄酒_数学建模_第3页
葡萄酒_数学建模_第4页
葡萄酒_数学建模_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 西 安 邮 电 大 学 (理学院) 数学建模报告葡萄酒的评价 专业名称: 信息与计算科学班 级: 1302班 学生姓名: 张梦倩学号(8位): 07131057指导教师: 支晓斌1、 问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.

2、 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。二、问题分析这是一个关于大型数据处理和分析的问题。问题1要求我们分析两组评酒员评价结果有无显著差异。利用多元统计分析的相关知识,先对原始评分数据进行了检验,进而通过差异性检验得出两组评论结果具有显著性差异。利用SPSS软件绘制出第一组红、白葡萄酒以及第二组红、白葡萄酒在评酒员评价结果下的评分分布直方图,得出数据基本服从正态分布,利用Q-Q图对其进行正态性分布检验,得出有无显著性差异关于问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。综合考虑葡

3、萄酒质量和葡萄理化指标与葡萄质量的相关性,以品酒员的感官评价为主,葡萄理化指标为辅,采用逐步回归分析、聚类分析、判别分析的数学方法,建立了葡萄分级模型,利用此模型对酿酒红、白葡萄进行分类,得出可靠结果。3、 基本假设1、 假设品酒员给出的葡萄酒评价能够准确反映葡萄酒的质量;2、 假设附件三数据中芳香物质数据的单位不一定相同;3、 假设现有的评价体系能够准确的反映葡萄酒的质量。4、 符号说明1、 表示第j号品酒员对第i号酒样的评分;2、 表示葡萄酒各个理化指标(一级);3、 表示酿酒葡萄各个理化指标(一级);4、 表示品酒员对葡萄或葡萄酒的综合评分;5、 表示度量酿酒葡萄与分级标准的“距离”;6

4、、 表示葡萄或葡萄酒的芳香物质。5 模型建立、求解与结果分析1、问题1的求解 先进行分布检验,选择合适的检验的方式对差异性进行检验,否则进行非参数检验。评价可信程度,选用离差平方和。通过对附件1 数据的观察,可知葡萄酒样品的评价项目满分为100,葡萄酒外观、香气、口感以及平衡、整体评价等指标在其中占有一定比例。仔细观察数据可得部分数据有错误,为了减少其对结果分析的影响,我们取均值代替异常数据。将每个表格中10个品酒员对某一种酒打分求其平均作为该酒的最终得分,绘制出频数分布图进行初步分析,再通过SPSS软件绘制出红、白葡萄酒在两组评酒员评价结果下的评分分布直方图:(左图为样酒真实得分所得直方图和

5、正态曲线,右图为取整后所得的直方图图)第一组红葡萄酒:第一组白葡萄酒第二组红葡萄酒:第二组白葡萄酒:结论:通过对图像的观察分析,可以大致预科葡萄酒样品质量及其对应的数量分布呈正态分布。接下来进行数据分布的正态性检验。为了对这一预测进行更精确的验证,下面分别使用统计软件SPSS中提供的Q-Q图检验对数据进行正态性分布检验。 Q-Q图检验:第一组红葡萄酒:第一组白葡萄酒:由Q-Q图得,第一组图离散情况较为一般,并不严格离散在分布线上,第二组图大量数据集中在0.5-1.0之间,虽无数据超过1.0,单集中在0.5之内的数据同样不足。于是得出结论:葡萄酒的样感官分析评价不符合正态分布,但是将数据取整之后

6、画出直方图较之前的数据得图部分可近似认为服从正态分布。所以接下来使用非参数检验来确定是否有显著性差异。非参数检验:秩和检验基本步骤为:(1)建立假设:差值的总体中位数为0,:差值的总体中位数部位0,检验水准为0.05;(2) 算相各对值的代数差;(3) 根据差值的绝对值大小编秩;(4) 将秩次冠以正负号,计算正、负秩和;(5) 用不为“0”的对子数n及T(任取T+或T-)查检验界值表得到P值。得红葡萄酒秩和检验结果:得白葡萄酒秩和检验结果:由上述秩和检验结果可得出,红葡萄酒和白葡萄酒的两组评价具有显著性差异。进一步我们判断这两组数据的可靠性。我们假设为第j号评酒员对第i号酒样的评价分数,则每一

7、酒样的评分误差程度为: 此处为10名品酒员对第i号酒样评价离散程度的衡量指标。 此处为第j名品酒员对110号酒样评价的离散程度的衡量指标。 我们认为,不同专家对同一酒样的评分差距越小时,说明该评分越是能被大多数人接受。当一名专家对不同酒样给出的评分差异比较明显时,该评分也能被大多数人接受。综上所述我们建立可靠性指标:(1)同一样品酒的得分离散度越小越好;(2)同一品酒员对不同品质的酒评分离散度越大越好。可得到: 红葡萄酒白葡萄酒第一组52.4063106.1114第二组30.4114850.4175结论:第二组的样品酒的离散程度更小,第二组对样品酒一致性更高。 第一组第二组红葡萄酒52.176

8、5415.2383白葡萄酒22.44499.695735结论:第一组的品酒员分数离散度更大。综上所述,两组在可靠评价指标上各具有一定优势。故考虑权重,我们比较查阅相关饲料得出,同一样品酒的得分离散度越小越好这一指标所占权重较第二个条件更大,因此选取第二组数据可信度更高。5.2问题2的求解 问题2要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,葡萄酒的质量很大程度上取决于酿酒葡萄的质量,但也与酿酒葡萄的的理化指标有关,所以这些因素都要考虑进去。我们先对理化指标数据进行标准化处理,公式如下:为某种理化指标原始数据,为该理化指标标准差。利用多元统计分析中逐步回归的思想,把葡萄酒评分作

9、为因变量,对应的酿酒葡萄理化指标作为自变量,将酿酒葡萄的理化指标逐个加入到函数中进行拟合,若相应的统计量是检验显著的则保留该变量,检验不显著则剔除该变量。令为标准化处理后的葡萄酒评分,分别对应酿酒葡萄的30种理化指标(一级),建立如下形式的函数:其中和为待估参数,为残差。由对进行逐步回归,得出函数,再利用函数关系可获得各个酿酒葡萄样本所酿葡萄的预期评分。接下来对各葡萄酒的得分进行聚类分析,我们采用对样本进行聚类的Q型聚类,利用SPSS进行聚类分析,再根据各类平均得分的高低进行分级,得出初步结果,考虑到分级的合理性,我们将红、白葡萄酒各分为四级(一级最优,四级最劣),在各级别内,对各葡萄酒样品的

10、评分求均值得到该评级葡萄酒的基准分。结果如下:葡萄酒的分类标准: 评级基准分葡萄酒 一级二级三级四级 红葡萄酒1.1390.338-0.538-1.559白葡萄酒0.533-0.08-0.652-1.646通过文建立酿酒葡萄理化指标和葡萄酒评分的函数关系,得到各个葡萄样本所酿葡萄酒的预期评分,我们参考欧式空间距离的概念,利用预期评分与葡萄酒各评级基准分之间的“距离”来判断酿酒葡萄与各个等级之间的“远近关系”,进而实现对酿酒葡萄的分级公式如下:,经判别,分级结果如下表:红葡萄样本分级:葡萄样本1234567891012131415分级31122333134332葡萄样本15161718192021222324252627分级3323212212323白葡萄样本分级:葡萄样本1234567891012131415分级22211323113322葡萄样本1516171819202122232425262728分级141222112212216、 实验心得 在这个模型的建立中用到很多的数学软件,有的我还不是很熟悉,但是它有很重要,需要用这些软件去对数据处理,计算等,还需

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论