已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
葡萄酒的评价模型 摘要 近年来 我国掀起了一场葡萄酒热 对葡萄酒的需求与日俱增 特别是随着食品科学 技术的发展 人们不再满足传统感官评价葡萄酒的水平 如何运用数据资料定量研究葡 萄酒的品质 加快建立葡萄酒市场指标规则成为人们关注的焦点 本文通过对感官评价 分析 结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据 建立了客观可靠的葡 萄酒质量综合评价模型 针对问题一 本题需要检验两组品酒员的评价结果是否存在显著差异 并选出更可 靠的一组 我们将各种葡萄酒的10个二级指标得分 相加得到每种酒的总分 在判断知每 组品酒员的评价总分均服从正态分布后 用 检验分析两组品酒员对各葡萄酒评价的差异 性 由此计算得到两组评价的显著性差异率为13 36 即总体上两组品酒员的评价不存在 显著差异 但由于两组品酒员的评价仍存在部分差异 我们比较两组品酒员对55种葡萄 酒评价的方差 发现第二组评分的方差普遍小于第一组 所以第二组的评价结果更可信 针对问题二 为了对酿酒葡萄进行分级 我们将葡萄的理化指标作为媒介 先根据国 际指标制定适用于本题评分的分级标准 将葡萄酒进行分级 再根据理化指标经标准化 之后的数值 利用欧氏距离对酿酒的55种酿酒葡萄进行 型聚类分析 聚类得到红白葡萄 各六个分类后 再把各类酿酒葡萄对应至相应葡萄酒的等级 将酿酒红葡萄和酿酒白葡 萄各分为五级 针对问题三 由于各种酿酒葡萄的理化指标种类复杂 我们用主成分分析的方法 从 酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分 考虑到酿酒 葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系 我们建立多元 线性回归模型 得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系 关键词 显著性检验 聚类分析 主成分分析 多元回归 1 一 问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评 每个评酒员在对 葡萄酒进行品尝后对其分类指标打分 然后求和得到其总分 从而确定葡萄酒的质量 酿 酒葡萄的好坏与所酿葡萄酒的质量有直接的关系 葡萄酒和酿酒葡萄检测的理化指标会 在一定程度上反映葡萄酒和葡萄的质量 附件1给出了某一年份一些葡萄酒的评价结果 附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据 请尝试建立数学 模型讨论下列问题 1 分析附件1中两组评酒员的评价结果有无显著性差异 哪一组结果更可信 2 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级 3 分析酿酒葡萄与葡萄酒的理化指标之间的联系 4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响 并论证能否用葡萄和葡萄 酒的理化指标来评价葡萄酒的质量 二 问题分析 1 问题一的分析 已知两组品酒员分别对27个红葡萄酒样品和28个白葡萄酒样品在10个 二级指标的评分 利用二级指标的评分之和得到每个品酒员对每种酒的总分 判断不 同品酒员对同一葡萄酒的总分是否符合正态分布 若符合 则用 检验的双侧检验对 两组品酒员各葡萄酒的评价是否存在显著性差异 由于两组品酒员对相同葡萄酒的 评价可能存在显著差异 我们认为对同种酒的评价总分方差普遍小的一组更可信 2 问题二的分析 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系 而葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量 已知55种葡萄酒的 质量评分和酿酒葡萄的理化指标 需要对酿酒葡萄进行分级 我们将葡萄的理化指标 作为媒介 先根据国际指标将葡萄酒进行分级 再根据理化指标对酿酒的55种葡萄进 行聚类 最后将各类酿酒葡萄对应至相应的等级 对酿酒葡萄进行聚类前需要先进性 各理化指标数据的标准化处理 再利用欧氏距离定义类与类之间和样品与样品之间 的距离 最后逐步聚类 3 问题三的分析 由于各种酿酒葡萄的理化指标种类复杂 我们先用主成分分析的方 法提取出能清晰反映所有有效指标的几个新指标 首先对酿酒红葡萄和酿酒白葡萄 的27个有效指标中进行标准化处理 将标准化得到的矩阵导入 分别提取出累 计贡献率恰好大于80 的前几个主成分 考虑到酿酒葡萄经化学反应酿造成葡萄酒的 过程中各项理化指标一般存在线性关系 随后我们建立葡萄酒新指标关于酿酒葡萄 的多元线性回归模型 得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系 三 模型的假设 1 同种葡萄的各理化指标和质量均相同 2 所有葡萄酒的酿造工艺和酿造环境相同 3 酿造葡萄和葡萄酒中未测到的芳香物质含量为零 2 四 符号说明 符号意义 第 个品酒员对第 种酒的第 个二级指标的评分 第 个品酒员对第 种酒的总分 品酒员对第 种葡萄酒评价总分的均数 2 品酒员对第 种葡萄酒评价总分的方差 第 个酿酒葡萄 第 个酿酒葡萄与第 个酿酒葡萄之间的距离 第 种葡萄的第 项指标 葡萄酒的第 项理化指标 五 模型的建立与求解 5 1问题一 两组品酒员评价的差异分析模型 5 1 1数据的预处理 1 数据的观察 在附件一葡萄酒品尝评分表中有两组品酒员分别对每种葡萄酒的评分 每组均有10个品酒员 评分标准分为4个一级指标 一级指标下又分为10个二级指标 每个二级指标的分值如下表 各指标总分为100 图1 葡萄酒指标及分值 观察数据发现 第一组7号品酒员对白葡萄酒样品3的浓度评分77存在记录错误 第一组4号品酒员对红酒样品20的色调评分缺失 故用对应组其他品酒员的对应指标评分均值代替其评分 2 总分的计算 为第 个品酒员对第 种酒的第 个二级指标的评分 将各个指标的得 分相加得到第 个品酒员对第 种酒的总分 10 1 1 得到红葡萄酒27 10的矩阵 11 1 1 27 10 5 1 2差异分析模型的建立 1 图检验是否符合正态分布 3 正态分布是利用t检验两个独立样本是否有显著性差异的前提 我们利用 图 检验总体是否服从正态分布 具体方法如下 将两组20个品酒员对同一样品的评价总分按开序排列使 1 2 20 再计算样本均数 1 20 20 1 2 标准差 2 20 1 3 分位数 4 和正态分布表 对应分位置 其中 0 5 20 5 由 画出 图 与 比较 若 图与之吻合 则总体服从正态分 布 否则不服从 2 两个独立样本的t检验 假设 0 1 2 1 1 2 选用双侧检验 置信区间为95 计算统计量 1 2 1 1 2 1 2 1 2 2 1 2 1 1 1 1 2 6 查表得 2 若 2 则 0 05 接受 0 拒绝 1两个独立样本不具有显著差异 若 2 则 0 05 则两组品酒员对红葡萄酒样品1的评价不存在显著性差异 同理对27种红葡萄酒和28种白葡萄酒进行t检验的分析 记两组品酒员对第 种葡 萄酒的评价是否存在显著性差异为 1 2 55 其中27种红葡萄酒对应 1 2 27 28种 白葡萄酒对应 28 29 55 当 1时 存在显著性差异 当 0时 不存在显著 性差异 则55种葡萄酒 检验的结果如下表 5 表1 红 白葡萄酒的显著性分析结果 3 两组品酒员的评价结果差异分析 计算两组品酒员评价结果的显著性差异率 55 1 55 1 7 得到 13 36 十分小 故两组品酒员的评价结果总体上无显著性差异 5 1 3可信度分析模型的建立 由于两组品酒员对部分几种葡萄酒的评价结果存在显著性差异 我们需要建立模型 分析哪组的评价更加可信 我们利用方差可以反映同组10个品酒员对同种酒评价的波动 程度 建立方差模型分析可信度 代表同组品酒员对第 种葡萄酒评价总分的均数 2 代表同组品酒员对第 种葡萄酒 评价总分的方差 1 1 8 2 1 1 1 9 方差越小 即波动程度越小 代表评价更客观 5 1 4可信度分析模型的求解 求得两组各10个品酒员对55种葡萄酒评价总分的方差 以葡萄酒的种类为 轴 方差 为 轴 画在同一张折线图中 6 图3 两组品酒员评价的方差对比图 发现第二组10位品酒员对55种不同葡萄酒的评价总分方差折线整体明显低于第一组10 位品酒员对55种不同葡萄酒的评价总分方差折线 即第二组评分的波动程度普遍小于第 一组 第二组的评价结果更可信 5 2问题二 酿酒葡萄分级模型 5 2 1葡萄酒的分级 1 分级标准的制定 现在国际上对葡萄酒的分类流行用罗伯特 帕克的分类方法 即 表2 罗伯特 帕克分类法 评分等级 96 100分顶级葡萄酒 90 95分具有高级品味特征和口感的葡萄酒 80 89分品质优良 口感纯正 70 79分一般 略有瑕疵 60 69分低于一般 50 59分次品可以认为是一款不合格的葡萄酒 由于国际分类法是对评分为50 100的葡萄酒的分类 而本题中品酒员对葡萄酒的 评分分布在60 85分之间 故我们将葡萄酒的分级作适当调整 得到适用于本题的葡萄 酒分级标准 7 表3 葡萄酒分级标准 评分等级 80 85分一级葡萄酒 75 80分二级葡萄酒 70 75分三级葡萄酒 65 70分四级葡萄酒 60 65分五级葡萄酒 2 葡萄酒的分级结果 将55中葡萄酒根据评分对应至五个等级中 得到红葡萄酒的分级如下表 表4 红 白葡萄酒的分级 5 2 2基于Q型聚类的酿酒葡萄分类模型的建立 1 数据标准化 由于不同理化指标的单位不同 我们需要利用标准分数先对各理化指标的数据进行 标准化 10 得到矩阵 其中 表示第 个品酒员对第 种葡萄酒评价总分经标准化后的数据 11 1 1 2 类间距离的定义 在对有 个理化指标的酿酒葡萄进行聚类分析的过程中 利用欧氏距离定义两类理化 指标样本的距离 为第 个酿酒葡萄 与第 个酿酒葡萄 之间的距离 1 2 11 3 Q型聚类的实现 8 将距离最近的两个类合并为一个类 类的数目减一 直至当前的类数目为一 5 2 2基于Q型聚类的酿酒葡萄分类模型的求解 1 酿酒葡萄的聚类图 图4 红葡萄聚类图 图5 白葡萄聚类图 2 酿酒葡萄的聚类分析 将红葡萄和白葡萄根据聚类图各分成六类 9 表5 酒葡萄的分类 5 2 3酿酒葡萄的分级 酿酒葡萄的理化指标反映了葡萄的种类 同类葡萄质量相似 酿酒葡萄的质量又与葡 萄酒的质量有密切的关系 所以我们将葡萄酒的分级与酿酒葡萄的分类结合 得到酿酒 葡萄的分级 结果如下表 表6 红 白葡萄的分级 5 3问题三 酿酒葡萄与葡萄酒理化指标联系模型 5 3 1基于主成分分析的降维模型的建立 1 数据标准化 由于各指标的量纲和大小存在差异 首先需要用标准分数对数据进行标准化处理 方 法与5 2 2中第一步相同 2 选取主成分 27个红葡萄样本标准化之后的理化指标构成矩阵 由于果皮颜色只对葡萄本身 的观赏性存在影响而对所酿葡萄酒的质量无明显影响 我们只对其他27个指标进行 了主成分分析 将 导入 得到个第 1 2 27 个主成分 及其贡献率 越大 则主成 分 对模型的贡献率越大 对 1 2 27分别称为第一主成分 第二主成分 前 面几个主成分构成了样本空间的最大变化特征 10 计算前 个主成分的累计贡献率 1 12 使 恰好 80 此时选取 个主成分作为酿酒葡萄样本的新指标 5 3 2基于主成分分析的降维模型的求解 红 白葡萄酒分别选取前8个和前9个主成分时 主成分的累计贡献率分别为82 842 和82 275 恰好可以作为酿酒葡萄样本的新指标 红 白葡萄酒主成分的贡献率和到第 个主成分的累计贡献率分别如下表 表7 红葡萄酒理化指标主成分 表8 白葡萄酒理化指标主成分 则对于红葡萄酒 第一主成分主要反映了氨基酸 总糖 还原糖 可溶性固形物和干 物质含量的信息 第二主成分主要反映了总酚 自由基和苹果酸的信息 第三主 成分主要反映了多酚氧化酶活力 褐变度的信息 第八个主成分主要反映了蛋白 11 质 含量 和出汁率的信息 八个主成分可以简洁地反映红葡萄酒的27个理化指标 同 理 白葡萄酒的九个主成分可以简洁地反映白葡萄酒的27个理化指标 5 3 3葡萄酒理化指标关于酿酒葡萄的多元回归模型的建立 1 确定自变量 因变量和多元线性模型 通过对酿酒葡萄理化指标的主成分分析 多个理化指标已经合并为几个具有代表性 的主成分作为新指标 现我们将新指标对葡萄酒的每项理化指标进行多元回归 多元 线性回归的模型为 0 1 1 2 2 13 其中 1 2 为上一步提取出的酿酒葡萄主成分即为新指标 为葡萄酒的理 化指标 为测量误差向量 1 2 为回归系数 为葡萄酒的第 项理化指标 2 利用最小二乘法得到会回系数 的值 得到多元线性回归方程 0 1 1 2 2 14 5 3 4葡萄酒理化指标关于酿酒葡萄的多元回归模型的求解 对于红葡萄酒 利用所有酿酒葡萄样本的八个主成分值 对葡萄酒的七项一级理化指 标进行多元线性回归 红葡萄酒各理化指标的回归结果为 1 0 2199 1 0 0014 2 0 1215 8 2 0 3724 1 0 0352 2 0 1289 8 3 0 4214 1 0 0228 2 0 1755 8 4 0 2545 1 0 0043 2 0 1423 8 7 0921 1 0 0141 2 0 0921 8 15 其中 1 2 8为酿酒红葡萄提取出的八个主成分 1 2 7 为红葡萄酒的各项一级理 化指标 由各回归系数的正负值和大小可得出结论 酿酒红葡萄的第一 三主成分与红葡 萄酒的理化指标存在较强的正相关关系 即红葡萄中的氨基酸 总糖 还原糖 可溶性固 形物 白藜芦醇 黄酮醇和可滴定酸等与红葡萄酒的理化指标存在较强的正相关性 果 梗比 果皮质量与红葡萄酒的理化指标存在负相关 对于红葡萄酒 各理化指标的回归 结果为 1 0 2191 1 0 0124 2 0 1901 9 2 0 3724 1 0 0352 2 0 1289 9 3 0 4132 1 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 互联网网络管理员岗前基础应用考核试卷含答案
- 农村房屋建设工程质量、安全协议书
- 函数综合压轴题(32题)原卷版-中考数学试题
- 模型变量筛选审核工作规则
- 解读现代诗歌
- 揭秘运动科学
- 揭秘色彩之谜
- 教育革新与社会进步
- 硕士学程攻略
- 第十章《常见的盐》复习题-2024-2025学年北京版九年级化学下册
- 河南省铭玮昊化工科技有限公司年产1000吨溴硝醇、100吨磺酰胺、200吨叔丁酯项目环境影响报告书
- 灭火器检查记录表模板实用文档
- 年产1万吨结晶木糖醇项目节能评估报告书
- 《赢利 未来10年的经营能力》读书笔记PPT模板思维导图下载
- 2023年成都交子金融控股集团有限公司招聘考试备考题库及答案解析
- 陕西天使康健生物工程有限公司年产15吨香紫苏醇提取精制项目环境影响报告表
- YS/T 337-2009硫精矿
- 《语言学纲要》文字1课件
- 英语关联词汇总大全
- (完整版)基础工程习题集与参考答案
- 水稻全程机械化生产技术课件
评论
0/150
提交评论