




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 关于葡萄酒评价问题的研究关于葡萄酒评价问题的研究 摘要摘要 现今的葡萄酒评价机制主要依靠评酒员对葡萄酒样品的色 香 味的判断 然后进行打分 这种评价机制存在很大的主观性和局限性 本文通过评酒员的打 分 酿酒葡萄以及葡萄酒的各项指标等因素结合起来以寻求一种更加科学的葡萄 酒评价机制 问题一我们建立了秩和检验模型 模型结果表明两组评酒员的评分具有显 著性差异 为比较两组评酒员的可靠性 我们首先通过置信区间法对两组评酒员 评价数据进行了分析 改善由于评酒员本身主观因素导致评价数据的差异性 然 后通过单因素方差分析了每组评酒员评价结果的稳定性 得出第二组评酒员对葡 萄酒样品的评价结果更加可信 问题二我们首先建立了主成份分析模型 给出了葡萄理化指标的八个主成 份 这些主成份包含了所有指标 85 以上的信息 然后利用多元线性回归模型给 出了这八个主成份与葡萄酒质量之间的具体关系 0112288 Yaa Xa Xa X 其中 0128 a a aa 依次为 70 5148 0 7109 0 9129 0 1593 1 1742 0 5779 0 4239 0 1703 0 4719 并结合打分情况给出了样品葡萄的排序 最后结合总成分评价值给出了酿酒葡萄的具体分级 问题三我们建立了典型相关分析模型 利用问题二中得到的葡萄与葡萄酒 理化指标的主成份 再利用 spss 软件给出了葡萄酒与葡萄的理化指标主成份之 间的相关系数 从而得到两组主成份之间的内在数值联系 再根据主成份中理化 指标所占的权重得到葡萄与葡萄酒理化指标之间的联系 问题四与问题二的解决方法类似 通过给出葡萄以及葡萄酒理化指标对葡 萄酒质量的影响 给出了指标评价与人工评价之间的比较 然后结合芳香物质对 模型做了进一步改进 得到了更加合理的评价结果 关关键字键字 秩和检验 主成份分析 置信区间法 多元线性回归 相关性分析 2 一 问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分 然后求和得到其总分 从而确定葡 萄酒的质量 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系 葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量 需要建立数学模 型讨论下列问题 1 分析两组评酒员的评价结果有无显著性差异 判断哪一组结果更可信 2 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级 3 分析酿酒葡萄与葡萄酒的理化指标之间的联系 4 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响 并考虑能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量 二 问题分析 分析第一问可以知道问题是先分析有无显著性差异 若是有显著性差异才可 进一步分析哪一组更可信 对于显著性分析我们又必须对酒进行分类 从而对两 组进行显著性分析 作显著性分析要对数据进行处理 我们取每组评委对每类酒 中的每种酒的均值为显著性分析的数据组 因为是均值我们首先会想到t检验 但 Q Q 图检验后发现都不是正态分布 所以使用t检验 那么对数据观察可以知 道 两组数据形态近似相同且两组数据个数都大于 10 因此我们可以引进比t检 验弱化条件的近似正态性秩和检验 结果要是在接受域内就没有显著性差异 要 是在拒绝域内就有显著性差异 在有显著性差异的前提下我们去分析哪一组可信 度更高 我们可以对两组评委对每种葡萄酒的评价为出发点利用置信区间法对两 组评委的可行性进行评估 问题二中通过对酿酒葡萄的理化指标以及葡萄酒质量的相关数据的研究我 们发现 酿酒葡萄的理化指标过于冗杂 而且理化指标之间也存在着各种错综复 杂的联系 这种关系严重阻碍了对问题的进一步探究 因此我们首先考虑是否能 将酿酒葡萄的理化指标进行简单处理 即通过几个有代表性的综合指标来取代原 有的指标 于是我们首先想到使用主成分分析原理寻找酿酒葡萄理化指标的主成 分 在此基础之上我们将这些指标和葡萄酒的质量进行综合以求更加合理的对酿 酒葡萄进行分类 我们通过多元线性回归分析和主成分分析原理的综合使用最终 对给定的 27 种葡萄样品 这里仅以红葡萄为例 分别进行了打分 最后我们对 所得数据进行进一步的分析整合 给出了一种依据酿酒葡萄的理化指标和葡萄酒 对酿酒葡萄进行分级的方案 问题三要求分析酿酒葡萄与葡萄酒的理化指标之间的联系 首先通过对附件 二数据的分析 发现葡萄的理化指标太多 主要体现在分为一级指标和二级指标 而且数据有些是测量多次 故进行主成分分析需要对变量进行降维 对于多次测 量的数据进行平均 对降维之后的变量进行典型相关相关分析 得出酿酒葡萄与 葡萄酒的理化指标之间的联系 由于问题四与问题二有一定的相似性 所以我们首先考虑对问题二的模型 3 进行加工以顺利解决问题四 由于问题二中已经得到各个葡萄样品的综合主成分 评价 值 因此我们在这里只需计算各个葡萄酒样品的综合主成分 评价 值 在 此基础之上我们再次使用多元线性回归 使得各个葡萄酒样品质量的综合主成分 评价 值与评酒员对各个葡萄酒样品的打分相吻合 以达到通过葡萄酒样品和葡 萄样品的各个指标就能判断出葡萄酒质量的目的 但我们必须清楚只依据样品这 两项的各个指标很难达到我们的目标 所以我们进一步考虑增加更多的指标以寻 求对葡萄酒质量作出更加精准的评价 在此 我们引入葡萄和葡萄酒的各项芳香 物质含量 并对此数据进行聚类分分析处理 从而达到降维的目的 然后我们再 对所得数据重复以上操作 作出新的多元回归拟合 三 模型假设 1 两组评酒员在评论时相互之间不会受到令一组的影响 2 所有同种葡萄酒的酿造工艺完全相同 3 所给数据的测量都不受外部因素的影响 4 评酒员评分时的标准都是相同的 四 符号说明 T 总体观察值的秩和 1 n 2 n 分别代表相同种类酒的总数 j x j 评酒员对同一酒样的均值和标准差 i F 代表重新组合成一组新的互相无关的综合指标的主成份第i 个成份 Y 红葡萄酒的质量 Cov 协方差 Var 方差 五 模型建立与求解 5 1 问题一模型的建立与求解 5 1 1 两组评论员显著性差异模型的建立 对附录 1 的四组数据进行分析 可以发现四组数据可以按酒的种类分成两部 分如下 第一部分红葡萄酒 第一组红葡萄酒品尝评分 第二组红葡萄酒品尝评分 第二部分白葡萄酒 第一组白葡萄酒品尝评分 第二组白葡萄酒品尝评分 由上面的分类及其假设 对酒的评价标准都是相同的 因此我们完全可以把 每组评论员对每种编号酒的评价均值来对每种酒作显著性检验 因为是比较样本 4 均数是否具有显著性差异 所以我们自然想到利用两样本t检验 但两样本t检 验适用的范围是两独立正态总体且方差相同的数据 因此有必要首先对四组数据 进行正态性检验 对每组数据进行 Q Q 图正态检验 四组数据如下图 4 2024 50 60 70 80 90 Standard Normal Quantiles Quantiles of Input Sample 第 一 组 红 葡 萄 酒 品 尝 评 分 4 2024 60 65 70 75 80 Standard Normal Quantiles Quantiles of Input Sample 第 二 组 红 葡 萄 酒 品 尝 评 分 4 2024 60 70 80 90 Standard Normal Quantiles Quantiles of Input Sample 第 一 组 白 葡 萄 酒 品 尝 评 分 4 2024 65 70 75 80 85 Standard Normal Quantiles Quantiles of Input Sample 第 二 组 白 葡 萄 酒 品 尝 评 分 由上图我们可以发现在所给的四组数据中有部分点偏离理论直线的方程过 大 不符合正态分布 因此我们不使用t检验来检测两组评论员的评分是否有显 著性差异 对于这两个独立样本采用 Wilcoxon 秩和检验 由于在零假设下 两个总体的分布被假定是相同的且允许总体不服从正态分 布 秩和检验法就必然涉及到极端观察值出现的可能性 可以混合总体 即有 来自两个总体组成的数据中 用数据对应的秩 从最小到最大 替换数据本身 其中最小的数据秩为 1 最大数据秩为 12 Nnn 秩的大小与最小次小两值 或 最大次大两值 之间的距离无关 这样 极端值和统计量的影响就不像对t检验 影响那么大 以下是秩和检验统计量的计算包括如下步骤 1 将两个样本的数据一起从小到大进行排序 2 在下一列中 将数据从小到大进行编号 最小值对应于1 最大值对应于 N 这些序号就是相应观察值的秩 3 如果在混合样本数据中有相同的值 那么他们的秩就是他们几个秩和的均 值 4 令T表示总体1观察值的秩和 如果零假设为真 即两总体同分布 因此在零假设下 秩和分布就由总体容 量 1 n 和 2 n 惟一决定 在零假设下 T 的均值的方差分别为 112 1 2 T n nn 2 12 12 1 12 T n n nn 5 直观上 如果T比 T 小 或大 很多时 我们就有理由相信零假设不成立 即两个总体分布是不同的 秩和检验的拒绝域具体给出了 当零假设被拒绝时T 和 T 差异的大小 由于在零假设条件下 T分布和总体分布无关 因此 对于 给定的两组数据检验临界值与总体分布形状无关且两组数据都是大于 10 个数 据 T近似正态 这就使得我们可以在 Wilcoxon 秩和检验中用z统计量代替T T T T z 理论上 Wilcoxon 秩和检验要求总体分布是连续的 所以任意两个数值相等 的概率为 0 因为在许多研究中 我们只记录数据的几个小数位 这样 我们会 常常遇上数据相等的情况 即相等的观察值 在这种情况下 每个相等数据的秩 为这些相等数据秩的平均值 当有相等数据时 必须调整T的方差 调整后的方 差 2 T为 2 12 12 12 1212 1 1 12 1 k jj j t t n n nn nnnn T 这里k是相等数据的组数 j t 是 j 组相等观察值中数据的个数 注意 当没有相 等数据时 对所有的 j 1 j t 这时 2 12 12 1 12 nn nn T 从适用的角度看 除非有许多相等数据 否则 调整对 2 T的影响不大 将 正态近似的 Wilcoxon 秩和检验步骤总结如下 Wilcoxon秩和检验 0 H 为两个总体分布相同 H 分为下面三种情况 1 总体1是总体2 的一个右偏移 2 总体1是总体2 的一个左偏移 3 总体1和2互为平移 T S T T为总体1的秩和 R R 给定 0 05 查表得临界值 1 r 2 r 1 若 zz 则拒绝 0 H 2 若 zz 则拒绝 0 H 3 若 2 zz 则拒绝 0 H 检验假设 并得出结论 5 1 2 问题一显著性求解 第一题中 首先根据附件一四组数据 分别得出每一种葡萄酒在 10 位评酒 员评分下的平均数如下 表 1 组别 第一组红葡 萄酒 第二组红葡 萄酒 第一组白葡 萄酒 第二组白葡 萄酒 6 酒号 第 1 种酒均值 62 7 68 1 82 77 9 第 2 种酒均值 80 3 74 74 2 75 8 第 3 种酒均值 80 4 74 6 78 3 75 6 第 4 种酒均值 68 6 71 2 79 4 76 9 第 5 种酒均值 73 3 72 1 71 81 5 第 6 种酒均值 72 2 66 3 68 4 75 5 第 7 种酒均值 71 5 65 3 77 5 74 2 第 8 种酒均值 72 3 66 71 4 72 3 第 9 种酒均值 81 5 78 2 72 9 80 4 第10种酒均值 74 2 68 8 74 3 79 8 第11种酒均值 70 1 61 6 72 3 71 4 第12种酒均值 53 9 68 3 63 3 72 4 第13种酒均值 74 6 68 8 65 9 73 9 第14种酒均值 73 72 6 72 77 1 第15种酒均值 58 7 65 7 72 4 78 4 第16种酒均值 74 9 69 9 74 67 3 第 17 种总分 79 3 74 5 78 8 80 3 第18种酒均值 59 9 65 4 73 1 76 7 第19种酒均值 78 6 72 6 72 2 76 4 第20种酒均值 78 6 75 8 77 8 76 6 第21种酒均值 77 1 72 2 76 4 79 2 第22种酒均值 77 2 71 6 71 79 4 第23种酒均值 85 6 77 1 75 9 77 4 第24种酒均值 78 71 5 73 3 76 1 第25种酒均值 69 2 68 2 77 1 79 5 第26种酒均值 73 8 72 81 3 74 3 第27种酒均值 73 71 5 64 8 77 第28种酒均值 无 无 81 3 79 6 利用这些平均数做 Wilcoxon 两样本秩和检验 把第一组红葡萄酒品尝评分 均值与第二组红葡萄酒品尝评分均值看做为分别取自分布函数 F x G y 的简单 两组数据 F x G y 均未知 在求秩的过程中 先将两组数据按大小混合排列 然后进一步得到各个数据的秩 再算出第一组数据在混合数据中的秩和 m i i RT 1 1 mi 即因为本题中的 10 10mn 较大 故可用正态分布求T的近似临界值 1 r 与 2 r 即在显著性水平 下 拒绝域由 7 2 m n 1 2 P m n 1 12 m T mn 得出拒绝域 12 TrTr 或 其中 1 r 2 r由 1 2 2 2 m n 1 m n 1 21 2 m n 1 m n 1 21 2 mm n r mm n r 给出 首先提出假设 01 H F xG x HG X 其次取显著性水平 0 05 96 1 025 0 2 ZZ 54 27 27 nmnm 再者 0 H 的拒绝域为 27 2 1 T i i Rr 算出 T 882 8 12 r 629 205 r 855 795 因为 2 T r 故拒绝 0 H 即认为第一二 组红葡萄酒评酒员不服从同一分布 同理 第一二组白葡萄酒评酒员对 28 种白葡萄酒的评分中 T 666 1 r 678 3918 2 r 917 6082 因为 1 T r 故拒绝 0 H 即认为第一二组白葡萄酒评 酒员之间不服从同一分布 由上述结论可得两组评论员之间存在显著性差异 5 1 3 可信性模型建立 以第一组红葡萄酒品尝数据为例 说明模型建立过程 表 1 列出了由 10 名 评酒员对 27 种红葡萄酒评价得分 得分越高的样品 感官质量越高 将评酒员 看成不同的 区组 对表 1 的结果进行双向方差分析以减少误差方差 同时分 析不同评酒员之间是否存在差异 分析结果表明 由于评酒员之间存在显著性差 异 各组数据离平均值分散范围很大 从而降低了酒样间的方差 只有当酒样之 间的差异非常大时 才能得到显著性差异造成评酒员差异 评价尺度的差异 在感官评价中 每个评酒员都用自己的评价尺度对葡萄 酒进行评价 而且他们的评价尺度之间存在很大的差异 评价顺序的差异 有的评酒员的给分区间虽然相同 但他们的评价顺序却 存在着很大的差异 评价方向的差异 对于不同的酒样 一些评酒员认为是好的 而另一些 评酒员却认为是差的 通过上述分析 可以认为在感官评价中 每个评酒员都是 分析仪器 而 且他们有各自的准确度和精确度 因此在对评酒员对葡萄酒评价结果进行统计分 析时 必须像对分析仪器一样进行校正 对评酒员的原始数据进行相应的处理以 降低评酒员的系统误差 即异质性 真实反映样品间的差异 为了降低评酒员的 异质性可以计算所有评酒员对同一酒样的平均值 j x 及其标准差 j 则评酒 8 员i对酒样 评价的置信区间为 jj x 其中 j x 酒样 j 的平均值 j 酒样 j 的标准差 如果评酒员i对酒样 j 的评价 ij x 在其置信区间范围内就可以 直接使用 如果其评价 ij x 不在置信区间范围内 则将评酒员的评价 ij x 进行逐 步整 使不同评酒员对同一酒样的评价值都处于 jj x 范围内 即 若 ij xj 则 ijijj Xx 若 ij xj 则 ijijj Xx 表最后得到新的评酒员对葡萄酒的 评分 最后通过单因素方程分析 确定评酒员对葡萄酒评分数据的可信度 依次 可对第一组白葡萄酒评分表 第二组红葡萄酒评分 第二组数据的评分数据的可 信性进行分析 5 1 4 可信性求解 通过置信区间对第一组红葡萄酒的评分数据进行修正 修正后的数据见附录 2 表2 第一组红葡萄酒评分的单因素方差分析如下 12345678910 45 50 55 60 65 70 75 80 85 90 Values Column Number 通过方差分析表知0953 0 P大于 0 05 说明改组评酒员对红葡萄酒的评 价的差异性显著 该组评酒员对红葡萄酒的评价数据的可信度低 通过置信区间对第二组红葡萄酒的评分数据进行修正 修正后的数据见附录 2 表3 第二组红葡萄酒评分的单因素分析 9 12345678910 55 60 65 70 75 80 Values Column Number 通过方差分析表知0002 0 P 说明改组评酒员对红葡萄酒的评价的差异性 相对于第一组来说显著降低 说明该改组评酒员对红葡萄酒的评价数据的可信度 较高 通过置信区间对第一组白葡萄酒的评分数据进行修正 修正后的数据见附录 2 表4 第一组白葡萄酒评分的单因素方差分析如下 通过方差分析表知 P 接近 0 说明第 12345678910 55 60 65 70 75 80 85 90 Values Column Number 一组评酒员对红葡萄酒的评价几乎无差异性说明第一组评酒员对白葡萄酒的评 价数据的可信度相当高 通过置信区间对第二组白葡萄酒的评分数据进行修正 修正后的数据见附录 2 10 表 5 第二组白葡萄酒评分的单因素分析 12345678910 55 60 65 70 75 80 85 90 Values Column Number 通过方差分析表知 P 接近 0 说明第二组评酒员对白葡萄酒的评价几乎无差 异性说明第二组评酒员对白葡萄酒的评价数据的可信度相当高 综合分析知第一组评酒员对红葡萄酒的评分可信度低 对白葡萄酒的评分可 信度高 而第二组评酒员对红葡萄酒和白葡萄酒的评分的可信度都相当高 所以 综合考虑认为第二组评酒员对葡萄的评分的可信度比第一组高 5 2 问题二模型的建立与求解 5 2 1 主成份分析原理和模型 主成份分析是设法将原来众多具有一定相关性 比如 个指标 重新组合 成一组新的互相无关的综合指标来代替原来的指标 通常数学上的处理就是将原 来 个指标作线性组合 作为新的综合指标 最经典的做法就是用 1 F 选取的第 一个线性组合 即第一个综合指标 的方差来表达 即 1 Var F 越大 表示 1 F 包 含的信息越多 因此在所有的线性组合中选取的 1 F 应该是方差最大的 故称 1 F 为 第一主成份 如果第一主成份不足以代表原来 个指标的信息 再考虑选取 2 F 即 选第二个线性组合 为了有效地反映原来信息 1 F 已有的信息就不需要再出现再 2 F 中 用数学语言表达就是要求 12 0Cov FF 则称 2 F 为第二主成份 依此 类推可以构造出第三 第四 第P个主成份 主成份分析的数学模型如下 11212222 pp Fa ZXa ZXa ZX 1122 pppppp Fa ZXa ZXa ZX 其中 12 iipi aaa 1 ip 为X的协方差阵M的特征值所对应的特征向 11 量 12 p ZX ZXZX 是原始变量经过标准化处理的值 因为在实际应用中 往 往存在指标的量纲不同 所以在计算之前须先消除量纲的影响 而将原始数据标 准化 本文所采用的数据就存在量纲影响 进行主成份分析主要步骤如下 1 指标数据标准化 SPSS 软件自动执行 2 指标之间的相关性判定 3 确定主成份个数 4 主成份 i F 表达式 5 得到主成分与综合主成份 评价 值 5 2 2 模型的求解 对于主成份分析可以直接利用 spass 软件对数据进行处理 在此我们仅以红 葡萄为例 表 6 初始因子载荷矩阵 主成份 F1 主成份 F2 主成份 F3 主成份 F4 主成份 F5 主成份 F6 主成份 F7 主成份 F8 氨基酸 0 129256 0 214164 0 14102 0 288058 0 13387 0 20135 0 207618 0 007092 蛋白质 0 232182 0 10703 0 239632 0 140296 0 125071 0 001717 0 16527 0 11575 VC 含量 0 04797 0 11823 0 143837 0 01369 0 40393 0 062091 0 05116 0 021634 花色苷 0 321239 0 02395 0 004422 0 17672 0 051808 0 120818 0 14509 0 055696 酒石酸 0 129143 0 139719 0 125499 0 217301 0 240041 0 06579 0 226743 0 37352 苹果酸 0 133286 0 192018 0 03772 0 38379 0 051681 0 167263 0 25927 0 092096 柠檬酸 0 100528 0 18697 0 081038 0 22581 0 258517 0 007019 0 257026 0 31042 多酚氧化 酶活力 0 124439 0 00935 0 12086 0 34749 0 160684 0 09743 0 197322 0 087214 褐变质 0 224432 0 010385 0 039353 0 4234 0 02255 0 04783 0 05383 0 07744 DPPH 自 由基 0 288052 0 12355 0 162111 0 120467 0 0396 0 139571 0 088888 0 165995 总酚 0 328484 0 06202 0 013499 0 140507 0 01844 0 095793 0 12393 0 150099 单宁 0 292744 0 07162 0 05461 0 0232 0 1389 0 229796 0 092905 0 025719 葡萄总黄 酮 0 276909 0 11134 0 039979 0 173841 0 002449 0 214689 0 05904 0 144198 白藜芦醇 0 00882 0 223602 0 351969 0 023328 0 16924 0 122432 0 110263 0 217942 黄酮醇 0 205699 0 03688 0 024135 0 04469 0 11936 0 22019 0 461706 0 26581 总糖 0 082607 0 259406 0 27065 0 183733 0 101852 0 06229 0 06433 0 226268 可溶性固 体物 0 085623 0 212336 0 33762 0 123699 0 11775 0 05464 0 03565 0 244496 ph 值 0 098678 0 05663 0 186289 0 394401 0 103947 0 12051 0 15164 0 082541 可滴定酸 0 10354 0 015662 0 37503 0 038021 0 24255 0 204097 0 136602 0 00922 固酸比 0 134825 0 100743 0 192071 0 02154 0 399692 0 14723 0 21727 0 103388 干物质含0 127819 0 276865 0 30662 0 084737 0 084685 0 00521 0 051607 0 036144 12 量 果穗质量 0 111140 0 24878 0 053479 0 023344 0 389496 0 18063 0 18426 0 075699 百粒质量 0 17760 0 0 27993 0 07441 0 045974 0 156054 0 20241 0 084165 0 222774 果梗比 0 217013 0 00931 0 133653 0 13854 0 28366 0 26126 0 181625 0 05317 出汁率 0 214721 0 10756 0 02453 0 102672 0 03121 0 327184 0 13418 0 10602 果皮质量 0 0719 0 26485 0 15904 0 06006 0 203984 0 106274 0 314014 0 326606 果皮颜色 L 0 21604 0 06259 0 206498 0 04382 0 045155 0 19397 0 106149 0 298044 a 0 16207 0 313684 0 216011 0 020831 0 02998 0 218888 0 06516 0 159269 b 0 08787 0 360488 0 099111 0 01301 0 118804 0 324783 0 032122 0 082258 H 0 031318 0 04136 0 05832 0 01045 0 06548 0 366301 0 332033 0 27813 C 0 1575 0 29987 0 24166 0 022646 0 0424 0 188955 0 065689 0 176188 表 7 综合主成份值 主成份 F1 主成份 F2 主成份 F3 主成份 F4 主成份 F5 主成份 F6 主成份 F7 主成份 F8 葡萄样品 1 4 715323 1 170262 0 48011 3 13977 0 295582 1 651122 2 82348 0 11537 葡萄样品 2 4 443064 0 22305 1 067798 0 999589 0 901113 0 26967 1 43705 0 0682 葡萄样品 3 4 225562 2 391792 1 76618 3 166024 1 08127 2 18805 1 668104 1 391001 葡萄样品 4 2 40749 0 05595 0 26481 0 34048 0 76071 1 63947 1 40628 0 255852 葡萄样品 5 0 04457 1 7932 0 34403 0 722676 2 355501 0 741726 0 731945 0 055023 葡萄样品 6 0 95465 0 870466 3 83488 0 895725 0 7434 1 072048 0 14285 0 233893 葡萄样品 7 1 57102 1 142389 1 98978 1 20949 1 50375 0 47951 0 97897 1 06293 葡萄样品 8 3 084842 0 370544 0 55266 5 2402 0 306188 0 75718 2 251442 1 483603 葡萄样品 9 5 712241 1 0086 2 389054 2 181138 0 27816 1 437466 0 02171 1 25815 葡萄样品10 2 06741 2 71111 2 874013 0 22149 4 05921 0 574374 0 40192 0 164801 葡萄样品11 3 82605 7 30713 5 269884 0 162577 0 340132 2 024162 0 709516 1 330255 葡萄样品12 2 2785 1 641878 3 29692 0 758154 1 01712 0 82319 1 02568 1 150283 葡萄样品13 0 02313 1 16314 2 029311 0 851639 0 77545 1 35889 0 39558 0 14181 葡萄样品14 1 853598 0 68422 0 987204 2 44333 0 400781 1 05501 1 741949 0 276553 葡萄样品15 1 10677 0 146493 1 85512 0 83417 0 64176 1 778874 1 291213 2 15405 葡萄样品16 0 231826 0 912537 1 53573 0 86003 1 007758 0 79557 1 33983 2 14363 葡萄样品17 0 76325 1 36358 2 60612 0 905814 0 953212 1 907123 1 071437 0 88985 葡萄样品18 2 48563 1 367346 2 4256 0 1156 0 2857 1 266855 0 126845 0 82382 葡萄样品19 0 607023 0 98897 0 090972 0 1605 1 2613 1 46299 0 32822 0 626259 葡萄样品20 2 44844 1 80598 0 878101 1 539791 1 524193 0 71747 0 86709 1 179576 葡萄样品21 1 560846 2 515274 0 209556 1 719211 0 18509 1 32083 1 645304 2 62014 13 葡萄样品22 0 16798 1 746133 0 65587 0 157649 0 449734 1 54232 2 17805 0 492342 葡萄样品23 2 600153 1 86124 0 35836 1 071904 0 90993 2 495472 0 41972 2 199413 葡萄样品24 0 94234 1 24965 0 79527 0 512272 1 339473 1 422073 0 243752 0 89152 葡萄样品25 3 08917 2 93556 0 457004 0 37694 1 68438 0 103341 0 495511 0 08763 葡萄样品26 2 47773 3 15842 2 377109 0 08019 3 182791 0 68825 0 421208 0 21893 葡萄样品27 2 42661 0 57955 0 343237 0 94299 0 09653 1 37623 0 291332 0 14253 从上述数据我们可以得到 8 个主成分 821 FFF 作为酿酒红葡萄新的相互独 立的综合指标 用来替换之前酿酒葡萄的 31 个指标 由于在第一个问题中我们 发现第二组评酒员所得到的结果更可信 因此我们结合第二组葡萄酒评酒员对红 葡萄酒的评分 通过多元线性回归给出这8个新的相互独立的指标在葡萄酒质量 所占的权重 设红葡萄酒的质量 这里以第二组葡萄评酒员对红葡萄酒的评分代 替红葡萄酒的质量 为 Y 128 X XX 分别为8个主成份 128 F FF 的 27 个样 本数据的输入值 做多元线性回归函数 0112288 Yaa Xa Xa X 适当的选 取系数 0128 a a aa 使得 Y 向量与评酒员对红葡萄的评分向量之差的范数最小 具体 Mtlable 编程见附录 求出 0128 a a aa 为 70 5148 0 7109 0 9129 0 1593 1 1742 0 5779 0 4239 0 1703 0 4719 于是我们可得到各个葡 萄样品的综合主成份 评价 值如下 表 8 点 列 1 排位 百分比 9 6 560281 1 100 00 2 5 551405 2 96 10 3 4 929549 3 92 30 23 4 387693 4 88 40 20 3 746485 5 84 60 26 3 363696 6 80 70 5 3 347253 7 76 90 13 2 395139 8 73 00 19 1 779694 9 69 20 17 1 330938 10 65 30 1 1 065992 11 61 50 24 0 655236 12 57 60 22 0 1158 13 53 80 21 0 19899 14 50 00 14 0 25759 15 46 10 14 25 1 02742 16 42 30 12 1 09826 17 38 40 10 1 23904 18 34 60 16 1 29735 19 30 70 4 1 4856 20 26 90 27 1 72508 21 23 00 6 1 82997 22 19 20 8 3 57327 23 15 30 15 4 55631 24 11 50 18 4 64867 25 7 60 7 4 89673 26 3 80 11 8 51288 27 0 00 图 1 葡萄样品的综合主成份 评价 值图示 通过以上分析我们可将酿酒葡萄进行如下分级 A 级 当 Y 0 a的数值高于 3 347253 时 B 级 当 Y 0 a的数值在 0 25759 到 3 347253 之间时 C 级 当 Y 0 a 的数值在 1 82997 到 0 25759 时 D 级 当 Y 0 a的数值在 4 89673 到 1 82997 之间时 E 级 当 Y 0 a的数值低于 4 89673 时 5 3 问题三模型的建立与求解 利用问题二主成份分析法对红葡萄酒与红葡萄的理化指标分别进行主成份 分析 对红葡萄进行主成分分析得 当提取八个主成分时 可以解释 82 333 的 10 8 6 4 2 0 2 4 6 8 1357911 13 15 17 19 21 23 25 27 系列1 15 总体的方差 通过计算得出 27 个葡萄样品对八个主成分的成分的得分 通过同 样的方法 对红葡萄酒 也可以得出八个主成分的得分 对红葡萄酒 进行主成 份分析 通过观察 可以得出四个主成分时 可以解释 90 221 的方差 通过计 算得出 27 种葡萄酒对四个主成分的得分 将得到的葡萄的八个主成分与葡萄酒 的四个主成分进行典型相关分析 得出以下主要运行结果及相关结论 1 计算典型相关系数 Canonical Correlations 1 912 2 732 3 538 4 209 从表中可以得出第一典型相关系数达到 0 912 第二典型相关系数为 0 732 第三典型相关系数为 0 538 第四典型相关系数为 0 209 2 计算主要统计量的值 进行典型相关的显著性检验 Test that remaining correlations are zero Wilk s Chi SQ DF Sig 1 053 57 334 32 000 004 2 316 22 478 21 000 372 3 680 7 524 12 000 821 4 956 875 5 000 972 从表中可以得出 在 0 05 的显著性水平下 四对典型变量中只有第一对典 型相关变量是显著的 3 分别计算四组典型变量的标准化系数 Standardized Canonical Coefficients for Set 1 1 2 3 4 x1 1 169 1 582 1 835 2 660 x2 842 059 879 1 777 x3 255 525 1 373 096 x4 967 1 091 971 199 x5 880 1 630 1 795 2 682 x6 339 116 1 328 1 257 x7 1 067 531 844 589 x8 217 142 522 402 由上面的表格知 1 12345678 U1 169X 0 8420 2550 9670 8800 3391 0670 217XXXXXXX Standardized Canonical Coefficients for Set 2 1 2 3 4 y1 376 862 219 259 y2 668 233 435 557 y3 041 348 689 634 y4 641 284 537 469 由上面的表格知 得 11234 0 3760 6680 0410 641VYYYY 在 1 U中 由于1X 2X 4X 5X 7X的系数的绝对值较大 1 U主要由 1X 2X 4X 5X 7X这五项决定 在 1 V中 24 Y Y的系数的绝对值较大 1 V主要 由 24 Y Y决定 且同时由于两个典型变量中 1 X与 2 Y的系数是同号的 都为正 反映这两个变量是正相关的 4 分别计算两组变量分别与自身 相对的典型变量的相关系数 Canonical Loadings for Set 1 1 2 3 4 16 x1 295 152 107 082 x2 409 264 210 482 x3 115 400 613 235 x4 351 518 151 259 x5 000 000 000 000 x6 000 000 000 000 x7 000 000 000 000 x8 000 000 000 000 Cross Loadings for Set 1 1 2 3 4 x1 270 111 058 017 x2 373 193 113 101 x3 105 293 329 049 x4 320 379 081 054 x5 000 000 000 000 x6 000 000 000 000 x7 000 000 000 000 x8 000 000 000 000 Canonical Loadings for Set 2 1 2 3 4 y1 376 862 219 259 y2 668 233 435 557 y3 041 348 689 634 y4 641 284 537 469 Cross Loadings for Set 2 1 2 3 4 y1 343 631 118 054 y2 609 171 234 117 y3 037 255 371 133 y4 585 208 289 098 上面四个表是第一组和第二组各变量分别与自身及相对的典型变量的相关 系数 据此 可以得出每组变量与自身典型变量的各个相关系数 和每组变量与 相对典型变量的各个相关系数 而又因为这里的变量是通过主成分的方法降维过 后的 原始葡萄与葡萄酒的理化指标变量在主成分中所占权重大小再结合这里的 相关系数 就可以得出葡萄与葡萄酒理化指标之间的联系 对白葡萄酒与白葡萄的理化指标分别进行主成分分析 然后将两组主成分进 行典型相关分析 通过所得表格 见附录 3 得 对白葡萄 调用 spss 中因子 分析知 当总体取 10 个主成分时 可以解释总体 84 553 的方差 计算得到主 成分的得分 根据表知 取四个主成分时就可以解释总体 88 812 的总方差 1 计算典型相关系数 由表 详情见附录 3 知 第一典型相关变量达到 0 882 第二典型相关变 量达到 0 862 第三典型相关变量达到 0 695 第四典型相关变量达到 0 442 2 计算主要统计量的值 进行典型相关的显著性检验 从表中 详情见附录 3 知 在显著性水平为 0 05 的情况下 只有第一和 17 第二两对典型相关变量是显著的 3 分别计算四组典型变量的标准化系数 计算结果见附录 3 112345678910 0 4230 6090 6620 0040 0330 1090 0430 089X0 0230 105UXXXXXXXXX 和 212345678910 0 6760 5870 0680 0640 0770 0150 276 0 05X0 0970 306UXXXXXXXXX 11234 0 5110 0850 0870 097VYYYY 和 21234 0 8340 5270 1010 131VYYYY 在 1 U中 123 XXX的系数绝对值较大 反映 1 U主要由 123 XXX决定 2 U中 1210 XXX的系数绝对值较大 反映 2 U主要由 1210 XXX决定 在 1 V中 1 Y的系数 的绝对值最大 反映 1 V主要由 1 Y决定 在 2 V中 12 YY 的系数的绝对值较大 反映 了 2 V主要由 12 YY 决定 同时由于在第一组典型相关变量中 31 X Y的系数是同号 都为正 的 反映这两个变量是正相关的 在第二组典型相关变量中 22 XY 的系数是同号 都为正 的 反映这两个变量是正相关的 4 分别计算两组变量分别与自身 相对的典型变量的相关系数 得到四个表 结果见附录 3 是第一组和第二组各变量分别与自身及相对的 典型变量的相关系数 据此 可以得出每组变量与自身典型变量的各个相关系数 和每组变量与相对典型变量的各个相关系数 而又因为这里的变量是通过主成分 的方法降维过后的 原始葡萄与葡萄酒的理化指标变量在主成分中所占权重大小 再结合这里的相关系数 就可以得出葡萄与葡萄酒理化指标之间的联系 5 4 问题四模型的建立与求解 在问题二中我们分别对 27 个葡萄样品进行了综合主成分评价 进而得到各 个葡萄样品的综合主成分评价值 现在我们使用同样的方法对 27 个葡萄酒样品 进行综合主成分评价 于是我们可得到各个葡萄酒样品的综合主成分 评价 值如 下 表 9 点 葡萄酒 9 葡萄酒 23 葡萄酒 2 葡萄酒 3 葡萄酒 14 葡萄酒 21 葡萄酒 5 葡萄酒 19 葡萄酒 17 列 5 7243 43 5 7021 5 3 5196 32 2 6757 7 2 3034 48 2 2247 82 1 8819 91 1 2556 55 0 9676 58 排位 1 2 3 4 5 6 7 8 9 百分 比 100 00 96 10 92 30 88 40 84 60 80 70 76 90 73 00 69 20 点 葡萄酒 22 葡萄酒 13 葡萄酒 8 葡萄酒 26 葡萄酒 4 葡萄酒 24 葡萄酒 15 葡萄酒 6 葡萄酒 16 列 0 4034 97 0 3486 99 0 2607 09 0 144 24 0 354 29 0 632 09 0 739 47 0 758 2 0 986 84 排位 10 11 12 13 14 15 16 17 18 百分 比 65 30 61 50 57 60 53 80 50 00 46 10 42 30 38 40 34 60 18 点 葡萄酒 12 葡萄酒 1 葡萄酒 25 葡萄酒 7 葡萄酒 18 葡萄酒 10 葡萄酒 27 葡萄酒 20 葡萄酒 10 列 1 244 44 1 404 75 1 520 59 1 746 24 2 089 37 2 764 4 2 863 36 3 947 32 6 072 76 排位 19 20 21 22 23 24 25 26 27 百分 比 30 70 26 90 23 00 19 20 15 30 11 50 7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023公路水运工程试验检测人员考试习题及答案
- 安国市2025-2026学年八年级上学期语文期中模拟试卷
- 安徽省滁州市全椒县2023-2024学年高三上学期第二次月考历史试题及答案
- 江苏省江阴市2025-2026学年八年级上学期开学考试数学试题答案
- 河南省驻马店市汝南县2024-2025学年四年级下学期期末英语试题
- 2024-2025学年山东省淄博市周村区七年级(下)期末数学试卷(五四学制)(含答案)
- 地摊仓库出租合同范本
- 运动教练聘用合同范本
- 供暖施工付款合同范本
- 湖南建工工程合同范本
- 2025年电抗器行业当前市场规模及未来五到十年发展趋势报告
- 新班主任自我介绍课件
- 2025年副高卫生职称-公共卫生类-妇女保健(副高)代码:093历年参考题库含答案解析(5卷)
- 2025广西中考英语真题(原卷版)
- 餐饮行业食品安全管理实务培训教材
- 反歧视艾滋病课件
- 医疗放射安全知识培训课件
- 2025年南京保安考试题库
- 2025年广东省中考历史试卷(含答案)
- 基孔肯雅热防控技术指南2025版培训课件
- GB 2536-2025电工流体变压器和开关用的未使用过的矿物绝缘油
评论
0/150
提交评论