陈尚洋,高玉斌,王贝贝,A题.doc_第1页
陈尚洋,高玉斌,王贝贝,A题.doc_第2页
陈尚洋,高玉斌,王贝贝,A题.doc_第3页
陈尚洋,高玉斌,王贝贝,A题.doc_第4页
陈尚洋,高玉斌,王贝贝,A题.doc_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2012高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 重庆理工大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要随着科技的不断进步和发展,人类的物质水平得到提高,对葡萄酒的需求日益增大。葡萄酒的评价主要从感官指标和理化指标两大类进行,尤其是感官品评,是目前国内外鉴定葡萄酒品质的主要手段。但评酒师品评确定质量较主观,如何确定一种量化的评定标准日益受到人们的关注。本论文对葡萄酒相关数据进行量化处理,分析与葡萄酒质量的联系,寻求一种可以量化评定葡萄酒质量的模型。首先,对两组评酒员的评价结果应用SPSS两配对样本的非参数检验法进行显著性分析,得红葡萄酒评价结果无显著性差异,白葡萄酒评价结果有显著性差异;其次,对比评分波动图以及各自方差比较,得红、白葡萄酒均是第二组数据更可信。针对问题二,首先利用SPSS主成分分析法对酿酒葡萄的所有理化指标进行处理,综合为八种主成分;其次,对八种主成分处理进行SPSS聚类分析,把酿酒葡萄分为五类;最后与葡萄酒质量进行对比分析,最后把酿酒葡萄分为四种等级。问题三中,首先分析葡萄酒与酿酒葡萄两组理化指标各变量因子,存在多元性和相关性,建立多重多元线性回归模型,利用MATLAB编程求解出各自变量与因变量之间的相关系数,得到两组理化指标之间具有极强的相关性,个别因子之间存在显著相关性。问题四中,首先对众多理化指标处理,筛选出的部分指标与葡萄酒质量进行SPSS多元线性回归,最终得到葡萄酒质量的线性回归方程,表明酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量有着极其显著的影响,能够用这些理化指标量化葡萄酒的质量。 本文得出了一种定量获得葡萄酒质量的方法,为葡萄酒的生产提供了有利的参考依据。关键词:葡萄酒 质量评价 理化指标 SPSS 多元线性回归一、 问题重述葡萄酒是用新鲜的葡萄或葡萄汁经发酵酿成的酒精饮料,通常分红葡萄酒和白葡萄酒两种。前者是红葡萄带皮浸渍发酵而成;后者是葡萄汁发酵而成的。随着科技的不断进步和发展,人类的物质水平得到提高,人们对葡萄酒的质量关注日益成为民生大事。葡萄酒的主要质量指标大体可分为感官指标和理化指标两大类。感官指标主要指色泽、香气、滋味和典型性方面的要求,理化指标主要指酒精含量(酒精度)、酸度和糖分指标。葡萄酒的主要质量指标为专业性评酒提供了依据,尤其是感官品评,是目前国内外鉴定葡萄酒品质的主要手段。本文聘请一批有资质的评酒员对某一年份一些葡萄酒进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。1.根据两组评酒员的评价结果,判断两组数据有无显著性差异,确定哪一组数据更可信。2.根据所提供数据,对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。二、 模型假设1. 假设题目中所提供的数据均可靠。2. 假设所使用的葡萄酒样品、酿酒葡萄样品取自同一样本总体;3. 假设品酒员不受外界影响,根据自身知识所得数据公正;4. 假设各种软件对数据处理无操作性错误时,各个数据无错误;5. 假设所有葡萄酒样品的工艺流程完全一致。6.三、 符号说明 合并的标准差 合并的值1 红葡萄酒样品数量 2 白葡萄酒样品数量 检验自由度 第一组红葡萄酒样品方差 第二组红葡萄酒样品方差 第一组红葡萄酒样品标准差 第二组红葡萄酒样品标准差 第一组第个品酒员评分(=1,2,,27) 第二组第个品酒员评分(=1,2,,27) 显著性水平 一级理化指标的个数 相关系数矩阵 主成分系数矩阵 主成分得分矩阵 被解释变量 第i个解释变量四、 模型的建立及求解4.1 问题一4.1.1问题分析显著性差异1是统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体,而是来自于具有差异的两个不同总体。显著性检验就是事先对总体( 随机变量) 的参数或总体分布形式作出一个假设,然后利用样本信息来判断这个假设( 原假设) 是否合理,即判断总体的真实情况与原假设是否存在显著差异。利用样本数据对总体特征进行推断时,在总体分布未知的情况下,通常采用统计推断方法中的非参数检验方法。两组品酒员测定的两组数据,其总体分布情况不甚了解,判断这两个平均值之间是否有显著性差异,采用SPSS两配对样本的非参数检验。在数理统计2中一般以概率5%作为显著评定标准,本文中我们设显著性水平=0.05,以红葡萄酒样品数据计算。4.1.2问题求解根据每组品酒员对各个酒样品的评价,得出表1红葡萄酒样品评分均值(见附件),对表1中两组数据采用SPSS两配对样本的非参数检验,分析结果如表2所示。表2(a)两组评分两配对样本符号检验结果(一)表2(b)两组评分两配对样本符号检验结果(二)由表2(a)和表2(b)可知,第二组评酒员的评分低于第一组的有22个,高于第一组的有5个,两组评分没有相等的。双尾的二项分布累计概率为0.002,显著性水平为0.05,由于概率P-值大于显著性水平,因此不能拒绝原假设,红葡萄酒第一、二组的评分结果没有显著差异。同理可知,白葡萄酒第二组品酒员的评分低于第一组的有9个,高于第一组的有19个,两组评分没有相等的。双尾的二项分布累计概率为0.0089,显著性水平为0.05,由于概率P-值小于显著性水平,拒绝原假设,因此白葡萄酒第一、二组的评分结果有显著差异。4.1.3数据可信性对比求解进行各种估计时,该估计围绕参数真值的波动越小越好,波动大小可以用方差来衡量。下图1为红葡萄酒评分曲线的直观图。图1 红葡萄酒评分对比折线图根据第一组与第二组红葡萄酒样品具体数据,计算其方差,方差计算公式如下: 第一、二组全体红葡萄酒样本方差如下:=54.48 =15.83第一、二组全体白葡萄酒样本方差如下:=54.48 =15.83可知方差对比可知,第一组品酒员的评分波动明显比第二组大,而且方差越小说明波动较小,可信性更高,可以明显得到红、白葡萄酒均是第二组数据更可信。4.2问题二4.2.1 问题分析 在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。由于变量个数较多再加上变量之间的相关性,势必增加了分析问题的复杂性。如何从多个变量中综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,这时就需要进行主成分分析4。主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。聚类分析是直接比较各事物之间的性质,在分类情况未知情况下,对数据结构进行分类,性质相近的归为一类,将性质差别较大的归入不同的类的分析技术。通过分类,有利于我们抓住重点,从总体上去把握事物,找出解决问题的方法。聚类的主要过程一般可分为如下四个步骤:数据预处理(标准化)、构造关系矩阵(亲疏关系的描述)、聚类(根据不同方法进行分类)、确定最佳分类(类别数)。基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类比离差平方和应当较大,选用利差平方和法,应用SPSS软件,如何选取应用酿酒葡萄的各个理化指标,进行聚类分析,得出酿酒葡萄的初级分类,再选用一定的方法,与酿酒葡萄的质量对比分析,得出最终酿酒葡萄的分级。由第一问中确定红葡萄酒第二组的数据更具可信性,则在下面问题处理中,均依据红葡萄酒第二组数据来解答。4.2.2模型建立对酿酒葡萄的一级指标进行分析处理,建立主成分分析模型。观测28个一级理化指标(=28),个样品的数据资料阵为:其中:(表示第个样品第个指标)对原始数据进行标准化处理,如下 其中 为方便,假定原始数据标准化后仍用表示,则经标准化处理后的数据的相关系数为: 用雅克比方法求相关系数矩阵的特征值()和相应的特征向量。主成分分析就是将个观测变量综合成为个新的变量(综合变量),即上述模型可用矩阵表示为:,其中 称为主成分系数矩阵。4.2.3模型求解应用SPSS软件进行主成分分析,得表5和表6如下。表5 方差分解主成分提取分析表表6 红葡萄酒理化指标主成分分析结果主成分包含成分名称贡献率(%)第一主成分总酚 总黄酮 花色苷单宁17.318第二主成分可溶性 氨基酸 总糖14.859第三主成分褐变度 苹果酸10.451第四主成分果穗质量9.039第五主成分白藜芦醇8.968第六主成分可滴定酸8.552第七主成分黄酮醇7.523第八主成分酒石酸6.333从上表可以看出对于红葡萄样品的28个一级理化指标进行处理,转化为了8个互相无关的综合变量,分析上表可得花色苷与总酚、单宁、总黄酮这几个指标存在着极其显著的关系,同时干质量与还原糖、总糖、可溶性也有显著关系,白藜芦醇、褐变度、黄酮醇以及酒石酸之间的关系。根据多元数据作图的图表示可视化回归方法5,根据上述理化指标之间的关系,选取适当的理化指标作为输入变量,对其数据作适当变换,进行酿酒葡萄样品可视化图形分析。得下图2以及附件相关图形。图2 葡萄理化性质联系可视化平行坐标图由图2可知,这些葡萄样品在很多理化性质上都不大相同,只有第四个变量理化指标PH大致相同,这说明这个理化指标对酿酒葡萄质量的影响不大。对其他酿酒葡萄理化指标作相同分析,由附件中一系列可视化平行坐标图可知,酿酒葡萄的理化性质果皮质量、VC含量、DPPH自由基、出汁率、果皮颜色等对酿酒葡萄的影响均不大。同样可得酿酒葡萄的理化性质氨基酸、花色苷、褐变度、总黄酮、黄酮醇、总酚、白藜芦醇、酒石酸等对酿酒葡萄的影响很大。经过对数据处理后选取酿酒葡萄理化性质花色苷、单宁、总酚、总黄酮、白藜芦醇、氨基酸、柠檬酸、总糖、出汁率、酒石酸、苹果酸、氧化酶、褐变度、黄酮醇、还原糖、可溶性、可滴定酸、固酸比、果穗质量、百里质量、果梗比、a、b进行聚类分析,经过SPSS软件处理后,得到图3聚类树状谱系图图3聚类树状谱系图根据图4将27种红葡萄样品利用23个指标进行初步分类,共分为五类,得表6如下。表6 红葡萄酒初级分类分类红葡萄酒样品第一类18、6、12、7、17、24、5、15第二类16、21、13、19、22、27、4、10、25、20、26第三类11第四类8、14、1第五类2、9、23、3第二组红葡萄酒样品评分的排列(从高到低)为:9、23、20、3、17、2、14、19、21、5、26、22、24、27、4、16、13、10、12、25、1、6、8、15、18、7、11。与上述分类对比可发现,五类葡萄样品中,大部分评分相近,每一类中均有评分波动较大的样品,用此样品与同类其他样品对比,可发现其某些理化指标明显不同。第一类中红葡萄酒样品17、5、24分在了一类,而17的葡萄酒样品评分却很高,其他的评分相对较低;第二类红葡萄酒样品20出现波动,评分很高却和大部分红葡萄酒样品中上的排在一起;第三类综合评分较低,故为最差的;第四类分机比较合理;第五类的指标很贴近,评分也很高说明酒质量很高。根据上述分析,红葡萄最终分为四级,得表7如下。表7 红葡萄分级级别红葡萄酒样品一级2、3、9、23二级5、13、14、17、19、20、21、22三级1、4、6、8、10、12、15、16、24、25、26、27四级7、11、18对于白葡萄样品作相似分析,得其聚类树状谱系图见附件,最终白葡萄样品分为四级,得表8如下。表8 白葡萄分级级别白葡萄酒样品一级5、9、28二级1、10、14、15、21、23、25三级2、3、4、6、7、12、13、17、18、19、20、22、27四级8、11、164.3问题三4.3.1问题分析 在实际问题中,经常需要同时考虑多个因变量对多个自变量的相互依赖关系,对于分析酿酒葡萄与葡萄酒的理化指标的关系,由于两类理化指标都有诸多变量因子,且存在着多元性和相关性,于是葡萄酒的理化指标可作为多个因变量,而影响葡萄酒的理化指标的因素显然更有多个可作为多个自变量,从数量上揭示这种相互依赖关系,采用多重多元回归分析的方法,将葡萄酒的各指标作为一个整体,建立与葡萄的指标相对应的模型,最后应用MATLAB软件求解模型。4.3.2模型建立设有个自变量,对应个因变量,假定它们之间有线性关系式:其中是未知参数,是随机误差项,它们不是相互独立的,通常假设它们服从多元正态分布即,其中为未知的协差阵。写成矩阵形式如下:则关系式:为回归方程,为回归系数,为常数项。设有n组自变量与因变量的实测数据将组数据代入到多元回归模型则得出多重多元线性回归模型为:,残差阵: ,验证是的无偏估计量。是的无偏估计量。对于多重多元回归,假设检验需要考察某一部分自变量对p个因变量的影响是否显著的问题,得到模型:,判断对个因变量作用是否显著。4.3.3模型求解由主成分分析出9个主要因子作为自变量,将葡萄酒的指标作为因变量,具体如下:表示酿酒葡萄主要指标数据矩阵,表示红葡萄理化指标数据矩阵。经过MATLAB计算得到 9个典型相关系数及原变量在各典型变量上的负荷矩阵。最后求出原变量在各典型变量上的负荷矩阵,这里只列出2个典型变量和典型相关系数,具体如下:第一典型变量系数和典型相关系数: u=(0.0174 0.0534 0.8559 0.1778 0.1308 -0.3619 -0.0099 0.1346 0.0853)Tv=(0.6181 0.3949 -0.4840 0.2391 0.1584 -0.7302 -0.7306 -0.3721 0.0534)T典型相关系数为:0.9593,第二典型变量系数和典型相关系数:u=( -0.2950 -0.1196 0.1021 -0.1048 0.2315 -0.7891 -0.2299 0.3089 0.1591)Tv=(1.2954 0.0189 -0.5088 -0.4842 -0.2303 -0.2475 0.4416 0.2025 0.3886)T典型相关系数为:0.9173,剩下的典型相关系数分别为:0.7830、0.4846、0.3919、0.2977、0.1582、0.0756、1.2728e-004。最后得到原变量在典型变量上的负荷矩阵为U、V,具体数据见附件。从第一组典型变量得出,酿酒葡萄和葡萄酒的理化指标具有极强的相关性;第二组典型变量反映出氨基酸与总酚、总黄酮、白藜芦醇、DPPH同号,而与L和a、b异号,所以氨基酸与总酚、总黄酮、白藜芦醇、DPPH成较强的正比关系,与L和a、b成相对弱一点的反比关系;第三组典型变量看出褐变度与总酚、总黄酮、L成正比关系,与白藜芦醇、DPPH成反比关系,第四组典型变量得出除氧化酶以外的所有指标与葡萄酒的前8种指标之间的关系,其相关系数为0.4846,它们的关系相对较弱;其他组的相关系数很小,故相关性非常弱可以将其忽略。4.4问题四4.4.1问题分析 对于影响葡萄酒的质量(被解释变量)的诸多因子(解释变量)如酿酒葡萄和葡萄酒的理化性质、芳香物质,观察和的散点图,发现和之间呈现出线性关系,建立线性回归分析模型,建立关于的线性回归模型。模型中引用多少解释变量是需要研究的。如果引入较少回归方程将无法很好地解释说明被解释变量的变化,引入过多可能存在多重共线性。本文中初始解释变量数目很多,需要对数据进行筛选,选取适当数目的解释变量,然后进行模型求解。4.4.2模型建立 多元线性回归模型的一般形式为 其中k为解释变量的数目,为回归系数。它的非随机表达式为 为偏回归系数。4.4.3模型求解在多元回归分析中,本模型采取向前筛选策略对解释变量引入回归方程加以控制和筛选。由于本文中解释变量过多,共同引入时存在多重共线性,必须首先进行初步筛选。首先,初步筛选如下,计算出各解释变量与被解释变量之间的相关系数,选择与被解释变量线性相关系数相对较高的解释变量为初步数据,其中含有23个理化指标。其次,将初步数据全部引入方程,选用向后筛选策略,并进行回归方程的各种检验。然后,再依次剔除最不显著的解释变量,直到再也没有克剔除的解释变量为止。 采用向后筛选策略让SPSS自动完成解释变量的选择,观测每一步检验的变化情况,并进行残差分析和异常点探测。经过多次向后筛选策略,依次剔除最不显著解释变量。随着解释变量的不断减少,方程的拟合优度下降了。这一方面说明了判定系数的自身特性,同时也说明建立回归方程并不是以一味追求高的拟合优度为唯一目标,还需重点考察解释变量是否对被解释变量有贡献。最后一个模型是最终的回归方程,剩余解释变量为11个。其相关性质如表9所示。表9(a) 多元线性回归分析结果(一)由上表可知:回归平方和为249.826,残差平方和为0.011,总平方和为249.837,对应的F统计量的值为1989.430,对应的概率P-值为0.017,依据该表可进行回归方程的显著性检验。显著性水平a为0.05,由于概率P-值小于显著性水平a,应拒绝回归方程显著性检验的原假设,认为个回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立的回归方程模型。表9(b) 多元线性回归分析结果(二)上表展示了每个模型中各个解释变量的偏回归系数、偏回归系数显著性检验的情况。各个解释变量的回归系数显著性检验的概率P-值均小于显著性水平a,此11个解释变量与被解释变量间的线性关系显著,保留在模型中是合理的。最终的回归方程为:葡萄酒质量= -152.763+51.354*C8H18O-1.485*总黄酮+0.443*总酚-116.517*DPPH+74.409*DPPH1+43.863*PH+0.252*C10H18O-4.235*酒总黄酮+0.159*蛋白质-2.212*C10H16+1.213*C12H2202 该方程意味着酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量有着极其显著的影响,能够用这些理化指标量化葡萄酒的质量。五、 模型的检验从上面建立的模型来看,需要检验它的有效性以及合理性。在问题一中,应用了非参数假设检验,不用对其分布进行验证。问题二、三所建立的数学模型由于是在显著性水平0.05下进行的建模,所以满足有效性和合理性。对于问题四,得到回归方程为:葡萄酒总分= -152.763+51.354-1.485 +0.443-116.517 +74.409 +43.863 +0.252 -4.235 +0.159 -2.212 +1.213 。其中分别代表C8H18O,总黄酮,总酚-,DPPH,DPPH1,PH,C10H18O-,酒总黄酮,蛋白质,C10H16,C12H2202的含量,我们随机将一组葡萄酒样品3,5,7的各含量代入上式,则得到葡萄酒的总分分别为74.8,72.3,65.5与附件一中专家评分期望值74.6,72.1,65.3基本吻合。六、 模型的评价与推广6.1模型优点:1、首先对数据进行主成分分析,剔除了次要成分,简化了计算。2、借助Matlab、SPSS等软件进行计算,得出结果准确、可靠。3、论文中将图形与数据相结合更具有说服力。4、所建立的模型与实际紧密联系,由一些利用简单的模型就能达到很好的效果,有很好的通用性和推广性。6.2模型缺点:1、由于所给数据量庞大,造成一些二级指标直接剔除,可能对结果造成一定影响。2、由于对葡萄酒的评价没有具体精确的量化,因而对葡萄酒的质量的评价存在一定的局限性。3、在处理数据和求解过程中不可避免的出现各种误差,在一定也影响到模型求解的精确度。6.3模型推广 本模型对评价葡萄酒质量具有重要的参考价值,当今物质生活水平提高,葡萄酒在我们餐桌上扮演愈来愈重要的角色,葡萄酒的消费也越来越高,本文所得出的质量指标为专业性评酒提供了依据,对提高我们的生活质量与生活品味有着重要的作用。七、 参考文献1 张凤菊,刘晓娟,赵丽平等,数据差异显著性检验,农机使用与维修,51-52,2012。2 程依明,茆诗松,概率论与数理统计教程,北京:高等教育出版社,2004。3 晏娅萍 鱼先锋,食品质量多级模糊综合评价研究,价值工程,298-299,2012。4 薛薇,统计分析与SPSS的应用,北京:中国人民大学出版社,2011。5 王金甲,尹涛,李静等,基于物理化学性质的葡萄酒质量的可视化评价研究,燕山大学学报,第34卷第2 期:133-137,2010。6 李运,李记明,姜忠军,统计分析在葡萄酒质量评价中的应用,酿酒科技,第4 期:79-84,2009。八、 附录问题一:表1红葡萄酒样品评分均值酒样品样品1样品2样品3样品4样品5样品6样品7样品8样品9第一组62.780.380.468.673.372.271.572.381.5第二组68.17474.671.272.166.365.36678.2酒样品样品10样品11样品12样品13样品14样品15样品16样品17样品18第一组74.270.153.974.67358.774.979.359.9第二组68.861.668.368.872.665.769.974.565.4酒样品样品19样品20样品21样品22样品23样品24样品25样品26样品27第一组78.679.877.177.285.67869.273.873第二组72.675.872.271.677.171.568.27271.5表2 白葡萄酒样品评分均值酒样品样品1样品2样品3样品4样品5样品6样品7样品8样品9第一组8274.285.379.47168.477.571.472.9第二组77.975.875.676.981.575.574.272.380.4酒样品样品10样品11样品12样品13样品14样品15样品16样品17样品18第一组74.372.363.365.97272.47478.873.1第二组79.871.472.473.977.178.467.380.376.7酒样品样品19样品20样品21样品22样品23样品24样品25样品26样品27样品28第一组72.277.876.47175.973.377.181.364.881.3第二组76.476.679.279.477.476.179.574.37779.6表3白葡萄酒SPSS两配对样本的非参数检验FrequenciesN第二组-第一组 Negative Differencesa Postitive Differencesb Tiesc Total225027a. 第二组第一组c. 第二组=第一组Test Statisticsa第二组-第一组ZAsymp.Sig.(2-tailed)-3.079.002a.Sign Test表4白葡萄酒SPSS两配对样本的非参数检验FrequenciesN第二组-第一组 Negative Differencesa Postitive Differencesb Tiesc Total919028d. 第二组第一组f. 第二组=第一组Test Statisticsa第二组-第一组ZAsymp.Sig.(2-tailed)-1.701.089a.Sign Test图1 红葡萄酒评分方差对比折线图图2 白葡萄酒评分方差对比图第二问图3 红葡萄30个指标的分级图4 白葡萄样品所有指标分级表5 初始因子载荷矩阵第三问MATLAB代码clc,clearA=xlsread(a.xls,1,B2:S28);x1=A(:,1);x2=A(:,2);x3=A(:,3);x4=A(:,4);x5=A(:,5);x6=A(:,6);x7=A(:,7);x8=A(:,8);x9=A(:,9);y1=A(:,10);y2=A(:,11);y3=A(:,12);y4=A(:,13);y5=A(:,14);y6=A(:,15);y7=A(:,16);y8=A(:,17);y9=A(:,18);X=x1 x2 x3 x4 x5 x6 x7 x8 x9;Y=y1 y2 y3 y4 y5 y6 y7 y8 y9;All=zscore(X) zscore(Y);DXY=cov(All)V11=DXY(1:9,1:9);V12=DXY(1:9,10:18);V21=DXY(10:18,1:9);V22=DXY(10:18,10:18);A=inv(V11)*V12*inv(V22)*V21B=inv(V22)*V21*inv(V11)*V12 U_A,D_A=eig(A) U_B,D_B=eig(B) mA1,nA1=sort(D_A,1);mA2,nA2=sort(mA1,2);mB1,nB1=sort(D_B,1);mB2,nB2=sort(mB1,2);for i=1:9 a=(U_A(:,nA2(9,9-i+1)*V11*U_A(:,nA2(9,9-i+1); u(:,i)=U_A(:,nA2(9,9-i+1)./sqrtm(a); v(:,i)=inv(V22)*V21*u(:,i)./sqrtm(mA2(9,9-i+1);endfor i=1:9 disp (-分割线-) disp (i) disp (u=) disp (u(:,i) disp (v=) disp (v(:,i) disp (典型相关系数) disp (mA2(9,9-i+1)enddisp (原变量在典型变量上的负荷矩阵为)inv(u)inv(v)结论:对数据进行标准化处理,并计算样本的协方差矩阵DXY = Columns 1 through 15 1.0000 -0.1528 0.0807 0.2591 0.4654 0.1307 0.0510 0.0829 -0.1181 0.1060 0.4962 0.3359 0.2006 0.3342 0.4004 -0.1528 1.0000 0.6961 0.3612 0.4207 0.2356 0.0254 0.3891 0.5559 0.7670 0.4454 0.4588 0.4429 -0.0945 0.3810 0.0807 0.6961 1.0000 0.7278 0.3524 0.5665 -0.0601 0.2751 0.3999 0.9226 0.7196 0.7735 0.7085 0.2004 0.6711 0.2591 0.3612 0.7278 1.0000 0.3456 0.8951 -0.0194 -0.0160 0.0878 0.6132 0.8172 0.8751 0.8831 0.4593 0.8744 0.4654 0.4207 0.3524 0.3456 1.0000 0.2627 0.1829 0.2227 0.2890 0.4081 0.5785 0.4053 0.2987 0.0742 0.4221 0.1307 0.2356 0.5665 0.8951 0.2627 1.0000 0.0210 -0.0564 -0.0457 0.4414 0.6837 0.8154 0.8228 0.5666 0.8133 0.0510 0.0254 -0.0601 -0.0194 0.1829 0.0210 1.0000 0.1998 -0.2077 -0.0350 0.0490 0.0761 0.0468 0.0135 0.0732 0.0829 0.3891 0.2751 -0.0160 0.2227 -0.0564 0.1998 1.0000 0.1992 0.3803 0.1448 0.1390 -0.0825 -0.2040 0.0175 -0.1181 0.5559 0.3999 0.0878 0.2890 -0.0457 -0.2077 0.1992 1.0000 0.4809 0.1416 0.1538 0.1236 -0.1278 0.0735 0.1060 0.7670 0.9226 0.6132 0.4081 0.4414 -0.0350 0.3803 0.4809 1.0000 0.7444 0.7649 0.6645 0.1239 0.6757 0.4962 0.4454 0.7196 0.8172 0.5785 0.6837 0.0490 0.1448 0.1416 0.7444 1.0000 0.9210 0.8373 0.3312 0.9150 0.3359 0.4588 0.7735 0.8751 0.4053 0.8154 0.0761 0.1390 0.1538 0.7649 0.9210 1.0000 0.9039 0.4860 0.9527 0.2006 0.4429 0.7085 0.8831 0.2987 0.8228 0.0468 -0.0825 0.1236 0.6645 0.8373 0.9039 1.0000 0.3994 0.9264 0.3342 -0.0945 0.2004 0.4593 0.0742 0.5666 0.0135 -0.2040 -0.1278 0.1239 0.3312 0.4860 0.3994 1.0000 0.5281 0.4004 0.3810 0.6711 0.8744 0.4221 0.8133 0.0732 0.0175 0.0735 0.6757 0.9150 0.9527 0.9264 0.5281 1.0000 -0.2357 -0.5638 -0.8342 -0.7540 -0.5237 -0.6086 0.1621 -0.2538 -0.4110 -0.8221 -0.7680 -0.8024 -0.7018 -0.3525 -0.7529 -0.0998 -0.3350 -0.3486 -0.1685 -0.0490 -0.0674 -0.4494 -0.2687 -0.0069 -0.3649 -0.2981 -0.3048 -0.2704 0.2387 -0.2427 0.3558 -0.2443 -0.2401 0.0551 0.2234 0.0475 -0.1101 -0.0154 0.1020 -0.3018 0.0172 0.0155 -0.0204 0.2136 0.0734 Columns 16 through 18 -0.2357 -0.0998 0.3558 -0.5638 -0.3350 -0.2443 -0.8342 -0.3486 -0.2401 -0.7540 -0.1685 0.0551 -0.5237 -0.0490 0.2234 -0.6086 -0.0674 0.0475 0.1621 -0.4494 -0.1101 -0.2538 -0.2687 -0.0154 -0.4110 -0.0069 0.1020 -0.8221 -0.3649 -0.3018 -0.7680 -0.2981 0.0172 -0.8024 -0.3048 0.0155 -0.7018 -0.2704 -0.0204 -0.3525 0.2387 0.2136 -0.7529 -0.2427 0.0734 1.0000 -0.0423 -0.1201 -0.0423 1.0000 0.3113 -0.1201 0.3113 1.0000计算矩阵A和BA = 0.4767 -0.0131 0.0252 0.1281 0.1390 0.1358 0.1796 0.0041 -0.0358 -0.0618 0.2351 0.0832 0.0518 -0.1236 0.0498 0.0794 -0.1057 0.1001 -0.1145 0.5655 0.8196 0.2490 0.1285 0.1136 0.1219 0.3880 0.2390 0.2686 0.0712 0.0894 0.3765 0.5591 0.1309 -0.0634 -0.0744 0.0270 0.2534 -0.0574 0.0002 0.0206 0.4537 -0.1223 -0.2070 0.1016 0.0117 -0.0957 -0.2210 -0.0389 0.2822 -0.4763 0.6488 0.0390 -0.2560 -0.2182 0.0143 0.0066 0.0558 0.0639 -0.1466 0.0867 0.3157 -

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论