食品实验设计与统计分析实验指导书XX年.doc_第1页
食品实验设计与统计分析实验指导书XX年.doc_第2页
食品实验设计与统计分析实验指导书XX年.doc_第3页
食品实验设计与统计分析实验指导书XX年.doc_第4页
食品实验设计与统计分析实验指导书XX年.doc_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

食品实验设计与统计分析实验指导书XX年 食品实验设计与分析实验指导书食品科学与工程教研室xx年4月1试验 一、SPSS数据文件管理 一、实验目的与要求通过本试验项目,使学生理解并掌握SPSS软件包有关数据文件创建和的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行,包括数据查询,数据修改、删除,数据的排序等等。 二、试验原理SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。 一个典型的SPSS数据文件如表1所示。 定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。 在spss数据窗口中单击“变量视窗”标签,进入变量视窗界面(如图1所示)即可对变量的各个属性进行设置。 三、操作步聚例1某航空公司38名职员性别和工资情况的调查数据,如表2所示,试在SPSS中进行如下操作 (1)将数据输入到SPSS的数据窗口中,将gender定义为字符型变量,将salary定义为数值型变量,并保存数据文件,命名为“试验1-1.sav”。 (2)插入一个变量ine,定义为数值型变量。 (3)将数据文件按性别分组数据内容观测变量2选择菜单【数据】【排列个案】打开对话框选Gender(A)按键在“排列依据”中Gender(A)在排列顺序中选“升序”确定。 (4)查找工资大于40000美元的职工选择菜单【数据】【选择个案】打开对话框选如果条件满足(C)双击“如果”打开“选择个案If”选定”Salary”按键在右边Salary出输入40000继续在“输出”选定“过滤掉未选定的个案(F)”确定。 (5)当工资大于40000美元时,职工的奖金是工资的20;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入工资奖金,计算所有职工的实际收入,并添加到ine变量中。 表2某航空公司38名职员情况的调查数据表Id Gender Salary IdGender Salary1M$5700020F$26250162M$40xx1F$388503F$2145022M$217504F$2190023F$240005M$4500024F$169506M$3210025F$211507M$3600026M$310508F$2190027M$603759F$2790028M$3255010F$2400029M$13500011F$3030030M$31xx2M$2835031M$3615013M$2775032M$11062514F$3510033M$4200015M$2730034M$9200016M$4080035M$8125017M$4600036F$3135018M$10375037M$2910019M$4230038M$313503 四、结果及分析结果输出如下表3GenderSalaryine filter-1F$21,450.0002F$21,900.0003F$21,900.0004F$27,900.0005F$24,000.0006F$30,300.0007F$35,100.0008F$26,250.0009F$38,850.00010F$24,000.00011F$16,950.00012F$21,150.00013F$31,350.00014M$57,000.00$58,140.00115M$40,200.00$41,004.00116M$45,000.00$45,900.00117M$32,100.00$32,421.00018M$36,000.00$36,360.00019M$28,350.00$28,633.50020M$27,750.00$28,027.50021M$27,300.00$27,573.00022M$40,800.00$41,616.00123M$46,000.00$46,920.00124M$103,750.00$1,037,575.00125M$42,300.00$43,546.00126M$21,750.00$21,967.50027M$31,050.00$31,360.50028M$60,375.00$60,982.50129M$32,550.00030M$135,000.00131M$31,200.00032M$36,150.00033M$110,625.00134M$42,000.00135M$92,000.00136M$81,250.00137M$29,100.00038M$31,350.000文档保存按保存,保存到指定的地址。 4试验 二、在线分析处理过程(OLAP) 一、实验要求 1、掌握SPSS软件的窗口界面和基本操作。 2、掌握数据文件、输出文件的建立、保存、打开操作。 3、掌握常用的数据预处理操作。 二、实验原理OLAP(Online AnalyticalProcessing)过程对于按一个或多个分组变量所分的组计算所考察的连续变量的总体值、均值以及其它基本统计量,称为对该变量作摘要分析,结果以分层的方式输出,表中每一层是依据一个分组变量的结果输出。 在建立或打开一个数据文件后,就可进行在线分析处理了。 Summary Variable框,要求进入该框中的变量是数值变量,程序将对该框中得变量作摘要分析。 Grouping Variable框,从左侧的源变量框中,选择取值有限的数字型或字符型变量作为分层变量进入该框,程序将按照每个分组变量的每一类别进行摘要分析。 需要说明的是,这里的分层变量在实际的运算过程中并不起到分组变量的作用,而仅仅是确定进入统计过程的观测量的范围。 例如,选择数学成绩作为摘要分析变量,而性别变量作为分层变量。 要计算数学平均成绩,那么在输出结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有的属于男女生的观察量的数学成绩的总平均值。 Statistics对话框,在主对话框中单击Statistics按钮,打开Statistics对话框,在该框中可以选择要输出的统计量。 可供选择的统计量有Sum(总和)、Number ofcases(观察量数目)、Mean(均值)、Median(中位数)、Grouped median(分组中位数),Standard errorof themean(均值标准误差)、Minimum(最小值)、Maximum(最大值),Range(范围)、Standard deviation(标准差)、Variance(方差)、Kurtosis(峰度)、Standard errorof kurtosis(峰度的标准误差)、Skewness(偏度)、Standard errorof skewness(偏度的标准误差)、First(首值)、Last(尾值)、Percentage oftotal sum(占总和的百分比)、Percentage oftotal N(占观察量总数的百分比)、Geometric mean(几何均数)、Harmonic mean(调和均数)Title对话框,在主对话框中单击Title按钮,即可打开Title对话框,在该框中可以为数出加上标题。 在Title框中可以设定标题。 注意,该标题并不是整个输出的标题,而只是统计量输出栏的标题。 在Caption中输入注解,这些注解将显示在统计量输出栏的下面。 三、操作步聚例-01某地区30名10岁少儿的身高(cm)进行测量,数据如下。 现要求对其进行在线分析处理。 5表1少儿身高数据编号性别年级身高(cm)编号性别年级身高(cm)1男5131.516女5132.72男5137.417女5133.03男5128.218女5139.74男6136.019女6125.45男4140.420女5138.66男4135.521女6137.57男4121.422女4141.48男6129.223女5138.89男4134.124女4120.910男4135.825女6137.511男6132.226女5124.012男5129.027女4140.313男5132.628女5130.114男6140.929女4133.415男5129.330女6136. 71、打开SPSS,将数据输入到SPSS的数据窗口中,按Analyze-Reports-OLAP Cubes的顺序单击,即可打开OLAP Cubes对话框 2、将身高height变量选入Summary Variable框(进入该框中的变量要求是数值变量)中,将sex变量作为分组变量选入Grouping Variable中。 3、单击Statistics按扭,打开Statistics对话框,选择Sum,Mean,Median项作为要输出的统计量。 4、单击Title按扭,打开Title对话框,在Title框中输入“少儿身高分层报告”单击Continue键返回。 5、单击OK键完成。 6 四、结果及分析表2观察量摘要Case ProcessingSummary CasesIncluded ExcludedTotal NPercent NPercent NPercent身高*性别30100.0%0.0%30100%表2说明了观察量的一些基本情况,包括总的个数、有效个数和缺失值个数。 表3分层报告性别Total少儿身高Sum MeanMedian身高4003.5133.450133.750表3是分层报告,输出了总和(Sum)、均值(Mean)和中位数(Median)7试验三观察值摘要分析过程 一、实验要求掌握SPSS软件的基本统计分析方法。 对观察值分别进行分组统计分析,掌握功能框的选择。 二、原理Cases Summary过程主要是计算指定变量的分组统计量,分组变量可以是一个,也可以有多个。 如果是多个的话,将在所有水平进行交叉组合。 每个组中,变量值可以显示出来或不显示。 对大数据集,可以仅列出前面的观察值。 在建立或打开一个数据文件后,就可进行观察值摘要分析了。 按Analyze-Reports-Case Summaries的顺序单击,就打开了Summarize Cases主对话框。 该框中各项功能如下 1、Variables框可以选择一个或多个变量进入该框,观察值摘要分析过程一次可以分析多个变量。 2、Grouping Variables框分组变量可以是数值型或是短字符型变量,变量值仅表示分类,取值应尽可能少。 3、Display cases框选中该框,下面三个复选框同时被激活,表示可供选择。 (1)Limit casesto first复选框选中该框,并在随后的参数框中输入数值,该数值表示分析过程只对前几个观测值进行。 (2)Show onlyvalid cases复选框选中该框,带有缺失值的观测值将不被显示。 (3)Show casenumbers复选框选中该框,将在列出现观察值的同时,显示观察值的序号。 4、Statistics对话框该框中可以选择要输出的统计量。 5、Options对话框单击Options按钮,即可打开Options对话框,在该对话框中,可以确定输出结果的标题、脚注、分组统计量的标题等。 (1)Title框 (2)Caption框 (3)Subheadings fortotal复选框选中该框,将在输出结果中显示各分组统计量的标题。 (4)Exclude caseswith missingvalues listwize复选框选中该框,在分析过程中剔除带有缺失值的观测量。 (5)Missing statisticsappear as框在框中健入一个字符以便在输出结果中标记缺失值。 8 四、操作步骤 1、打开SPSS,将数据输入到SPSS的数据窗口中(实验二中的表一),用sex表示性别,grade表示年级,height表示身高。 2、按analyzereportscase summaries的顺序单击,就打开了summarize Case主对话框。 3、将变量height选入Variable框中作为摘要分析的变量,将sex、grade选入Grouping框中作为分组变量。 4、清除Display case复选框 5、单击Statistics按扭,在对话框中选中作为要输出的统计量,单击continue键返回主对话框。 6、单击OK键 四、结果及分析表4观测量处理摘要Case ProcessingSummary CasesIncluded ExcludedTotal NPercent NPercent NPercent少儿身高*性别*年级30100%0.0%30100%表4说明了观测量总的个数、有效值的个数、缺失值的个数以及各占的百分比。 表5分组统计量少儿身高(cm)性别年级N MeanMedian男四年级6133.600134.800五年级6132.350131.850六年级3132.600132.600Total15132.900132.600女四年级3132.600132.700五年级7133.571137.500六年级5135.440136.700Total15134.000136.700Total四年级9133.267134.100五年级13133.008133.400六年级8134.375134.500Total30133.450133.750表5分为三部分,第一部分是男生的基本统计量,第二部分是女生的基本统计量,第三部分是男女生总的基本统计量。 每部分包括分年级进行的统计和总的统计。 这就是交叉分组。 9试验 四、单因素方差分析 一、实验要求掌握SPSS进行单因素方差分析的方法,包括有重复实验结果的和没有重复实验结果的分析方法,了解各功能框的选取,并对输出结果能进行解析。 二、原理 1、主对话框按Analyze-Compared Means-One WayAnova的顺序单击,就可打开“单因素方差分析”主对话框。 2、因变量框在主对话框中可以看到因变量框(Dependent List),该框中列出要分析的所有因变量。 要从左边源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。 可以有多个因变量。 3、因素框在主对话框中可以看到因素框(Factor),该框中列出了因素。 要从左边源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。 因素同样也是分组变量,必须满足只取有限个水平的条件。 4、Contrast对话框在主对话框中单击(Contrast)健,即可打开“Contrast”对话框。 在该框中指定一种要用t检验来检验的priori对比,可以进行均值的多项式比较。 该框中各项意义如下 (1)Polynomial复选框选中该框,将进行均值的多项式比较。 均值的多项式比较是指包括两个或更多个均值的比较。 选中该框,并在其后的参数框中选定阶数,Linear是一阶,即是线性模型,Quadratic是二阶,Cubic是三阶,最高可到五阶。 (2)Coefficients参数框在该框中输入多项式各组均值的系数,方法是在Coefficients中输入一个系数,单击Add按钮,Coefficients框中的系数就进入下面的方框中。 依次输入各组均值的系数,在方形框中形成一列数值,因素变量分为几组,就输入几个系数。 例如,如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0。 考虑另一种情况,如果只包括第一组与第二组的均值,侧只需要输入两个系数,第三个、第四个可以不输入。 (3)Coefficient Total栏该栏显示每组系数的总和,例如,输入第一个系数1,该栏显示1,输入第二个系数2,该栏显示3,输入第三个系数4,该栏显示7。 5、Post Hoc对话框在主对话框中,单击Post Hoc按钮,即可进入Post HocMultiple Comparisons对话框。 在该对话框中可以选择进行多重比较的方法。 10 (1)方差相等时(Equal varianceassumed) (2)方差不相等时(Equal variancenot assumed) 6、Options对话框在主对话框中单击Options按钮,展开“Options”对话框。 在该对话框中规定输出的统计量,并规定缺失值的处理方式。 (1)Statistics栏该栏中规定要输出的统计量。 *Descriptive复选框选中该框,要求输出描述统计量,包括观察量数目,均值,最小值,最大值,标准差,标准误差,各组中每个因变量的95%的置信区间。 *Homogeneity ofvariance复选框选中该框,要求用Levene检验进行方差一致性检验 (2)Means plot复选框选中该框,输出均数分布图,即根据各组均数描绘出因变量的分布情况。 (3)Missing Values栏在该框中选择缺失值的处置方式,有两个选项*Exclude casesanalysis byanalysis选中该框,在检验变量中含有缺失值的观察将不被计算。 Exclude caseslist-wise选中该框,在任何一个变量中含有缺失值的观测都将不被计算。 三、操作步骤例某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。 在每批灯泡中随即地抽取若干个灯泡测其使用寿命(单位小时),数据列于下表。 现在想知道,对于这四种灯丝生产的灯泡,其使用寿命有无显著差异。 灯泡使用寿命灯泡灯丝12345678甲1600161016501680170017001780乙15001640140017001750丙16401550160016xx40160017401800丁151015xx30157016401680在该例中,可设灯泡的使用寿命为因变量,灯泡的配料为因子,四种配料方案为四水平,这是单因素四水平的试验。 如果这四种配料方案制成的灯丝,其灯泡的使用寿命没有显著差异,侧可以从中挑选一种既经济又方便的配料方案;如果这四种配料方案制成的灯丝,其灯泡的使用寿命存在显著差异,侧希望从中挑选一种较优的配料方案,以对提高灯泡的使用寿命更为有利。 1、在数据窗建立数据文件,定义两个变量并输入数据,如图所示,这两个变量是111)filament变量,数值型,取值 1、 2、 3、4分别代表、甲乙丙丁,格式为F1.0,标签为“灯丝”2)hours变量,数值型,其值为灯泡使用寿命,单位是小时,格式为F4.0,标签为“灯泡使用寿命” 2、按analyzepared meansone-way anova的顺序单击,打开“单因数方差分析”主对话框。 3、从左边源变量框中选取变量hours,然后按向右的箭头,所选取的变量hours即进入框中Dependent List框中。 4、从左边源变量框中选取变量filament,然后按向右的箭头,所选取的变量filament即进入Factor框中 5、在主对话框中,单击OK提交运行。 四、结果及分析灯泡使用寿命的单因素方差分析结果ANQVA灯泡使用寿命Sun of Squares df Means Square F Sig.Between GroupsWithin GroupsTotal39776.46178088.9217865.43222513258.8198094.9511.638.209第一列方差,Between Groups是组间变差,Within Groups是组内变差,Total是总变差。 第二列离差平方和,组间离差平方和为39776.46,组内离差平方和为178088.9,总离差平方和为217865.4,是组间离差平方和与组内离差平方和相加而得。 第三列自由度第四列均方第五列F值第六列显著值由于显著值0.209大于0.05,所以在置信水平0.95下不能否定零假设,也就是说四种灯丝生产的灯泡,其平均使用寿命没有显著差异。 12试验五多因素方差分析 一、实验要求掌握用SPSS进行多因素分析方差分析的方法,能灵活运用 二、原理同单因素方差分析 三、操作步骤例某生产队在12块面积相同的大豆试验田上,用不同方式施肥,大豆亩产(斤)的数据如下表。 表1大豆实验亩产数据编号氮肥(斤)磷肥(斤)亩产(斤)100400xx90300420404450504460604455760430860420960440106446011645701264570氮肥用N表示,磷肥用P表示,两个因子各取二水平,output表示亩产(斤)。 为了探明究竟氮肥的作用大,还是磷肥的作用大,我们进行方差分析。 (1)输入数据集,因素变量有两个,即N(氮肥)和P(磷肥),均有两水平,0表示不用该肥料,1表示用该肥料;因变量output(大豆亩产),单位为斤。 (2)在“Analyze”菜单中打开“General LinearModels”子菜单,从中选择“Univariate”命令,打开“多因素方差分析”主窗口。 (3)指定分析变量。 选择因变量output进入Dependent框。 选择因素变量N和P进入Fixed Factors框。 (4)在主对话框中单击(Contrasts)按钮,打开对比方法对话框,在该对话框中作如下操作在Factor框中选择N。 在Chang Contrast栏内,单击Contrasts参数框内向下箭头,打开比较方法表,选13择Simple项,再选择First项为比较参考类,然后单击(Change)按钮,在Factors框中显示N(simple(First)。 用相同方法指定P(simple(First)。 单击(Continue)按钮回到主对话框。 (5)在主对话框中单击(Options)按钮,打开选项对话框,做如下操作在Factors框中选择因素变量N、P、NP,单击向右箭头将因素变量送入Display Meansfor框中在Display栏内选中Spread vs1evel plot和Residual plot复选框单击(Continue)按钮回到主对话框 (6)单击(OK)按钮回到主对话框。 四、结果及分析输出结果如下表2是“氮肥和磷肥对大豆亩产影响”实验中的有关变量信息,表中列出了N和P两个因素变量和分类水平,以及海水平的样本含量。 表2因素变量表Between-Subjects FactorsValue LabelN氮肥0不用61用6磷肥0不用61用6表3是对因素效应检验的结果,显著值都很小,从中可以得知氮肥、磷肥及其交互作用对大豆亩产影响很明显。 表3方差分析Dependent Variable:大豆产量Source TypeIII Sumof Squaresdf MeanSquare F Sig.Corrected Model47408.333(a)315802.778151.707.000Intercept2585408.33312585408.33324819.920.000N14700.000114700.000141.120.000P27075.000127075.000259.920.000N*P5633.33315633.33354.080.000Error833.3338104.167Total2633650.00012Corrected Total48241.66711a R Squared=.983(Adjusted R Squared=.976)14表4是定义均值比较假设检验索引表均值比较结果,从表中可看出,选用的是Simple比较方法并选择了第一水平作为参考水平。 由于每个因素变量只有两个水平,因此均值比较都是与第一水平的比较。 表4假设检验索引Custom HypothesisTests Index1Contrast Coefficients(LMatrix)Simple Contrast(reference category=1)for氮肥Transformation Coefficients(M Matrix)Identity MatrixContrast Results(K Matrix)Zero Matrix2Contrast Coefficients(LMatrix)Simple Contrast(reference category=1)for磷肥Transformation Coefficients(M Matrix)Identity MatrixContrast Results(K Matrix)Zero Matrix下面是对氮肥使用的假设检验结果(Custom HypothesisTests#l)。 表5和6是对氮肥使用的假设检验结果。 表5对比结果Contrast Results(K Matrix)氮肥Simple Contrast(a)Dependent Variable大豆产量Level2vs.Level1Contrast Estimate70.000Hypothesized Value0Difference(Estimate-Hypothesized)70.000Std.Error5.893Sig.00095%Confidence Intervalfor DifferenceLower Bound56.412Upper Bound83.588a Referencecategory=115表6检验结果Test ResultsDependent Variable:大豆产量Source Sumof Squaresdf MeanSquare FSig.Contrast14700.000114700.000141.120.000Error833.3338104.167在表5中各行意义如下Contrast Estimate行列出了氮肥的第二水平与第一水平的对比值,Hypothesized Value行列出了检验值,Difference行是对比值与检验值的差,StdError是标准误差,Sig.行是显著值,95Confidence Interval行中列出了95的置信区间的上下限。 表6是均数对比方差分析表,该表列出了方差、平方和、自由度、均方、F值及显著值。 其显著值小于0.05,即在0.05的水平上拒绝接受零假设,使用氮肥和不使用氮肥对大豆产量有显著差异。 下面是对氮肥使用的假设检验结果(Custom HypothesisTests#2)。 表7和8是对磷肥使用的假设检验结果。 表7对比结果Contrast Results(K Matrix)磷肥Simple Contrast(a)Dependent Variable大豆产量Level2vs.Level1Contrast Estimate95.000Hypothesized Value0Difference(Estimate-Hypothesized)95.000Std.Error5.893Sig.00095%Confidence Intervalfor DifferenceLower Bound81.412Upper Bound108.588a Referencecategory=116表8检验结果Test ResultsDependent Variable:大豆产量Source SumofSquaresdfMeanSquareFSig.Contrast27075.000127075.000259.920.000Error833.3338104.167从表8的显著水平可看出,使用磷肥与不使用磷肥对大豆产量有显著差异。 表9的第一个部分是使用氮肥和不使用氮肥的均值、标准误差和95的置信区间,第二部分是使用磷肥和不使用磷肥的均值、标准误差和95的置信区间,第三部分是氮肥和磷肥的交叉组合的均值、标准误差和95的置信区间。 表9使用氮肥、磷肥及其组合的大豆亩产的统计值1.氮肥Dependent Variable:大豆产量氮肥Mean Std.Error95%Confidence IntervalLower BoundUpper Bound不用429.1674.167419.558438.775用499.1674.167489.558508.7752.磷肥Dependent Variable:大豆产量磷肥Mean Std.Error95%Confidence IntervalLower BoundUpper Bound不用416.6674.167407.058426.275用511.6674.167502.058521.2753.氮肥*磷肥Dependent Variable:大豆产量氮肥磷肥Mean Std.Error95%Confidence IntervalLower BoundUpper Bound不用不用403.3335.893389.745416.922用455.0005.893441.412468.588用不用430.0005.893416.412443.588用568.3335.893554.745581.922图1是大豆亩产的均值与标准差散点图,横坐标是均值,纵坐标是标准差。 图2是大豆亩产的均值与方差散点图,横坐标是均值,纵坐标是方差。 17图3是大豆亩产的观测值、预测值和残差值散点图,共有9个单元格,主对角线上的三格标明了坐标,从上至下依次是观测值、预测值和残差值。 其余六个单元格是散点图,横、纵坐标分别是该行、该列主对角线上标明的坐标。 图1大豆亩产的均值与标准差散点图图2大豆亩产的均值与方差散点图Spread vs.Level Plotof大豆产量Groups:氮肥*磷肥Level(Mean)600500400300Spread(Variance)300xx000Spread vs.Level Plotof大豆产量Groups:氮肥*磷肥Level(Mean)6005004003001614121086418图3大豆亩产的观测值、预测值和残差值散点图ObservedPredictedStd.ResidualDependent Variable:大豆产量Model:Intercept+N+P+N*P19实验六单一样本T检验 一、实验要求掌握SPSS进行t-test(单一样本t检验、独立样本的T检验、配对样本t检验)。 二、原理 1、简介单一样本T检验(One-Sample T Test)是检验单个变量的均值是否与假设检验值(给定的常数)之间存在差异。 例如,研究某地区高考数学平均分数与去年分数(定值)的差异。 如果已知总体均数,进行样本均数与总体均数之间差异显著性检验也属于单一样本的T检验。 例如,研究某地区高考数学平均分数与全省高考数学平均分数的差异,这样的问题就是依靠进行样本均数与总体均数之间差异显著性检验即进行单一样本的T检验来解决的问题。 单一样本T检验过程对每个检验变量给出的统计量包括观测量个数、均值、标准差和均值的标准误差,它还给出了每个数据值与假设检验值之间的差的平均值以及进行该差值为0的T检验和该差值的置信区间,并且用户可以指定这个显著性水平。 2、完全窗口分析2.1One-SampleTTest主对话框按AnalyzeCompare MeansOne SampleTTest的顺序单击,就可打开主对话框。 2.2Test Variable框Test Variable框中的变量是要作检验的变量,要从源变量框中选取变量进入该框,只需选中所要选取的变量,然后按向右的箭头即可。 2.3Test Value参数框在该框中输入一个定值作为假设检验值。 2.4Options对话框在主对话框中单击(Options)键,即可打开“Options”对话框。 (1)ConfidenceInterval参数框在该框中输入置信区间,必须在1-99之间,一般取为 90、 95、99等,过程将给出这个置信区间的上下限,需要说明的是,计算置信区间的变量不是样本值,而是样本值和假设检验值(Test Value)的差。 (2)MissingValue框在该框中选择缺失值的处置方式。 Excludecasesanalysisbyanalysis选中该框,在检验变量中含有缺失值的观测将不被计算。 Excludecaseslistwise选中该框,在任何一个变量中含有缺失值的观测都将不被计算。 20 三、操作步骤例题某地区一所大学医院测量新生的血红蛋白值(g%)如下表。 已知另一地区1618岁少年血红蛋白平均值为11.657g%,检验这一地区1618岁少年血红蛋白值是否与另一地区的平均值相等。 血红蛋白值编号性别年龄血红蛋白值编号性别年龄血红蛋白值1男1813.6621女1611.362男1810.5722男1612.783男1612.5623男1815.094女179.8724女188.675女178.9925女178.566女1711.3526女1812.567男1714.5627女1711.568男1612.4028男1614.679女168.0529男167.8810男1814.0330男1812.3511女1812.8331男1613.6512男1615.5032女169.8713女1812.2533女1810.0914女1710.0634女1812.5515男1610.8835男1816.0416男189.6536男1813.7817女168.3637男1711.6718男1811.6638男1710.9819女188.5439女168.7820女177.7840男1611.35 (1)按AnalyzeCompareMeansOneSampleTTest的J顷序单击,就可打开主对话框。 (2)将变量hb选入Test Variable框。 (3)在Test Value框中输入11.657。 (4)单击(OK)完成。 四、结果及分析输出结果如下。 表1是血红蛋白值的一些统计量,包括观测量个数、均值、标准差和均值的标准误差。 21表1单个样本统计量One-Sample StatisticsN MeanStd.Deviation Std.Error Mean血红蛋白值4011.44482.26900.3588从表2中可以看出,t值为-0.592,自由度为39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95的置信区间是-0.9379-0.51340表2单个样本检验One-Sample TestTest Value=11.65795%Confidence Intervalof theDifference tdf Sig.(2-tailed)Mean DifferenceLower Upper血红蛋白值-0.592390.558-0.2122-0.93790.513422试验 七、Excel中的直线回归分析 一、实验要求掌握Excel的基本统计分析方法。 对观察值进行直线回归分析,掌握功能框的选择。 二、基本原理回归是研究某种变量受另外一种或一种以上变量的影响程度。 自变量X是事先设计的,没有误差或者误差很小,依变量Y随X变化而变化,并具有其自身的随机误差。 二者之间的依存关系或因果关系,称为回归关系,如果用直线回归方程来表示,一般通式为y=a+bx其中a为回归截距;b为回归系数或斜率。 三、实验工具Microsoft Excel 四、操作步骤在Excel统计中,任何回归分析都可以用“回归分析工具”来分析,具有方法如下。 例经调查,华农本地早柑橘10个果实的横径和单果重资料,现测验果实横径与单果重是否有显著的相关性。 华农本地早柑橘10个果实的横径和单果重果实横径单果重X(cm)Y(g)7.0115.06.596.05.879.04.144.05.562.06.7106.06.388.04.348.06.185.05.155.01.打开Excel将上表的数据输入Excel2.工具加载宏选“分析工具库”确定3.工具选“数据分析”回归确定4.用左键点击“Y值输入区域”用鼠标选定Y值单击鼠标结束。 5.同理,在“X值输入区域”输入数据。 6.点击标志、置信度为95%、残差、标准残差、残差图、线性拟合图、正态概率图。 7.单击“确定”。 23 四、回归输出结果1.SUMMARY OUTPUT(概要输出)回归统计Multiple R0.97249RSquare0.945738Adjusted Rquare0.938955标准误差6.089802观测值102.PROBABILITY OUTPUT(概率输出)百分比排位Y(g)54415482555356245795585658875968510695115方差分析df SSMS FSignificance F回归分析15170.9145170.914139.43151.42E-06残差8296.685537.08569总计95467.63.RESIDUAL OUTPUT(残差输出)观测值预测Y(g)残差标准残差1108.40586.5942491.14852296.26061-0.26061-0.04539379.25742-0.25742-0.04483437.963946.0360571.051299571.97033-9.97033-1.736536101.11874.8813330.850181791.40256-3.40256-0.59262842.8225.1780010.901852986.5445-1.5445-0.269011062.25422-7.25422-1.2634724Coefficients标准误差t StatP-value Lower95%Upper95%Intercept-61.62611.963-5.1510.000873-89.214-34.038X(cm)24.2902.05711.8082.42E-0619.54629.034Normal ProbabilityPlot050100150020406080100Sample PercentileY(g)回归输出正态概率图X(cm)Line FitPlot05010015002468X(cm)Y(g)Y(g)预测Y(g)回归输出最佳适配曲线图X(cm)Residual Plot-20-1001002468X(cm)残差回归输出残差分析图25 五、结论由输出结果可知a=-61.63,b=24.29。 所以其回归方程为y=24.29x-61.63再由输出结果中的方差分析可知,Significance F=2.42E-06=0.05,说明果实横径与果重之间回归关系显著。 而由结果中回归系数的t Stat检验可知,截距aP-value=0.000873=0.05;斜率bP-value=2.42386E-06=0.05,说明回归系数均达到显著水平。 因此回归方程是可靠有效的。 26试验 八、SPSS中的多元回归分析 一、实验要求掌握SPSS的基本多元回归分析方法。 对观察值进行多元回归分析,掌握功能框的选择。 二、基本原理多元回归是研究某种变量受多个变量的影响程度。 可以建立因变量y与自变量x j(j=1,2,3,.n)之间的多元线性回归模型y=b0+b1x1+b2x2+b3x3+b kx k+e其中b0是回归常数;b k(k=1,2,3n)是回归参数;e是随机误差。 三、操作步骤例某地区病虫害测报站用相关系数法选取了以下4个预报因子x1为最多连续10天诱虫量(头);x2为4月份上、中旬百束小谷草把累计落卵量(块);x3为4月份中旬降雨量(毫米);x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。 分级数字列成表1。 预报量y每平方米幼虫0-10头为1级,11-20头为2级,21-40头为3级,40头以上为4级。 预报因子x1诱蛾量0-300头为1级,301-600头为2级,601-1000头为3级,1000头以上为4级。 x2卵量0-150块为1级,151-300块为2级,301-550块为3级,550块以上为4级。 x3降水量0-10.0毫米为1级,10.1-13.2毫米为2级,13.3-17.0毫米为3级,17.0毫米以上为4级。 x4雨日0-2天为1级,3-4天为2级,5天为3级,6天或6天以上为4级。 表1x1x2x3x4y年蛾量级别卵量级别降水量级别雨日级别幼虫密度级别19601022411214.3121101196130014403.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论