版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS生物统计应用 SPSS统计分析基础【1学时】14.1.1描述性统计14.1.2统计绘图14.2统计假设检验【1学时】14.2.1方差同质性检验14.2.2单样本t检验14.2.3配对设计资料t检验14.2.4成组(非配对)设计资料t检验14.2.5参数的区间估计14.3卡方检验【1学时】14.3.1适合性检验14.3.2独立性检验14.4方差分析【3学时】14.4.1单因素资料方差分析14.4.2两因素资料方差分析14.4.3系统分类资料方差分析14.4.4其他类型试验设计资料的方差分析145相关与回归分析【1学时】一元线性回归分析14.5.2曲线回归14.5.3多重线性回归分析146
2、协方差分析【1学时】14.6.1单因素试验资料的协方差分析14.6.2随机区组(配伍组)设计资料的协方差分析14.6.3两因素析因设计资料的协方差分析14.7非参数检验【1学时】14.7.1两配对样本资料的非参数检验14.7.2两非配对样本资料的非参数检验(Wilcoxon非配对法)14.7.3多个样本比较的非参数检验(Kruskal-Wallis法,H法)148多元统计分析【2学时】14.8.1多元方差分析14.8.2多元协方差分析14.8.3主成分分析14.8.3因子分析14.8.5聚类分析第一章SPSS统计分析基础因SPSS中文界面有关统计学术语的翻译欠准确,所以本章内容均以SPSS22
3、.0英文版为准,介绍SPSS统计分析。若想使用中文界面,可打开SPSS数据电子表格上端菜单栏中的Edit,在打开的下拉菜单中依次点击Option、Language,设置输出和用户界面语言为简体中文。第一节数据整理在原始数据难不能直接满足数据分析要求的情况下,需要对原始数据进行适当的转换。SPSSTransformation菜单提供了各种对变量进行转换的过程,包括对原始数据进行四则运算的Conpute命令、对数据重新编码的Reconde命令等。这些命令在统计分析的数据整理中起着非常重要的作用。单击主菜单的Transform.弹出数据转换子菜单界面,见图2-36。14.1.1描述性统计【例14.1
4、】126头基础母羊的体重资料(表14.1),计算平均数等基本统计量。表14.1126头基础母羊的体重资料(单位:kg)品种基础母羊体重甲品种53.050.051.057.056.051.048.046.062.051.061.056.062.058.046.548.046.050.054.556.040.053.051.057.054.059.052.047.057.059.054.050.052.054.062.550.050.053.051.054.056.050.052.050.052.043.053.048.050.060.058.052.064.050.047.037052.046.
5、045.042.053.058.047.0乙品种50.050.045.055.062.051.050.043.053.042.056.054.545.056.054.065.061.047.052.049.049.051.045.052.054.048.057.045.053.054.057.054.054.045.044.052.050.052.052.055.050.054.043.057.056.054.049.055.050.048.046.056.045.045.051.046.049.048.549.055.052.058.054.5注:数据引自四川农业大学主编生物统计学,其中品种
6、不是真实情况,仅供模拟。解SPSS操作步骤:建立数据文件并定义变量:将数据输入一列,建立表示母羊体重的变量。另建立一表示品种的分组变量,甲、乙两品种分别用1、2表示。定义变量:点击SPSS电子表格左下角的变量视图VariableView或双击变量名,可定义变量。变量名Name尽量用英文或汉语拼音缩写,宜短不宜长。本例母羊体重变量命名为weight,品种变量命名为breed。在命名变量后,可指定变量类型type。单击Type相应单元中的按钮,在弹出的对话框中选择合适的变量类型并单击Ok按钮确定,即可定义变量类型。常用的变量类型为数值型Numeric和字符串String。本例变量weight和br
7、eed均可指定为数值型。在breed变量之后,还可指定变量标签Label,一般用汉字比较好,可以比较长。本例weight变量标签可指定为基础母羊体重,breed变量标签可指定为品种。对分组变量breed,还可指定变量值(Value)。点击变量值单元格内的按钮,打开变量值对话框,在其中的Value后面的框内输入1,在其下的Label框内输入“甲品种”点击Add按钮添加,同理可备注2为乙品种。其它变量定义可用缺省设置。定义变量后,点击左下角的数据视图DataView可返回。选择命令操作:SPSS进行基本统计分析可用3种命令实现,即描述(Descriptives)、频率(Frequencies)、探
8、索(Explore)。下面分别讲述3种命令的基本操作方法。Descriptive命令操作AnalyzeDescriptiveStatisticsDescriptive,从左侧栏中选择weight变量,点击导入右侧的Variable变量栏中。点击Option按钮,选择要计算的统计量及其它项目。在选项卡上,可选择平均值Mean、合计Sum、最小值Minimum、最大值Maximum、极差Range、标准偏差Stddeviation、方差Variance、平均值的标准误S.Emean、观察值分布的偏度Skewness、峰度Kurtosis。峰度统计量的意义在于:峰度为0表示变量数据分布与正态分布陡缓
9、程度相同;大于0表示比正态分布高峰要更加陡峭,为尖顶峰;小于0表示比正态分布的高峰要平坦,为平顶峰。偏度是描述某变量取值分布对称性的统计量:偏度为0表示数据分布形态与正态分布偏度相同;大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。偏度的绝对值数值越大表示分布形态的偏斜程度越大。本例选择输出所有统计量。注意,SPSS不能直接输出几何均数(GeometricalMean)和调和均数(HarmonicMean)等统计量。输入计算结果。SPSS的输出表格具有可编辑性。点击表格可选择复制重要的内容,复制到Word、Excel等文
10、字图表软件中,加以修饰后应用。DescriptiveStatisticsNRangeMinimumMaximumSumStatisticStatisticStatisticStatisticStatistic基础母羊体重12628.0037.0065.006522.00ValidN(listwise)126MeanStdDeviationVarianceSkewnessKurtosisStatisticStd.ErrorStatisticStatisticStatisticStd.ErrorStatisticStd.Error51.7619.461295.1779226.811.035.216
11、.089.428输出结果中包括平均数、标准差等各种主要统计量(statistic)。本例有效含量(ValidN)为126例,样本中观察值的极差为28.00kg,最小值、最大值分别为37.00、65.00kg,观察值总和为6522.00kg。样本平均数、均数标准误、标准差、样本方差(均方)分布偏度、偏度标准误、峰度、峰度标准误分别为51.7619、0.46129、5.17792、26.811、0.035、0.216、0.089、0.428。其中,观察值分布偏度和峰度值都很小(接近于0),说明该样本观察值分布与正态分布相对比较接近。Frequencies命令操作AnlysesDesicriptiv
12、eStatisticsFrequencies,从左侧栏中选择weight变量,点击导入右侧栏Variable中。点击Option,指定要计算的统计量及其它项目。Ok确定,输出结果(此处不再陈列)。Explore命令操作Explore命令即探索性分析,是SPSS提供的一项很重要的分析功能,非常有用。一般在进行正式统计分析前,都应进行探索性分析。该命令操作步骤如下:AnlysesDesicriptiveStatisticsExplore,从左侧栏中选择weight变量,点击导入右侧DependentList即依变量或反应变量栏中,将breed变量选入FactorList栏中。点击图形Plots按钮
13、。在打开的对话框中,点选Normalityplotswithtest,并在其下的Spreadvslevelwithlevenetest选项中点选不转换数据Untranslated,Continue返回。Ok确定,输出探索性分析结果。Explore分析除可分组输出基本统计量外,还可输出各样本正态分布和方差同质性检验结果。本例正态性检验TestsofNormality结果如下:TestsofNormality品种Kolmogorov-SmirnovShapiro-WilkStatisticdfSig.StatisticdfSig.基础母羊体重甲品种.10763.068.98563.651乙品种.0
14、8963.200*.97563.236SPSS用Kolmogorov-Smirnov、Shapiro-Wilk两种方法对各样本进行正态分布检验。本例中,甲品种Kolmogorov-Smirnov正态性检验统计量为0.107,无效假设成立概率(Sig.)即p=0.068;Shapiro-Wilk检验统计量为0.985,p=0.651;两种检验结果均差异不显著,提示甲品种羊的样本服从正态分布。乙品种羊的样本Kolmogorov-Smirnov、Shapiro-Wilk检验p值分别为0.200、0.236,表明乙品种羊的样本观察值分布也与正态分布没有显著差异。TestofHomogeneityofV
15、arianceLeveneStatisticdf1df2Sig.基础母羊体重BasedonMean.3041124.582BasedonMedian.2751124.601BasedonMedianandwithadjusteddf.2751120.084.601Basedontrimmedmean.3221124.571TestofHomogeneityofVariance表格输出的是方差同质性检验结果。SPSS提供了基于平均数(BasedonMean)、基于中位数(BasedonMedian)、基于中位数和校正自由度(BasedonMedianandwithadjusteddf)、基于校正
16、平均数(Basedontrimmedmean)等不同情况下的Levene方差同质性检验结果。本例各种情况下的p值分别为0.582、0.601、0.601、0.571,均大于0.05,说明甲、乙两样本所在总体方差没有显著差异,即两样本总体方差满足方差同质性(齐性,同质性)前提条件,可进行t检验或方差分析,而无需进行校正。14.1.2统计绘图在常用的统计软件中,SPSS绘制的统计图较为美观,可满足科学研究中图表制作的要求。因此,SPSS统计图应用非常广泛。(1)简单条形图【例14.2】应用【例14.1】前例数据文件,绘制不同品种母羊的体重平均值条形图。解SPSS操作步骤:图形Graphs旧对话框L
17、egacyDialogues条形图Bar,打开条形图BarCharts对话框,点选简单条形图命令Simple,在其下的DatainChartAre即图形数据定义中选择各组观察值分组汇总Summariesforgroupsofcases。单击Define按钮,开启正式的条形图定义对话框。在DefineBarChart:SummariesforGroupsof对话框中,条形图代表类型BarsRepresent点选框组其它统计功能0therstatistic,egmean再将左侧候选变量栏中的weight选入变量对话框Variable中;点击变更统计量ChangeStatistic按钮,在出现对话框
18、中选择Meanofvalues,点击Continue按钮返回上一级对话框。在分类轴CategoryAxis框中,选入breed变量。单击Ok按钮,系统输出的简单条形统计图如下:60.00-50.00-Mean基础母羊休重40.00-30.00-20.00-uT1甲品神二品神品种除简单条形图外,SPSS还可以绘制聚簇条形图ClusterdBarChart、堆积条形图StackedBarChart等。限于篇幅,在此不一一列举。(2)散点图(SeatterChart)SPSS散点图包括simple、matrix(以矩阵的形式显示多个变量间两两的散点图)、Overlay(将多个变量间两两的散点图同时作
19、在一张图上)和3D(X、Y、Z三个变量立体散点图)等4种。下面仅介绍简单散点图的绘制方法。【例14.3】在四川白鹅生产性能研究中,得到一组关于雏鹅重(g)与70日龄重(g)的数据,试作散点图。表14-2四川白鹅重与70日龄重测定结果(单位:g)编号123456789101112雏鹅重(x)80869890120102958311310511010070日重(y)235024002720250031502680263024003080292029602860性别malefemalemalefemalefemalefemalemalefemalemalefemalemalemale注:数据引自四川
20、农业大学主编生物统计学,其中性别不是真实数据,仅供模拟。解SPSS操作步骤:建立数据文件,包含雏鹅重变量BW、70日龄重变量SW、性别变量gender。GraphsScatter/DotChartSimple,点击Define,打开散点图对话框,将BW变量选入右侧的X轴变量栏,将SW变量选入Y分类轴,gender选入设置标记Setmarkersby栏。单击Ok,输出散点图。3200.00-性别OfemaleOmale3000.00-70日龄垂2800.00-2600.00-2400.00-2200.00-80.0090.00100.00110.00120.0014.2统计假设检验14.2.1方
21、差同质性检验【例14.4】测得甲、乙两种植物植株的株高如下表,试检验甲、乙两种植物植株株高的方差是否一致。表14.4两种植物植株高度测量(单位:cm)植株高度组别甲乙16332022171515282217方差同质性检验主要是从各样本的方差来推断其总体方差是否相同。在有原始数据情况下,有多种方法可通过菜单操作检测两样本或多样本方差同质性。解SPSS操作步骤:建立数据文件:将观察值输入一列,命名为height;另建一分组变量,分别用1、2表示两种植物,命名为variety。AnalyzeDescriptiveStatisticsExplore,打开对话窗。选择变量height进入因变量Depen
22、dentList栏,选择变量Variety进入分组变量FactorList栏。点击Plots按钮,打开对话框。将Spreadvsplotswithtests下选项指定为Untranslated。点击Continue返回。点击Ok,输出结果。本例为两样本方差同质性检验。运行SPSS程序后,在输出结果中,TestofHomogeneityofVariance表格式方差同质性检验结果。TestofHomogeneityofVarianceLeveneStatisticdf1df2Sig.植株高度BasedonMean5.06318.055BasedonMedian3.34018.105Basedon
23、Medianandwithadjusteddf3.34015.786.119Basedontrimmedmean4.87218.058SPSS分别输出了基于平均数、中位数、中位数及校正df、修正平均数等5项参数基础上Levene检验的结果,各项检验结果p均大于0.05,所以两样本所在总体方差同质。若各项检测结果冲突,一般以基于平均数Levene检验结果为准下结论。若观察值偏离正态分布,则以基于中位数的检验(Brown-Forsythe检验)为准。方差同质性检验还有Bartlett、HartleyF、Cochran等法,SS仅提供Levene检验。Bartlett方法对正态性很敏感,而常用的Le
24、vene检验对正态性偏离耐PS受性较强。另外,若只有平均数、标准差、样本含量等信息,也可进行方差同质性检验,但需要编程才能实现。【例14.5】假设某试验设计包含3个样本,试检验这三个样本所来自总体方差是否相同。表14.53样本试验数据资料一组别测定指标甲乙丙1111127186121513910101017916612141091011本例为3样本方差同质性检验。多样本的方差同质性检验,可依照两样本方差同质性检验方法进行。下面给出另一种求解方法。解SPSS操作步骤:建立数据文件,包括试验指标变量index、分组变量group。AnalyzeGenralLinearModelUnivariate
25、,打开对话窗。选择变量index进入因变量DependentVariable栏,选择group变量入分组变量Fixedfactor(s)栏。点击Options按钮,勾选方差同质性检验Homogeneitytest,点击Continue返回。点击Ok运行,输出检验结果。SPSS输出结果中LevenesTestofEqualityofErrorVariances即为方差同质性检验结果。本例Levene检验p值为0.359,大于0.05,所以可判定3样本所在总体方差无显著差异,即方差同质。LevenesTestofEqualityofErrorVariancesFdf1df2Sig.1.077220
26、.3594.2.2单样本t检验单样本t检验又叫样本平均数与总体平均数差异显著性检验,是检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自该总体。【例14.6】正常人血钙值属于N(2.29,0.37),现有8名甲状旁腺减退患者,测得其血钙值分别为2.03、2.18、2.11、1.98、1.87、2.01、2.09、1.78mmol/L,试检验这8人血钙值是否正常。解SPSS操作步骤:建立数据文件:将观察值输入一列,命名为calcium。AnalyzeCompareMeansOne-SampleTTest,打开对话窗。选择变量calcium为TestVariable。在Tes
27、tValue后面的框内输入总体均数2.29。点击Ok,输出统计分析结果。运行程序后,首先输出单样本统计量,包括样本名称、样本含量、平均数Mean、标准差Std.Deviation和标准误Std.ErrorMean。One-SampleStatisticsNMeanStdDeviationStd.ErrorMeancadmium82.0063.13038.04610One-SampleTestTestValue=2.29tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUppercadmium-6.15
28、670.000465-.28375-.3927-.1748其次,输出One-SampleTest表格,即单样本t检验结果。t统计量构建中表面效应(样本与总体均数之差)为-0.28375,该差值的95%置信区间为-0.3927到-0.1748。值为-6.156,自由度为7,双尾检验p值实际为0.000465(双击SPSS输出的One-SampleTest表格中Sig.(2-tailed)下的小概率框内0.000可显示)。本例为双侧检验,因此可断定p0.01,所以否定无效假设,样本所在总体平均数与总体均数2.29差异极显著,或该样本不是来自于总体均数为2.29的总体。换言之,甲状旁腺减退患者的血钙
29、水平极显著低于正常人生理常值,此结论符合甲状旁腺素的生理功能。【例14.7】按规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C含量服从正态分布,该批产品是否符合规定要求?解SPSS操作步骤:建立数据文件:将观察值输入一列,命名为Vc。AnalyzeCompareMeans246,实际表面效应=6.00000,大于246,所以单侧检验p值应为双侧检验p值除以2,即0.044/2=0.022。因单侧检验0.
30、01p0.05,所以该饲料场产品是合格的。若检验三聚氰胺等有害化学物质,则备择假设应为pp0。单样本t检验实际为配对t检验的特例,可用配对t检验和两因素无重复观测值方差分析模型或单因素配伍组设计方差分析模型求解,主要结果等价(即p值相等),且可以获得更多的统计信息。14.2.3配对设计资料t检验配对设计(Dependentsamplesttest,Paired-samplesttest)是实际是随机区组设计试验的特例,可降低试验误差和提高试验的准确性和精确性。SPSS配对t检验命令可进行1对或同时进行多对配对资料的分析。在进行配对t检验时,也应特别注意分布正态性和方差同质性两大前提条件。数据分
31、布正态性可以用SPSS探索性分析命令explore来实现,但方差同质性检验不宜采用explore命令进行,需要根据混合线性模型分析结果编程来完成。【例14.8】用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表14.8。设体温服从正态分布,问注射前后体温有无显著差异?表14.8家兔注射药物前后体温变化兔号12345678910注射前体温37.838.238.037.637.938.138.237.538.537.9注射后体温37.939.038.938.437.939.039.538.638.839.0解SPSS操作步骤:建立数据集:将注射前体温和注射后体温观察值分别输入
32、两列,分别命名为Pretr和Posttr。AnalyzeCompareMeansPaired-SamplesTTest,打开对话框。单击变量,分别将pretr和posttr选入PairedVariable栏,也可按Control键一次性调入成对变量。点击Ok确定,输出分析结果。PairedSamplesStatisticsMeanNStdDeviationStd.ErrorMeanPair1注射前体温37.970010.29833.09434注射后体温38.700010.50990.16125首先输出成对变量基本统计结果PairedSamplesStatistics表格,包括样本含量、平均数、
33、标准差、标准误等。PairedSamplesCorrelationsNCorrelationSig.Pair1注射前体温&注射后体温10.497.144PairedSamplesCorrelations表格为成对样本相关分析。成对样本观察值存在相关,是进行配对t检验基础,但相关系数显著与否不起决定性作用。本例注射前后实验动物体温的相关系数为0.144,无显著的统计学意义,仅供参考。PairedSamplesTestPairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheD
34、ifferenceLowerUpperPair1注射前体温-注射后体温-.73000.44485.14067-1.04822-.41178-5.1899.001PairedSamplesTest表内陈列了配对t检验最主要的结果。从表可见,本例配对t检验两样本差值d平均值(表面相应)=-0.73000;试验误差,即差值d标准误=0.14067;t=-5.189,双侧检验p值为0.001,小于极显著水平0.01。因此,注射药物前后兔体温有极显著差异,这里表现为注射药物后体温极明显升高。配对t检验命令可以进行单样本t检验。【例14.9】根据例14.6的数据,用配对t检验法求解单样本t检验案例。解SP
35、SS操作步骤:建立数据文件:将8名甲状旁腺减退患者血钙值输入同列,将该变量命名为calcium;另建一变量,内含8个病人对应的正常人血钙值,即2.29重复8个案例,变量名为GM。AnalyzeCompareMeansPaired-SampleTTest,打开对话框。单击变量,分别将calcium和GM选入Pairedvariable栏。点击Ok确定,输出分析结果。PairedSamplesTestPairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifference
36、LowerUpperPair1cadmium-总体均数-.28375.13038.04610-.39275-.17475-6.1567.000从PairedSamplesTest表可见,t=-6.156,双击sig.栏,得到p=0.000465(p0.01)。因此,配对t检验与单样本t检验计算结果等价。此例有助于深入领会单样本t检验的实质。此外,配对t检验本身可以被方差分析模型替代。14.2.4成组(非配对)设计资料t检验非配对t检验(Independentsamplettest)的两个样本相互独立,其含量不一定相等。无论样本含量是否相等,用SPSS进行非配对t检验的操作方法完全一致。利用SP
37、SS进行非配对t检验时,两组数据应满足效应独立性、分布正态性、方差同质性三大前提条件。效应独立性一般可根据专业知识,结合相关分析来确定;分布正态性可用SPSS探索性分析命令explore完成;SPSS非配对t检验本身也提供了方差同质性检验结果。【例14.10】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表14.10所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异?表14.10长白与蓝塘后备种猪背膘厚度品种N背膘厚度(cm)长白121.21.321.11.281.351.081.181.251.
38、31.121.191.05蓝塘1121.851.61.781.961.881.821.71.681.921.8解SPSS操作步骤:建立数据文件:将所有观察值输入同列,命名为fat;另建一分组变量breed。AnalyzeCompareMeansIndependent-samplesTTest,打开对话框。单击变量名,选择变量fat为TestVariables,breed变量为GroupingVariable。单击Independent-SamplesTTest下方的DefineGroups按钮,弹出定义对话框,默认选项为UseSpecifiedValue,在Group1和Group2框中分别填
39、入1和2,即要对组别变量值为1和2的两个组做t检验。点击Continue返回IndependentSamplesTTest对话框。若要选择置信度和处理缺失值的方法,可点击independent-SamplesTTest对话框的options对话框设置。本例不改缺省设置,按continue返回independentSamplesTTest对话框。点击0k,运行程序,输出结果。首先输出的是描述性统计,给出了两个组的样本数N、均值Mean、标准偏差Std.Deviation、标准误Std.ErrorMean。GroupStatisticsbreedNMeanStdDeviationStd.Error
40、Meanfat长白121.2017.09980.02881蓝塘111.8173.12281.03703IndependentSamplesTestLevenesTestforEqualityof十一十esfCXFmia1彳十“cflUoanuFSigtdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceTowerTinneyfatEqualvariancesassumed.289.597-13.24421.000-.61561.04648-.71227-.51894Equalv
41、ariancesnotassumed-13.12119.332.000-.61561.04692-.71369-.51752第二部分输出的IndependentSamplesTest是主要结果。该部分内容主要分为两部分:LevenesTestforEqualityofVariances,即方差齐次检验(Levene检验)。本例Levene检验F统计量为0.289,p值为0.589,可见两样本所在总体方差没有显著差异,即方差同质。样本均数t检验部分。因方差相等或不相等而计算不同。如果两组样本所在总体方差有显著差异(Equalvariancesnotassumed),则需要进行校正,则要对两样本所
42、在总体均数进行校正t检验,均数t检验结果列在Equalvariancesnotassumed行;若满足方差同质性条件(Equalvariancesassumed),则进行正常的非配对t检验,均数t检验结果列在Equalvariancesassumed行。本例两样本总体方差相等,所以t=T3.244,df=21,双侧t检验概率p0.01,表明两品种猪背膘差异极显著。结果中还给出了两组均数差值等统计信息,可见蓝塘、长白猪两样本均数差值(MeanDifference)为-0.61561,两组均数差值的95%置信区间(95%ConfidenceIntervaloftheDifference)的上下限分
43、别为为-0.51894、-0.71227,即有95%的把握可以判定两组均数在-0.71227到-0.51894之间。试验误差,也就是均数差异标准误(Std.ErrorDifference)为0.04648。在使用SPSS进行t检验时,还应注意以下问题:虽然各主流统计软件均提供了方差不等时的校正t检验算法,但许多统计学专家建议,在不满足分布正态性、方差同质性的情况下,最适宜的方式是直接进行两样本秩和检验,即惠特尼U检验。与配对t检验相似,非配对t检验可被方差分析模型以及更高级的统计模型所替代。与SYSTAT、NCSS等软件不同,SPSS没有提供百分率资料t检验(U检验)的菜单式的直接命令。该类资
44、料分析可用SPSS卡方检验替代,也可以通过编程实现。14.2.5参数的区间估计利用SPSS菜单可进行参数估计,即用样本统计量来估计总体参数的区间范围,但直接用菜单命令进行区间估计的功能不够强大,编程可满足各种统计量和数据区间估计的需要。【例14.11】某品种猪10头仔猪的初生重为1.5、1.2、1.3、1.4、1.8、0.9、1.0、1.1、1.6、1.2(kg),求该品种猪仔猪初生重总体平均数的置信区间。解SPSS操作步骤如下:建立数据文件,包含表示仔猪初生重的单独变量BW。依次选择AnalyseDescriptiveStatisticsExplore命令。在打在的Explore对话框中,选
45、择BW进入DependentVariable对话框。点击Statistics按钮,在对话框中Descriptive下的Confidenceintervalformean后面的框内,设置置信度,点击Continue返回主对话框。点击0k,运行命令,输出统计结果。DescriptivesStatisticStd.Error 框。 仔猪初生重Mean1.3000.0881995%ConfidenceIntervalforMeanLowerBound1.1005UpperBound1.4995可见,该品种猪仔猪初生重总体平均数的95%置信区间为下限为1.1005,上限为1.4995。通过改变置信度,可
46、得99%置信区间,95%置信区间为下限、上限为1.0134、1.5866。14.3卡方检验14.3.1适合性检验【例14.12】在进行山羊群体遗传检测时,观察了260只白色羊与黑色羊杂交的子二代毛色,其中181只为白色,79只为黑色,问此毛色的比率是否符合孟德尔遗传分离定律的3:1比例?解SPSS操作步骤:建立数据文件:将各属性类别的实际观察次数输入同列,命名为A;另建变量color,其值可为1、2,分别表示白色和黑色羊(在变量value中定义)。DataWeightCases,打开加权对话框,点选weightcasesby,将A选入,对实际次数变量进行加权,Ok确定。AnalyzeNonpa
47、rametrieTestsLegacyDialoguesChi-Square,弹出Chi-Square对话框。点击color,将该变量选入检验变量TestVariables;在期望值(理论值)ExpectedValues下面,点选Values,在其后的框内输入第1类别(白色)理论次数195,点击Add加入,同法输入第二类别理论次数65。点击Ok确定,输出适合性卡方检验结果。本例属于2个属性类别的适合性卡方检验案例。运行适合性卡方检验程序后,首先输出实际观察次数和理论预期次数表,可见实际观察次数(ObservedN)、理论次数(ExpectedN)数据及其对应关系正确。羊群毛色统计Residua
48、l白色181195.014.0黑色7965.014.0Total260其次,输出适合性卡方检验结果表(TestStatistics)。从检验表可以看出,本例卡方值(Chi-Square)为4.021,自由度为1,近似p值(Asymp.Sig.)为0.045。TestStatistics表下的注释表明,本例没有理论次数小于5者,符合卡方检验的前提条件。TestStatist:Lcs毛色Chi-Square4.021aDf1AsympSig.045a.0cells(0.0%)haveexpectedfrequencieslessthan5.Theminimumexpectedcellfrequen
49、cyis65.0.在经典的卡方检验中,当df=1时,要进行yates校正,但目前比较多的统计学认为yates校正有矫枉过正之嫌,特别是在适合性卡方检验中。因此,主流的大型统计软件(包括SPSS),在适合性检验中都不提供yates校正卡方值。本例中,以pearsonchi-ssquare为主下结论,无效假设成立的概率p0.05,表明该群羊毛色实际次数与理论次数不相符,子二代毛色分离不符合经典的孟德尔遗传分离规律。【例14.13】在研究牛的毛色和角的有无两对相对性状分离现象时,用黑色无角牛和红色有角牛杂交,子二代出现黑色无角牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头,共360
50、头。试问这两对性状是否符合孟德尔遗传规律中9:3:3:1的遗传比例?解SPSS操作步骤:建立数据集:将各属性类别的实际观察次数输入一列,将该变量命名为A;依据理论比例,计算各类别的理论预期次数,命名为T。另建变量type,其值可为1、2、3、4,分别表示黑色无角、黑色有角、红色无角、红色有角牛。DataWeightCases,打开对话框。点选weightcasesby,将A选入,对实际次数变量进行加权,Ok确定返回。AnalyzeNonparametricTestsLegacyDialoguesChiSquare,弹出Ch-Square对话点击Type变量选入TestVariables;在Ex
51、pectedValues下面,点选Values,依次输入黑色无角、黑色有角、红色无角、红色有角牛的理论预期次数202.5、67.5、67.5、22.50。点击Ok确定。牛群毛色、角型两性状类别统计ObservedNExpectedNResidual黑色无角192202.5-10.5黑色有角7867.510.5红色无角7267.54.5红色有角1822.5-4.5Total360TestStatistics牛群毛色、角型两性状组合类别Chi-Square3.378aDf3AsympSig.337a.0cells(0.0%)haveexpectedfrequencieslessthan5.Them
52、inimumexpectedcellfrequencyis22.5.运行程序后,输出牛群毛色、角型两性状类别统计表和卡方检验结果表(TestStatistics)。从检验表可以看出,本例卡方值(Chi-Square)为3.378,自由度为3,近似p值(Asymp.Sig.)为0.337,差异不显著(p0.05),说明牛毛色和角型两对性状符合孟德尔遗传规律中9:3:3:1的自由组合定律。14.3.2独立性检验【例14.14】研究某暴露因素与某疾病发生的关系,某研究者对120人进行了调查,其中患病人数为54人,非患病人数为66人,患者中有37人有暴露史,而非患者中有13人有暴露史,请问该暴露因素是
53、否与该病的发生相关?解SPSS操作步骤:建立数据文件:将各属性类别的实际观察次数输入同列,命名为count。建行变量history,输入不同数字表示(1表示有暴露史,2表示无暴露史);在变量视图下,定义该变量Label和value。另建列变量health,1表示患病,2表示健康;定义该变量Label和value。DataWeightCases,打开加权对话框,点选WeightCasesBy,选择变量count进入FrequencyVariable,点击Ok确定,返回主菜单界面。AnlysisDiscriptiveStatisticsCrosstable,将history选入行变量Row(s),
54、将health选入列变量Colomn(s)框。点击Statistics按钮,点选Chi-Square,Continue返回主对话框。点击Cell按钮,勾选Observed、Expected,即实际次数和理论次数。Continue返回主对话框。 # 在Crosstabs主对话框,点击确定,输出结果。健康状况*暴露史Crosstabulation暴露史Total有暴露史无暴露史健康状况患病Count3717b54ExpectedCount22.531.554.0%within健康状况68.5%31.5%100.0%健康Count1353b66ExpectedCount27.538.566.0%wi
55、thin健康状况19.7%80.3%100.0%TotalCount5070120ExpectedCount50.070.0120.0%within健康状况41.7%58.3%100.0%Eachsubscriptletterdenotesasubseto暴露史categorieswhosecolumnproportionsdonotdiffersignificantlyfromeachotheratthe.05level.健康状况*暴露史交互表(Crosstabulation)是主要输出结果之一,其中各单元格上边一行Count均为实际次数,下行ExpectedCount为计算的理论次数。Ch
56、iSquareTestsValuedfAsympSig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PearsonChi-Square29.126a1.000ContinuityCorrection27.1521.000LikelihoodRatio30.2381.000FishersExactTest.000.000Linear-by-LinearAssociation28.8831.000NofValidCases120本例为双向无序分类资料,卡方检验适用于此类资料的统计分析。Chi-SquareTests是独立性卡方检验表。在本例检验结果中,
57、输出了多种重要方法的检验结果,其中皮尔逊卡方(PearsonChi-Square)值为29.126,自由度为1,yates连续性校正卡方(ContinuityCorrection)值为27.152,似然比卡方(LikelihoodRatio,G卡方)值为31.238。几种重要卡方检验无效假设成立概率值p均小于0.0001。在独立性检验中,当df=1时,仍然有必要进行yates连续性校正。主流统计软件均在df=1的独立检验中提供连续性校正卡方。所以,本例以校正卡方值为主下结论,p0.0001,差异极显著,说明暴露史与疾病发生有密切关联,即有暴露史的人群发病率极显著高于未暴露者。【例14.15】乳
58、房自检有利于乳腺癌的早期发现,Senie等人对年龄与乳房自检频率的相关性进行了研究,对1216名女性进行的调查研究如表14.15所示,问该地区乳房自检频率是否与女性年龄相关?表14.15某地妇女年龄与乳房自检频率的关系表14.15某地妇女年龄与乳房自检频率的关系 乳房自检频率年龄(岁)每月偶尔从不合计4591(66.7)90(93.1)51(72.1)23245-59150(145.4)200(202.7)155(157.0)505三60109(137.9)198(192.2)172(149.0)479合计3504883781216解SPSS操作步骤:建立数据文件:包含实际观察次数变量freq
59、uency,行变量age,列变量inspection。DataWeightCases,打开加权对话框,点选WeightCasesBy,选择Frequency变量进入FrequencyVariable,确定,返回Crosstab界面。AnalyzeDescriptiveStatisticsCrosstab,将age选入行变量Row(s),将inspection选入列变量Column(s)框。点击Statistics按钮,点选Chi-Square。点击Cell按钮,勾选Observed、Expected。点选CompareColumnProportions及其下的Adjustpvalues(Bon
60、ferronimethod)。点选Percentages下的Column。Continue返回主对话框。在Crosstabs主对话框,点击确定,输出结果。年龄*乳房自检频率Crosstabulation乳房自检率Total每月偶尔从不年龄45Count919051232ExpectedCount66.893.172.1232.0%within乳房自检频26.0%18.4%13.5%19.1%45-59Count150200155505ExpectedCount145.4202.7157.0505.0%within乳房自检频42.9%41.0%41.0%41.5%三60Count10919817
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年水下焊接焊缝无损检测验收标准知识考察试题及答案解析
- 安全员A证考试考前冲刺分析【名校卷】附答案详解
- 企业员工语言表达能力提升方案
- 安全员A证考试复习试题附完整答案详解【夺冠系列】
- 安全员A证考试强化训练及答案详解(考点梳理)
- 货币资金内部控制制度的内容及方法
- 安全员A证考试模拟卷包【学生专用】附答案详解
- 安全员A证考试模拟题库及答案详解1套
- 安全员A证考试复习提分资料附完整答案详解(网校专用)
- 押题宝典安全员A证考试模考模拟试题附参考答案详解【培优】
- 2024年中考语文复习冲刺课内古诗词阅读(上海专用)(原卷版+解析版)
- 建筑防水工程技术规程DBJ-T 15-19-2020
- 矢量网络分析仪校准规范
- 高考英语阅读理解分类及方法课件
- 绍兴金牡印染有限公司年产12500吨针织布、6800万米梭织布高档印染面料升级技改项目环境影响报告
- DHA乳状液制备工艺优化及氧化稳定性的研究
- 岳麓书社版高中历史必修三3.13《挑战教皇的权威》课件(共28张PPT)
- GC/T 1201-2022国家物资储备通用术语
- 污水管网监理规划
- GB/T 6730.65-2009铁矿石全铁含量的测定三氯化钛还原重铬酸钾滴定法(常规方法)
- GB/T 35273-2020信息安全技术个人信息安全规范
评论
0/150
提交评论