统计学全程试题解析.doc_第1页
统计学全程试题解析.doc_第2页
统计学全程试题解析.doc_第3页
统计学全程试题解析.doc_第4页
统计学全程试题解析.doc_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上表为单样本t检验表1. 单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均数的差值(Mean Difference)、差值的95%可信区间。由上表可知:t=2.975,P=0.007。因此可以认为血磷值的总体均数不等于1。2Independent-Samples T Test过程两组需检验变量的基本情况描述。第一部分为Levenes方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,P = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,=22,P=0.019。从而最终的统计结论为按=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。上表的标题内容翻译如下:Levene方差齐性检验两均数是否相等的t检验F值P值t值自由度P值(双侧)均数差值差值的标准误差值的95%可信区间下限上限血磷值假设方差齐.032.8602.52422.019.4363.17297.777E-02.7948假设方差不齐2.52421.353.020.4363.17297.716E-02.79543.配对t检验:Paired-Samples T Test过程对子间的差异差值均数标准差标准误均数的95%可信区间t值自由度P值(双侧)下限上限第一对G1 - G2812.5000546.2535193.1298355.82071269.17934.2077.0044. 成组设计的方差分析:One-Way ANOVA过程用于进行两组及多组样本均数的比较,即面实际上是一个典型的方差分析表。给出了单因素方差分析的结果,可见F=84.544,P0.001。因此可认为三组矿工用力肺活量不同。上表的标题内容翻译如下:离均差平方和SS自由度均方MSF值P值组间变异9.26624.63384.544.000组内变异1.534285.480E-02总变异10.80030上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。从上表可见,石棉肺患者、可疑患者和非患者被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P值均为1.000(自己和自己比较,当然绝对不会有差异了)。5.两因素方差分析现在大家看到的是一个典型的方差分析表,只不过是两因素的而已,我来解释一下:首先是所用方差分析模型的检验,F值为00.517,P小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量GROUP,可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的FOOD,非常遗憾,它的P值为0.084,还没有统计学意义。尽管不太愿意,我们的结论也只能是:尚不能认为三种营养素喂养的小白鼠体重增量有差别。上表的标题内容翻译如下:变异来源III型方差SS自由度均方MS统计量FP值校正的模型2521.2949280.14411.517.000截距74359.534174359.5343056.985.000GROUP2376.3767339.48213.956.000FOOD144.917272.4592.979.084误差340.5431424.324合计77221.37024校正的合计2861.83623现在是两两比较的结果,方法为SNK法,由于前面总的比较无差异,所以这里三种食物均在一个亚组内,检验无差异,P值为0.121。好了,上面是正确的结果,如果model选择是采用Full factor又如何呢?会得出方差分析表如下:看到了吗?由于所谓的交互作用将自由度给全部“吃”掉了,没有误差可用于统计分析,什么结果也做不出来6. 协方差分析上表显示交互作用无统计学意义,而且P值非常大,因此交换group和age多半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析。这是正式的统计分析结果,显示group和age都对胆固醇含量有影响,P值分别为0.038和小于0.001。Estimated Marginal Means这是两组的修正均数及相应的可信区间,显然超重组的胆固醇均值较高。下方的提示表明该修正均数是按年龄为50.2308岁的情形计算的。7.多元方差分析所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。这是引入模型的自变量的取值情况列表上表是针对模型中的自变量间及其交互作用所做的检验,采用的是四种多元检验方法。一般他们的结果都是相同的,如果不同,一般以Hotellings Trace方法的结果为准。可见在所用的模型中,extrusn和additive对结果变量是有统计学意义的,但交互作用无统计学意义。上表实际上是四个一元方差分析表的合并,即分别考虑四个应变量时的方差分析结果。上面的多元方差分析已经得知两自变量对应变量有影响,从现在的分析表就可以更清楚的知道是对那些自变量影响较大。对照可知,extrusn和additive对tear resistance和gloss都有较大影响,而他们的交互作用对gloss有影响,他们(及交互作用)对Opacity都没有影响。8.重复测量的方差分析重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决General Linear Model上表给出了所定义的4次测量的变量名,在模型中它们都代表一个应变量trial,只是测量的次数不同而已。这是引入模型的其它自变量的情况列表。上表是针对所检验的结果变量trial,以及他和另两个引入模型的自变量间的交互作用是否存在统计学意义,采用的是四种多元检验方法。一般他们的结果都是相同的,如果不同,我一般以Hotellings Trace方法的结果为准。可见在所用的模型中,trial的四次测量间的确是存在着统计学差异的,但它和另两个变量间的交互作用无统计学意义。上表是球形检验,因为重复测量的方差分析模型要求所检验的应变量服从一种叫做球形分布的东东。上面可能有些内容不好懂,不过没关系,只要看到近似卡方为9.383,自由度为5,P值为0.097就可以了。因此trial是勉强服从球形分布的,可以进行重复测量的方差分析。上面又用方差分析的方法对组内因素进行了检验,注意第一种为球形分布假设成立时的结果,就是我们所要看的。如果该假设不成立,则根据不同的情况可能看下面三种检验结果之一,或放弃该检验方法。上表是非常重要的一部分:各次重复测量间变化趋势的模型分析,这里要求检验没有统计学意义,否则说明变化趋势不服从该曲线。以trial为例,对Linear的检验P值小于千分之一,Quadratic的P值略大于0.05。只有Cubic的P值在0.5附近,因此最佳的拟合曲线应为Cubic(三次方曲线);但由于一共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上的知识,最终的拟和曲线应为Quadratic(二次方曲线)。上表为最后一张,为组间效应的方差分析结果,可见anxiety和tension均无统计学意义。最后,为了再确认一下几次测量间的变化趋势,我们另外用plots子菜单作出模型估计的四次测量均数值如下图:可见四次测量均数实际上还是近似于直线趋势的,因此前面的模型应为线性最佳。9.多元线性回归Regression这里的表格是拟合过程中变量进入/退出模型的情况记录,由于我们只引入了一个自变量,所以只出现了一个模型1(在多元回归中就会依次出现多个回归模型),该模型中fat为进入的变量,没有移出的变量,具体的进入/退出方法为enter。上表为所拟合模型的情况简报,显示在模型1中相关系数R为0.578,而决定系数R2为0.334,校正的决定系数为0.307。这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!有兴趣的读者可以自己用方差分析模型做一下,就会发现出了最左侧的一列名字不太一样外,其他的各个参数值都是相同的。从上表可见所用的回归模型F值为12.059,P值为0.002,因此我们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。上表给出了包括常数项在内的所有系数的检验结果,用的是t检验,同时还会给出标化/未标化系数。可见常数项和fat都是有统计学意义的,上表的内容如果翻译成中文则如下所示:未标准化系数标准化系数模型系数b系数标准误系数t值P值1常数5.0970.42711.9230.000fat0.7000.2020.5783.4730.002最终的结果如下:Regression上面的表格依次列出了模型的筛选过程,模型1用进入法引入了extrusn,然后模型2用stepwise法引入了additive,另两个变量因没有达到进入标准,最终没有进入。上面的表格翻译出来如下:模型进入的变量移出的变量变量筛选方法1extrusn进入法2additivestepwise法(标准:进入概率小于0.05,移出概率大于0.1)上表是两个模型变异系数的改变情况,从调整的R2可见,从上到下随着新变量的引入,模型可解释的变异占总变异的比例越来越大。上表是所用两个模型的检验结果,用的方法是方差分析,可见二个模型都有统计学意义。上表仍然为三个模型中各个系数的检验结果,用的是t检验,可见在模型2中所有的系数都有统计学意义,上表的内容翻译如下:未标化的系数标化的系数模型B标准误Betat值P值1(常数)5.900.26522.278.000extrusion.590.167.6393.522.0002(常数)5.315.31416.926.000extrusion.590.144.6394.905.000additive.390.144.4222.707.000这是新出现的一个表格,反映的是没有进入模型的各个变量的检验结果,可见在模型1中,未引入模型的候选变量additive还有统计学意义,可能需要引入,而模型2中没有引入的两个变量其P值均大于0.05,无需再进行分析了。10. Logistic回归模型结果解释Logistic Regression上表为记录处理情况汇总,即有多少例记录被纳入了下面的分析,可见此处因不存在缺失值,26条记录均纳入了分析。上表为应变量分类情况列表,没什么好解释的。Block 0: Beginning Block此处已经开始了拟合,Block 0拟合的是只有常数的无效模型,上表为分类预测表,可见在17例观察值为0的记录中,共有17例被预测为0,9例1也都被预测为0,总预测准确率为65.4%,这是不纳入任何解释变量时的预测准确率,相当于比较基线。上表为Block 0时的变量系数,可见常数的系数值为-0.636。上表为在Block 0处尚未纳入分析方程的侯选变量,所作的检验表示如果分别将他们纳入方程,则方程的改变是否会有显著意义(根据所用统计量的不同,可能是拟合优度,Deviance值等)。可见如果将X2系列的哑变量纳入方程,则方程的改变是有显著意义的,X4和X5也是如此,由于Stepwise方法是一个一个的进入变量,下一步将会先纳入P值最小的变量X2,然后再重新计算该表,再做选择。Block 1: Method = Forward Stepwise (Conditional)此处开始了Block 1的拟合,根据我们的设定,采用的方法为Forward(我们只设定了一个Block,所以后面不会再有Block 2了)。上表为全局检验,对每一步都作了Step、Block和Model的检验,可见6个检验都是有意义的。此处为模型概况汇总,可见从STEP1到STEP2,DEVINCE从18降到11,两种决定系数也都有上升。此处为每一步的预测情况汇总,可见准确率由Block 0的65%上升到了84%,最后达到96%,效果不错,最终只出现了一例错判。上表为方程中变量检验情况列表,分别给出了Step 1和Step 2的拟合情况。注意X4的P值略大于0.05,但仍然是可以接受的,因为这里用到的是排除标准(默认为0.1),该变量可以留在方程中。以Step 2中的X2为例,可见其系数为2.413,OR值为11。上表为假设将这些变量单独移出方程,则方程的改变有无统计学意义,可见都是有统计学意义的,因此他们应当保留在方程中。最后这个表格说明的是在每一步中,尚未进入方程的变量如果再进入现有方程,则方程的改变有无统计学意义。可见在Step 1时,X4还应该引入,而在Step 2时,其它变量是否引入都无关了。Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一刀两断 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 Two-Independent-Samples Tests:即成组设计的两样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论