非参数的统计分析培训课件_第1页
非参数的统计分析培训课件_第2页
非参数的统计分析培训课件_第3页
非参数的统计分析培训课件_第4页
非参数的统计分析培训课件_第5页
已阅读5页,还剩70页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本资料来源第一页,共七十五页。第六讲非参数检验和卡方检验任衍具E-mail:山东师范大学心理学院第二页,共七十五页。非参数的统计分析第三页,共七十五页。主要内容非参数检验的必要性非参数检验的预备知识SPSS非参数模块介绍两个配对样本的非参数检验两个独立样本的非参数检验多个独立样本的非参数检验多个相关样本的非参数检验第四页,共七十五页。非参数检验与参数检验参数统计方法:如t检验和方差分析特点:假定随机样本来自某种已知的分布的总体对总体分布的参数可估计或检验第五页,共七十五页。非参数检验与参数检验问题:比较男女红细胞数的差别参数检验步骤建立无效假设H0:u=u0,H1:u≠u0计算统计量t=???p>0.05,……p<0.05,……下结论:有统计意义,认为男女红细胞数不同通过比较均数回答两总体是否相同的问题第六页,共七十五页。参数检验的条件观测值互相独立两样本对应的总体服从正态分布(双变量正态分布)两样本方差齐当条件不满足时方差不齐:t’检验非正态:变量变换、稳健方法、非参数法第七页,共七十五页。非参数检验的必要性问题:总体分布不确定分布呈非正态且无适当数据转换方法不能或未加精确测量:如等级资料第八页,共七十五页。非参数法参数法条件不满足时的处理方法对参数的分布没有什么要求distributionfree不对均数等参数检验,而是检验分布是否相同(构造的统计量)效能可能比较低当数据满足参数法条件时,效能低于参数法不满足参数法条件时,处于“优势”第九页,共七十五页。非参数检验的特点优点具有较好的稳健性受限条件少:对数据要求不像参数检验那样严格适用范围广:不受总体分布限定缺点检验效率低于参数检验主要是犯第二类错误的可能性加大第十页,共七十五页。非参数检验预备知识数据分布类型的把握数据的初步描述图象的巨大作用图象总比单个地数据提供了更多的信息可以对整个数据的分布有全面的了解直方图Histogram直观描述,并且和正态曲线比较P-P图和Q-Q图专业的分布描述和检验工具囊括10多个分布,并且分析残差第十一页,共七十五页。非参数检验预备知识顺序统计量:非参数检验的理论基础通过对数据从小到大的排序(即排队),并由数据的大小排序号(排队号)代替原始数据进行统计分析。秩(Rank):排序号(排队号)在统计学上称为秩结(ties):绝对值相等称为结又称同秩,则取平均秩次。第十二页,共七十五页。SPSS非参数检验介绍第十三页,共七十五页。分布位置检验检验几个总体是否相同2IndependentSamples:两个独立样本的比较KIndependentSamples:多个独立样本的比较2RelatedSamples:两个配对样本的比较KRelatedSamples:多个相关样本的比较第十四页,共七十五页。分布类型检验检验某样本是否服从一定总体分布,也称为拟合优度检验分类资料:Chi-SquareBinomial:也可是连续性变量Runs连续性变量1SampleK-S(柯尔莫诺夫-斯米尔诺夫检验)检验:正态分布、均匀分布、二项分布、指数分布第十五页,共七十五页。两个配对样本的非参数检验2RelatedSamplesH0:差值的总体中位数Md=0H1:差值的总体中位数Md≠0基本原理:检验配对数据的差值总体的中心位置是否为0sign——符号检验Wilcoxon——符号秩和检验第十六页,共七十五页。Wilcoxon—符号秩和检验第十七页,共七十五页。配对设计差值的符号秩和检验正态近似法:当N>50时,T分布逼近均数为??,方差为??的正态分布,故可用u检验第十八页,共七十五页。配对样本比较的非参数检验方法Wilcoxon:符号秩和检验,最常用Sign:符号检验,只利用了正负号,效能较低McNemar:配对卡方检验,只适用于两分类资料,特别适合于自身对照设计MarginalHomogeneity:McNemar法多分类下的扩展第十九页,共七十五页。分析实例例:两种去污配方去污剂除污时间比较,对12份污渍物件分别用新、老两种去污配方去污剂测量去污时间,分析两种去污剂功效有无差别?分析同一样本用两种方法测量是配对设计差值的分布呈正态分布?第二十页,共七十五页。独立样本间的比较2IndependentSamples—Mann-WhitneyUKIndependentSamples—Kruskal-WallisH检验两个或多个独立样本所在总体是否相同界面上基本相同第二十一页,共七十五页。两个独立样本的非参数检验2IndependentSamples过程Mann-WhitneyU检验:比较两个总体分布的各自中心位置是否相同如两个样本来自相同的总体,则两组数据应相间出现,如来自不同的总体,则会出现一组数据分布比另一组数据高或低的趋势结果同Wilcoxon秩和检验第二十二页,共七十五页。实例第二十三页,共七十五页。独立样本比较的非参数检验方法两独立样本比较的非参数方法Mann-WhitneyU:两样本等级和检验,利用大小次序进行检验Kolmogorov-SmirnovZ:即K-S检验Mosesextremereactions:结果为单侧检验Wald-Wolfowitzruns:游程试验中的一种第二十四页,共七十五页。多个独立样本比较的非参数检验第二十五页,共七十五页。独立样本比较的非参数检验方法Kruskal-WallisH:最常用Median:中位数检验,统计效能较低Jonckheere-Terpstra:适用于连续性或有序分类资料,有序分类时统计效能高于Kruskal-WallisH第二十六页,共七十五页。分析实例第二十七页,共七十五页。结果解释第二十八页,共七十五页。多个样本间的两两比较只能得到各组总的有没有差别的结论得不到两两比较的结果解决办法直接进行两组间的非参数检验(样本量较小时)α调整编秩后方差分析第二十九页,共七十五页。多个相关样本的非参数检验KRelatedSamplesFriedman检验区组内进行编秩,再将处理组的各区组秩相加,然后比较处理组的位置是否相同第三十页,共七十五页。结果解释第三十一页,共七十五页。随机区组样本比较的非参数检验Friedman:最常用,Kendall’sW:Kendall的和协系数,表示K个指标间的关联程度Cochran’sQ:McNemar的推广,只适用于两分类资料第三十二页,共七十五页。无序分类变量的统计推断

卡方检验第三十三页,共七十五页。主要内容统计学回顾拟合问题:样本率与已知总体率的比较相关问题:两个(多个)率或构成比的比较两分类变量间的关联程度的度量一致性检验和配对卡方检验分层的卡方检验第三十四页,共七十五页。统计学回顾第三十五页,共七十五页。检验基础卡方检验原理以卡方分布为基础的一种常用假设检验方法根据样本推断总体的分布与期望分布有无差别推断两个分类变量是否相关联或相互独立H0:观察频数与期望频数无差别第三十六页,共七十五页。卡方的计算表示观察值与期望值之间的偏离程度第三十七页,共七十五页。卡方分布第三十八页,共七十五页。统计学回顾第三十九页,共七十五页。假设H0:π1=π2,H1:π1≠π2,α=0.05实际数、观察值(A,actualfrequency)为实际的频数数据理论数、期望值(E,expectedfrequency)是在无效假设成立的前提下计算的频数第四十页,共七十五页。分类资料数据录入格式第四十一页,共七十五页。拟合问题:样本率与已知总体率

的比较-Chi-square过程用来检验变量的几个取值所占百分比是否和期望的比例有统计学差异。如在人群中随机抽取样本,来分析四种血型所占的比例是否相同(都是25%),新生儿的出生男女性别比是否为50%或检验样本比例与指定比例是否相同该检验与一般所用的卡方检验不同,一般的卡方检验是用crosstable菜单来完成第四十二页,共七十五页。分布类型检验-Chi-square过程界面说明主对话框:TestVariableList框:指定需要检验的变量ExpectedRange单选框:设定需检验变量的取值范围,默认为最大值和最小值ExpectedValues单选框:指定已知总体的各分类构成比,默认各类别构成比相等Exact子对话框:共有近似概率、蒙特卡罗模拟法计算的确切概率和直接计算确切概率三种选择第四十三页,共七十五页。分析实例公司人员变动后,经理、监察员、办事员三种职务的比例是否仍为15:5:80比较:观察值和理论值的差别H0:三个职务的构成比例为15:5:80H1:个职务的构成比例不是15:5:80第四十四页,共七十五页。分布类型检验-Chi-square过程结果解释第四十五页,共七十五页。分布类型检验-Chi-square过程结果解释:不拒绝H0第四十六页,共七十五页。相关问题:两个(多个)率或构成比的比较推断两个或多个分类变量是否相关联或相互独立两个或多个发生率或构成比是否相同Crosstabs过程第四十七页,共七十五页。Crosstabs过程Crosstabs过程用于对分类资料和有序分类资料进行统计描述和统计推断。可以产生二维至n维列联表,并计算相应的百分数指标。统计推断包括了常用的X2检验、Kappa值,分层X2(X2M-H)。计算n维列联表的确切概率(Fisher'sExactTest)值。第四十八页,共七十五页。Crosstabs过程详解界面说明【Rows框】用于选择行×列表中的行变量【Columns框】用于选择行×列表中的列变量【Layer框】Layer指的是层,如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。第四十九页,共七十五页。界面说明【Displayclusteredbarcharts复选框】显示重叠条图。【Suppresstable复选框】选中后可禁止在结果中输出行×列表。【Exact钮】针对2×2以上的行×列表设定计算确切概率的方法,可以是不计算确切概率(Asymptoticonly)、蒙特卡罗模拟(MonteCarlo)或确切计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计算默认计算时间限制在5分钟内。可更改默认值。第五十页,共七十五页。界面说明【Statistics钮】用于定义所需计算的统计量。Chi-square复选框:计算x2值,对四格表资料会自动给出校正卡方检验和确切概率法的结果Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数第五十一页,共七十五页。界面说明Norminal复选框组:包括一组反映分类资料相关性的指标,有序变量和无序变量均可。Contingencycoefficient:即列联系数,其值介于0~1之间,越大相关性越强;PhiandCramer‘sV:Phi在四格表x2检验中介于-1~1之间,在R×C表x2检验中介于0~1之间;Cramer’sV则介于0~1之间,指标绝对值越大相关性越强Lambda:在自变量预测中用于反映应变量预测效果,其值为1时表明自变量预测应变量好,为0时表明自变量对应变量无预测作用Uncertaintycoefficient:不确定系数,其值介于0~1之间第五十二页,共七十五页。界面说明Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标。Gamma:介于0~1之间,当所有观察值集中于左上角和右下角时,其值为1Somers‘d:由tau-b改进而来,介于-1~1之间Kendall'stau-b:介于-1~1之间Kendall‘stau-c:由tau-b改进而来,介于-1~1之间第五十三页,共七十五页。界面说明Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例;Kappa复选框:计算Kappa值,即内部一致性系数,介于0~1之间;Risk复选框:计算比数比OR值、RR值;McNemanr复选框:进行McNemanr检验(一种非参检验),即进行配对卡方的检验;Cochran‘sandMantel-Haenszelstatistics复选框:计算X2M-H统计量、X2CMH,可在下方输出H0假设的OR值,默认为1。第五十四页,共七十五页。界面说明【Cells钮】用于定义列联表单元格中需要计算的指标Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected)Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total)Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)标化后的差值(Standardized,实际数与理论数的差值除理论数),由标准误确立的单元格残差(Adj.Standardized)第五十五页,共七十五页。界面说明【Format钮】用于选择行变量是升序还是降序排列第五十六页,共七十五页。分析实例三种职位类别中是否存在性别比例差别H0:性别和职位类别独立,或不同性别的职位类别构成没有差别H1:性别和职位类别不独立,或不同性别的职位类别构成有差别第五十七页,共七十五页。结果解释拒绝H0,认为不同性别的职位类别构成有差别第五十八页,共七十五页。其他检验方法连续性校正的卡方检验ContinuityCorrectionFisher‘s确切概率法Fisher'sExactTest似然比卡方LikelihoodRatio线性相关的卡方值Linear-by-LinearAssociation第五十九页,共七十五页。卡方检验对数据要求非配对2×2四格表理论数>5且n>40,用Pearson卡方检验理论数<5但理论数>1且n>=40,用校正的卡方检验理论数<1或n<40,用Fisher’确切概率法检验第六十页,共七十五页。两分类变量间关联程度的度量相对危险度RelativeRisk优势比OddsRatio第六十一页,共七十五页。分析实例报纸订阅与邮件回应的相关性,报纸订阅者回应邮件的概率是非订阅者的几倍分析:卡方检验P<0.01,报纸订阅与邮件回应有相关性报纸订阅者回应邮件的概率是非订阅者的倍数通过计算RR值解决第六十二页,共七十五页。结果解释报纸订阅者的邮件回应率是非订阅者1.668倍第六十三页,共七十五页。一致性检验与配对卡方检验配对设计包括同一样本接受不同处理的比较配对的两个受试对象分别给予两种处理甲乙合并+-+aba+b-cdc+da+cb+dn第六十四页,共七十五页。一致性检验与配对卡方检验资料为配对资料结果是否基本一致:kappa检验Kappa≥0.75一致性好0.75>Kappa≥0.4一致性一般Kappa<0.4一致性较差结果有无差别:配对卡方检验(McNemanr)第六十五页,共七十五页。分析实例两位顾问对20个地址的评价是否一致?分析:同一样本由两位顾问评价,为配对设计评价结果是否一致用kappa检验第六十六页,共七十五页。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论