




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率与数理统计的非参数统计规定一、概述
非参数统计是一种在不依赖数据具体分布形态的条件下,对数据进行分析和推断的统计方法。与参数统计相比,非参数统计对数据分布的假设较少,适用范围更广,尤其适用于小样本、分布未知或非正态分布的数据。本指南将介绍非参数统计的基本规定、常用方法及其应用步骤。
二、非参数统计的基本规定
(一)适用条件
1.数据分布未知或不确定。
2.样本量较小,无法满足参数统计的样本量要求。
3.数据类型为定序或定类数据。
4.数据不满足正态分布假设。
(二)核心特点
1.不依赖于数据的具体分布形式。
2.对异常值不敏感。
3.常用假设检验,无需估计参数。
4.结果解释相对简单。
三、常用非参数统计方法
(一)符号检验
符号检验用于比较两个相关样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(两样本中位数无差异)。
(2)计算每对样本的差值,记录正负符号。
(3)统计正负符号的个数,计算P值。
(4)判断P值是否小于显著性水平(如0.05),决定是否拒绝零假设。
2.应用场景:
适用于配对样本比较,如治疗前后效果对比。
(二)秩和检验(Wilcoxon秩和检验)
秩和检验用于比较两个独立样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(两样本中位数无差异)。
(2)将两样本混合排序,分配秩次。
(3)计算较小样本的秩和(W值)。
(4)查表或计算P值,判断是否拒绝零假设。
2.应用场景:
适用于两组独立数据的比较,如不同工艺产品的性能对比。
(三)Kruskal-WallisH检验
Kruskal-WallisH检验用于比较多于两个独立样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(所有样本中位数无差异)。
(2)将所有样本混合排序,分配秩次。
(3)计算每个样本的秩和及H统计量。
(4)查表或计算P值,判断是否拒绝零假设。
2.应用场景:
适用于多组独立数据的比较,如不同教学方法的效果对比。
(四)Friedman检验
Friedman检验用于比较多于两个相关样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(所有样本中位数无差异)。
(2)对每个样本计算秩次。
(3)计算Q统计量及P值。
(4)判断P值是否小于显著性水平,决定是否拒绝零假设。
2.应用场景:
适用于重复测量数据,如不同时间段的产品满意度对比。
四、非参数统计的应用步骤
1.数据准备:
-检查数据完整性,剔除无效值。
-确认数据类型(定序或定类)。
2.选择方法:
-根据样本关系(独立或相关)选择检验方法。
-考虑样本数量和分布情况。
3.执行检验:
-使用统计软件(如SPSS、R)或手工计算。
-记录检验统计量和P值。
4.结果解释:
-若P值小于显著性水平(如0.05),拒绝零假设。
-若P值大于显著性水平,不拒绝零假设。
5.结论撰写:
-说明检验结果的实际意义。
-提出进一步研究方向(如参数检验补充分析)。
五、注意事项
1.非参数统计的统计效率低于参数统计,结果可能不如参数检验精确。
2.选择方法时需结合实际数据特征,避免盲目应用。
3.结果解释应谨慎,避免过度推断。
非参数统计为数据分析提供了灵活工具,尤其适用于复杂或非典型数据场景。通过正确选择方法并遵循标准化步骤,可确保分析结果的科学性和可靠性。
---
(接续原文)三、常用非参数统计方法
(一)符号检验(SignTest)
符号检验是一种基础且直观的非参数检验方法,主要用于比较两个相关样本的中位数是否存在显著差异,或者检验单个样本的中位数是否显著偏离某个特定值。其核心思想是通过观察样本数据差值的符号(正或负)来进行推断。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):对于配对样本,两样本的中位数无差异(即差值的总体中位数为0);对于单个样本,样本中位数等于某个特定值μ₀。
备择假设(H₁):对于配对样本,两样本的中位数存在差异(即差值的总体中位数为0);对于单个样本,样本中位数不等于某个特定值μ₀(或大于/小于,根据研究问题设定)。
(2)计算差值并记录符号:
对于配对样本,获取每一对观察值(如治疗前后的测量值),计算它们的差值(dᵢ=xᵢᵢ⁻¹ᵢ⁻²)。
只关注差值的符号:若差值为正,记为“+”;若差值为负,记为“-”;若差值为零,通常将其排除在检验之外(或根据具体方法处理,有时会单独计数)。
统计得到的“+”符号的总个数(记为S⁺)和“-”符号的总个数(记为S⁻)。注意,S⁺+S⁻等于排除零差值后的总对数。
(3)确定检验统计量:
对于配对样本,检验统计量通常是较小的符号个数(S⁺或S⁻,取较小者)。例如,若S⁺=15,S⁻=10,则统计量S=min(15,10)=10。
对于单个样本检验中位数是否为μ₀,需要计算正差值个数、负差值个数和零差值个数(n⁺,n⁻,n₀)。检验统计量通常是n⁺或n⁻(取较小者)。
(4)确定分布并计算P值:
在零假设成立的情况下,S(或n⁺/n⁻)的分布近似于二项分布B(n,0.5),其中n是排除零差值后的总对数(或单个样本中的n⁺/n⁻的总数),概率p=0.5。
计算P值。对于双尾检验(中位数不等),P值=2P(X≤x),其中X是二项分布随机变量,x是观察到的较小统计量S(或n⁺/n⁻)的值。对于单尾检验(中位数大于/小于μ₀),P值=P(X≤x)。通常使用统计软件或二项分布表查找P值。
(5)做出统计决策:
将计算得到的P值与预设的显著性水平α(常用0.05)进行比较。
若P≤α,则拒绝零假设,认为存在显著差异(或偏离)。
若P>α,则不拒绝零假设,认为没有足够证据表明存在显著差异(或偏离)。
(6)解释结果:
根据决策结果,结合研究背景,用非专业或半专业的语言解释统计发现的意义。例如,“符号检验结果表明,治疗前后的测量值存在显著差异,且正向变化(正符号更多)更为常见。”
2.应用场景:
配对样本比较:例如,比较同一组受试者在两种不同状态下(如使用不同药物前后的某个指标)的表现是否存在差异;比较同一组消费者对两种不同包装产品的偏好是否存在差异。
单个样本中位数检验:例如,检验某项新工艺处理后产品尺寸的中位数是否显著不同于标准尺寸;检验某城市居民对某项服务的满意度评分的中位数是否显著高于(或低于)某个期望值。
(二)秩和检验(Wilcoxon秩和检验)
秩和检验是由F.Wilcoxon提出的,用于比较两个独立样本的中位数是否存在显著差异。它是Mann-WhitneyU检验的非参数等价形式,但计算过程和解释略有不同。秩和检验在假设检验的势(power)上通常优于符号检验。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):两个独立样本的总体中位数无差异。
备择假设(H₁):两个独立样本的总体中位数存在差异。
(2)混合样本并排序:
将两个样本的所有数据合并成一个样本。
对合并后的数据按从小到大的顺序进行排序。
给每个数据点分配一个秩次(rᵢ),最小值为1,最大值为n₁+n₂(样本量之和)。若存在tiedranks(并列秩次),则将这些并列数据的秩次取其理论平均秩次。例如,三个数据并列排在第3、4、5位,则它们的秩次均为(3+4+5)/3=4。
(3)计算秩和:
将每个样本中数据点的秩次相加,得到该样本的秩和。通常,将样本量较小的那个样本称为“样本1”,计算其秩和并记为W₁。样本量较大的样本秩和记为W₂。根据定义,W₁+W₂=Σrᵢ=(n₁+n₂)(n₁+n₂+1)/2。
(4)确定检验统计量(秩和):
检验统计量通常就是样本1的秩和W₁。W₁的理论取值范围是n₁到n₁(n₁+n₂+1)/2。W₁的期望值E(W₁)和标准差SD(W₁)可以根据样本量计算:
E(W₁)=n₁(n₁+n₂+1)/2
SD(W₁)=sqrt[n₁n₂(n₁+n₂+1)/12]
(5)确定分布并计算P值:
在零假设成立的情况下,W₁近似服从正态分布N(E(W₁),SD(W₁)²)。
对秩和W₁进行标准化,计算Z分数:Z=(W₁-E(W₁))/SD(W₁)。
查标准正态分布表或使用软件计算P值。对于双尾检验,P值=2P(Z≤|z|)。对于单尾检验(预期样本1中位数更大或更小),P值=P(Z≤z)或P(Z≥z),取决于备择假设的方向。
注意:当样本量较小(通常n₁,n₂≤20)时,应使用精确的秩和分布表(Wilcoxon秩和检验表)查找P值,因为正态近似可能不够准确。当样本量较大时,正态近似通常足够好。
(6)做出统计决策:
将计算得到的P值与预设的显著性水平α进行比较。
若P≤α,则拒绝零假设,认为两个样本的中位数存在显著差异。
若P>α,则不拒绝零假设,认为没有足够证据表明两个样本的中位数存在显著差异。
(7)解释结果:
根据决策结果,结合样本信息和研究背景,解释中位数差异的实际意义。例如,“Wilcoxon秩和检验显示,处理组的产品寿命中位数显著高于对照组,表明该处理方法可能有效。”
2.应用场景:
独立样本比较:当数据不满足参数检验(如t检验)的正态性假设时,比较两组独立数据的中心位置(中位数)。
非正态连续数据:例如,比较两种不同原材料制成的产品的重量中位数;比较两种不同教学方法下学生的成绩中位数。
定序数据:当数据是定序(有序分类)变量时,比较两组受试者的偏好等级或评分的中位数。
(三)Kruskal-WallisH检验
Kruskal-WallisH检验是单因素方差分析(One-wayANOVA)的非参数等价形式,用于比较多于两个独立样本的中位数是否存在显著差异。当样本量较小或数据不满足正态分布假设时,它是比较多个独立组中心趋势的有力工具。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):所有k个独立样本的总体中位数无差异。
备择假设(H₁):至少有两个独立样本的总体中位数存在差异。
(2)混合样本并排序:
将所有k个样本的所有数据合并成一个样本。
对合并后的数据按从小到大的顺序进行排序。
给每个数据点分配一个秩次(rᵢ),最小值为1,最大值为N(所有样本量之和)。处理并列秩次的方法与Wilcoxon秩和检验相同(取平均秩次)。
(3)计算每个样本的秩和:
将每个样本中数据点的秩次相加,得到该样本的秩和,记为Wᵢ(i=1,2,...,k)。计算所有秩和的总和ΣWᵢ=N(N+1)/2。
(4)计算检验统计量H:
H检验统计量的计算公式为:
H=12/(N(N+1))Σ[(Wᵢ)²/nᵢ]-3(N+1)
其中,Wᵢ是第i个样本的秩和,nᵢ是第i个样本的样本量,N是所有样本的总样本量(N=Σnᵢ)。
H统计量是样本秩和差异的量度,其值越大,表明样本间中位数差异越可能显著。
(5)确定分布并计算P值:
在零假设成立的情况下,当k=3且每个nᵢ≥5时,H近似服从自由度为k-1的卡方分布(χ²分布)。
当k>3或存在较小样本量时,需要使用Kruskal-WallisH检验的精确分布表查找P值,或使用软件进行计算。软件通常会提供精确P值或基于正态近似的P值(可能需要校正)。
查找χ²分布表或使用软件,根据计算得到的H值和k-1的自由度,确定P值。通常进行的是双尾检验。
(6)做出统计决策:
将计算得到的P值与预设的显著性水平α进行比较。
若P≤α,则拒绝零假设,认为至少有两个样本的中位数存在显著差异。
若P>α,则不拒绝零假设,认为没有足够证据表明多个样本的中位数存在显著差异。
(7)解释结果:
根据决策结果,结合样本信息和研究背景,解释多个样本中位数差异的可能性。若拒绝零假设,通常需要进一步进行多重比较(如Dunn检验)来识别具体哪些组之间存在显著差异。例如,“Kruskal-Wallis检验表明,三种不同处理方法对植物生长高度的影响存在显著差异,提示至少有两种方法的效果不同。”
2.应用场景:
多独立样本比较:当数据不满足参数检验(如单因素方差分析)的正态性或方差齐性假设时,比较三个或更多组独立数据的中心位置(中位数)。
非正态连续数据:例如,比较三种不同品牌汽车的平均油耗中位数;比较不同地区人群的某种生理指标(如白细胞计数)中位数。
定序数据:比较多组受试者的满意度等级或分类结果的中位数。
(四)Friedman检验
Friedman检验是配对样本方差分析(RepeatedMeasuresANOVA)的非参数等价形式,用于比较多于两个相关样本的中位数是否存在显著差异。它适用于重复测量设计或匹配设计的数据。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):所有k个相关样本的总体中位数无差异。
备择假设(H₁):至少有两个相关样本的总体中位数存在差异。
(2)对每个样本进行内部秩次排序:
对于每个受试者或配对单位,在其经历的k个不同条件下(或时间点),对其观测值进行排序,分配秩次(1,2,...,k)。注意,这里的排序是针对每个个体内部的。
处理并列秩次的方法与之前相同(取平均秩次)。例如,若一个受试者在三个条件下的观测值分别为5,5,8,则在排序时5被赋予平均秩次(1+2)/2=1.5,8被赋予秩次3。
(3)计算每个条件(或时间点)的秩和:
将每个条件(或时间点)下所有受试者的秩次相加,得到该条件的秩和,记为Wᵢ(i=1,2,...,k)。计算所有秩和的总和ΣWᵢ。
(4)计算检验统计量Q:
Friedman检验统计量Q的计算公式为:
Q=12/(Nk(k+1))Σ[(Wᵢ)²]-3N(k+1)
其中,Wᵢ是第i个条件的秩和,N是受试者(或配对单位)的数量,k是条件(或时间点)的数量。
Q统计量衡量的是k个条件下秩次的总体差异程度。
(5)确定分布并计算P值:
在零假设成立的情况下,当N较大(通常N≥5)时,Q近似服从自由度为k-1的卡方分布(χ²分布)。
当N较小时,需要使用Friedman检验的精确分布表查找P值,或使用软件进行计算。软件通常会提供精确P值或基于正态近似的P值。
查找χ²分布表或使用软件,根据计算得到的Q值和k-1的自由度,确定P值。通常进行的是双尾检验。
(6)做出统计决策:
将计算得到的P值与预设的显著性水平α进行比较。
若P≤α,则拒绝零假设,认为至少有两个相关样本的中位数存在显著差异。
若P>α,则不拒绝零假设,认为没有足够证据表明多个相关样本的中位数存在显著差异。
(7)解释结果:
根据决策结果,结合样本信息和研究背景,解释多个相关样本中位数差异的可能性。若拒绝零假设,通常需要进一步进行多重比较(如Nemenyi检验)来识别具体哪些条件之间存在显著差异。例如,“Friedman检验显示,采用三种不同促销策略后,顾客购买意愿评分的中位数存在显著变化,表明至少有两种策略的效果不同。”
2.应用场景:
重复测量设计:比较同一组受试者在三个或更多个不同时间点或条件下的某种连续变量(如血压、疼痛评分)的中位数变化。
匹配设计:比较配对(如双胞胎、家庭成员)在暴露于k种不同处理或处于k种不同状态下的结果变量(如反应时间、满意度)的中位数。
非正态定序数据:比较多组配对单位在某个有序分类变量上的中位数水平。
---
(接续原文)四、非参数统计的应用步骤
1.数据准备:
数据清洗:检查数据是否存在缺失值、异常值(非参数检验对异常值相对不敏感,但检查仍有助于理解数据)。确定数据类型是否为连续变量(用于中位数检验)或定序/定类变量(用于某些特定检验,如符号检验、卡方检验——虽然卡方检验常作为单独方法)。
数据转换:如果原始数据是定序或定类数据,需要先将其转换为相应的秩次,以便进行秩和检验等。如果数据虽然是连续的,但严重偏态且样本量较小,有时也会考虑将其转换为秩次进行非参数检验。
明确变量关系:清晰定义研究中的自变量(分组因素)和因变量(测量指标),以及样本之间的关系(独立或相关)。
2.选择方法:
根据样本关系选择:
独立样本:比较两个独立组(Wilcoxon秩和检验)或多于两个独立组(Kruskal-WallisH检验)。
相关样本(配对):比较同一组在两个不同条件下(符号检验)或多个相关条件下(Friedman检验)。
根据数据类型选择:
连续数据,但分布未知/非正态:优先考虑Wilcoxon秩和检验(两独立组)、Kruskal-WallisH检验(多独立组)、符号检验(配对)、Friedman检验(配对)。
定序数据:Wilcoxon秩和检验、Kruskal-WallisH检验、符号检验(若视为定序)、Friedman检验(若视为定序)通常适用。有时也可直接使用卡方检验分析定序数据的关联性(作为补充)。
考虑样本量:小样本时,应选择有精确分布的检验方法(如精确的符号检验、Kruskal-Wallis表、Friedman精确检验),或使用非参数检验软件提供的精确计算。大样本时,正态近似通常足够好,计算也更简便。
考虑研究目的:是检验差异是否存在,还是需要具体指出哪些组间存在差异(此时需要多重比较方法)。
3.执行检验:
手工计算(适用于小样本):
按照所选方法的步骤,手动进行排序、赋秩、计算秩和、检验统计量等。务必仔细,避免计算错误,特别是秩次分配和并列秩次的处理。
查阅相应的分布表(二项分布、正态分布、χ²分布、精确秩和表等)以获得P值。
使用统计软件(常用SPSS,R,Python等):
将数据输入软件,定义变量和分组。
调用相应的非参数检验命令(如SPSS中的NonparametricTests菜单)。
选择具体的检验方法(如WilcoxonTwo-SampleTest,Kruskal-WallisH,FriedmanTest)。
设置参数(如指定检验变量和分组变量,选择显著性水平α)。
运行程序,获取输出结果。仔细阅读输出中的零假设、检验统计量(如W,H,Z,Q值)、P值、样本量等信息。
4.结果解释:
关注P值:明确报告P值,并说明它是基于何种检验(如Kruskal-Wallis检验的P值)。将P值与预设的显著性水平α(通常是0.05)进行比较。
区分结果:
若P≤α:报告“拒绝零假设”,说明在统计上,至少存在一个显著的中位数差异。需要结合秩和的大小或效应量(见下文)来解释差异的方向和程度。
若P>α:报告“未能拒绝零假设”,说明没有足够统计证据表明存在显著的中位数差异。
解释方向(如果拒绝零假设):
对于Wilcoxon秩和检验和Kruskal-Wallis检验,可以通过比较各组的秩和来推断差异方向(哪个组倾向于有更大的值)。
对于符号检验,可以比较正负符号的频率。
对于Friedman检验,可以比较各条件的秩和。
注意:非参数检验本身不提供精确的均值差异估计,因此解释时应侧重于“中位数”的差异。
结合效应量(EffectSize):非参数检验通常也提供效应量指标,用于量化差异的大小,不受分布影响。常用的效应量有:
Mann-WhitneyU(或Wilcoxon秩和)效应量:通常以r表示,r=U/(n₁n₂)或r=(W-n₁(n₁+1)/2)/sqrt[n₁n₂(n₁+n₂+1)/12]。r的值域在0到1之间,值越大表示差异越大。
Kruskal-Wallis效应量:有时报告为η²=Σ(Wᵢ-E(Wᵢ))²/(N(N+1)²/12)。η²的值域在0到1之间,值越大表示组间差异越大。
Friedman效应量:有时报告为φ²=(Q-k(N+1))/(k(N+1))。φ²的值域在0到1之间,值越大表示组间差异越大。
报告效应量有助于更全面地理解研究结果的实际意义。
5.结论撰写:
简洁明了:用清晰、准确的语言总结检验结果。
包含关键信息:提及所用的非参数检验方法名称、P值、样本量、效应量(如果计算了)。
结合研究背景:将统计结果与研究的初始假设或目的联系起来,解释其实践意义或理论价值。
限制性说明:如果适用,可以说明非参数检验相比参数检验的局限性(如统计效率可能较低),或说明选择非参数检验的原因(如数据不满足参数检验的假设)。
未来研究方向:可以提出基于当前结果,未来可能进行的深入研究方向。例如,“本研究发现处理组的中位数得分显著高于对照组(Wilcoxon秩和检验,P=0.03,r=0.42),表明该处理可能有效。效应量中等,支持了这一发现。后续研究可扩大样本量以确认结果并进一步探究其作用机制。”
---
(接续原文)五、注意事项
1.统计效率:非参数统计方法在样本量较大且数据满足参数检验假设时,其统计效率(即检测到真实差异的能力)通常低于相应的参数检验(如t检验、ANOVA)。当数据分布接近正态且样本量足够大时,参数检验往往更优。非参数检验的主要优势在于对数据分布的假设较少,在数据不满足参数检验条件时提供了一种可靠的替代方法。
2.信息损失:非参数检验通过将数据转换成秩次,丢失了原始数据中的部分信息(如确切的数值差异)。因此,在解释结果时,通常关注的是中位数差异,而难以像参数检验那样提供精确的均值差异和方差信息。
3.多重比较问题:当进行多个独立或相关的非参数检验时(例如,在Kruskal-Wallis后进行组间两两比较,或在Friedman后进行条件间两两比较),需要采取适当的校正措施来控制家族误差率(FamilywiseErrorRate,FWER),如Bonferroni校正、Holm方法等,以避免第一类错误的增加。统计软件通常提供这些校正选项。
4.样本量要求:某些非参数检验的精确分布要求(如χ²近似)需要满足一定的样本量条件(特别是样本量较大的条件)。对于小样本,应优先使用精确分布的结果。同时,非参数检验的统计功效通常随样本量增加而提高。
5.解释的精确性:由于非参数检验主要关注中位数或分布位置,对于涉及精确数值关系或方差结构的研究问题,其解释可能不如参数检验直接。研究者需要根据研究目的和数据特性,判断非参数检验是否是最合适的选择。
6.数据预处理:虽然非参数检验对分布假设宽松,但数据清洗和检查仍然是必要的。异常值的识别和处理需要结合具体情境和检验方法。例如,极端异常值虽然对秩和检验影响较小,但可能指示数据采集或记录问题,仍需关注。
7.选择基准值:在使用符号检验检验单个样本中位数是否等于某个特定值μ₀时,需要明确指定该基准值。这个值可以是理论值、标准值或零。
非参数统计为数据分析提供了灵活且强大的工具集,特别是在面对非正态、小样本或数据类型限制时。理解其基本规定、适用条件、操作步骤和局限性,有助于研究者根据具体情况选择最恰当的方法,从而获得可靠且有意义的统计推断。
一、概述
非参数统计是一种在不依赖数据具体分布形态的条件下,对数据进行分析和推断的统计方法。与参数统计相比,非参数统计对数据分布的假设较少,适用范围更广,尤其适用于小样本、分布未知或非正态分布的数据。本指南将介绍非参数统计的基本规定、常用方法及其应用步骤。
二、非参数统计的基本规定
(一)适用条件
1.数据分布未知或不确定。
2.样本量较小,无法满足参数统计的样本量要求。
3.数据类型为定序或定类数据。
4.数据不满足正态分布假设。
(二)核心特点
1.不依赖于数据的具体分布形式。
2.对异常值不敏感。
3.常用假设检验,无需估计参数。
4.结果解释相对简单。
三、常用非参数统计方法
(一)符号检验
符号检验用于比较两个相关样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(两样本中位数无差异)。
(2)计算每对样本的差值,记录正负符号。
(3)统计正负符号的个数,计算P值。
(4)判断P值是否小于显著性水平(如0.05),决定是否拒绝零假设。
2.应用场景:
适用于配对样本比较,如治疗前后效果对比。
(二)秩和检验(Wilcoxon秩和检验)
秩和检验用于比较两个独立样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(两样本中位数无差异)。
(2)将两样本混合排序,分配秩次。
(3)计算较小样本的秩和(W值)。
(4)查表或计算P值,判断是否拒绝零假设。
2.应用场景:
适用于两组独立数据的比较,如不同工艺产品的性能对比。
(三)Kruskal-WallisH检验
Kruskal-WallisH检验用于比较多于两个独立样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(所有样本中位数无差异)。
(2)将所有样本混合排序,分配秩次。
(3)计算每个样本的秩和及H统计量。
(4)查表或计算P值,判断是否拒绝零假设。
2.应用场景:
适用于多组独立数据的比较,如不同教学方法的效果对比。
(四)Friedman检验
Friedman检验用于比较多于两个相关样本的中位数是否存在差异。
1.步骤:
(1)提出零假设(所有样本中位数无差异)。
(2)对每个样本计算秩次。
(3)计算Q统计量及P值。
(4)判断P值是否小于显著性水平,决定是否拒绝零假设。
2.应用场景:
适用于重复测量数据,如不同时间段的产品满意度对比。
四、非参数统计的应用步骤
1.数据准备:
-检查数据完整性,剔除无效值。
-确认数据类型(定序或定类)。
2.选择方法:
-根据样本关系(独立或相关)选择检验方法。
-考虑样本数量和分布情况。
3.执行检验:
-使用统计软件(如SPSS、R)或手工计算。
-记录检验统计量和P值。
4.结果解释:
-若P值小于显著性水平(如0.05),拒绝零假设。
-若P值大于显著性水平,不拒绝零假设。
5.结论撰写:
-说明检验结果的实际意义。
-提出进一步研究方向(如参数检验补充分析)。
五、注意事项
1.非参数统计的统计效率低于参数统计,结果可能不如参数检验精确。
2.选择方法时需结合实际数据特征,避免盲目应用。
3.结果解释应谨慎,避免过度推断。
非参数统计为数据分析提供了灵活工具,尤其适用于复杂或非典型数据场景。通过正确选择方法并遵循标准化步骤,可确保分析结果的科学性和可靠性。
---
(接续原文)三、常用非参数统计方法
(一)符号检验(SignTest)
符号检验是一种基础且直观的非参数检验方法,主要用于比较两个相关样本的中位数是否存在显著差异,或者检验单个样本的中位数是否显著偏离某个特定值。其核心思想是通过观察样本数据差值的符号(正或负)来进行推断。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):对于配对样本,两样本的中位数无差异(即差值的总体中位数为0);对于单个样本,样本中位数等于某个特定值μ₀。
备择假设(H₁):对于配对样本,两样本的中位数存在差异(即差值的总体中位数为0);对于单个样本,样本中位数不等于某个特定值μ₀(或大于/小于,根据研究问题设定)。
(2)计算差值并记录符号:
对于配对样本,获取每一对观察值(如治疗前后的测量值),计算它们的差值(dᵢ=xᵢᵢ⁻¹ᵢ⁻²)。
只关注差值的符号:若差值为正,记为“+”;若差值为负,记为“-”;若差值为零,通常将其排除在检验之外(或根据具体方法处理,有时会单独计数)。
统计得到的“+”符号的总个数(记为S⁺)和“-”符号的总个数(记为S⁻)。注意,S⁺+S⁻等于排除零差值后的总对数。
(3)确定检验统计量:
对于配对样本,检验统计量通常是较小的符号个数(S⁺或S⁻,取较小者)。例如,若S⁺=15,S⁻=10,则统计量S=min(15,10)=10。
对于单个样本检验中位数是否为μ₀,需要计算正差值个数、负差值个数和零差值个数(n⁺,n⁻,n₀)。检验统计量通常是n⁺或n⁻(取较小者)。
(4)确定分布并计算P值:
在零假设成立的情况下,S(或n⁺/n⁻)的分布近似于二项分布B(n,0.5),其中n是排除零差值后的总对数(或单个样本中的n⁺/n⁻的总数),概率p=0.5。
计算P值。对于双尾检验(中位数不等),P值=2P(X≤x),其中X是二项分布随机变量,x是观察到的较小统计量S(或n⁺/n⁻)的值。对于单尾检验(中位数大于/小于μ₀),P值=P(X≤x)。通常使用统计软件或二项分布表查找P值。
(5)做出统计决策:
将计算得到的P值与预设的显著性水平α(常用0.05)进行比较。
若P≤α,则拒绝零假设,认为存在显著差异(或偏离)。
若P>α,则不拒绝零假设,认为没有足够证据表明存在显著差异(或偏离)。
(6)解释结果:
根据决策结果,结合研究背景,用非专业或半专业的语言解释统计发现的意义。例如,“符号检验结果表明,治疗前后的测量值存在显著差异,且正向变化(正符号更多)更为常见。”
2.应用场景:
配对样本比较:例如,比较同一组受试者在两种不同状态下(如使用不同药物前后的某个指标)的表现是否存在差异;比较同一组消费者对两种不同包装产品的偏好是否存在差异。
单个样本中位数检验:例如,检验某项新工艺处理后产品尺寸的中位数是否显著不同于标准尺寸;检验某城市居民对某项服务的满意度评分的中位数是否显著高于(或低于)某个期望值。
(二)秩和检验(Wilcoxon秩和检验)
秩和检验是由F.Wilcoxon提出的,用于比较两个独立样本的中位数是否存在显著差异。它是Mann-WhitneyU检验的非参数等价形式,但计算过程和解释略有不同。秩和检验在假设检验的势(power)上通常优于符号检验。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):两个独立样本的总体中位数无差异。
备择假设(H₁):两个独立样本的总体中位数存在差异。
(2)混合样本并排序:
将两个样本的所有数据合并成一个样本。
对合并后的数据按从小到大的顺序进行排序。
给每个数据点分配一个秩次(rᵢ),最小值为1,最大值为n₁+n₂(样本量之和)。若存在tiedranks(并列秩次),则将这些并列数据的秩次取其理论平均秩次。例如,三个数据并列排在第3、4、5位,则它们的秩次均为(3+4+5)/3=4。
(3)计算秩和:
将每个样本中数据点的秩次相加,得到该样本的秩和。通常,将样本量较小的那个样本称为“样本1”,计算其秩和并记为W₁。样本量较大的样本秩和记为W₂。根据定义,W₁+W₂=Σrᵢ=(n₁+n₂)(n₁+n₂+1)/2。
(4)确定检验统计量(秩和):
检验统计量通常就是样本1的秩和W₁。W₁的理论取值范围是n₁到n₁(n₁+n₂+1)/2。W₁的期望值E(W₁)和标准差SD(W₁)可以根据样本量计算:
E(W₁)=n₁(n₁+n₂+1)/2
SD(W₁)=sqrt[n₁n₂(n₁+n₂+1)/12]
(5)确定分布并计算P值:
在零假设成立的情况下,W₁近似服从正态分布N(E(W₁),SD(W₁)²)。
对秩和W₁进行标准化,计算Z分数:Z=(W₁-E(W₁))/SD(W₁)。
查标准正态分布表或使用软件计算P值。对于双尾检验,P值=2P(Z≤|z|)。对于单尾检验(预期样本1中位数更大或更小),P值=P(Z≤z)或P(Z≥z),取决于备择假设的方向。
注意:当样本量较小(通常n₁,n₂≤20)时,应使用精确的秩和分布表(Wilcoxon秩和检验表)查找P值,因为正态近似可能不够准确。当样本量较大时,正态近似通常足够好。
(6)做出统计决策:
将计算得到的P值与预设的显著性水平α进行比较。
若P≤α,则拒绝零假设,认为两个样本的中位数存在显著差异。
若P>α,则不拒绝零假设,认为没有足够证据表明两个样本的中位数存在显著差异。
(7)解释结果:
根据决策结果,结合样本信息和研究背景,解释中位数差异的实际意义。例如,“Wilcoxon秩和检验显示,处理组的产品寿命中位数显著高于对照组,表明该处理方法可能有效。”
2.应用场景:
独立样本比较:当数据不满足参数检验(如t检验)的正态性假设时,比较两组独立数据的中心位置(中位数)。
非正态连续数据:例如,比较两种不同原材料制成的产品的重量中位数;比较两种不同教学方法下学生的成绩中位数。
定序数据:当数据是定序(有序分类)变量时,比较两组受试者的偏好等级或评分的中位数。
(三)Kruskal-WallisH检验
Kruskal-WallisH检验是单因素方差分析(One-wayANOVA)的非参数等价形式,用于比较多于两个独立样本的中位数是否存在显著差异。当样本量较小或数据不满足正态分布假设时,它是比较多个独立组中心趋势的有力工具。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):所有k个独立样本的总体中位数无差异。
备择假设(H₁):至少有两个独立样本的总体中位数存在差异。
(2)混合样本并排序:
将所有k个样本的所有数据合并成一个样本。
对合并后的数据按从小到大的顺序进行排序。
给每个数据点分配一个秩次(rᵢ),最小值为1,最大值为N(所有样本量之和)。处理并列秩次的方法与Wilcoxon秩和检验相同(取平均秩次)。
(3)计算每个样本的秩和:
将每个样本中数据点的秩次相加,得到该样本的秩和,记为Wᵢ(i=1,2,...,k)。计算所有秩和的总和ΣWᵢ=N(N+1)/2。
(4)计算检验统计量H:
H检验统计量的计算公式为:
H=12/(N(N+1))Σ[(Wᵢ)²/nᵢ]-3(N+1)
其中,Wᵢ是第i个样本的秩和,nᵢ是第i个样本的样本量,N是所有样本的总样本量(N=Σnᵢ)。
H统计量是样本秩和差异的量度,其值越大,表明样本间中位数差异越可能显著。
(5)确定分布并计算P值:
在零假设成立的情况下,当k=3且每个nᵢ≥5时,H近似服从自由度为k-1的卡方分布(χ²分布)。
当k>3或存在较小样本量时,需要使用Kruskal-WallisH检验的精确分布表查找P值,或使用软件进行计算。软件通常会提供精确P值或基于正态近似的P值(可能需要校正)。
查找χ²分布表或使用软件,根据计算得到的H值和k-1的自由度,确定P值。通常进行的是双尾检验。
(6)做出统计决策:
将计算得到的P值与预设的显著性水平α进行比较。
若P≤α,则拒绝零假设,认为至少有两个样本的中位数存在显著差异。
若P>α,则不拒绝零假设,认为没有足够证据表明多个样本的中位数存在显著差异。
(7)解释结果:
根据决策结果,结合样本信息和研究背景,解释多个样本中位数差异的可能性。若拒绝零假设,通常需要进一步进行多重比较(如Dunn检验)来识别具体哪些组之间存在显著差异。例如,“Kruskal-Wallis检验表明,三种不同处理方法对植物生长高度的影响存在显著差异,提示至少有两种方法的效果不同。”
2.应用场景:
多独立样本比较:当数据不满足参数检验(如单因素方差分析)的正态性或方差齐性假设时,比较三个或更多组独立数据的中心位置(中位数)。
非正态连续数据:例如,比较三种不同品牌汽车的平均油耗中位数;比较不同地区人群的某种生理指标(如白细胞计数)中位数。
定序数据:比较多组受试者的满意度等级或分类结果的中位数。
(四)Friedman检验
Friedman检验是配对样本方差分析(RepeatedMeasuresANOVA)的非参数等价形式,用于比较多于两个相关样本的中位数是否存在显著差异。它适用于重复测量设计或匹配设计的数据。
1.步骤:
(1)提出零假设与备择假设:
零假设(H₀):所有k个相关样本的总体中位数无差异。
备择假设(H₁):至少有两个相关样本的总体中位数存在差异。
(2)对每个样本进行内部秩次排序:
对于每个受试者或配对单位,在其经历的k个不同条件下(或时间点),对其观测值进行排序,分配秩次(1,2,...,k)。注意,这里的排序是针对每个个体内部的。
处理并列秩次的方法与之前相同(取平均秩次)。例如,若一个受试者在三个条件下的观测值分别为5,5,8,则在排序时5被赋予平均秩次(1+2)/2=1.5,8被赋予秩次3。
(3)计算每个条件(或时间点)的秩和:
将每个条件(或时间点)下所有受试者的秩次相加,得到该条件的秩和,记为Wᵢ(i=1,2,...,k)。计算所有秩和的总和ΣWᵢ。
(4)计算检验统计量Q:
Friedman检验统计量Q的计算公式为:
Q=12/(Nk(k+1))Σ[(Wᵢ)²]-3N(k+1)
其中,Wᵢ是第i个条件的秩和,N是受试者(或配对单位)的数量,k是条件(或时间点)的数量。
Q统计量衡量的是k个条件下秩次的总体差异程度。
(5)确定分布并计算P值:
在零假设成立的情况下,当N较大(通常N≥5)时,Q近似服从自由度为k-1的卡方分布(χ²分布)。
当N较小时,需要使用Friedman检验的精确分布表查找P值,或使用软件进行计算。软件通常会提供精确P值或基于正态近似的P值。
查找χ²分布表或使用软件,根据计算得到的Q值和k-1的自由度,确定P值。通常进行的是双尾检验。
(6)做出统计决策:
将计算得到的P值与预设的显著性水平α进行比较。
若P≤α,则拒绝零假设,认为至少有两个相关样本的中位数存在显著差异。
若P>α,则不拒绝零假设,认为没有足够证据表明多个相关样本的中位数存在显著差异。
(7)解释结果:
根据决策结果,结合样本信息和研究背景,解释多个相关样本中位数差异的可能性。若拒绝零假设,通常需要进一步进行多重比较(如Nemenyi检验)来识别具体哪些条件之间存在显著差异。例如,“Friedman检验显示,采用三种不同促销策略后,顾客购买意愿评分的中位数存在显著变化,表明至少有两种策略的效果不同。”
2.应用场景:
重复测量设计:比较同一组受试者在三个或更多个不同时间点或条件下的某种连续变量(如血压、疼痛评分)的中位数变化。
匹配设计:比较配对(如双胞胎、家庭成员)在暴露于k种不同处理或处于k种不同状态下的结果变量(如反应时间、满意度)的中位数。
非正态定序数据:比较多组配对单位在某个有序分类变量上的中位数水平。
---
(接续原文)四、非参数统计的应用步骤
1.数据准备:
数据清洗:检查数据是否存在缺失值、异常值(非参数检验对异常值相对不敏感,但检查仍有助于理解数据)。确定数据类型是否为连续变量(用于中位数检验)或定序/定类变量(用于某些特定检验,如符号检验、卡方检验——虽然卡方检验常作为单独方法)。
数据转换:如果原始数据是定序或定类数据,需要先将其转换为相应的秩次,以便进行秩和检验等。如果数据虽然是连续的,但严重偏态且样本量较小,有时也会考虑将其转换为秩次进行非参数检验。
明确变量关系:清晰定义研究中的自变量(分组因素)和因变量(测量指标),以及样本之间的关系(独立或相关)。
2.选择方法:
根据样本关系选择:
独立样本:比较两个独立组(Wilcoxon秩和检验)或多于两个独立组(Kruskal-WallisH检验)。
相关样本(配对):比较同一组在两个不同条件下(符号检验)或多个相关条件下(Friedman检验)。
根据数据类型选择:
连续数据,但分布未知/非正态:优先考虑Wilcoxon秩和检验(两独立组)、Kruskal-WallisH检验(多独立组)、符号检验(配对)、Friedman检验(配对)。
定序数据:Wilcoxon秩和检验、Kruskal-WallisH检验、符号检验(若视为定序)、Friedman检验(若视为定序)通常适用。有时也可直接使用卡方检验分析定序数据的关联性(作为补充)。
考虑样本量:小样本时,应选择有精确分布的检验方法(如精确的符号检验、Kruskal-Wallis表、Friedman精确检验),或使用非参数检验软件提供的精确计算。大样本时,正态近似通常足够好,计算也更简便。
考虑研究目的:是检验差异是否存在,还是需要具体指出哪些组间存在差异(此时需要多重比较方法)。
3.执行检验:
手工计算(适用于小样本):
按照所选方法的步骤,手动进行排序、赋秩、计算秩和、检验统计量等。务必仔细,避免计算错误,特别是秩次分配和并列秩次的处理。
查阅相应的分布表(二项分布、正态分布、χ²分布、精确秩和表等)以获得P值。
使用统计软件(常用SPSS,R,Python等):
将数据输入软件,定义变量和分组。
调用相应的非参数检验命令(如SPSS中的NonparametricTests菜单)。
选择具体的检验方法(如WilcoxonTwo-SampleTest,Kruskal-WallisH,FriedmanTest)。
设置参数(如指定检验变量和分组变量,选择显著性水平α)。
运行程序,获取输出结果。仔细阅读输出中的零假设、检验统计量(如W,H,Z,Q值)、P值、样本量等信息。
4.结果解释:
关注P值:明确报告P值,并说明它是基于何种检验(如Kruskal-Wallis
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中石油俄罗斯协议书
- 电焊机装配工合规风险规避能力考核试卷及答案
- 遗产继承分割协议书
- 外贸合作协议书
- 风机装配调试工工具生命周期管理考核试卷及答案
- 牧草栽培工岗位职业健康、安全、环保技术规程
- 2025办公室租赁合同范本(标准版)
- 业务知识培训中心课件
- 2025年上海车牌买卖合同范本官方版
- 网络舆情培训课件
- 冰雪场馆建设施工方案
- 食用菌科普课件模板
- 各种引流管的固定及护理
- 核心高考高频688词汇(高考高频词汇)
- 国开2025年人文英语4写作形考答案
- AIGC艺术设计 课件全套 第1-8章 艺术设计的新语境:AI的介入 -AIGC艺术设计的思考与展望
- 老年教育课程体系2025年优化与探究式教学模式实践报告
- 学堂在线 遥测原理 期末考试答案
- 2025年湖南省市场监督管理局下属事业单位招聘考试笔试试题【答案】
- 针灸调理养生在心脑血管疾病防治中的应用研究与实践
- 四年级上册面积单位换算题100道
评论
0/150
提交评论