版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 | x1 x2 | s 本公式:适用于哪种类型的资料?哪种研究设计?哪种分布形式?哪些使用条件?t =x1x2 成组设计资料不是来自正态分布总体,或经 F 检验方差不齐时,其检验可选择下列三种方法: 1.采用适当的变量变换,使其转成为正态分布的情况下,又达到方差齐性,再用 t 检验; 2.采用 t 检验; 3.采用非参数统计方法。v = n 1 n 2 2 | x1 x2 第十五章 非参数统计 统计分析方法大致分为两大类,一类是参数统计方法( parametric statistics ) , 另一类是非参数统计方法 ( non- parametric statistics ) 。 第一节
2、概 述 1、前面所讲的内容除部分2检验的内容外,基本上是参数的统计方法,它们都是以样本来自某种总体分布为已知前提,然后选择相应的统计分析方法或公式 , 以计算各种统计量为基础,对未知总体参数予以估计或检验 。 第十五章 非参数统计 2、若不知道样本来自的总体类型或已知的总体不符合估计或检验的条件,此时可用非参数统计方法 。 非参数统计方法是一种与总体分布状态无关的统计检验方法,它比较的不是参数,而是比较分布的位置,故有与“参数无关” ( parameter free )、或者“与分布无关”(distribution free)方法之称。在这种方法中,资料的数据常常被用“符号”(sign)或“等
3、级”(rank)来代替或转换进行分析。 2、若不知道样本来自的总体类型或已知的总体不 3、非参数统计方法的主要优缺点 不受总体分布类性的限制,应用范围广泛,基本上,每一种参数统计方法都有相应非参数统计方法对应;对数据的要求不象参数统计方法那样严格。 其不足之处是对符合用参数统计的资料,用非参数统计方法时,犯第二类错误的概率比参数统计方法要大,亦即 (1) 要小。若要使其相同,非参数的方法比参数的方法所需要得样本含量更多。故适合参数统计条件的资料,通常首选参数统计,若应用条件不能满足,才用非参数统计的方法。 3、非参数统计方法的主要优缺点 第二节 两独立样本检验(成组设计) 两独立样本检验即成组
4、设计的两样本资料的比较。 一、等级和检验(rank test ,Wilcoxon,Mann and Whitney 法) 目的:检验两总体分布的位置相同。 检验的基本步骤:(例 15.1 p 202) 1 . 将两比较组的数据混合,并由小到大排列统一编秩(等级),遇相同等级时取平均等级。 2 . 以较小样本的等级之和作为 T。 3 . 计算 T T = n1( n1 + n 2+ 1)T 4 . 以 T 和 T 中较小者与附录 C 附表11中相 第二节 两独立样本检验应数值比较,如果小于表中 p = 0.05时的 T 数值,则差别有统计学意义。 附录 C 附表 11 的统计学意义 本例,n1
5、= 7,按公式n1 (n1 +n2 +1) / 2计算,理论等级和是126 / 2,而n1 的实际等级和为93.5,其差值T 为32.5,离理论值63.0相差愈远,如此,p 值就愈小;假如两者之差较大,表明 n1 的等级总和小(或大),离中点较近,则 p 值也就较大。 63.012693.532.542374237应数值比较,如果小于表中 p = 0.05时的 T 数值,则 二、中位数检验(median test ) 其方法和步骤是先混合数据计算中位数 Md,如两组分布位置相同,则其两组分别在中位数的两侧各有一半的观察例数,故可对中位数的上下两侧例数的差异在两组间是否有统计学意义进行检验。 1
6、 . 两样本混合由小到大排列,求其中位数 Md。 2 . 列中位数检验用表。分别计数两样本中超过 Md 的观察例数,记为 m1 和 m2 。将 m1 、 二、中位数检验(median test )m2 以及两样本含量 n1、n2 列入表中。(表15.3和表15.4 p 203 204 ) 3 . 如果两样本含量均超过10,则用四格表2 检验法,否则用四格表精确概率检验。本例 Md = 17(g /100g)。列中位数检验表如下: 中 位 数 检 验 表 非铅作业组 铅作业组 合计 M d例数(m ) 2 6 8 M d例数( n m) 8 1 9 合 计 10 7 17 由于两样本含量均小于1
7、0,故宜用四格表精确概率法。 m2 以及两样本含量 n1、n2 列入表中。(表15.3和表 E RC = n R n C / N = 8 10 / 17 = 4.706 | O| = | 2 4.706 | = 2.706 经周边合计不变的四个基本数据的组合中大于2.706的有: 8 0 2 6 1 7 2 7 8 1 9 0 P 1 = 8 ! 9 ! 10 ! 7 ! / 8 ! 0 ! 2 ! 7 ! 17 ! = 0.001851 p 7 = 8 ! 9 ! 10 ! 7 ! / 2 ! 6 ! 8 ! 1 ! 17 ! = 0.012957 p 8 = 8 ! 9 ! 10 ! 7
8、! / 1 ! 7 ! 9 ! 0 ! 17 ! = 0.000411 P = p 1 + p 7 + p 8 = 0.015219 ( 1 )( 7 )( 8 ) E RC = n R n C / N = 8 本例,P = 0.015219 0.05,故差别有统计学意义,认为铅作业工人的血铅值高于非铅作业工人。结论同上述等级和检验法及 t 检验法。 若超过附表11的最大例数值,则用正态检验。 第三节 K 个独立样本检验(完全随机设计) K 个独立样本检验即是完全随即设计的多组样本的比较。前面讲述的检验方法有单向(因素)方差分析,包括总的比较和多重比较。 一、总的比较 1 . H 检验(Kru
9、skal and Wallis 法 ) 本方法的前提是假定K个样本的抽样总体是连续性的并且是相同的,检验的目的是判断K个总体的分布位置是否相同。 本例,P = 0.015219 0.05, 【例 15.2 】 表15.6 ( p 206 ) 检验步骤如下:H0 : 各组分布相同。H1 : 各组分布至少两组不同。 0.05 (1) 将个组数据混合后由小到大排列统一编秩次(等级) ,若有相同数据则取平均秩次(等级)。 (2)计算各组等级之和 T i (3)计算各组的平均等级(平方)和(T / ni )与总的平均等级(平方)和(T / ni )。 (4)计算各组中的每个等级平方和T 与总的等级平方和
10、T 。 (5)按下式计算 S2 值 资料中无相同数据时 S2 = N( N + 1) / 12 2 i2 i2 i2 i 【例 15.2 】 表15.6 ( p 20资料中有相同数据时 1 (N+1)2 n1 4 (6)计算 H 值 资料中无相同数据时 12 N(N+1) 资料中有相同数据 1 T N(N+1)2 S2 n i 4 T 2ijS 2 =2 i(T / n i) 3(N+1)H =H = +2 i资料中有相同数据时 T (7)确定 p 值,判断结果 如果处理组数 k3,n5,则可查附录 C 附表13作出判断。如果超出附表13的范围,根据在 n 不太小时 H 近似服从于 v = k
11、 1的2分布,可查2界值得表作出判断。 2 . 中位数检验法 (1)将各组数据混合由小到大排列 。 (2)求出混合数据的中位数 M d。 (3)列表分别计数出各组中 M d 的观察值个数( m i)或 M d 的观察值个数( nm)。 (4)按公式 2 = (OE)/ E 或 = N ( O2 /n Rn C)1,计算2值,v = k1。 (7)确定 p 值,判断结果 例 15.2 中 位 数 检 验 表 ( 2k表) 组 别 1 2 3 M d (m i) 1 4 10 M d (nm) 9 6 0 ( E = 5,可用上述2检验公式) 应用上述2检验公式 , n 应足够的大 , 一般需在
12、10 以上,否则理论数会过小。 本例结果, v = ( 31) = 2 ,2 = 16.8 , p0.01, 差别有统计学意义,认为各组间血浆总皮质醇测定值不同。 20.01, 2 例 15.2 中 位 数 检 二、多重比较 ( multiple comparison ) 首先计算各组平均等级之差: d ij = | ( T I / n i )(T j / n j ) | 再计算差异的临界值 d 0.05 : N1H 1 1 Nk n i nj 如 d ijd0.05 ,则第 i 组与第 j 组之间的差异有统计学意义。见例15.2 表15.8 ( p 209 ) 或者, d ij a bd 0
13、.05 = t 0.05,vS2+(a)(b)t 再根据vN k 查t 界值表确定 p 值。 二、多重比较 ( multiple comp 第四节 两个相关样本检验(配对设计) 即配对设计的两样本资料的检验。常用方法为符号检验和符号等级检验(Wilcoxon法) 一、符号检验 (sign test ) 【 例 15.3 】 表 15.9 ( p 210 ) 将本例冷、热消化法前后两组数据差值的符号(+、)计入表中,差值为 0 者不计,也不计入比较的总例数中。 本例两组尿铅含量正号 5 例和负号 10 例共 15 例,按无差别的无效假设,应正、负号各半,即理论值 E 15 / 2 7.5 例。
14、第四节 两个相关样本检验(配对设计 应用 2 = (OE0.5) 2 / E 或 2 = ( | bc |1) 2 / (bc) ( +为b,为c) 然后用 v = 1的2界值比较,确定 p 值,判断结果。 【例 15.4】 表15.10 ( p 211 ) 比较饲料中缺乏vit E 与肝脏中vit A含量的关系。发现正常饲料组鼠肝中vit A高于vit E缺乏的大鼠有 7 例 ,相反者1 例 ,代入公式得: 2 = ( | 71 | 1)/( 7 + 1 ) 3.125 3.84 ,其差别无统计学意义。用参数法 t = 4.2 , p0.01 , 差别有显著性。两者的不同是因为符号检验法没有
15、利用原资料中变量信息(差数的大小) 应用 2 = (OE0.5) 2而且样本量较少,故即使有差别也难以比较出来。如果差别是客观存在的,增大样本含量则可发现其差别。一般来说,资料含量 6 对以下是难以检出差别的;7 12 对时也不敏感;20对以上时较易检出存在的差别。与 t 检验法相比,符号检验法只有其65的检验效率。可见,资料符合参数法则尽可能用参数法。另外,也可用下述改进方法。 二、符号等级检验( Wilcoxon 法 ) 在配对资料的检验中由于利用了同一对子中的两个数据间差值大小的信息,故检验效果比符号检验法好。 计算步骤如下: (1)将每对的差数按其绝对值的大小排列,而且样本量较少,故即
16、使有差别也难以比较出来。如果差别是客观存并标明等级及原差数的正、符号。 (2)分别计算正号等级的总和、负号等级的总和,以两者较小者为 T。 (3)以 T 值与附录 C 附表 10 进行比较,以判断差别的统计学意义。 本例T = 1,与附表10中 v = 8 ,T0.02 =2 比较 ,T T0.02 , p0.02 , 则其差别有统计学意义,说明正常饲料的鼠肝中vit A 含量高。可见本法较为敏感。 若对子数 n25 ,则用下列公式: z = | TT | / T ( z1.96,则 p0.05) 式中,T = n(n + 1) / 4 n(n + 1 / 2)(n + 1) 12 T =并标
17、明等级及原差数的正、符号。T = 当差数相等,则取其平均等级。假如两差数相等的等级分别为 10 和11,则其平均等级为: (10+11)/ 2 = 10.5 本法与符号检验法比较,其敏感性较强。 第五节 K个相关样本检验 一、K个相关样本的总的比较(区组设计) 即随机区组设计的K个样本资料之间的总的比较。常用方法有M检验、F检验和中位数检验。 1. M 检验 ( Friedmen test )查表法 【 例 15.5 】 表 15.12 ( p 213 ) 检验 6 名产妇个不同时间羊水中前列腺素含量的差别有无统计学意义? 当差数相等,则取其平均等级。假如两差数相 检验步骤: (1)将 6 个
18、区组的 4 个时间前列腺素的含量各自按从小到大的顺序排成等级(编秩 Rij)。相同数据以平均等级排列。 (见表15.13 p 213) (2)分别计算4个时间上的等级之和 m i。 (3)按下式计算平均等级 E。 E = 1 / 2 b( k + 1) 本例,E = 0.5 6 ( 4 + 1) = 15 (4 ) 求 m i E 值, (m i E ) 2 和 (m i E ) 2 。(见续表15.13 p 214) 本例,M = (m i E ) 2 = 170 (5 ) 查附录 C 附表 12 判断结果。 本例,当 b = 6,k = 4 时,MM 0.05( = 76 )p 0.05
19、, 故可认为不同时间羊水中前列腺素的含量不同。 检验步骤: 2. F 检验 本法检验的优点是 , 不仅能用于 k 值或 b 值超过附表12的情况,而且其计算过程的结果可供两两比较之用。 检验步骤: (1)同前计算 m i (2)按下式计算表中所有等级 R ij 的平方和 A 和 B及 F。 各区组内有相同等级: 则 A = R 各区组内无相同等级: A = bk ( k + 1) (2k + 1) / 6 B = m / b 2ij2 i 2. F 检验22 ( b1 ) Bbk( k + 1)/ 4 A B 本例,A = 12 + 22 + + 42 = 180 B = ( 72 + 112
20、 + 182 + 242 ) / 6 = 178.33 F = 84.22 (3)查附录附表 5,F0.05(5,15) = 2.90 , F0.01(5,15) = 4.56。本例 , F F0.01(5,15) = 4.56 , p0.01 , 表明不同时间羊水中前列腺素含量不同。结果同前。 3. 中位数检验 本法要求资料的总体分布为连续性和分布相同 检验步骤: (1)求每个区组中数据的中位数 如第一位产妇(第一区组)其中位数为( 0.04+4.9 ) / 2 = 2.47 = ( b1 (2)在每个区组中数据小于中位数者记为“”,大于者记为“ + ”。如第一区组记为“”。 (3)列出 2
21、 k 表 如本例表中“用药前”有 0 个数据大于中位数,有 6 个数据小于中位数,故用药前处理“+”的个数为 0,“”的个数为 6。列表如下: 依中位数划分的 2 k 表 用 药 后 1 h 产程开始 分娩 0(3.00) 0(3.00) 6(3.00) 6(3.00) 12 6(3.00) 6(3.00) 0(3.00) 0(3.00) 12 6 6 6 6 24 (4) 用2 检验的公式计算2 值 2 = ( O E ) / E= 32 3824 用药前 合计 (2)在每个区组中数据小于中位数者记为“”,大于者 本公式仅适用于区组数大于或等于 10 、且E 5的情况 , 为说明方法暂用此公
22、式。本例, 2 = 24.00 2 (16.266) , P0.001。结论同前 二、K个相关样本的多重比较 即随机区组设计的 K 个样本资料之间的两两比较。其方法是: 1. 先计算两比较组等级和之差的绝对值 | m im j | 2. 再按下式计算最小显著性差异值 C 2b ( AB ) ( b1 ) ( k1 ) 本例 , 取= 0.05 , v = ( 61 ) ( 41 ) = 15,则: t 0.05, 15 = 2.131 , C 0.05= 25.9889 。 3. 将 | m im j | 与 C 0.05= 25.9889 比较 , 判断结果。 见表15.15 ( p 216
23、 )。0.001,3C = t ,vv = ( b1 ) ( k1 ) 本公式仅适用于区组数大于或等于 10 (09研)第十二(十五)章-非参数统计-演示文稿1课件 第六节 等级相关与列联相关 一、等级相关 前述线性相关与回归的分析方法只适用于变量为正态分布的资料 。但在实际工作中,往往资料并不呈正态分布,或不知道何种分布,或是按等级分组的资料。分析这样的资料就不能采用前面介绍的方法,而用非参数分析的方法。 1. 两个变量间的相关 常用的方法为 Spearman 等级相关 ( Spear- man s rank correlation ) 和 Kendall 等级相关。前者只适用于分析两个变量
24、间在数量上的相关,后者可用于分析两个及两个以上变量间的数量上的相关。 Spearman 等级相关法的分析步骤: 第六节 等级相关与列联相关 (1)先将 x、y 分别由小到大列出等级,数据相同时取平均等级。 (2)求出每对 x、y 值的等级差 d 。 (3) 按下述公式求出等级相关系数 r s 。 6d 2 n(n 2 1) (4)根据样本含量 n 查附录 C 附表 14, 如 rsrs,n , 则 p。说明两变量之间相关有统计学意义,存在相关关系。若样本含量较大,附表 14 查不出来,可用 v = n2 直接查 r 相关系数临界值表。 【 例 15.6】 表15.16 ( p 217 )r s = 1 (1)先将 x、y 分别由小到大列出等级,数 在计算 Spearman 等级相关系数时, 若相同等级数较多,应用下式计算校正等级相关系数 r s ( n 3n ) / 6 ( T x + T y ) d 2 ( n 3n ) / 6 2Tx ( n 3n ) / 6 2Ty 式中,T x (或 T y ) = ( t 3t ) / 12 , t 为x ( 或 y )中的相同等级数的个数。 2. 多个变量间的相关( Kendall 等级相关) 二、列联相关 1. 2k 列联表的等级相关 2k 列联表 ( contingency table ) 也可看
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食堂网络营销推广方案
- 2026广东广州中心实验研究部康铁邦教授课题组课题组自聘技术员招聘备考题库带答案详解(研优卷)
- 2026广东深圳北理莫斯科大学管理系招聘备考题库及答案详解(夺冠)
- 2026年1月广东广州市天河区金穗幼儿园招聘编外聘用制专任教师2人备考题库及答案详解(历年真题)
- 2026天津职业技术师范大学第二批招聘方案(博士或高级专业技术职务岗位)36人备考题库及完整答案详解
- 2026年甘肃省兰州市城关区文璟学校春季学期教师招聘备考题库附答案详解(培优b卷)
- 商业街区水景设计方案
- 2026年福建莆田市城厢区教师进修学校附属兴安小学代课教师招聘2人备考题库带答案详解(巩固)
- 工程决策支持系统方案
- 2026广东佛山市均安城市建设有限公司管理人员招聘备考题库含答案详解(突破训练)
- 危险化学品基础知识概述
- 主播合作协议解除协议书
- 旅游产业股权合作协议书
- 养老院入住合同协议书
- DB32/ 4440-2022城镇污水处理厂污染物排放标准
- 文第19课《井冈翠竹》教学设计+2024-2025学年统编版语文七年级下册
- 车库使用协议合同
- 耐磨钢的应用现状及行业发展分析
- 《不在网络中迷失》课件
- 2024新人教版七年级上册英语单词字帖(衡水体)
- 2024-2025年上海中考英语真题及答案解析
评论
0/150
提交评论