




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析的统计方法选择小结 0 E/ , h9 p3 F$ + G1 A3 : f; _7 _l0 f2 w) S n* ! f+ N, c6 s9 2 完全随机分组设计的资料; |+ 2 , |/ P8 . * k/ Y# ! U5 G% 0 D Y/ D9 ; K一、 两组或多组计量资料的比较- P; v3 X$ s3 u b K% M/ j7 b, m: K/ z9 q7 _/ C1.两组资料:* c; U, j* r- w! M0 x5 c( H: I# Z7 X+ j& ) J1)大样本资料或服从正态分布的小样本资料2 w1 tu8 9 y8 P$ v3 J. I7 s& m! Y& A1 L(1)若方差齐性,则作成组t检验3 P; 3 V& n* - d% N5 q- n$ ( |7 u: v- # Z3 g(2)若方差不齐,则作t检验或用成组的Wilcoxon秩和检验6 b9 Q2 V, o& N3 S. V9 ; P2 N5 sR6 X% C2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验5 F0 Y1 F/ x, T3 P6 m% F, j. G! R_$ X0 G4 K5 U5 2.多组资料:2 u0 a0 Z$ U0 n7 i. ( v4 h3 m! f5 ) ?# y) ?1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。, C& F. 5 7 % _, U. P7 U7 Q1 R/ 1 O9 J$ K6 T D2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。* g R2 G# Ww, Z! H! D. j2 y& M! Y( H! Q7 L/ C s7 二、 分类资料的统计分析0 p0 b% I! k8 J0 z5 r; Z2 q# c8 g1.单样本资料与总体比较! F& z8 u4 BK# L* B4 t0 i& Y/ 7 z+ p$ v2 . C! x; A9 Y7 x1)二分类资料:3 N! X 4 w: Q. - q b; G6 z) R(1)小样本时:用二项分布进行确切概率法检验;I) G1 U( s9 J9 Co* k! B2 d5 (2)大样本时:用U检验。! r* J8 r4 Y& H; F 6 Z- T- m, 7 7 a% ) C% # 0 y9 f; S6 b6 g2)多分类资料:用Pearson c2检验(又称拟合优度检验)。( I, + W7 m- + e( U5 y* O2 M8 k+ Q& 3 Z2. 四格表资料6 S9 c5 ) s: % J0 , n( F+ r7 & A9 U3 U& U( x/ P8 C. y1)n40并且所以理论数大于5,则用Pearson c2& q! V# L& ?; Z2 i4 L3 R( ) _# M O) Q% G4 r c) n2)n40并且所以理论数大于1并且至少存在一个理论数5,则用校正 c2或用Fishers 确切概率法检验& u% g1 1 l1 e n; Rs! C $ I* F: i2 M3)n40或存在理论数40并且理论数小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检验) z+ O E, u0 ( L; h/ E1 A S/ 0 A. G# m* A3 Z1 h4. RC表资料的统计分析3 h/ Y; O, e+ r: |1 O* V E( c1 k1 9 x: R2 Z1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验/ t) o0 _& _% S0 mj9 b) 2 B; u% K0 V % J( W; d# g$ S k2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2$ u: y% % A% L/ v5 k& o- Z; & D0 O* S+ U% G3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析1 n+ _* L|) V5 g) ?6 P) L/ y/ 4 C* A4 u3 Z4)列变量和行变量均为无序多分类变量, i4 q. R! y9 e+ 2 Z( v. O0 y1 w+ K(1)n40并且理论数小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检验 N3 k5 j# S- F3 ?6 o4 N, a6 H. r3 C& I2 K三、 Poisson分布资料+ t( X 7 R/ m! A# T. a. O4 v8 S9 J1.单样本资料与总体比较:% 7 8 |! I9 ; U. f4 _. 6 g/ S( G: 1)观察值较小时:用确切概率法进行检验。6 X) F, n% y8 G f, 6 H+ t& D2 K( r1 W8 I% x% b2)观察值较大时:用正态近似的U检验。 I. q: |0 7 O$ J6 , P& + ?1 I3 2.两个样本比较:用正态近似的U检验。+ 7 Q4 N d5 E6 O! T9 F; X0 7 A_5 E配对设计或随机区组设计8 c7 H. f0 j/ p四、 两组或多组计量资料的比较, o/ + p w0 |# H3 o0 r, N& B2 J+ W9 x: w! M3 6 b: J ?1.两组资料:# A0 A% + 1 r6 N; z; U7 / C* Z$ N# j# r+ a, o0 Y1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验7 P3 N) T8 g K1 c/ |$ ?- _1 , # R* F$ s/ ?0 2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验/ R; a! u0 R$ n1 l$ o8 7 k; g0 C# V( l! n2.多组资料:# L: k2 L1 d: G& j4 g+ y1 Q# P9 j9 M8 H% L( Y) Q. N, K( W1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。. q# P* V0 F) S& j$ i. j$ 7 DI5 x7 M4 x5 m5 2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。( i8 A l, D* m1 h: R ?( d5 i9 C( M$ R7 y5 V3 u% 五、 分类资料的统计分析; G t |2 W# f6 g6 A# f7 p: f& G1.四格表资料& 5 L6 c0 P: i( a( q) V U9 Ix$ o: o. y! J s/ X1 M! z1)b+c40,则用McNemar配对 c2检验或配对边际c2检验! A! G$ & H7 L* mO6 A/ EU9 6 4 V7 y0 u8 J2)b+c40,则用二项分布确切概率法检验: p1 L0 5 i) 0 Av2 Z9 . V2 A0 Z2 M9 Q V1 ; . % Q2.CC表资料:3 r4 M4 V; _3 w0 U* S* XN D, 0 4 . U z5 m$ P v1)配对比较:用McNemar配对 c2检验或配对边际c2检验; s0 Q! h# O8 f% ?3 K: i8 Z0 S. v9 K2 z) oc: D5 2)一致性问题(Agreement):用Kap检验1 ? S6 p7 r4 H( w- + 3 n6 lk& k变量之间的关联性分析* * _. 9 Y# M六、 两个变量之间的关联性分析; D# % r( Et9 |/ X% 6 0 I2 X& K1 Y% % A6 p1.两个变量均为连续型变量1 ( C( w& 1 E; e* N2 7 B6 e, C K2 n9 L9 P1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析* g6 ) o1 F9 F# f3 6 b. L7 Y9 D+ D; l: |, 6 x2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析 ! F! d0 a2 f% Z+ X* ; l. n, Y s0 A2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析0 w4 S1 |) A+ * P. F6 l5 x3 f6 F1 k- c% v I1 s3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析5 s. P! Z5 s6 2 Qd. A8 Y, T* S. h; n , ) W七、 回归分析$ 1 : / l6 k# e5 d3 S H* _* q- R5 G& X2 n2 b, b3 1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。 W5 u3 U9 ?! H# D0 b0 A& _) o3 _2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。- X& e* F/ H7 q s, A1 x5 n: l$ ) K* K1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素, G9 w- 3 3 M1 a( T( U3 4 s: ! ?& ?2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用$ y; W& C: m5 _+ T9 t# 5 D( e+ W: A, Y$ g, H8 b& t* P& 3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1 8 j& o5 b* d% D( C* . T4 G5 k7 I: n1)非配对的情况:用非条件Logistic回归* 9 l: aJ/ x, v Y- d$ 8 T* g1 t, w- p8 x(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素% J3 i, k: r% k; F H9 Z+ l# f0 c2 1 C(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用; d5 u3 q: N6 p& n+ - 3 4 U+ S3 r Y6 W2)配对的情况:用条件Logistic回归5 j7 , q5 p* x7 % - 6 Q- T7 (1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素$ o% N# A& _4 F9 r. 7 J7 U( q; A: z( c% R(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用, C 6 n; |4 cA; 2 I: ( 8 c- h: V1 y4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。$ g& & : x( Y4 ?6 B : ( U* ; 8 X. Nr9 7 d1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 O- B7 J# Q6 t! w E2 / pU: S2 j. W! D/ w4 ?! K2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2 N; a! Z% E: H9 c% ) T, F+ % z K7 D# j. z5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。, D, q$ N4 - p3 C) f2 Z2 - y1 g0 g* l; 1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素+ D* r! |) M4 i o7 a* + B4 5 X/ ?$ f7 A0 + Y2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用. Gm) ) ?- s6 e# U1 R+ 7 P9 R& x* / i( X) o3 , w八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间), S# i) _4 e/ v; N9 ?! B3 t4 |8 j) 1.用Kaplan-Meier方法估计生存曲线2 o$ p# m$ VT4 , g* 0 x- p6 H, k) k) b- L2.大样本时,可以寿命表方法估计$ f0 ! I* N, B1 J5 G% W; F0 , C/ M+ K/ w3.单因素可以用Logrank比较两条或多条生存曲线6 O b) a8 z6 T( J( d1 d; _) K1 n- T4.多个因素时,可以作多重的Cox回归. z8 V& e; i. y5 O4 ?0 D; t2 n9 + q# K! I) G! k4 K, E+ b) m1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素6 X$ ?% p q z 9 p8 w+ d% ; O3 A4 E S2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用各种检验的方法的应用前提(1)正态性检验:大样本用K-S检验,小样本用Shapiro-Wilk检验。具体方法有两种,一种是使用# v+ o/ o& y( D$ O9 BExplore,一种是使用1 d6 T: Q( R* l: F$ d: X4 B! h1 Sample K-S Test3 i/ H9 k( R# d* x4 J(2)标准化处理(去量纲):即将原有的一组数据转为符合N(0,1)分布的数据,从而达到去单位的效果。具体做法是在0 0 Q: l1 / B/ Z AuDescriptive下勾选Save standardized values as variables,即可得到相应的标准化数据。$ s% A7 Q% R2 R& r9 c m) h(3)单因素方差分析:$ w3 j8 ?! 7 % i0 b( c4 E1前提条件4 M# Z- V r3 e9 v4 9 n7 FY: s/ h r正态性检验,独立性检验,方差齐性) f2 F5 J* Z8 p# 6 % Y2数据导入, P; d3 A$ a8 S E& h* f对于固定效应模型,可以利用Compare Means/One way ANOVA实现,亦可以用GLM/univariate实现,对于随机效应模型,可以用GLM/univariate实现。0 3 B* k7 s s如何判定该用固定效应模型还是随机效应模型:因为HAUSMAN TEST的原假设是:采用随机效应模型:备选假设:采用固定效应模型所以,直接看P值就行了,若P值小于0.010.050.1三者中的一个显著性水平(看你怎样定显著性水平),就可以拒绝原假设,而采用固定效应模型) 2 h. o5 t S) Ru b5 ?(4)多因素方差分析0 P: V% s8 i! O9 h0 M1前提条件8 W. 7 _. B- Q, Z& d; x: R6 Q/ Y正态性检验,独立性检验,方差齐性( m$ Y+ ( y! M8 f( |9 0 v3 H2数据导入- q, P/ p7 y) t/ h. F5 I/ |对于固定效应和随机效应,都用GLM/univariate实现。* i: ) % C8 r; Y! x. D3模型的选择N+ + D9 f3 y/ r8 S对于有重复观测值的多因素方差分析,首先分析各个因素是否存在交互效应,如果不存在交互效应,则把交互效应并为误差效应,仅分析各因素的独立效应或主效应。7 b+ W( B6 b3 U7 (4.5)实际应用中对方差分析适应条件的把握* d0 n8 g8 h9 L1 P0 # S# U * H9 T1单因素方差分析:在单因素方差分析中,如果各组的重复观测数相同或总体呈正态分布,则方差分析模型对方差不齐有一定的承受力,只有最大方差与最小方差之比小于3,结果是稳定的。+ Y$ e5 , P& P3 N/ X% z! CW9 Q2单元格内无重复的多因素方差分析:不考虑正态性和方差齐性问题,这是因为正态性和方差齐性是以单元格为基本单位的,每个单元格只有一个数据,因此无法分析。( e, e- W# r8 R3 A3单元格有重复数据的多因素方差分析:一般数据量较小,因此正态性检验和方差齐性检验无实际意义。 v, V! x, B7 T(5)简单相关分析% * W( p& o; t$ H1参数方法(Pearson方法). f7 y7 V3 n) S! Z: w) y8 要求所有变量均服从正态分布1 5 C5 F: r* - YM8 |2非参数方法(Spearman方法)- U3 R* B: r% g适用于不服从正态分布的变量7 v. C+ _5 H* Snps:偏相关分析和复相关分析均要求服从正态分布(Pearson方法)8 3 _( k U& p) (6)线性回归分析的前提条件% c* & J, _0 ! C/ j* s1自变量之间相互独立% B) G. l; R% T1 F检验方法:多重共线性检验,检验指标为容许度(Tolerance)和方差膨胀因子(VIF) y3 w6 j) j2 y3 U5 I5 E2残差独立且服从正态分布0 q/ n3 G! v6 t. X$ G检验方法:一是作图法,二是DW(Durbin-Watson)检验,三是Runs检验9 g9 x3 |) 7 F* z0 8 U! x3自变量和因变量之间的关系是线性的! L% u0 * k! w1 c检验方法:一是作图法,二是t检验,三是F检验与可决系数1 D# w s5 6 f4 s8 d8 _(7)各种t检验的用途3 sv$ x4 j2 f, j/ c5 V: e! Q3 p1单样本t检验(One Sample T Test)1 v) f1 u w对一组样本,检验相应总体均值是否等于某个值4 G. B a5 C1 w1 N2相互独立样本t检验(Independent-Sample T Test); _0 |# O5 P: v. I. 6 f, r样本x1,x2,xn与样本y1,y2,yn可以颠倒顺序而对结果不会产生影响; k3 T$ Z A* Q8 V, ) Y3配对样本t检验 h$ b0 s7 V) r- 3 ! a2 g4 样本x1,x2,xn与样本y1,y2,yn的顺序不可以颠倒。数据分析的统计方法选择小结完全随机分组设计的资料一、 两组或多组计量资料的比较1. 两组资料:1) 大样本资料或服从正态分布的小样本资料(1) 若方差齐性,则作成组t检验(2) 若方差不齐,则作t检验或用成组的Wilcoxon秩和检验2) 小样本偏态分布资料,则用成组的Wilcoxon秩和检验2. 多组资料:1) 若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2) 如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。二、 分类资料的统计分析1. 单样本资料与总体比较1) 二分类资料:(1) 小样本时:用二项分布进行确切概率法检验;(2) 大样本时:用U检验。2) 多分类资料:用Pearson c2检验(又称拟合优度检验)。2. 四格表资料1) n40并且所以理论数大于5,则用Pearson c22) n40并且所以理论数大于1并且至少存在一个理论数5,则用校正 c2或用Fishers 确切概率法检验3) n40或存在理论数40并且理论数小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检验4. RC表资料的统计分析1) 列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2) 列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c23) 列变量和行变量均为有序多分类变量,可以作Spearman相关分析4) 列变量和行变量均为无序多分类变量,(1) n40并且理论数小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检验三、 Poisson分布资料1. 单样本资料与总体比较:1) 观察值较小时:用确切概率法进行检验。2) 观察值较大时:用正态近似的U检验。2. 两个样本比较:用正态近似的U检验。配对设计或随机区组设计四、 两组或多组计量资料的比较1. 两组资料:1) 大样本资料或配对差值服从正态分布的小样本资料,作配对t检验2) 小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验2. 多组资料:1) 若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2) 如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。五、 分类资料的统计分析1. 四格表资料1) b+c40,则用McNemar配对 c2检验或配对边际c2检验2) b+c40,则用二项分布确切概率法检验2. CC表资料:1) 配对比较:用McNemar配对 c2检验或配对边际c2检验2) 一致性问题(Agreement):用Kap检验变量之间的关联性分析六、 两个变量之间的关联性分析1. 两个变量均为连续型变量1) 小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析2) 大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析2. 两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析3. 一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析七、 回归分析1. 直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2. 多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3. 二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1) 非配对的情况:用非条件Logistic回归(1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2) 配对的情况:用条件Logistic回归(1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4. 有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5. 无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)1. 用Kaplan-Meier方法估计生存曲线2. 大样本时,可以寿命表方法估计3. 单因素可以用Logrank比较两条或多条生存曲线4. 多个因素时,可以作多重的Cox回归1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用数据分析的统计方法选择小结完全随机分组设计的资料一、 两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。二、 分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。2)多分类资料:用Pearson c2检验(又称拟合优度检验)。2. 四格表资料1)n40并且所以理论数大于5,则用Pearson c22)n40并且所以理论数大于1并且至少存在一个理论数5,则用校正 c2或用Fishers 确切概率法检验3)n40或存在理论数40并且理论数小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检验4. RC表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c23)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n40并且理论数小于5的格子数行列表中格子总数的25%,则用Fishers 确切概率法检验三、 Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。2)观察值较大时:用正态近似的U检验。2.两个样本比较:用正态近似的U检验。配对设计或随机区组设计四、 两组或多组计量资料的比较1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。五、 分类资料的统计分析1.四格表资料1)b+c40,则用McNemar配对 c2检验或配对边际c2检验2)b+c40,则用二项分布确切概率法检验2.CC表资料:1)配对比较:用McNemar配对 c2检验或配对边际c2检验2)一致性问题(Agreement):用Kap检验变量之间的关联性分析六、 两个变量之间的关联性分析1.两个变量均为连续型变量1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析七、 回归分析1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件Logistic回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用2)配对的情况:用条件Logistic回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)1.用Kaplan-Meier方法估计生存曲线2.大样本时,可以寿命表方法估计3.单因素可以用Logrank比较两条或多条生存曲线4.多个因素时,可以作多重的Cox回归1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用1.连续性资料1.1两组独立样本比较1.1.1资料符合正态分布,且两组方差齐性,直接采用t检验。1.1.2资料不符合正态分布(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。1.1.3资料方差不齐(1)采用Satterthwate的t检验;(2)采用非参数检验,如Wilcoxon检验。1.2两组配对样本的比较1.2.1两组差值服从正态分布,采用配对t检验。1.2.2两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。1.3多组完全随机样本比较1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的KruscalWallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。1.4多组随机区组样本比较1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。需要注意的问题:(1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确。(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。2分类资料2.1四格表资料2.1.1例数大于40,且所有理论数大于5,则用普通的Pearson检验。2.1.2例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的检验或Fishers确切概率法检验。2.1.3例数小于40,或有理论数小于2,则用Fishers确切概率法检验。2.2 2C表或R2表资料的统计分析2.2.1列变量行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目总格子数目的25,则用Fishers确切概率法检验。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工厂安全培训考试题及参考答案
- 2025年罗江区事业单位公开考核招聘工作人员(11人)备考练习题库及答案解析
- 2025重通成飞风电设备江苏有限公司招聘48人考试参考试题及答案解析
- 2025年芜湖某国有单位招聘10名备考练习试题及答案解析
- 威胁健康的主要疾病2讲课文档
- 2025年偃师区参加洛阳市第三批中小学面向社会联考招聘教师25名备考练习试题及答案解析
- 消毒灭菌监测方法
- 机械租赁合同五篇
- 厂房租赁合同续租
- 消毒供应室笔试题库(附答案)
- 2025-2030中国光耦元件市场竞争风险及发展态势分析报告
- 2025年中州水务财务笔试题及答案
- 公交交警安全知识培训课件
- (标准)仓库退租协议书
- 2025年国际法律合规与跨境经营风险试题及答案
- 脊髓损伤的康复课件
- 配电线路运维培训课件
- 初级健康照护师课件
- 酒店股东消费管理办法
- 《慢性萎缩性胃炎中西医结合诊疗专家共识(2025)》解读
- 新解读《碳纤维电热供暖系统应用技术规程 T-CCES 13 - 2020》解读
评论
0/150
提交评论