统计方法总结_第1页
统计方法总结_第2页
统计方法总结_第3页
统计方法总结_第4页
统计方法总结_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、、统计描述(一)计量资料1、集中趋势、离散趋势指标计算:均数、标准差:Descriptive Statistics Descriptives.几何均数:(1) Compare Means Means中位数、四分位数间距:Explore2、95%可信区间估计:Explore3、95%正常值范围估计(采用百分位数法):Frequencies(二)计数资料1、常用相对数指标2、率的标准化二、假设检验(一)t检验 Compare Means1、配对 t 检验(Paired-Samples T Test)2、两样本均数比较 t 检验(Independent-Samples T Test)3、 两样本几何

2、均数比较t检验(同2,不过要把x转化为lgx)(二)方差分析1、成组设计方差分析及两两比较:Compare Means One-wayANOVA2、随机区组设计方差分析及两两比较:General Linear Model(Model:custom)(三)卡方检验 Descriptive Statistics Crosstabs.1、四格表卡方检验:成组设计两样本率比较2、配对四格表卡方检验:配对两样本率比较3、行列表卡方检验:多样本率比较、构成比比较4、四格表确切概率法。(四)秩和检验(等级资料)Nonparametric Test1、配对设计秩和检验2、两样本比较秩和检验3、多样本比较秩和检

3、验三、相关回归分析1、直线回归分析:Regression Linear2、直线相关分析Correlate3、秩相关分析Correlate附:常见的数据格式1、成组设计原始数据(2组或多组):g (组别),x(分析指标)主要用于:统计描述、t检验、方差分析2、 成组设计频数表数据:g (组别),d (组段),f (频数)主要用于:统计描述、t检验、方差分析3、卡方检验:r(行),c (列)f (频数)4、配对t检验(相关,回归):x1,x2配伍设计:a(处理组),b (配伍组),x (分析指标)连续性资料1.1两组独立样本比较1.1.1资料符合正态分布,且两组方差齐性,直接采用t检验。1.1.2

4、资料不符合正态分布:(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采 用t检验;(2)采用非参数检验,如Wilcoxon检验。1.1.3资料方差不齐:(1)采用 Satterthwate 的 t检验;(2)采用非参数检验,如Wilcoxon检验。1.2两组配对样本的比较1.2.1两组差值服从正态分布,采用配对t检验。1.2.2两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。1.3多组完全随机样本比较1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如 果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检 验,Bo

5、nferroni 法,tukey 法,Scheffe 法,SNK 法等。1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal- Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni法校正P值,然后用成组的Wilcoxon检验。1.4多组随机区组样本比较1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如 果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检 验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。1.4.2资料不符合正态分布,或各组方差不齐,则采用

6、非参数检验的Fridman检 验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P值,然后用符号配对的Wilcoxon检验。*需要注意的问题*一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验, 直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从 正态分布的。当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组, 这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比 较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两 两比较有特定的统计方法,如上面提到的LSD检验,Bon

7、ferroni法,tukey法, Scheffe法,SNK法等。*绝不能对其中的两组直接采用t检验,这样即使得出 结果也未必正确*关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同 设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设 计,嵌套设计等。分类资料2.1四格表资料2.1.1例数大于40,且所有理论数大于5,则用普通的Pearson检验。2.1.2例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的 检验或Fishers确切概率法检验。2.1.3例数小于40,或有理论数小于2,则用Fishers确切概率法检验。2.2 2xC表或Rx2表资

8、料的统计分析2.2.1列变量&行变量均为无序分类变量:例数大于40,且理论数小于5的格子数目总格子数目的25%,则用普通 的Pearson检验:例数小于40,或理论数小于5的格子数目总格子数目的25%,则用Fishers 确切概率法检验。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的 Pearson检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或 成组的Wilcoxon秩和检验。2.2.3列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采 用普通的Pearson检验比较各组之间有无差别,如果总的来说有差别,还可进一 步作两两比较,以说明是

9、否任意两组之间的差别都有统计学意义。2.3RxC表资料的统计分析2.2.1列变量&行变量均为无序分类变量:例数大于40,且理论数小于5的格子数目 总格子数目的25%,则用Fishers 确切概率法检验。如果要作相关性分析,可采用Pearson相关系数。2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的 Pearson检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用 行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。2.2.3列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则 可采用普通的Pearson检验比较各组之间有无差别,如

10、果有差别,还可进一步作 两两比较,以说明是否任意两组之间的差别都有统计学意义。2.2.4列变量&行变量均为有序多分类变量:如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验 或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意 两组之间的差别都有统计学意义。如果要做两变量之间的相关性,可采用Spearson相关分析。2.4配对分类资料的统计分析2.4.1四格表配对资料:b + c40,则用McNemar配对检验;b + c40,则用校正的配对检验。2.4.1 CxC 资料:(1)配对比较:用McNemar配对检验。(2)一致性检验,用Kappa检验。

11、在SPSS软件相关分析中,pearson(皮尔逊),kendall (肯德尔)和spearman (斯伯 曼/斯皮尔曼)三种相关分析方法有什么异同?两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分 析的适用条件时,使用Spearman秩相关系数来描述.Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分 析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于 服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一 些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但 公

12、式中的x和y用相应的秩次代替即可。Kendalls tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个 分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范 围在-1-1之间,此检验适合于正方形表格;计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数, 适合于定序变量或不满足正态分布假设的等间隔数据;计算Kendall秩相关系数, 适合于定序变量或不满足正态分布假设的等间隔数据。计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等 级表示时,宜用spearman或kendall相关Pearson相关复选项积差相关

13、计算连续变量或是等间距测度的变量间的相关 分析Kendall复选项等级相关计算分类变量间的秩相关,适用于合并等级资料 Spearman复选项等级相关计算斯皮尔曼相关,适用于连续等级资料利用SPSS检验数据是否符合正态分布正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。 卜面的图就是正态分布曲线,中间隆起,对称向两边下降。下面我们来看一组数据,并检验“期初平均分”数据是否成正太分布(此数 据已在SPSS里输入好)j3 I-SB9 - SFSS Datil Edit ar1112101719K如212223-2fl而2729*3031rr14212121刘航 liET i何宣ff

14、e i1112101719K如212223-2fl而2729*3031rr14212121刘航 liET i何宣ffe i宰符胃 i鲤 i m i陈跑雄 i底祐 1同悻卓 11范超跟 1葩苗祛 1抑好311211211雌程1211211丁演洁211王市*211王豆凡211王屈洁211王伸宜211耶.恰21励若芳211昊股2112狂玉节22222222wooMtnEe w ra SF5.00 es.oo 电3 0O.DO 6Q.cn 75.DO 60.D040 000000000000泻?2阳的10 0020.00 50 00 .W 50.D0 .D0 0O.DO 虹DO 4Q.D0再00 10

15、00 S3 tn w.ro aim 的M 困DO &3 DO 用m aani 53 CO 31 DO Qa.U)妍 706 SLS ra.s mJ w 6J.5 6-1D ea.D 61.5 73.D ea.DtB闵Sa-BOQ01W72 00印 i90MOTW8118009ODD扇 MWOOsim63WE372.G0即X7 2 CO7B X69 DDS1 HAO.IDO75XMX01 EOESOtt765眼KO!W.044 5ffiDO她XIODE3X45-11.5:aux)0.550.W53QI.O-25172.C0姬口虬I.W614051.514 553 CO51.5斑ro的皿G9A17

16、 Ara.co珥PX1D0SQ.m4.0前m mnLft隼以望导IE等I页。球Bf切)坛定块远夹心琲( )立:宅制远期一束平均甚京幅度|勺IXFFr;1 MIEW) 1)洲 XHW Ba tflQlal -k| fel&J Al 0.05, 因此数据呈近似正态分布检验方法三:Q-Q图检验在SPSS里执行“图表一Q-Q图”,弹出对话框,见下图:8年缀编号 够班号 性别 亩实心球【即初】 缨立定跳远【期初) 瓣实心球【期末】 磅立定跳远期末】会期末平均鑫 彰进步幅度片rn变量必I多期初平均芟巷8年缀编号 够班号 性别 亩实心球【即初】 缨立定跳远【期初) 瓣实心球【期末】 磅立定跳远期末】会期末平

17、均鑫 彰进步幅度片rn变量必I多期初平均芟巷验另布coI 酬I、-扮布参数从数据估计旧Location:|0Scale:F粘驻E重置旧取消帮助r有懿对数转换匹)标莅化数值四r差异皿r季节性差异回:当前周期:无比例估计曷式k Blom Rank.it Tukeys:L Vari der WaerdensL 指定结也秩 国均值U L高凹fLL任意芬断菇点讪变量选择“期初平均分”,检验分布选择“正态”,其他选择默认,然后点“确定”, 最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见下图。Normal Q-Q Plot of期初平均分tuHratuHraAraEMN 足:ptlJdx

18、LUQQ Plot中,各点近似围绕着直线,说明数据呈近似正态分布。上四分位数叫箱中包舍g上四分位数叫箱中包舍g的观测箱异常值判断箱线图前提不要求正态分布,而Z分数法前提要求正态分布。简单箱线图由五部分组成,分别是最小值、中位数、最大值和两个四分位数。第一四分位数Q1:又称“下四分位数”,等于该样本中所有数值由小到大排列后 第25%的数字。中位数F:又称第二四分位数(。2),又称“中位数”,等于该样本中所有数值由小 到大排列后第50%的数字。第三四分位数:又称“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。ffi航值C观测值与中位数的距离母1三倍四,外限界汁值观测值与上四给位数

19、的睡噩超过5倍皿,界外值观测值与下四分位数的距更超过1.S倍QKJ.外跟报端值(观训值与中位数的距离境3三信眺) 箱线图判断异常值的标准以四分位数和四分位距为基础。四分位距(QR, Quartile range):上四分位数与下四分位数之间的间距,即上四分 位数减去下四分位数。F代表中位数,QR代表四分位距。在Q3+1.5QR(四分位距)和Q1-1.5QR处画两条与中位线一样的线段,这两条线段 为异常值截断点,称其为内限。在F(中位数)+3QR和F-3QR处画两条线段,称其为外限。SPSS常用统计检验方法一、正态性检验大样本用K-S检验,小样本用Shapiro-Wilk检验。以SPSS为例,具

20、体方法 有两种,一种是使用 Descriptive Statistics-Explore, 种是使用 Non-parametic Test-1 Sample K-S Test二、标准化处理(去量纲)即将原有的一组数据转为符合N(0,1)分布的数据,从而达到去单位的效果。 具体做法是在 Descriptive Statistics-Descriptive 下勾选 Save standardized values as variables,即可得到相应的标准化数据。三、单因素方差分析1、前提条件:正态性检验,独立性检验,方差齐性。2、数据导入:对于固定效应模型,可以利用Compare Means/

21、One way ANOVA 实现,亦可以用GLM/univariate实现,对于随机效应模型,可以用GLM/univariate 实现。3、如何判定该用固定效应模型还是随机效应模型:因为HAUSMAN TEST 的原假设是采用随机效应模型,备选假设是采用固定效应模型,所以,直接看P 值就行了,若P值小于0.010.050.1三者中的一个显著性水平(看你怎样定显著 性水平),就可以拒绝原假设,而采用固定效应模型。四、多因素方差分析1、前提条件:正态性检验,独立性检验,方差齐性。2、数据导入:对于固定效应和随机效应,都用GLM/univariate实现。3、模型的选择:对于有重复观测值的多因素方差分析,首先分析各个因素 是否存在交互效应,如果不存在交互效应,则把交互效应并为误差效应,仅分析 各因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论