SPSS基础教程解析_第1页
SPSS基础教程解析_第2页
SPSS基础教程解析_第3页
SPSS基础教程解析_第4页
SPSS基础教程解析_第5页
已阅读5页,还剩257页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,SPSS 13 for Windows医学统计方法与应用,(基础统计),2,目 录,SPSS 13界面介绍 数据库建立和结果输出 数据整理 数据变换 报表 统计描述 T检验,3,方差分析 相关分析 线性回归分析 常用统计图,4,SPSS 13 界面介绍(Statistical Products and Services Solutions ),窗口类型介绍 主界面菜单介绍 对话框介绍 SPSS系统设置,目录,5,窗口类型介绍,数据编辑窗口,变量编辑窗口,6,结果输出窗口,脚本编辑窗口,命令语句编辑窗口,7,数据观察/编辑窗口,变量名,个体序号,数据格,编辑栏,数据格位置,8,变量定义选项:

2、,变量名,类型,数据位,小数位,标签,数值标签,缺失值,数据量度,变量定义编辑窗口,栏宽,对齐方式,9,主界面菜单介绍,文件菜单,编辑菜单,视图菜单,10,数据库处理 菜单,变量变换菜单,11,统计分析菜单,描述性统计子菜单,统计分析菜单,数据概况统计子菜单,12,统计分析菜单,均数比较子菜单,统计分析菜单,一般线性模型子菜单,13,统计分析菜单,相关分析子菜单,统计分析菜单,回归分析子菜单,14,统计分析菜单,对数线性分析,生存分析,非参数检验,分类分析,15,作图菜单,条形图,线图,面积图,圆图,散点图,直方图,图形特性描述,高_低图,误差条图,箱图,16,工具菜单,变量信息,定义变量,使

3、用变量,17,对话框介绍,变量类型设置对话框,变量标签设置对话框,18,SPSS系统设置,Edit / Options,可以对数据、表格、草稿、标题、数据编辑器、结果阅 读器、草稿阅读器视图界面进行定义或修改。,19,数据库建立和结果输出,相关统计学概念(1) SPSS数据统计分析步骤 数据库的建立 数据编辑 数据保存、转换和读取 结果输出 数据和结果打印,目录,20,相关统计学概念(1),总体(population):总体是根据研究目的确定的同质观察 单位的全体,或者说是同质的所有观察单位某种观察 值(变量值)的集合。 样本(sample):样本是总体中随机抽取部分观察单位,其 实测值的集合

4、。随机抽样就是按随机化原则(即总体 中每一个观察单位都有同等机会被选入到样本中来)获 取样本,以避免误差和偏倚对研究结果有所影响。样本 包含的观察单位称样本含量或样本大小(sample size), 也称样本例数。 资料和变量(data and variable):研究者对每个观察单位的 某项特征进行测量和观察 ,这种特征称为变量。对变 量测得的值称变量值(value of variable)或观察值( observed value)亦称为资料。观察个体间的差异,称 为变异(variation)。,21,定量资料(quantitative data):数值变量(numerical variab

5、le) 其变量的值是定量的,表现为数值的大小,一般有度量 衡。 分类资料(categorical data):分类变量( categorical variable ) 其观察值是定性的,表现为互不相容的类别或属性。 无序分类:阳性或阴性,治愈或未治愈 有序分类:治愈、显效、好转、无效 概率(probability):概率是描述随机事件发生的可能性大小的 数值,常用P表示。随机事件概率的大小在0与1之间,既 0 P 1。P值越接近于1,表示某事件发生的可能性越大; P值越接近于0,表示某事件发生的可能性越小。P=1表示 事件必然发生,P=0表示事件不可能发生。P 0.05称为小 概率事件,表示在

6、一次实验或观察中该事件发生的可能性 很小,可以认为很可能不发生。,22,SPSS 数据统计分析步骤,输入供SPSS分析的数据,选择统计分析过程,为统计分析选择变量,运行过程并对统计结果做出判断,23,数据库的建立,问题举例: 一个医生观察了一组住院病人,完成了其中24名患者的 资料收集,指标包括:观察编号、住院号(inno)、年龄 (age)、性别(sex)、身高(x1,cm)、体重(x2,kg) 、血压(收缩压x3,舒张压x4,mmHg)、空腹血糖(x5, mmol/L)和胰岛素样生长因子-1水平(igf-1,ng/ml),并 根据临床情况将患者的病情分为5级( x0 ,1为正常,2为一 级

7、,3为二级,4为三级,5为四级),建立其原始数据表。,数据分析: 住院日期为日期变量 病情分级为有序变量(Ordinal) 性别为字符变量(in nominal) 其它各指标为连续变量(Scale) 注意到igf-1指标中有个体数据丢失或实验误差,24,编号 inno indate age sex x0 x1 x2 x3 x4 x5 ifg-1 155 17442 10/21/1996 23.0 男 3 166.0 52.5 108 78 8.90 186.63 177 17281 10/16/1996 25.2 女 5 160.0 60.0 90 50 5.99 230.32 118 172

8、64 10/15/1996 26.4 女 4 164.0 58.5 100 80 7.59 117.45 171 20999 02/25/1997 28.0 男 2 172.0 61.2 110 70 14.07 105.74 70 24797 06/27/1997 32.0 女 2 152.0 42.0 118 76 5.89 135.89 49 17204 10/14/1996 33.9 女 2 157.0 58.0 146 86 12.41 8.33 64 19503 01/23/1997 35.0 男 3 167.0 68.0 124 76 7.94 162.40 166 28460

9、10/20/1997 38.0 女 1 153.5 50.5 114 62 8.81 416.74 17 41332 10/26/1998 43.2 男 3 174.0 80.0 144 94 12.60 141.73 158 28117 10/09/1997 45.0 女 2 155.0 67.0 180 110 5.76 297.58 146 19218 12/17/1996 48.1 男 2 178.0 69.0 110 72 7.44 234.85 240 43437 12/21/1998 49.3 男 3 173.0 69.0 110 70 9.80 467.81 42 22075

10、03/31/1997 52.8 男 2 163.0 62.0 125 80 14.87 150.62 72 22239 04/07/1997 54.2 男 2 167.5 72.0 140 90 7.80 172.55 195 31257 01/08/1998 57.3 女 2 143.5 41.5 152 88 13.53 0 .00 20 40910 10/13/1998 58.8 男 2 168.0 61.5 110 70 15.80 120.42 22 41965 11/11/1998 62.8 男 2 160.0 60.0 140 90 8.83 160.37 36 24681 06

11、/24/1997 65.6 男 3 162.0 52.0 166 70 17.79 180.41 16 41231 10/22/1998 67.4 女 2 153.0 62.0 140 86 11.94 175.18 62 44951 02/05/1999 68.9 女 1 145.0 42.0 108 50 11.72 160.33 172 45549 03/03/1999 71.1 女 4 151.0 61.5 150 90 15.80 145.97 14 36978 06/25/1998 72.3 女 2 148.0 50.0 96 66 16.88 181.51 38 24868 06

12、/30/1997 73.0 女 2 149.0 51.5 116 74 13.16 129.26 24 43579 12/25/1998 74.6 男 4 170.0 60.0 160 86 9.37 350.09,原始数据表,25,数据编辑(1),剪切 复制 粘贴 清除 网格字体,File / New / Data,26,数据编辑(2),Data / Insert Case 插入个体,27,数据编辑(3),Data / Insert Variable 插入变量,28,数据编辑_变量设置(1),Width、Decimals、Column选项,通过微调按钮调整数值,29,数据编辑_变量设置(2)

13、,变量类型,数值(默认),逗号,点,科学记数,日期时间,货币,自定义数据类型,字符,30,数据编辑_变量设置(3),数值标签Value Labels,数值,数值标签,31,数据编辑_变量设置(4),丢失值Missing Values,没有丢失值,离散丢失值,混合丢失值,连续值,离散值,32,数据编辑_变量设置(5),数据量度Measure,有序变量,名字变量,连续变量,33,数据保存、转换和读取,数据文件默认保存为 *.sav File / Save File / Save As,可以将数据文件转换为其它格式如:*.xls *.dat *.dbf File / Save As,数据文件读取:F

14、ile / Open /Data 直接读取 *.sav文件或直接读取 *.xls文件等数据文件,34,结果输出(1),激活结果阅读器 SPSS Viewer File / New / Output,分析结果窗,分析结果 目录窗,35,结果输出(2),选择分析过程,如:Means Analyze / Compare Means / Means ,36,修改选项内容:原文字为Mean更换为平均值,37,结果输出(3),统计分析_图表设置 Graphs / Bar ,38,图表结果输出:可以通过Copy复制到其它应用程序,或 Export输出为图形文件 *.jpg 默认输出文件:*.spo,39,数

15、据和结果打印,可以根据需要打印全部或部分数据,40,数据整理,个体排序 行列转置 合并文件 选择个体 加权个体,目录,41,个体排序,Data / Sort Cases,选择排序变量,升序,降序,复置,42,按住院号inno排序结果_升序,43,行列转置(Transpose),变量值转换为变量名,变量(Variable)转换为个体(Case),丢失的变量,复置,Data / Transpose,44,行列转换,丢失了name、sex变量,以id变量值作为 新数据表变量,45,合并文件(Merge File)-1,Data / Merge files /Add Cases,46,合并文件_仅合并

16、相同变量,47,Data / Merge files /Add Variables,合并文件(Merge File)-2,48,合并文件_增加变量以主表为主合并所有个体,49,Data / Merge files /Add Variables,合并文件(Merge File)-3,50,合并文件_增加变量以主表为准合并相同个体,51,选择个体(Select Cases),筛选某些符合特定条件的个体 Data / Select Cases,全部个体,若满足条件,随机个体样本,基于时间 或 个体范围,应用变量过滤,52,条件表达式生成器,函数选择框,输入条件表达式,符号按钮框,53,若条件满足,过

17、滤未满足条件的个体,54,Filter_$=0 非选择个体 Filter_$=1 选择个体,55,删除未满足条件的个体,若条件满足,56,仅保留符合 条件的个体 不符合条件 的个体被删 除,不可恢 复;因此必 须将其另存 为新的数据 文件。,Sex=“女” and (x5=8 and x5=12),57,加权个体(Weight Cases),设定某变量为频数变量,Data / Weight Cases,用x5变量加权个体,频数变量,非加权个体,加权个体,58,概念 建立新变量 重置代码 记数,数据变换,目录,59,概念,数据变换通过一个有效的数值表达式或SPSS内部函数 (对数、平方根、倒数、

18、百分比数的平方根、反正弦等) 来实现。连续型变量可变换为分类型变量。,60,建立新变量,Transform / Compute,源变量,目标变量,表达式,选择SPSS函数,61,常用对数变换,Lg10(x5),62,平方根变换,Sq=SQRT(x3),If sex=“男”,63,倒数变换,y5=1/x5,64,重置代码(Recode),重置代码包括:重置同一变量代码和重置不同变量代码,Transform / Recode / Into Different Variables,数值范围,最低值,最高值,65,重置不同变量代码,年龄分组,66,重置相同变量代码,Transform / Recode

19、 / Into Same Variables,男-1 女-2,67,记数,Transform / Count,68,170 男性,69,报 表,实时分析处理立体表 综合表 行输出综合报告 列输出综合报告,目录,70,实时多维分析立体表 计算综合变量统计量,显示分组变量的统计量,但不能显示变量值 综合表 显示分组变量各分类下综合变量的统计量及变量值 行输出综合报表 以行的形式输出统计量,列变量为综合变量 列输出综合报表 以列的形式输出统计量,71,sex age sbp_b dbp_b sbp_0 dbp_0 sbp_10 dbp_10 sbp_20 dbp_20 sbp_30 dbp_30 g

20、roup 2 58 160.0 100.0 150.0 94.0 150.0 90.0 146.0 90.0 150.0 92.0 1 2 51 146.0 90.0 130.0 80.0 118.0 70.0 110.0 70.0 110.0 70.0 1 2 47 150.0 90.0 145.0 75.0 135.0 75.0 130.0 60.0 130.0 60.0 1 1 70 160.0 100.0 146.0 90.0 140.0 90.0 140.0 90.0 140.0 90.0 1 1 72 150.0 96.0 140.0 90.0 140.0 90.0 140.0 9

21、0.0 140.0 90.0 1 1 60 170.0 100.0 148.0 76.0 140.0 74.0 136.0 72.0 136.0 72.0 1 2 52 148.0 90.0 120.0 80.0 120.0 80.0 120.0 80.0 120.0 80.0 1 2 55 155.0 80.0 140.0 85.0 130.0 80.0 130.0 85.0 130.0 80.0 1 1 77 160.0 100.0 140.0 90.0 140.0 90.0 140.0 90.0 140.0 90.0 1 1 55 150.0 94.0 145.0 80.0 140.0

22、80.0 135.0 75.0 135.0 75.0 1 2 77 165.0 90.0 160.0 82.0 155.0 80.0 151.0 72.0 140.0 70.0 1 2 66 150.0 100.0 130.0 90.0 120.0 80.0 120.0 80.0 120.0 80.0 1 2 62 150.0 90.0 140.0 86.0 140.0 96.0 140.0 82.0 140.0 82.0 1 2 63 160.0 95.0 150.0 85.0 155.0 75.0 140.0 70.0 136.0 70.0 1 2 67 165.0 90.0 145.0

23、80.0 140.0 80.0 135.0 75.0 135.0 75.0 1,治疗前后两组病人血压原始数据表(治疗组):,说明:sex=性别(1为女,2为男),age=年龄,sbp_b=治疗前收缩压, dbp_b治疗前舒张压, sbp_0=治疗后0分钟收缩压, dbp_0治疗后0 分钟舒张压,group=分组,72,sex age sbp_b dbp_b sbp_0 dbp_0 sbp_10 dbp_10 sbp_20 dbp_20 sbp_30 dbp_30 group 2 65 150.0 80.0 150.0 80.0 150.0 80.0 150.0 80.0 150.0 80.0

24、2 2 69 180.0 80.0 180.0 80.0 184.0 80.0 184.0 80.0 184.0 80.0 2 2 63 150.0 92.0 146.0 90.0 146.0 90.0 146.0 90.0 150.0 90.0 2 2 65 160.0 100.0 160.0 100.0 162.0 100.0 160.0 98.0 160.0 98.0 2 1 77 170.0 95.0 170.0 95.0 170.0 95.0 170.0 95.0 170.0 95.0 2 2 51 150.0 90.0 142.0 80.0 142.0 80.0 146.0 80.

25、0 146.0 80.0 2 2 69 170.0 110.0 166.0 108.0 170.0 110.0 170.0 110.0 170.0 110.0 2 1 60 160.0 100.0 150.0 100.0 158.0 100.0 158.0 100.0 160.0 100.0 2 1 64 170.0 100.0 168.0 98.0 168.0 98.0 170.0 100.0 170.0 100.0 2 2 58 160.0 95.0 160.0 95.0 160.0 95.0 160.0 95.0 160.0 95.0 2 1 60 180.0 96.0 180.0 96

26、.0 182.0 96.0 182.0 96.0 182.0 96.0 2 2 53 150.0 96.0 150.0 96.0 150.0 96.0 150.0 96.0 150.0 96.0 2 2 67 170.0 100.0 170.0 100.0 170.0 100.0 170.0 100.0 170.0 100.0 2 1 66 150.0 90.0 150.0 90.0 154.0 92.0 154.0 92.0 154.0 92.0 2 1 70 160.0 100.0 158.0 96.0 160.0 100.0 160.0 100.0 160.0 100.0 2 2 62

27、155.0 94.0 152.0 94.0 155.0 92.0 155.0 94.0 155.0 94.0 2 1 67 164.0 98.0 160.0 95.0 160.0 95.0 164.0 98.0 164.0 98.0 2,续前表(对照组),73,实时分析处理立体表(Online Analytic Processing Cubs),Analyze / Reports / OLAP Cubs,综合统计变量,分组变量,拟统计内容,统计学内容,74,求均值和标准偏差(立体报表),75,求均值和标准偏差(立体表不同层统计结果),治疗组(1),对照组(2),男性组(整体),女性组(整体),

28、76,取消层合并为平面报表,双击OLAP Cubs表,Pivot / Move Layer to Rows,Pivot / Move Layer to Rows,或,Pivot / Reset Pivot Defaults,还原表,77,综合表,Analyze / Reports / Case Summaries,78,样本综合表(无分组),79,样本分组综合表,80,样本综合表(分类统计),不显示个体 可进行分类 统计,81,鼠标双击综合 表上的对象可 进行文字修改,Edit / SPSS Pivot Table Object /Edit,82,行输出综合报告 Report Summarie

29、s in Rows,行输出综合报告过程是以行的形式输出统计量,每个所选 的变量都在报告中产生一列。,Analyze / Report / Report Summaries in Rows,分组排序方式,83,综合统计,选项,页面设置,标题,预览,格式化,显示个体数据,变量,数据列变量选择,分组变量选择,84,分组综合统计内容 Summary,数据列格式化定义 Format,85,分组格式定义 Format,分组选项 Options,分类间空行,每一分类从新一页开始,综合分析前的空行,页码从1开始,86,报表综合统计内容 Summary,报表标题设置 Titles,页眉,页脚,变量,87,行综合

30、输出表结果,注意:行综合输出 适合于多项统计分析结果的输出,88,列输出综合报告 Report Summaries in Column,列输出综合报告过程是以列的形式输出统计量,每个所选 的变量都在报告中产生一列。,Analyze / Report / Report Summaries in Column,插入统计合计值,89,列综合输出表结果,注意:列综合输出仅适合于单项统计分析结果的输出,90,统计描述,频数表分析(Frequencies过程) 描述性统计分析(Descriptives过程) 平均数分析(Means过程) 探索性分析(Explore过程),统计分析包括统计描述和统计推断。

31、统计描述是用统计图表、统计指标来描述资料的分布 规律及其数据特征。,目录,91,频数(frequency):各组段内的数据个数,频数分布类型 有正态,左偏态和右偏态 算术均数(mean):总体均数,样本均数X 几何均数(geometric mean):原始数据分布不对称,但 经对数转换后呈对称分布的数据。几何均数G 中位数 (median):指将一组数值从小到大排序后居于 中间位置的那个数值。中位数M 极差(range):全距R,描述数据的分布范围,极差大说 明数据分布较分散 四分位数间距(inter-quartile range): QU与QL的差距,相关统计学概念(2),92,百分位数(p

32、ercentile):Px ,如P25,P50等 四分为数:QL(下四分位数,25%),QU(上四分 位数,75%) 方差(variance):样本方差S2,总体方差2 标准差(standard deviation):标准差S替代方差描述数据 分布的离散程度 变异系数(coefficient of variation):CV,标准差与算术 均数之比,它描述数据分布的相对离散程度。 标准误(standard error,SE)与均数的标准误( standard error of mean,SEM ):均数的标准误与标准差成正 比,与样本例数n的平方根成反比,93,频数表分析( Frequenci

33、es过程 ),Frequencies分析过程可产生频数分布图、条形图、饼图、 直方图、计算任意百分位数、分布参数估计值、集中趋势与 离散趋势等各项统计学指标。,Analyze / Descriptive Statistics / Frequencies,统计,图表,格式化,显示频数表,94,某市1982年110名7岁男童的身高资料:,序号,数据cm,95,统计,图表,直方图,饼图,条形图,正态曲线,96,频数表,身高的各项统计学指标,集中趋势指标,离散趋势指标,偏度系数,峰度系数,分布参数估计值,四分位数,97,某城市7岁男童身高直方图,正态曲线,98,描述性统计分析(Descriptives

34、过程),Descriptive分析过程可计算数值变量的描述性统计量: 均数、总和、标准差、方差、全距、最小值、最大值、标准 误、峰度系数、偏度系数及标准化(Z值、Z分数)。,Analyze / Descriptive Statistics / Descriptives,99,Data / Select Cases / If condition is satisfied sex=男,Data / Select Cases / All Cases,100,平均数分析(Means过程),Means过程可分组计算指定变量的描述性计算如:均数、 总和、标准差、方差、观察例数等;可进行单因素随机设计 方差

35、分析(One-way analysis of variance)和线性检验(Test for linearity)。,第一层: 以病情 分级进 行分组,自变量列表,因变量列表,Analyze / Compare Means / Means ,101,第二层: 以性别进 行分组,均值 个体数量 标准差 中位数,102,第一层:病情分级,第二层:性别,中位数,103,续前表,总病例统计值,104,40名麻疹易感儿的血凝抑制抗体滴度,平均抗体滴度统计表(平均滴度为1:64),105,第一步: 建立分组变量,第二步: 加权频数变量,106,几何均数,第三步: 选择统计变量 和分组变量,第四步: 选择统

36、计项目,107,探索性分析(Explore过程),Explor过程对数据进行探索性分析,包括数据描述、筛 选、奇异值辨认和假设验证,提供整体或分组数据的概要性统 计指标或图表,以了解数据的分布规律和特征以及亚组间的特 征性差异。提供反应数据集中趋势的四种最大似然估计量、数 据中前5位最大值和最小值、正态分布检验及正态分布Q-Q图、 转换前和多种转换后的方差齐性检验及分布-水平散点图。,108,女性:66名 281.14 162.82 339.26 206.04 214.19 294.24 120.37 332.60 191.95 144.76 207.67 255.37 419.86 621.

37、73 984.81 841.97 330.86 229.97 273.67 147.20 179.07 215.55 203.72 258.34 100.40 53.71 684.86 422.84 655.12 354.67 462.16 186.35 206.41 112.71 81.71 185.54 218.39 106.90 141.48 119.18 160.22 82.86 180.46 486.38 228.43 263.99 398.26 74.31 359.48 434.70 579.99 102.51 280.48 171.75 86.32 298.43 412.01 4

38、53.15 478.43 78.28 374.38 371.23 147.26 130.89 301.08 234.21 男性:83名 169.49 125.82 190.62 262.67 279.77 181.48 286.85 262.20 308.34 101.09 215.60 822.86 566.27 207.51 163.33 193.32 121.89 182.52 147.31 269.30 243.46 225.86 106.90 123.27 134.27 118.60 227.46 148.01 167.59 166.06 275.34 119.80 327.97 1

39、00.61 253.28 290.93 335.76 147.37 190.99 196.50 164.99 131.27 164.45 183.77 99.75 189.96 138.29 215.07 547.76 412.64 470.84 400.32 103.72 111.13 145.15 142.14 87.22 111.95 184.54 102.61 93.30 237.02 165.51 80.73 143.27 130.38 417.64 401.25 249.38 120.31 160.49 256.92 202.69 347.91 345.86 727.59 95.7

40、3 404.00 393.26 427.08 432.65 321.65 160.11,某医生测定了149名正常人的空腹血清胰岛素样因子-1水平:,109,Analyze / Descriptive Statistics / Explore,统计指标,统计图,110,描述性统计指标,反映集中性趋势的4种似然估算量,奇异值,百分位值及Tukeys折点,均值可信限范围,所有分析均忽略缺失值个体,分析中检验变量 含缺失值个体被忽略,缺失值作为分组之一,111,每个因变量 分别做箱图,多个因变量 在一个箱图 中显示,茎-叶图,直方图,正态分布Q-Q图,方差齐性检验及分布-水平散点图,方差齐性的力度估计

41、,数据转换,数据转换方式,112,描述性统计指标,113,反映集中性趋势的4种似然估算量,百分位值及Tukeys折点,114,奇异值,115,正态检验,方差正态检验,116,直方图-1,117,直方图-2,118,正态Q-Q图-1,期望正态分布直线,119,正态Q-Q图-2,期望正态分布直线,120,去势正态分布Q-Q图-1,期望正态分布直线,121,去势正态分布Q-Q图-2,期望正态分布直线,122,均数箱图,奇异值,P50均值,P25-P75,123,分布自然对数-水平自然对数散点图,数据转换力度不接近0,表示要使两组方差齐性,需做数据转换,124,数据转换,经数据转换后的方差正态齐性检验

42、,选择自然 对数转换,基于均数的显 著性为0.135 0.05,表示接 受两组均数方 差的假设,125,126,先进行IGF-1F数据转换(自然对数),127,数据转换(Ln)后的描述性统计指标,128,数据转换(Ln)后的百分位值及Tukeys折点,数据转换(Ln)后的4种似然估算值,129,数据转换(Ln)后的奇异值,130,数据转换(Ln)后的正态检验,数据转换(Ln)后的方差正态齐性检验,两组间 方差齐性 P0.05,131,数据转换(Ln)后的直方图,正态分布,132,数据转换(Ln)后的正态分布Q-Q图,接近期望正态分布直线,133,数据转换(Ln)后的去势正态分布Q-Q图,接近期

43、望正态分布直线,134,T检验,单样本T检验 独立样本T检验 配对样本T检验,目录,135,相关统计学概念(3),假设检验(hypothesis test)也称显著性检验(significance test) 1、建立检验假设( hypothesis under test ): 无效假设,= 0 (样本均数=总体均数) H0 2、建立备择假设( alternative hypothesis ): H1,若H0被否决, 则H1成立。 3、设定检验水准(size of test)或称显著性水准( significance level): =0.05(方差齐性检验=0.10,正态性检验 =0.20)

44、 4、确定P值,作出推断:推断结论包括统计结论和专业结论, 统计结论说明有统计学意义(statistical significance)或 无统计学意义(no statistical significance ),若P ,则拒 绝H0 ,接受H1 ,有统计学意义(统计结论);则可认为 不同或不等(专业结论)。 假设检验的方法:t检验(t-test或称Students t-test)和u检验(,136,u-test或称Z-test)。 t检验应用条件:当样本量较小时(如 n50),理论上要求样 本取自正态总体,两小样本均数比较时要求两样本总体方差 相等。 u检验的应用条件:样本含量n较大,或n虽

45、小但总体标准差已 知。 单样本t检验(one sample/group t-test):即样本均数代表的 未知总体均数和已知总体均数0 (一般为理论值、标准值 或经过大量观察所得的稳定值)的比较。 配对t检验(paired t-test for dependent samples): 两种情况 (1)两个同质受试对象分别接受两种不同的处理;(2)同 一受试对象分别接受两种不同的处理。配对t检验设两种处 理的效应相同,即1 = 2 ,则1 - 2 =0(即已知总体0 )。 两样本t检验( tow-sample t-test for independent samples ): 完全随机设计两样本

46、均数的比较。当关心两总体均数1 , 2 是否相等时,理论上应考虑是否两总体方差相同,即齐性方 差(homogeneity),若相等直接接受t检验。,137,单样本T检验(One-sample T Test),SPSS的One-sample T Test过程用于执行单样本T检验,它 是进行单变量均数与一常数或假设值的比较,要求单变量为定量 变量(数值型变量)。,Analyze / Compare Means / One-sample T Test,检验变量,检验值,138,T检验:样本均数与总体均数的比较,问题:正常人的脉搏平均72次/分,现测得10例某病患者的脉搏(次/分):54,67,68,

47、78,70,66,67,70,65,69,试问此病患者与正常人有无显著性差别?,结论:因t=-2.453,df=9,P=0.0370.05,有统计学意义;故此 病患者与正常人脉搏有显著性差异。,139,问题:某市1982年110名7岁男童的身高(cm)如下表,试估 计该市7岁男童身高的95%可信区间。,不设检验值,140,T检验:总体均数的可信区间估计,结论:因t=-264.848,df=109,双侧概率P0.0005,两均数之 差=119.725,差值的95%可信区间为118.829-120.621。因此该 市7岁男童的95%可信区间为118.829-120.621cm。,141,独立样本T

48、检验( tow-sample t-test for independent samples ),SPSS的Independent-Sample T Test过程用于执行独立样 本T检验,进行两样本资料的均数比较,要求两样本均来自正 态总体且方差相同。,Analyze / Compare Means / Independent-Samples T Test,142,问题:某克山病区测得11例克山病患者与13名健康人的血磷 (mmol/L)如下,问该地急性克山病患者与健康人的血磷 值是否不同? 患者:0.84,1.05,1.20,1.20,1.39,1.53,1.67,1.80,1.87,2.07

49、,2.11 健康人:0.54,0.64,0.64,0.75,0.76,0.81,1.16,1.20,1.34,1.35,1.48, 1.56,1.87,143,结论:Levene方差齐性检验 F=0.032,P=0.0860. 05,可认为 两总体方差相等。取t=2.524,df=22,P=0.0190.05,可认为 该地克山病患者与健康人的血磷值之间有统计意义。,两独立样本均数比较,144,两独立样本几何均数比较,问题:选甲型流感病毒抑制抗体滴度(倒数)5者24人,随机 分为两组,每组12人。用甲型流感病毒活疫苗进行免疫,一组 用气雾法,另一组用鼻腔喷雾法。免疫后一月采血,分别测定 血凝抑制

50、抗体滴度,结果如下。问两法免疫的效果有无差别? 气雾组(1): 40 20 30 25 10 15 25 30 40 10 15 30 鼻腔喷雾组(2):50 40 30 35 60 70 30 20 25 70 35 25,先进行flu数据的 自然对数转换 (lnFlu),然后 进行两样本几何 均数比较。,145,结论:Levene方差齐性检验 F=0.420,P=0.5240. 05,可认为 两总体方差相等。取t=-2.934,df=22,P=0.0080.05,可认为 两种方法的免疫效果差别之间有统计意义。,146,配对样本T检验,SPSS的 Paired-Samples T Test

51、过程用于执行配对样本 均数的比较。,Analyze / Compare Means / Paired-Samples T Test,问题:某单位研究饮食中缺乏维生素E与肝中维生素A含量的关 系,将同种属的大白鼠按性别相同,年龄、体重相近配成对子, 共8对并将每对种的两头动物随机分到正常饲料组和维生素E缺乏 组,经一定时期将大白鼠杀死,测得其肝中维生素A的含量,结 果如下。问不同饲料的大白鼠肝中维生素A含量有无差别? 大白鼠对号(1): 1 2 3 4 5 6 7 8 正常饲料组(x1): 3550 2000 3000 3940 3800 3750 3450 3050 维生素E缺乏组(x2):

52、2450 2400 1800 3200 3250 2700 2500 1750,147,配对样本均数比较,配对变量,148,结论:相关系数=0.584,P(sig.)=0.129,认为两配对变量无相 关关系。t=4.207,df=7,P=0.0040.05,故可认为不同饲料的大 百鼠肝中维生素A含量有统计意义。,149,方差分析(ANOVA),完全随机设计的单因素方差分析 随机区组设计的两因素方差分析 析因(有重复数,平衡数据)设计的双因素方差分析 析因(有重复数,不平衡数据)设计的双因素方差分析 完全随机设计的协方差分析 完全随机区组设计的协方差分析,目录,150,相关统计学概念(4),t检

53、验和u检验,仅适用于两个样本均数的比较,对于多 个样本均数的比较,t检验和u检验不适用,而应该用方差分 析。 方差分析的基本思想是将所有观察值之间的变异(称为总 变异)按设计和需要分解成几部分。如完全随机设计资料的方 差分析,将总变异分解为处理组间变异和组内变异两部分, 后者常称为误差;配伍组设计资料的方差分析,将总变异分 解为处理组间变异、配伍组间变异和误差三部分。将各部分 变异除以误差部分,得到统计量F值,并根据F值确定P值做 推断。 多个样本均数比较的方差分析应用条件为:1、各样本须 是相互独立的随机样本;2、各样本均来自正态总体:3、相 互比较的各样本所来自的总体其方差相等,即方差齐。

54、,151,完全随机设计的单因素方差分析,One-Way ANOVA过程是检验单一因素影响多个(两个 以上)彼此独立的样本是否来自相同的总体。适合于:1、 各样本是相互独立的随机样本;2、各样本来自正态总体; 3、各样本总体方差齐同;4、两个以上样本均数的比较。,Analyze / Compare Means / One-Way ANOVA,石棉肺患者(1):1.8 1.4 1.5 2.1 1.9 1.7 1.8 1.9 1.8 1.8 2.0 可疑患者(2): 2.3 2.1 2.1 2.1 2.6 2.5 2.3 2.4 2.4 非患者(3): 2.9 3.2 2.7 2.8 2.7 3.0

55、 3.4 3.0 3.4 3.3 3.5,问题:某职业病防治院对31名石棉矿工中的石棉肺患者、可疑 患者及非患者进行了用力肺活量(L)测定,如下表。问三组 石棉矿工的用力肺活量有无差别及其不同水平均数的变化趋势?,152,多项式模型趋势检验选项,参照子集选择,参照系数,线性,153,假定方差齐同时的两两比较方法选项:选择Bonferroni法,假定方差不齐时的两两比较方法选项: 选择Tamhanes T2法,显著性水平,154,描述性统计量,描述性统计量,方差齐性检验,均数图,总体均数95%可信区间,155,方差齐性检验,结论:按=0.05检验水准,P0.05,拒绝H0,接受H1,可以 认为各

56、组方差齐同,156,方差分析表,结论:组间F值=MS组间/MS组内=84.544,根据第一和第二自由度得P0.0005, 按=0.05检验水准,拒绝H0,接受H1,可认为各组总体均数不等或 不全等; 线性趋势检验MS未加权/MS加权一致,F=9.165组间/1.534组内=167.259,根 据第一和第二自由度得P0.0005,按=0.05检验水准,拒绝H0,接受 H1,可认为三组别值与各组均数间呈线性趋势; 偏离线性趋势检验F=0.100组间/1.534组内=1.829,根据第一和第二自由 度得P0.187,按=0.05检验水准,接受H0,可认为偏离线性无统计 学意义。,157,各组肺活量两

57、两比较表,星号表示均数的差别在=0.05检验水准上有统计学意义,因各组方差齐同,故不选择Tamhanes T2法检验,158,各组均数趋势图,结论:各组 肺活量均数 随分类值( 分组值)的 增大而增加 呈线性趋势,159,随机区组设计的两因素方差分析,广义线性模型(GLM)中的单变量(Univariate)过程 可以进行双因素和多因素方差分析、协方差分析和线性回归 分析。适用条件:1、各样本是相互独立的随机样本;2、各 样本来自正态;3、各样本的总体方差齐同;4、单个因变量 为连续型变量;5、单个或以上因素为分类变量;6、单个或 以上的协变量(Covariate)为连续变量。,Analyze / General linear Model/ Univariate,GLM-单变量过程,160,问题:在不同的室温下测定家兔的血糖浓度。室温分七组, 家兔分四个种属,每一种属七只,见下表。问不同 温度的血糖浓度有无差别及不同水平血糖浓度均数 的变化趋势?,161,Analyze / General linear Model/ Univariate,因变量,固定 因素,随机 因素,协变量,加权 变量,模型,参照值,绘图,因素各水平两两比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论