医学统计课件_第1页
医学统计课件_第2页
医学统计课件_第3页
医学统计课件_第4页
医学统计课件_第5页
已阅读5页,还剩244页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学概论数理统计试验设计企业管理质量控制人口统计经济预测农业育种其它……量子力学遗传统计生物统计气象预报医疗诊断药品检定医学统计学是用数理统计的原理和方法,结合医药学实际,研究医药科学中随机事件统计规律的学科。

为什么要学习医学统计学?(why)

怎样学习医学统计学?(how)

医学统计学的基本思想?(what)

为什么要学习医学统计学?(why)例1:某大学校医院用银楂丹桃合剂治疗高血压患者,治疗前后舒张压数据(Kpa),对比如表,怎样判断该中药治疗高血压是有效还是无效,需要一定的理论和方法,才能从8人的调查数据推理到任何高血压患者服用后的疗效。13.614.917.217.316.514.214.514.611.915.317.214.611.512.213.813.4治疗前治疗后

怎样学习医学统计学?(how)

1.不注重原理、公式推导,以具体应用为主

2.重点记住各统计方法的应用条件。学习一种

统计软件去实现。

3.结合实验数据、习题学习如何应用统计方法1.SPSS(StatisticalProgramforSocialSciences)社会科学统计程序2.SAS(STATISTICALANALYSISSYSTEM)统计分析软件3.minitab,statistica等4.DPS(DataProcessingSystem)中文数据处理系统6.卡方检验计算器,正交设计助手II3.15.JMTJFX简明统计分析10.31总体样本数据设计收集整理、分析推断

医学统计学的基本思想?(what)1.总体:是指研究对象的全体。(有限总体,无限总体)2.个体:组成总体的每个单元称为个体。3.样本:在一个总体X中抽取n个个体称为总体X的一个容量为n的样本。样本容量n是指样本中含有个体的数目,也称样本的大小。(小样本,大样本)

定义:对观察对象用测量工具或测量标准得到的数据.

例如:体重与身高、中药中的有效成分含量特点:有度量衡单位;(通过测量得到)多为连续变量(可取非整数)

(1)

计量资料(定量资料)统计资料类型(2)计数资料(定性资料)

定义:把观察对象按不同属性或类别分组计数的数据.

特点:多为离散变量(取整数)例:调查339名50岁以上的人的吸烟习惯与患慢性气管炎病的数据而建立如下列联表,试探讨吸烟与患慢性气管炎之间的关系。组别吸烟不吸烟患病组4313健康组162121(3)

等级资料定义:将观察单位按某种属性的不同程度分组计数,得到各组观察单位的个数称为等级资料。分类严重无效好转痊愈合计对照组648613020300处理组12513821026499合计18922434046799统计量:由总体中随机抽取样本而计算的相应指标。概率:是某一事件中发生的可能性大小的数值表示。记为P(A)P≤0.05与P≤0.01都可称为小概率事件。统计设计搜集资料整理资料分析资料推广应用分析资料统计描述统计推断:变量关系参数估计、假设检验第二章计量资料的统计分析刻画资料取值的平均水平和离散程度的数值§2.1总体数字特征

总体均数(数学期望)记为EX或MX,

反映总体取值的集中趋势、平均水平。

总体方差记作DX。总体标准差反映总体取值的离散程度、稳定程度。Def.

标准差与均数值之比为变异系数(相对标准差)

例:据调查某地18岁男子身高均数为165.08cm,标准差为4.98cm,体重均数为51.60kg,标准差为5.01kg,试比较该地男子身高和体重波动度哪个大一些?3.02%,9.71%一般的变异系数小于5%时认为数据资料较稳定。X与Y取值单位不同、均数相差悬殊如身高、体重,血压、血糖总体变异系数

比较几组资料的变异程度,若各组资料的单位不全相同,或均数相差悬殊时,用变异系数。总结:方差、标准差、变异系数统成为变异指标。共同点:值小表示变量值密集,值大表示变量值分散。样本均数:

设有容量为n的样本,则称为样本均数,亦可写成:或

统计量§2.2样本的数字特征二.样本方差、样本标准差、样本变异系数:

设有容量为n的样本则称为样本方差;S称为样本标准差(SD);

称为样本变异系数或相对标准差(RSD).

统计量三.样本标准误(SE):样本统计量的标准差,反映平均的抽样误差大小。

用样本标准差代替:例如:样本均数的标准差为样本均数的标准误(SEM)。用来表示。(表示偏离总体均数的程度)集中趋势样本均数中位数居中位置的值众数频率最大的值离散程度样本方差样本标准差样本变异系数样本均数标准误极差最大与最小值之差25%、75%位置值四分位数几何均数单峰、钟型、对称曲线。位置参数、形状参数1.正态分布(normaldistribution)。记为:§2.3统计学中的几种重要分布

当称为标准正态分布2.标准正态分布

-xx0u

/2称u分布双侧界值

u

称u分布单侧界值

右边与左边曲线下面积和为α

右边曲线下面积为α

u

服从参数为n-1的分布,记.其中参数n-1称为自由度(df),它表示上式中自由变化的量的个数。3.单组正态样本的分布

若为正态总体的一个样本,有服从自由度为n-1的t分布,记为4.单组正态样本的t分布

设为正态总体的一个样本,

则有5.F分布服从自由度为的F分布,

记作设为总体的样本,为总体的样本,样本方差为,则10

数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征作出统计推断。参数估计假设检验统计推断区间估计点估计§2.4正态资料的参数估计与假设检验一.正态总体参数点估计二.正态总体参数区间估计三.正态资料的假设检验1.单组正态资料的假设检验2.两组正态资料的假设检验一.正态总体参数点估计

已知分布的类型,估计未知参数。(例如当,但是未知的,可以用来估计)注:称为待估计参数

称为估计值例1开胸顺气丸崩解时间X~N(μ,σ).随机抽取5丸崩解时间为:36,40,32,41,36(min),作μ及σ2的点估计。定义:对于给定的,计算出一个区间,使它能够包含未知的总体参数,则称此区间是参数的置信度为1-α的置信区间(置信域CI).数值较小的称为置信下界(下限)、数值较大的称为置信上界(上限)。

二.正态总体参数的区间估计注:1.置信区间是总体参数的估计范围,判断有把握的概率为置信度1-

,犯错误的概率为显著水平

2.显著水平常用

=0.05、

=0.01,也可用

=0.1等

,设X1,X2,…,Xn

为简单抽样样本,为已知,μ的置信度1-

的置信区间为例2《伤寒论》中使用桂枝的39张处方中,桂枝用量服从σ为3g的正态分布,根据样本均数8.14g,显著水平0.05,估计桂枝用量μ的置信区间。μ的置信度0.95的置信区间为=(7.1984,9.0816)

假设检验对总体分布中的某些未知参数或分布的形式作某种假设然后通过抽取的样本,对假设的正确性进行判断的问题例1通宣理肺丸的丸重服从正态分布。若标准差

=2

mg,规定标准丸重38

mg。从一批中随机抽取

100

丸,样本均数=37.5

mg,该批药丸是否合格.

前提是正态分布且σ2已知,记μ0=38猜想μ≠μ0反设μ=μ0,称为备择假设或对立假设,记作

称为零假设或原假设,记作双侧检验:单侧检验:右检验单侧检验:左检验单组正态资料的假设检验1.单组正态资料的假设检验1,设X1,X2,…,Xn

为简单抽样样本,为已知,H0:μ=μ0

检验假设的步骤:1.建立原假设及备择假设;2.计算统计量;3.给定显著水平,确定临界值;4.进行比较,得统计结论。注:2.显著性水平的高低表示下结论的可靠程度的高低。在0.01水平下否定无效假设的可靠程度为99%,而在0.05水平下否定无效假设的可靠程度为95%。

1.称为显著性水平或检验水准。α=0.10,0.05,0.01。3.在P≤α时,拒绝H0,接受H1

。统计结论:“有统计学意义”

4.在P>α时,不能拒绝H0

统计结论:“无统计学意义”u

/2称u分布双侧界值

u

称u分布单侧界值

右边与左边曲线下面积和为α

右边曲线下面积为α

u例某厂生产一种抗生素,据经验,生产正常时,抗生素主要指标,某天为检验生产是否正常随机抽测50瓶,

测得mg,问该日生产是否正常?工作不正常单侧检验----右检验(左检验)例:某药厂生产某种药丸,要求有效期不得低于1000

天,现从某一天生产的药丸中随机抽取25丸,测得其有效期平均值为950天。已知该中药丸的有效期服从标准差为100天的正态分布,试在显著水平0.05下检验这天生产的药丸有效期的均值是否小于1000天。有效期低前提信息H1H0统计量方法拒绝域W正态分布σ2已知≠μ0μ≠μ=μ0双侧检验>μ0μ>μ0右侧检验<μ0μ<μ0左侧检验正态分布且σ已知,选用u统计量称为均数μ的u检验

前提信息H1H0统计量方法拒绝域W正态分布σ2未知≠μ0μ≠μ=μ0双侧检验>μ0μ>μ0右侧检验<μ0μ<μ0左侧检验正态分布且σ未知,选用t统计量称为均数μ的t检验

一.SPSS主要窗口1.数据编辑窗:主要有建立新的数据文件,编辑和显示已有数据文件等功能(由数据窗口(DataView)和变量窗口(VariableView)组成)2.结果输出窗

利用SPSS软件进行数据分析1.将数据录入SPSS并整理加工;2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法;3.按题目要求进行统计分析;4.SPSS分析结果的阅读和解释。1.将数据录入SPSS并整理加工定义变量输入数据保存变量类型:数值型、字符型(String)、日期型(date)数值型:标准型(Numeric)默认宽度(Width):8位=整数部分+小数点+小数部分位数小数(decimals):默认是2位。字符型(String)输入变量字符的最大个数(Characters):默认8位不能参与运算、区分大小写

数据的正态性检验493488483490454435412437334495519549525553585632395415451453485481490497503436547524551598400418441451487481492497505512537522554385402411439448490466467498507517546532575593404431446441480465482498505515542536573429443449485468481500510505544534578524449451470470478502512503544525568415458458487471476502517507549524564569541534498515497473475480456456490410461454470473478493514512541544558554378531500509495483470485417500517503534546416520例2.4

某地148名正常人血糖数据(单位mmol/l),分析其分布规律。问题:判断是否服从正态分布?1.将数据录入SPSS并整理加工定义变量输入数据保存血糖的正态性.sav可通过AnalyzeDescriptiveStatistics下的P-PPlots

和Q-QPlots通过qq图和pp图判断正态性。(越在直线附近正态性越好)变量窗口定义变量1.将数据录入SPSS并整理加工变量窗口定义变量数据窗口录入数据通过“Analyze”|“DescriptiveStatistics”|“Explore”(探索性)2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。主对话框Dependent:因变量列表FactorList:因子列表(分组变量)※

3.通过“Analyze”|“DescriptiveStatistics”|“Explore”(探索性)Statistics(统计量)二级对话框“Descriptive”(描述性)可输出基本统计量,且可输出置信区间范围“Plot”(绘制)设置选择“Normality….”(正态性检验)分析结果输出(均数)(均值的95%的置信区间)(中位数)(方差)(标准差)(极差)(四分位间距)(偏度)(峰度)结果分析:值越接近0,正态性越好。P(sig.)>0.05,则说明满足正态性。2024/4/6160血糖值的P-P图血糖值的Q-Q图

均数比较(CompareMeans)1.Means过程2.One-SampleTTest过程3.Independent-SamplesTTest过程4.Paired-SamplesTTest过程Analyze菜单为例,其中最常用的子菜单:

DiscriptiveStatisticsCompareMeansGeneralLinearModelCorrelateRegression(截图01.jpg)

均数比较(CompareMeans)菜单AnalyzeCompareMeans

Means过程:对准备比较的各组计算描述指标,进行预分析,也可直接比较。One-SampleTTest过程:进行样本均数与已知总体※

均数的比较。

Independent-SamplesTTest过程:进行两样本均数差※

别的比较,即通常所说的两组资料的t检验。

Paired-SamplesTTest过程:进行配对资料的显著性检验,※即配对t检验。

One-WayANOVA过程(下章内容):进行两组及多组样※

本均数的比较,即成组设计的方差分析,还可进行随后的两两多重比较。

One-SampleTTest过程:进行样本均数与已知总体均数的比较(即单个总体均数的检验)。

例:正常疫苗平均抗体强度为1.9,已知16人体注射某麻疹疫苗后测得抗体强度为1.2,2.5,1.9,1.5,2.7,1.7,2.2,2.2,3.0,2.4,1.8,2.6,3.1,2.3,2.4,2.1,根据样本能否证实该厂产品的疫苗平均抗体强度仍为1.9?目的:检验问题:数据是否服从正态分布?是参数检验(One-SampleTTest过程)否非参数检验“Nonparametrictest”利用第二章的DescriptiveStatisticsExplore(探索性)模块原理X1,X2,…,Xn为总体X~N(μ,σ2)简单随机样本

实现步骤:(2)正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)将“抗体强度”加入“Depedent”框;选择“Normality….”(正态性检验)(1).将数据录入SPSS并整理加工定义变量输入数据保存抗体强度.sav

结果输出和讨论:分析:由于抗体强度的K.S和S.W对应的P值均>0.05,

不拒绝原假设,即认为抗体强度数据服从正态分布Q-Q图(3)参数检验:菜单“Analyze”|“CompareMeans”|“One-SamplesTTest”【Options钮】ConfidenceInterval框输入需要计算的均数差值可信区间范围,默认为95%。【上方Test框】用于选入需要分析的变量。【下方Test框】在此处输入已知的总体均数,默认值为0。本题为1.9点击【Option钮】最后点击【Continue钮】输出结果

结果输出和讨论:<1>检验:结论:P=0.024<0.05,拒绝原假设。<2>若进行区间估计:在【下方Test框】填0,结论:置信区间在下为(1.9488,2.5012)问题:1.动物实验来鉴定使用或不使用某种药物;

2.临床试验比较新药和旧药的疗效;

3.制药工业中的新旧工艺之间的比较。思路:1.试验分为两组一组为处理组,一组为对照组;一种为甲种处理,一种为乙种处理;

2.以两组的数据对两个总体的参数作显著性检验两组正态资料的假设检验配对比较的四种情况:

1.同一对象处理前后的数据

同一批患者治疗前后的某些生理生化指标,

进行比较,以观察药物的疗效;

2.同一对象两个部位的数据

同一人或动物体的两侧器官,一侧为对照,

另一侧为药物处理;

3.同一对象接受两种不同处理同一样品分为两份在不同的条件下进行试验。

4.两个同质对象接受两种处理动物的同源配对试验;两个正态总体的配对比较

2.已知假设两种处理效果相同,μ1=μ2,即μ1-μ2=0例:某中医使用中药清木香治疗高血压患者,治疗前后的情况,对比如表,问该中药治疗高血压是否有效舒张压(kPa)治疗前治疗后

差数d

清木香有降压作用

Paired-SamplesTTest过程:进行配对资料的显著性检验,即配对t检验。

用于检验两个相关样本是否来自相同均值的正态总体例:一种新上市的减肥茶需要做市场调查,对35个消费者进行了测试,分别统计了这35个受试者服用减肥茶前后的体重数据,形成35个配对,试说明减肥茶是否有效。服药前7595829110087919086879888服药后71.59080.38793.675.4677387.3829485.9828792939584838987908295857988.59087.780797185896767服药前服药后818386939596978188859579757484.990.49387787874.986服药前服药后目的:检验问题1:两组数据是否均服从正态分布?是否非参数检验参数检验(Paired-SamplesTTest过程)

操作步骤:(2)正态性检验:AnalyzeDescriptiveStatisticsExplore(探索性)(1).将数据录入SPSS并整理加工定义变量输入数据保存减肥茶配对比较.sav分析结论:可以认为服从正态分布(3)检验利用Paired-SamplesTTest过程菜单“Analyze”|“CompareMeans”|“Paired-SamplesTTest”命令【PairedVariable框】:用于选入希望进行比较的一对或几对变量。注意:这里的量词是“对”而不是“个”。选入变量需要成对的选入,选中两个成对变量,再单击

将其选入。如果只选中一个变量,则

按钮为灰色,不可用。同时选中“服用减肥茶的体重”和“服用减肥茶后的体重”两个变量,按选入【PairedVariables框】before-after点击【Options钮】【Options钮】和One-SamplesTTest对话框的

Options钮完全相同,根据置信区间要求的显著水平选择。点击【OK钮】得到输出结果

输出结果和分析:

分析:从直观上可以看出受试者体重在服用减肥茶前后是有差异的分析:相关系数(C)为0.559,P≈0.00048<0.01,说明两个变量之间高度相关。

结果输出和分析:分析:变量before和变量after相减后的平均值(mean)为

7.2471,95%的置信区间为(4.94622,9.54521)配对检验t值为6.404,P=0.000<0.01,拒绝原假设,可以认为两变量间差异有极显著意义,认为减肥茶的效果是极显著的。优点:减少试验中个体差异,体现试验本质。缺点:有时配对不便。

成组比较(两独立样本比较):不易于配对比较,或比较不同种样品、药品的疗效成分含量时可以作组与组比较。

Independent-SamplesTTest过程:进行两样本均数差别的比较,即通常所说的两组资料的t检验。例:某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87特点:两变量间是独立关系目的:检验问题1:数据是否服从正态分布?是否非参数检验(“Nonparametrictest”)参数检验(Independent-SamplesTTest过程)(1).载入数据“1.1克山病.sav”菜单“File”|“Open”|“data”|选入“1.1克山病.sav”截图05.jpg(2)正态性检验:分析:无论患者组还是健康组P>0.05,所以可以认为服从正态分布(3)检验利用Independent-SamplesTTest过程菜单“Analyze”|“CompareMeans”|“Independent-SamplesTTest

”命令Analyze|DescriptiveStatistics|Explore(探索性)

结果输出和讨论:【Cutpoint框】用于连续型的定距型变量。输入分割点,大于该值一组,小于该值另一组。【Options钮】和One-SamplesTTest对话框的Options钮完全相同截图06-09.jpg【Test框】用于选入需要分析的变量。【Groups框】用于选入分组变量。注意选入变量后还要定义需比较的组别

结果输出和讨论:结论:F=0.032,P=0.86>0.05,认为方差齐。又因为t=2.524,P=0.019<0.05,所以拒绝原假设,认为患者组和健康组的血磷值有显著性不同。练习1:试比较例3-1中不同年龄同学的体重的平均值和标准差。例为研究乙醇浓度对提取浸膏量的影响,某中药厂取乙醇50%、60%、70%、90%、95%五个浓度作试验,判断五个浓度所得浸膏量是否不同。水平观测值50%60%70%90%95%6767554260695035796481709070798898969166因素:在试验过程中,影响试验结果的条件叫做因素(因子)常用大写字母A,B,C表示。…水平:把因素在试验中可能处的状态称做因素的水平.常用表示该因素的字母加上足标表示。方差分析的适用范围

在生产和科学实验中,影响结果的因素往往有很多。要知道哪个因素对结果有显著的影响时用方差分析。方差分析用于两个及两个以上总体均值差异的显著性检验。4.若拒绝了原假设进一步作两两间多重比较:LSD-t检验,Dunnett-t检验,SNK-q检验。方差分析表方差F值拒绝域方差来源离差平方和组间组内总和自由度1.先进行正态性检验方差分析的步骤2.进行方差齐性检验(Bartlett卡方检验法、Levene检验)3.进行方差分析,给出方差分析表结论:当统计量时,则拒绝假设,

认为在显著水平下,因素各水平间差异有显著意义,否则,不拒绝假设,认为水平间差异没有显著意义。称为组内离差平方和称为组间离差平方和组间方差和组内方差分别为LSD-t法(最小显著性差异法(事前多重比较检验法)):

H0:μi=μj,

检验与是否相同的多重比较检验法Dunnett-t法(新复极差法):多个实验组与一个对照组比较的多重比较检验法H0:μi=SNK-q法:(Student,Newma,Keuls姓氏缩写)H0:μi=μj检验μi与μj是否相同的多重比较检验法(事后多重比较检验法)3.2SPSS实现单因素方差分析的方法※

One-WayANOVA过程(单因素简单方差分析)【菜单“Analyze”|“CompareMeans”】Univariate过程(单变量多因素方差分析)【菜单“Analyze”|“GeneralLinearModel”】Multivariate过程(多变量多因素方差分析)RepeatedMeasure过程(重复测量方差分析)VarianceComponent过程(方差估计分析)One-WayANOVA过程(单因素简单方差分析)用于进行两组以上样本均数的比较,即成组设计的方差分析。如果做了相应选择,还可进行随后的两两比较。例3-1某研究者拟探讨枸杞多糖(LBP)对酒精性脂肪肝(AFL)大鼠GSH的影响,将36只大鼠随机分成甲、乙、丙三组,甲组为正常组12只,其余24只用乙醇灌胃10周造成慢性AFL模型后,随机分成两组,乙(LBP治疗组)12只,丙(戒酒组)12只,8周后测量GSH值,问三种处理方式大鼠的GSH值是否相同。目的:检验问题:数据是否服从正态分布(需提前进行)?方差是否齐?是参数检验(One-WayANOVA过程)否数据转换或进行非参数检验否是是否拒绝结束进行多重检验

实现步骤:(1).将数据录入SPSS并整理加工定义变量输入数据保存Group,GSH保存为:“GSH.sav”(2)正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)将“GSH”加入“Depedent”框;“Group”加入“FactorList”框。选择“Normality….”(正态性检验)

结果输出和讨论:分析:可见无论是K.S检验还是S.W检验GSH值

P>0.05,所以GSH值数据均服从正态分布。(3)One-WayANOVA过程(单因素方差分析)(在此步将进行方差齐性检验、方差分析和多重检验)菜单“Analyze”|“CompareMeans”|“One-WayANOVA”菜单“Analyze”|“CompareMeans”|“One-WayANOVA”将“GSH”加入上方“DepedentList”框;“Group”加入下方“Factor”框。【Factor框】【DependentList框】选入需要分析的因变量,可选入多个结果变量。选入需要比较的分组因素,只能选入一个。【Contrast钮】用于对精细趋势检验和精确两两比较的选项进行定义,较少使用。点击“PostHoc”钮【PostHocMultipleComparisons对话框】用于选择进行各组间两两比较的方法【EqualVariancesAssumed复选框组】

当各组方差齐时可用的两两比较方法

(14种)常用:LSD、S-N-KBonferroni、Turkey、Sheffe、Dunnett方法。勾选“LSD”,点击“Continue”返回【EqualVariancesNotAssumed复选框组】当各组方差不齐时可用的两两比较方法,共有4种.(一般认为“Game-Howell”方法较好,但由于统计学对此尚无定论,所以建议方差不齐时使用非参数方法。)点击“Option”钮【Statistics复选框组】

常用【Descriptive】统计描述【Homogeneity-of-variance】

方差齐性检验。【Meansplot复选框】用各组均数做图,以直观的了解它们的差异。【MissingValues单选框组】

定义分析中对缺失值的处理方法勾选“Descriptive”、

“Homogeneity-of-variance”、“Meansplot”三项。√√√点击“Continue”钮返回点击“OK”钮输出结果

结果输出和讨论:分析:得出各组的均数、标准差、均数标准误、均数的95%的置信区间,还有最小值、最大值。方差齐性检验分析:统计量值为0.015,P=0.985>0.5,不拒绝原假设,即可以认为方差齐的。(因为已证明了各水平既服从正态分布又是方差齐的,所以可以进行方差分析)方差分析表分析:F=23.845,P=0.000<0.05,拒绝原假设,即可以认为三种处理方式大鼠的GSH值不全相等。LSD法进行多重检验分析:可见戒酒组大鼠的GSH值与正常组大鼠的GSH值差异是显著的,戒酒组大鼠的GSH值与LBP治疗组GSH值差异显著。均数分布图3.3两因素的方差分析(Two-wayANOVA)Univariate子过程(单变量多因素方差分析)】

【菜单“Analyze”|“GeneralLinearModel”|=SSe+SSA+SSB

基本原理:=SSe+SSA+SSB+SSA×B或H0A:μ1=μ2=…=μrH0B:τ1=τ2=…=τs案例2:对8窝小白鼠,每窝各取同体重的3只,分别喂A,B,C三种不同的营养素,三周后体重增量结果如表所示,试判断不同营养素和不同窝的小白鼠体重增量是否不同。水平12345678ABC50.1047.8053.1063.5071.2041.4061.9042.2058.2048.5053.8064.2068.4045.7053.0039.8064.5062.4058.6072.5079.3038.4051.2046.2053.9053.9559.1457.6052.9055.1766.7372.9741.8355.3742.73

目的:检验H0A:μ1=μ2=…=μr问题:数据是否服从正态分布?(各因素下进行)是参数检验(Univariate子过程)否数据转换或进行非参数检验否是是否拒绝H0A结束进行相应因素下的多重检验各因素下方差是否齐?和H0BH0B:τ1=τ2=…=τs操作步骤:Univariate子过程(单变量多因素方差分析)】

【菜单“Analyze”|“GeneralLinearModel”|(1).将数据录入SPSS并整理加工定义变量输入数据保存保存为:“3.2两因素方差分析数据.sav”变量名:体重、不同营养素(1:甲素、2:乙素、3:丙素)分窝(1-8:1窝-8窝)(2)正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)不同营养素下正态性检验结果:

结果输出和讨论:不同窝下正态性检验结果:

有四种不同来源的家兔4只,在同一室温下,测其血糖值,以每100ml血中含葡萄糖的mg表示,(mg%),试判断不同来源的家兔其正常血糖值之间有无差异.家兔IIIIIIIV来源1234

为考察工艺对花粉中的氨基酸百分含量的影响,某药厂用四种不同工艺对花粉进行处理,测得氨基酸百分含量如下表,试判断四种不同工艺处理间的氨基酸百分比含量有无显著差异。试验号酸处理碱处理破壁水浸后醇提为研究乙醇浓度对提取浸膏量的影响,某中药厂取乙醇50%、60%、70%、90%、95%五个浓度作试验,判断五个浓度所得浸膏量是否不同。水平观测值50%60%70%90%95%6767554260695035796481709070798898969166进行Shapiro-Wilk正态性检验、方差齐性检验、方差分析、LSD多重检验,并给出各组均数的散点图。最后写出相应结论。某医院用三种不同疗法治疗同种疾病,以体温降至正常所需要的天数为指标,15例患者体温降至正常所需要的天数资料如下,试问:治疗方法的不同对患者体温的疗效是否有显著影响?例数甲法乙法丙法15572559357947795779平均天数5.86.68.6考察温度对某药物有效成分得率的影响,选了五种不同的温度,在同意温度下各做了三次实验,结果见表,试问温度的不同是否影响该成分的得率?温度编号

60oC65oC70oC75oC80oC190979684842929396838638892938882平均得率9094958584

为考察中药葛根对心脏功能的影响,配制每100ml含葛根1g,1.5g,3g,5g的药液,用来测定大鼠离体心脏在药液中7—8分钟时间内心脏冠脉血流量,数据如下:试推断葛根对心脏功能是否有显著影响?例1:某医院收得乙型脑炎重症病人204例,随机分成两组,分别用同样的中草药方剂治疗,但其中一组加一定量的人工牛黄,每个病人根据治疗方法和治疗效果进行分类,得出如下表格:4.1列联表原理疗法

疗效合计治愈未愈不加牛黄324678加牛黄7650126合计10896204列联表:观测数据按两个或更多属性(定性变量)分类时所列出的频数表。R×C列联表:分类频数排成R行C列的列联表。2×2表:二行二列的列联表,又称四格表。列联表分析:使用列联表进行分类资料的检验。※双向无序单向有序双向有序且属性不同列联表双向有序且属性相同设不加牛黄组治愈总体率为,加牛黄组治愈总体率为检验即“疗法”与“疗效”独立

1.双向无序表独立性检验双向无序列联表:两个分类变量分类标志无数值大小与先后顺序之分。疗法

疗效合计治愈未愈不加牛黄324678加牛黄7650126合计10896204若拒绝H0:X与Y独立(即两组总体率相同)

实际频数Oij与理论频数Eij的差异是随机误差,用Pearson卡方统计量

反映实际Oij与理论Eij吻合程度注意:上述检验适用于双向无序的表(df≠1)

分组标志无数量大小和先后顺序之分。分析的目的是考察两个属性之间是否独立。

疗效疗法

中医

西医痊愈显效合计687372638835好转无:2.若R×C列联表中理论频数出现小于1,或理论频数出现小于5的格数超过总格数1/5时,必须增大样本例数;

或把理论频数太小的行,列与性质相近的邻行,列合并;

或删去理论频数太小的行,列。最小理论频数=最小行合计频数﹒最小列合计频数/总频数1.双向无序列联表计算卡方统计量常用单侧检验。3.多个总体率比较的卡方检验,若结论为拒绝原假设,只能认为总体率之间不全等,不能说明任意两个总体率有无差别,需做多重比较。例:判断患鼻咽癌与血型有无关系分类A型血B型血O型血AB型血合计患癌者648613020300健康人12513821026499合计18922434046799第一行合计数,第四列合计数最小,最小理论频数H0:“患癌”与“血型”独立,H1:“患癌”与“血型”不独立df=(2-1)(4-1)=3,单侧概率P>0.05,不能以α=0.05水准的单侧检验拒绝H0,总体率的差异无统计意义,不能认为患鼻咽癌与血型不独立。2.四格表独立性检验

例1:某医院收得乙型脑炎重症病人204例,随机分成两组,分别用同样的中草药方剂治疗,但其中一组加一定量的人工牛黄,每个病人根据治疗方法和治疗效果进行分类,得出如下表格:疗法

疗效合计治愈未愈不加牛黄324678加牛黄7650126合计10896204双向无序四格表(1)N≥40,理论频数≥5(2)N≥40,理论频数小于5(但≥1),用校正卡方统计量(3)N<40或理论频数小于1,不能使用卡方检验,应使用Fisher精确检验,称为四格表确切概率法。列联表的原假设是两个变量X和Y相互独立,计算卡方统计量,当此统计量很大时否定原假设。df=1

疗法

疗效合计治愈未愈不加牛黄324678加牛黄7650126合计10896204“疗法”与“疗效”独立(即两组治愈率相同)N=204>40统计结论:“疗法”与“疗效”不独立(即两组治愈率不同)专业结论:加人工牛黄组疗效高于不加人工牛黄组的疗效。4.2Crosstabs过程例:调查339名50岁以上的人的吸烟习惯与患慢性气管炎病的数据而建立如下列联表,试探讨吸烟与患慢性气管炎之间的关系。组别吸烟不吸烟患病组4313健康组162121目的:检验变量X与Y是独立的输入数据个案加权列联表分析(weight

by

cases过程)结果分析(Crosstabs过程)

实现步骤:(1).将数据录入SPSS并整理加工定义变量输入数据保存smoke:吸烟情况;result:结果;count:频数;保存为:“吸烟与慢性支气管炎的关系.sav”(2).个案加权在SPSS系统中,列联表的输入多采用频数表格的方式,如果要对此类数据进行卡方分析等,必须采用个案加权(weight

by

cases)进行数据处理后才能使用相关的统计方法。菜单“Data”|“WeightCases”命令点击“WeightCasesby单选框”,选中“Freqency”:选入“频数[count]”。单击OK钮菜单“Analyze”|“DescriptiveStatistics”|“Crosstabs”命令(3)列联表分析将“结果[result]”点入“Row(s)”框,将“吸烟情况[smoke]”点入“Cloumn(s)”框。点击“Statistics”钮。

【Statistics钮】用于定义所需计算的统计量。点击“Chi-square复选框”,计算值

;选择“Nominal”里的“ContingencyCoefficient”计算Pearson列联相关系数。点击“continue”钮回到上一对话框点击”Cells”按钮【Cells按钮】:用于定义列联表单元格中需要计算的指标。勾选“Counts复选框组”中的输出实际观察数“Observed”和理论数“Expected”选择“Percentages”里的“column”计算列百分比。点击“Continue”按钮返回上一层对话框。点击”OK”按钮

结果输出和讨论:分析:处理记录缺失值情况报告,可见所有数据均是有效值。分析:给出了2×2列联表,其中表中给出了实际观测值和理论值。不吸烟者的患癌率9.7%吸烟者的患癌率21.0%给出了4种检验方法的结论。其中,1)PearsonChi-Square

即常用的卡方检验2)ContinuityCorrection

连续性校正的卡方值

3)LikelihoodRatio

似然比卡方检验4)Fisher'sExactTest:Fisher's确切概率法(N≥40,理论频数≥5)(N≥40,理论频数小于5(但≥1))(N<40或理论频数小于1)分析:由于最小理论值为22.14,N=339>40,所以选用普通的卡方检验。所以有理由拒绝吸烟与患病是独立的原假设,即认为吸烟与患支气管炎是有关的。计算Pearson列联相关系数r=0.147例:甲乙两种疗法治疗某病,问两法疗效有无差别组别有效无效合计甲法14115乙法7310合计21425N=25<40,Fisher'sExactTest:Fisher's确切概率法H0:“方法”与“疗效”独立,H1:“方法”与“疗效”不独立

双向有序表的检验例:用甲乙两种方法检查鼻咽癌患者93例,两法都是阳性的45例,都是阴性的20例,甲法阳性但乙法阴性的22例,甲法阴性但乙法阳性的6例。组别乙+乙-合计甲+452267甲-62026合计5142931.双向有序且属性相同表(配对四格表)的检验

两个分类变量的标志完全一样且有序排列相同,是相关样本数据构成的列联表。O12+O21≥40用吻合卡方统计量,df=1O12+O21<40用校正卡方统计量,df=1吻合性检验或McNemar检验:H0:“方法”与“阳率”独立,H1:“方法”与“阳率”不独立df=1,查统计用表,χ2>6.6349=χ20.01(1),单侧概率P<0.01,以

=0.01水准的单侧检验拒绝H0,只能认为“方法”与“阳性率”不独立

差异有统计意义,认为甲法的阳性检出率高于乙法O12+O21=22+6=28<40,使用校正卡方检验一致性检验(Kappa检验)

:观察一致率:两种分类结果一致的观察频数理论一致率:两种分类结果一致的理论频数K=1,说明两种分类结果完全一致K0.75,说明一致程度相当满意。K0.4,说明一致程度尚可。K=0,说明两次判断的结果是机遇造成的。菜单“Analyze”|“DescriptiveStatistics”|“Crosstabs”命令例:用脑神经生成素方案治疗急性脑出血所致脑神经功能障碍,判断三种方案的疗效有无差异。2.双向有序且属性不同表的检验

用药基本痊愈显著好转无效合计A(5-7天)57108B(10-12天)91074C(21-30天)161031好转单向有序R×C表,两个分类变量一个无序,另一个有序。双向有序且属性不同的R×C表,两个分类变量均有序但属性不同,不宜用卡方检验,应选用与有序性有联系的对应分析或线性趋势检验(或后面学习的非参数检验)。分组变量有序(如年龄),指标变量无序(如传染病类型),用卡方检验分析不同年龄组传染病的构成。分组变量无序(如疗法),指标变量有序(如疗效)用Ridit分析或非参数秩和检验分析不同疗法的疗效。例测某地10名三岁儿童的体重X(kg)与体表面积Y(10-1m2),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411判断X和Y是否是线性相关的。5.1相关分析原理1.直线相关:(1)两个变量均服从正态分布

总体相关系数:样本相关系数:r绝对值愈接近1,两个变量间的线性相关越密切r绝对值越接近0,两个变量间的线性相关越不密切性质:Pearson简单相关分析相关系数的检验原假设则:()×(2)如果不服从正态分布,则应考虑变量变换,或采用等级相关来分析。Spearman等级相关Kendall等级相关注:列联表可用“Crosstabs过程”中的“ContingencyCoefficient”

计算Pearson列联相关系数2.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的曲线趋势。一般都先将变量变换,再将趋势变换为直线来分析,或者采用曲线回归方法来分析。5.2Bivariate过程例某次体检中抽取12名学生的体重和血压,现通过相关分析过程来观测学生的体重与血压是否相关?体重68485660835662597758血压95988796110155135128113168目的:检验问题:两变量数据是否服从正态分布?(需提前进行)是Pearson相关分析否数据转换或进行等级相关分析

实现步骤:1.将数据录入SPSS并整理加工定义变量输入数据保存weight:体重;pressure:血压;保存为:“体重与血压.sav”2.正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)可以认为体重值、血压值服从正态分布。【Variables框】用于选入需要进行相关分析的变量,至少需要选入两个。【CorrelationCoefficients

复选框组】用于选择需要计算的相关分析指标。【Flagsignificantcorrelations】用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P<0.05的系数值旁会标记一个星号,P<0.01的则标记两个星号。将“体重[weight]”、“血压[pressure]”点入“Variables”框,点击“Options”按钮。

3.相关分析过程菜单“Analyze”|“Correlate

”|“Bivariate”命令【Options钮】弹出Options对话框,选择需要计算的描述统计量和统计分析:选择“Meansandstandarddeviations”,点击“Continue”返回上一层对话框。点击“OK”按钮

结果输出和讨论:分析:左图给出了体重和血压的平均值、标准差和样本数目。分析:Pearson相关系数r为-0.112,即两者是微弱相关的,但P=0.728>0.05,所以不能认为二者相关。即不存在直线相关关系。(反映了观测值总的分散程度)(回归平方和

)反映了回归值的分散程度(由于线性影响引起的离散性)(剩余平方和)反映了观测值偏离回归直线的程度(由于随机误差引起的离散性)5.3回归分析原理F检验:

H0:β=0()当时:或决定系数R2=SS回/SS总=1-SS剩/SS总

0≤R2≤1,越接近于1,回归效果越好。临床:R2≥0.7就认为回归效果不错高精度医药实验研究:R2>0.9R2=r2一元线性回归方程中:越接近于1,回归效果越好。校正决定系数1-MS剩/MS总例测某地10名三岁儿童的体重X(kg)与体表面积Y(10-1m2),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411做体表Y关于体重X的回归方程。做散点图建立回归方程并检验

实现步骤:保存为:“体重与体表.sav”x:体重;y:体表;1.将数据录入SPSS并整理加工定义变量输入数据保存2.利用Scatter/Dot命令做散点图菜单“Graphs”|“LegacyDialogs”|“Scatter/Dot”点击“simple

scatter”命令,点击“Define”按钮。将“体重[x]”变量选入“XAxis”框,将“体表[y]”选入“YAxis”框中,点击“OK”按钮输出结果。(2)正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)3.Regression过程菜单“Analyze”|“Regression

”|“linear”命令将“体表[y]”选入【Dependent框】;将“体重[x]”选入【Independent(s)框】中,点击“Statistics”按钮Enter

强迫进入Stepwise

逐步回归Remove

只出不进Backward

向后剔除,只出不进Forward

向前选择,只进不出【Modelfit】输出复相关系数R,其平方,校正决定系数和标准差,以及方差分析表。选择“Estimates”、“Confidenceinterval”、“Modelfit”、“Descriptives”,点击“continue”返回。【Estimates】

输出有关回归系数和相关测量【Confidenceinterval】输出回归系数95%的置信区间【Descriptives】描述性统计量点击“OK”按钮输出结果分析:给出了体表和体重的均数和标准差情况。分析:此表给出了体重和体表的相关系数阵和P值。

结果输出和讨论:分析:R=0.918(即相关系数r),决定系数校正的决定系数为0.823,估计值的标准误差为0.17434分析:可见回归平方和为1.301,剩余平方和为0.243,F=42.798,P=0.000<0.05,拒绝原假设,认为是线性相关的,即回归方程有意义。分析:非标准化系数,t统计量分别为5.616和6.542,其P值分别为0.001和0.000,均小于0.005,有显著性意义。其回归方程为

多元线性回归分析

研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,在计算上更为复杂,一般需借助计算机来完成。是偏回归系数编号载脂蛋白AI(mg/dl)载脂蛋白B(mg/dl)载脂蛋白E(mg/dl)载脂蛋白C(mg/dl)胆固醇含量(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.7395139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究认为血清中高密度脂蛋白降低是引起动脉硬化的一个重要原因,现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白AⅠ、载脂蛋白B、载脂蛋白E、载脂蛋白C和高密度脂蛋白中的胆固醇含量,资料见表,分析四种载脂蛋白对高密度脂蛋白中胆固醇含量的影响。91581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.634251471108.518.454262041226.121.072271311026.613.451281701278.424.7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论