版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3数值变量资料的统计推断
朱继民公共卫生与全科医学教研室2023/7/201回顾上一章内容:集中趋势指标:
算术均数、中位数、几何均数离散趋势指标:
全距、四分位数间距、方差、标准差、变异系数正态分布:概念、特征、面积规律、应用医学参考值估计:步骤、估计方法2023/7/202A.想知道合肥市现今新生儿出生体重B.根据某几个学校男大一学生的入学体检身高资料,推测该市大一学生男性身高总体参数的估计2023/7/203A.经常参加锻炼的女子脉搏是否等于74次/分B.比较来自中国广东省与河北省的一年级男大学生身高。以在合工大和中科大的两省男生为样本,得出样本均值分别为168.2cm与169.9cm,推测总体均值是否相等推测某个总体参数是否等于某个值或两个或两个以上的总体参数是否相等2023/7/204本次讲授内容均数的抽样误差t分布,t分布与u分布的区别总体均数的可信区间估计2023/7/205一、均数的抽样误差和标准误第一节抽样误差与总体均数的估计2023/7/206例如,从总体均数μ为4.83×/L、标准差为
0.52×/L的正态分布总体N(4.83,0.522)中,随机抽取10人为一个样本(n=10),并计算该样本的均数、标准差。如此重复抽取100次(g=100),可得到100份样本,可得到100对均数和标准差S。正态总体μ=4.83σ=0.521.4.58,0.382.4.90,0.453.4.76,0.49┆99.4.87,0.59100.4.79,0.39S2023/7/207
抽样误差
samplingerrorofmean:由于抽样而引起的差异。2023/7/208图9-1随机抽样所得100个样本均数的分布2023/7/209标准误(standarderror,SE)概念:样本均数的标准差,可用于衡量抽样误差的大小。σ未知σ已知2023/7/2010计算了100个样本的标准差S,由此可计算样本的标准误大小。2023/7/2011
100个样本均数的抽样分布特点:②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。①2023/7/2012标准误的特点:当样本例数n一定时,标准误与标准差呈正比;当标准差一定时,标准误与样本含量n的平方根呈反比。通过增加样本含量n来降低抽样误差。2023/7/2013n=5n=103个抽样实验结果图示2023/7/2014标准误的用途衡量抽样误差的大小;估计总体均数的置信区间;用于假设检验。2023/7/2015标准误与标准差的区别与联系区别:
标准误标准差定义反映抽样误差反映个体变异用途总体均数可信区间医学参考值范围进行统计学检验计算标准误、CV联系:当n一定时标准差大,标准误也大2023/7/2016抽样实验小结
样本的均数围绕总体均数上下波动。均数的标准差即标准误样本均数的标准误(StandardError)
计算公式为:样本的标准差/
从正态总体N(μ,σ2)中抽取样本,获得均数的分布仍近似呈正态分布N(μ,σ2/n)。二、
t分布(t-distribution)随机变量XN(m,s2)标准正态分布N(0,12)u变换2023/7/2018均数标准正态分布N(0,12)Studentt分布自由度:n-12023/7/2019图3-1
不同自由度下的t分布图2023/7/2020t分布的特征
①以0为中心,左右对称的单峰分布;②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于∞时,t分布即为u分布。2023/7/2021参数的估计点估计:由样本统计量
直接估计总体参数区间估计:在一定置信度(Confidencelevel)下,估计总体参数可能存在的范围三、总体均数的估计估计正确的概率(1)称为可信度或置信度(confidencelevel),常取95%或99%。置信区间(confidenceinterval,CI)是根据一定的置信度估计得到的区间。
总体均数的95%CI的涵义:从理论上来说,做100次抽样,可算得100个置信区间,平均有95个置信区间包括总体均数,只有5个置信区间不包括总体均数。(一)置信区间的有关概念2023/7/2023(二)总体均数置信区间的计算s未知,且n较小,按t分布s已知,或s未知但n足够大,按u分布2023/7/20242023/7/20252023/7/2026u0.05/2=1.962.σ未知但n较大时,按u分布计算总体均数的可信区间。双侧1-α可信区间为:3.σ已知时,总体均数双侧1-α可信区间为:u0.05/2=1.96=2023/7/2027(四)总体均数可信区间与参考值范围的区别2023/7/2028本讲小结均数的抽样误差标准误:计算公式、意义和特点
t分布及其特征总体均数可信区间含义估计方法与医学参考值的区别2023/7/20291正态曲线下面积分布规律是:A.μ±1.96δ范围内占曲线下面积的99%B.μ±1.96δ范围内占曲线下面积的95%C.μ±1δ范围内占曲线下面积的68%D.μ±2.58δ范围内占曲线下面积的95%E.μ±2.58δ范围内占曲线下面积的99%课堂练习题2023/7/2030
2某市120名12岁男孩平均身高为143.10cm,标准差为5.67cm,则身高在128.24-157.96cm范围内的理论频数最接近下列哪个值?A.114B.119C.64D.72E.962023/7/2031
3衡量抽样误差大小的统计指标是:
A.标准差B.变异系数
C.方差D.标准误2023/7/2032
4关于t值有:A.与总体均数和样本均数之差成正比
B.与标准误成反比
C.与样本含量有关
D.自由度一定时,t值愈大,P值越小
E.符合正态分布2023/7/2033数值变量资料的统计推断第二节假设检验的基本思想和基本步骤2023/7/2034学习要点:1.熟悉假设检验的基本思想和步骤;2.掌握t检验和u检验的方法;2023/7/2035(一)假设检验的基本思想—利用反证法的思想假设检验的基本思想和步骤
利用小概率反证法思想,先建立假设;然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P值小于或等于预先规定的概率值α,就是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设H0,认为其对立面H1成立,该结论可能犯大小为α的错误。2023/7/2036例
某地抽样调查了26名男性管理人员的空腹血糖,均数为4.84mol/L,标准差为0.85mol/L。已知大量调查的一般健康成年男性空腹静脉血糖的均数为4.70mol/L。试问能否认为该地健康男性管理人员的空腹血糖的均值与一般正常健康成年男性的的均值不同?2023/7/2037差异来自哪里?
(1)由于抽样误差造成的.(实际上,但由于抽样误差不能很好代表)(2)该地男性管理人员的空腹血糖与一般健康成年男性空腹静脉血糖()
2023/7/2038
假设检验的目的就是判断差异的原因:求出由抽样误差造成此差异的可能性(概率P)有多大!若P
较大(P>0.05),认为是由于抽样误差造成的。原因(1),实际上若P
较小(P≤0.05),认为不是由于抽样误差造成的。原因(2),实际上>2023/7/2039(二)假设检验的基本步骤1.建立假设2.确定检验水准3.选定检验统计方法,计算检验统计量4.确定P值,作出推断结论2023/7/20401、建立假设H0:(无效假设)µ=µ0H1:(备择假设)µ>µ0
(
µ≠µ0)2、确定检验水准检验水准的意义及确定(单、双侧检验的选择)(1)根据专业知识事先不知道会出现什么结果双侧事先知道只能出现某种结果单侧(2)问题的提法*通常用双侧(除非有充足的理由选用单侧之外,一般选用保守的双侧较稳妥)2023/7/20413、选定检验方法,计算检验统计量4、确定P值,作出推断结论P值:在H0成立的情况下,获得比现有统计量更极端的概率。2023/7/2042
(推断的结论=统计结论+专业结论)
P>0.05,按检验水准,不拒绝H0,差异无统计学意义(差异无显著性),还不能认为……不同或不等。
P≤0.05
,按检验水准,拒绝H0,接受H1,差异有统计学意义,可以认为……不同或不等。
P≤0.01,按检验水准,拒绝H0,接受H1,差异有高度统计学意义,可以认为……不同或不等。2023/7/2043确定P值:
(用求出的t值与查表查出的t值比较)查t
值表:
(t
越大,P
越小)
(1)求出t=1.833,P>0.05
(2)求出t=4.18,
P<0.01
(3)求出t=2.96,
0.01<P<0.05(简写为P<0.05)
(4)求出t=3.25,
P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.962023/7/2044第三节t检验和u检验t检验应用条件:
①当n<100时,要求样本取自正态分布的总体,总体标准差未知;②两小样本均数比较时,要求两样本总体方差相等(σ12=σ22)。2023/7/2045一、样本均数与总体均数比较的t检验(即:样本均数代表的未知总体均数µ和已知总体均数µ0的比较)2023/7/2046例
已知一般无肝肾疾患的健康人群尿素氮均值为4.882(mmol/L)。16名脂肪肝患者的尿素氮(mmol/L)的测定值为5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4.37,4.59,5.18,6.96。问脂肪肝患者尿素氮测定值的均数是否高于健康人?2023/7/2047(1)建立假设、确定检验水准H0:µ=µ0即脂肪肝患者尿素氮测定值的均值与健康人相等H1:µ>µ0
即脂肪肝患者尿素氮测定值的均值高于一般健康人2023/7/2048(2)选定检验方法,计算检验统计量n=16<100,故选用t检验。已知2023/7/2049(3)确定P值,作出推断结论
查t界值表
为单侧检验Pt0.050.012.6021.725P<0.0252.32P<0.05,按检验水准,拒绝H0
,接受H1,认为脂肪肝患者尿素氮测定值的均数高于健康人。0.0252.1312023/7/2050二、配对设计的均数比较常见的配对设计主要有以下情形:①自身比较:同一受试对象处理前后或不同部位测定值的比较。(目的是判断此处理有无作用)②同一受试对象(或样品)分别接受两种不同的处理。(目的是比较不同方法之间的差异)③成对设计:将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。(目的是比较不同方法之间的差异)2023/7/2051配对t检验的基本原理:
假设两种处理的效应相同,即µ1=µ2
,则µ1-µ2=0,即可看成是差值的样本均数所代表的未知总体均数µd与已知总体均数µ0=0的比较,此时,我们可套用前述t检验的公式。2023/7/2052例
应用某药治疗8例高胆固醇患者,观察治疗前后血浆胆固醇变化情况,如表9-1,问该药是否对患者治疗前后血浆胆固醇变化有影响?表
用某药治疗前后血浆胆固醇变化情况病人编号血浆胆固醇(mmol/L)差值dd2治疗前治疗后⑴⑵⑶⑷=⑵-⑶1
10.10
6.69
3.4111.632
6.78
5.40
1.83
3.353
13.22
12.67
0.55
0.304
7.78
6.56
1.22
1.495
7.47
5.65
1.82
3.316
6.11
5.26
0.85
0.727
6.02
5.43
0.59
0.358
8.08
6.26
1.823.319
7.56
5.06
2.50
6.25合计--
14.59
30.712023/7/2053
H0:该药对血浆胆固醇无影响。
H1:该药对血浆胆固醇有影响。2023/7/2054Pt0.050.011.860P<0.0055.172.896⑶确定P值,判断结果
自由度ν=n-1=9-1=8,查表9-1t界值表,t0.005,8=3.355,今5.17>3.355,故P<0.05,故按α=0.05水准,拒绝H0,接受H1,认为差异有高度显著性,可以认为该药对血浆胆固醇有影响。0.0053.3552023/7/2055三、两个样本均数比较的t检验大样本(n>50)----u检验小样本---正态分布资料t检验偏态分布资料秩和检验2023/7/20561、两个大样本均数的比较2023/7/2057
例
某地随机抽取正常男性264名,测得空腹血中胆固醇浓度的均数为4.404mmol/L,标准差为1.169mmol/L;随机抽取正常女性160名,测得空腹血中胆固醇浓度的均数为4.288mmol/L,标准差为1.106mmol/L,问男、女胆固醇浓度有无差别?2023/7/2058⑴建立假设,确定检验水准
H0:μ1=μ2
H1:μ1≠μ2
α=0.05⑵选择检验方法,计算检验统计量u值(n1,n2>50)2023/7/2059(3)查u界值表(t界值表中自由度为的一行),u=1.02<1.96,故P>0.05,按=0.05水准,不拒绝H0,差异无统计学意义;尚不能认为正常男女血中胆固醇浓度均数不同。2023/7/20602、两个小样本均数的比较2023/7/2061例
从40-59岁有无肾脏囊肿的女性中分别随机抽取10与12人,测定她们的尿素氮水平(mmol/L)见下表,问有肾囊肿女性尿素氮水平是否高于无肾囊肿女性?表
40-59岁有无肾脏囊肿的女性尿素氮水平(mmol/L)无肾囊肿4.054.185.934.302.417.606.612.985.934.184.05有肾囊肿4.544.633.64
5.076.445.62
6.144.816.422023/7/2062⑴建立假设,确定检验水准H0:μ1=μ2H1:μ1<μ2α=0.05⑵选择检验方法,计算检验统计量t值2023/7/20632023/7/2064⑶确定P值,判断结果
查t界值表,t0.05,20=1.725,今1.46<1.725,故P>0.05,故按α=0.05水准,不拒绝H0,尚不能认为有肾囊肿的女性尿素氮水平高于无肾囊肿的女性。PP=?t=1.46P=0.05tt=1.7252023/7/2065思考题:
两样本比较作t检验,差别有统计学意义时,P值越小说明A两样本均数差别越大B两总体均数差别越大C两总体均数差别越小D越有理由认为两样本均数不同E越有理由认为两总体均数不同2023/7/2066第四节方差分析
(analysisofvariance,ANOVA)又称变异数分析或F检验*用途:适用于对多个平均数进行假设检验;以检验所得的多个平均数是否来自相同总体。*对资料的要求:1独立性:每个个体的测量值相互独立;2正态性:总体服从或近似服从正态分布;3方差齐:总体的方差相等。2023/7/2067一、单因素方差分析单向方差分析(onewayanalysisofvariance)或成组设计(完全随机设计)方差分析,是指试验研究的处理因素,或调查研究资料的分类方式只有一种。这个处理因素(或分类方式)包含有多个离散的水平,分析在不同水平上应变量的平均值是否来自相同总体2023/7/2068Xij表示第i个处理组的第j个观察值,i=1,2,…k,j=1,2,…ni
*(一)基本思想2023/7/2069例某院外科对自行制备的三种消毒剂的杀菌效果进行考察,经过使用,以被消毒物品的残余细菌数(cfu/m2)为评价指标。试验结果如表12-5所示,试问三种消毒剂的效果是否存在差异?2023/7/20702023/7/2071变异原因变异表现处理因素(如不同的预防、治疗方案、不同的自然条件等)组间变异随机因素(含随机测量误差,抽样误差,个体变异等)组内变异T+EE组间均方MS组间组内均方MS组内F=MS组间/MS组内若无效假设成立,组内均方MS组间和组间均方MS组内是随机误差方差σ2的估计值,F值理论上应当等于1,F值有抽样误差;F分布是一种偏态分布。它的分布曲线由分子与分母两个自由度决定。方差分析基本思想示意图2023/7/20721=4,2=10的F值曲线和
=0.05时界值统计量F值等于或大于临界Fα(1,2)值时,就在α水准上拒绝无效假设,否则就不拒绝无效假设。2023/7/20732023/7/20741、总变异(sumofsquaresofdeviationfrommean)2023/7/20752、组间变异3、组内变异2023/7/20764、三种变异的关系5、假设检验统计量2023/7/20772023/7/2078(二)分析步骤1.提出检验假设及规定Ⅰ类错误概率水准α的大小。H0:µ1=µ2=…=µk,各组所代表的总体平均值相等;H1:µi≠µj,至少有一个不等式成立。i、j=1,2,…,i≠j。α=0.05。2.计算统计量F3.确定概率,统计推断2023/7/20792023/7/2080
1.建立假设:H0:三类人的空腹血糖均数相同
H1:三类人的空腹血糖均数不全相同α=0.05。2.计算各种离均差平方和、自由度、均方、F值2023/7/2081
ν总
=N-1=33-1=32,ν组间=k-1=3-1=2,ν组内=N-k=33-3=30MS组间=SS组间∕ν组间=6.7∕2=3.35,MS组内=SS组内∕ν组内=5.63∕30=0.19
F=MS组间∕MS组内=3.35∕0.19=17.632023/7/20822023/7/2083
随机区组设计的两因素方差分析随机区组设计(randomizedblockdesign)是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),相当于配对的扩大。例5.22023/7/20841、随机区组设计方差分析变异的分解2023/7/2085上式中,总平均值为:处理组平均值为:区组平均值为:2023/7/20862、分析计算步骤(1)建立检验假设和确定检验水准H0:三种营养素喂养的小白鼠体重增量相等,8个区组的体重增量相等,即1=2=3,1=2=3=4=5=6=7=8H1:三种营养素喂养的小白鼠体重增量不相等,或不全相等;8个区组的体重增量相等或不全相等,=0.05(2)计算检验统计量F值2023/7/2087上式中:2023/7/20882023/7/20892023/7/20902023/7/20912023/7/2092(3)确定P值和作出推断结论F0.05(2,14)=3.74,F处理<F,P>0.05,不拒绝H0。F0.05(7,14)=2.77,F区组>
F,P<0.05,拒绝H0。2023/7/2093
二、多个样本均数间两两比较的q检验
在有k个样本均数的情形下,若进行t检验,可作k!/[2!(k-2)!]次比较,对每个样本均数都要重复比较k-1次,5个均数比较,作10次t检验,=0.05,不犯I类错误的概率(1-0.05)10=0.9510=0.5987,总的检验水准为1-.5987=0.4013。本来差别无统计学意义,则判断为差别有统计学意义。故应用多重比较方法。检验多个样本均数间差别的无效假设H
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030牙科急救箱行业发展趋势分析与未来投资战略咨询研究报告
- 2025合同范本合作伙伴协议书样本
- 护理学导论护师考试题库及答案解析
- 19年江苏建筑安全A考试题库及答案解析
- 2025-2030绿色建筑节能门窗技术革新与市场竞争力分析报告
- 2025-2030绿色建筑技术应用与可持续发展实践分析
- 2025-2030绿色建材认证体系与建筑行业低碳转型路径研究报告
- 2025-2030绿色低碳科技园规划设计与可持续发展评估报告
- 2025-2030绘本分级阅读体系构建与教学实践验证
- 2025-2030纳米高岭土在橡胶复合材料中的性能优化研究
- 【MOOC】科技英语翻译-南京航空航天大学 中国大学慕课MOOC答案
- 第2课黄河文化网上搜(课件)泰山版信息技术三年级上册
- 乡土特色劳动教育的社会功能
- 安全生产方案计划
- 期中 (试题) -2024-2025学年人教PEP版(2024)英语三年级上册
- 高一地理教学计划高一地理(人教版2019必修一)
- DB13(J)-T 8318-2019 双面沟槽复合保温板应用技术规程(2024年版)
- 《热气球上升的秘密》教学课件
- 林地承包种植合同范本
- 浙教版(2023)四下信息科技第1课《初探数字化》教学设计
- DL-T-1798-2018换流变压器交接及预防性试验规程
评论
0/150
提交评论