




已阅读5页,还剩56页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,频数分布表、图,分组划计,原始资料,分布类型,数值变量统计描述小结,算术均数与标准差,对数转换,几何均数与对数值标准差的反对数,中位数与四分位数间距,1,.,第四章第四节正态分布及其应用,流行病与卫生统计学系何保昌,.,3,正态分布及其应用(Normaldistribution),一.正态分布的概念和特征二.正态曲线下面积的分布规律三.标准正态分布的性质四.正态分布的应用,.,4,此图的纵坐标为频率,横坐标为肺活量,称此图为频率直方图每一个直方条的面积=频率,各组段的频率之和=1,所以这个直方图的面积为1如果样本量越大,每个组段的频率就越稳定,也就趋向概率。由此我们可得到:随机抽一个9岁男孩,其肺活量落在各个组段的概率,.,5,假定各组段的概率如下,由此可知:如果一个区间由若干组段构成,计算肺活量落在某个区间的概率等于计算这个区间的中各个直方条图的面积之和.只能计算给定区间概率,不能计算任意区间概率.对于上述直方图,组距越小,组段越多,能够计算的概率区间就越多,当组距逐渐减小,上述计算方法仍然成立.,.,7,随人数逐渐增多,组段不断分细,则频数分布图中的直条逐渐变窄,就会逐渐形成一条高峰位于中央(均数所在处)、两侧逐渐降低且左右对称、不与横轴相交的光滑曲线,近似于数学上的正态分布曲线。,.,8,在医学卫生领域中,许多变量的频数分布是中间(靠近均数处)频数多,两边频数少,且左右对称。如人体的许多生理、生化指标等。这种变量的频数分布规律可用概率论中的一种重要的随机变量分布正态分布(Normaldistribution)加以描述。,一.正态分布的概念和特征1.正态分布的概念,.,9,医学资料中有许多指标的频数分布都呈正态分布:身高体重脉搏血红蛋白血清总胆固醇,.,10,正态分布曲线呈对称的钟形,在均数处最高,两侧逐渐低下,两端在无穷远处与横轴无限接近。若变量x的频率曲线对应于数学上的正态分布曲线,则称该变量服从正态分布。,.,11,2.正态分布的特征,正态分布曲线的密度函数为:-X与X范围内曲线下的面积相等,各占50%;,X轴,S(-,-X),-X,X,S(X,)S(-,-X),.,16,二.正态密度函数曲线下的面积规律,曲线下在区间(,)的面积为68.27%,曲线下在区间(1.64,1.64)的面积为90%,曲线下在区间(1.96,1.96)的面积为95%,曲线下在区间(2.58,2.58)的面积为99%。,.,17,-,+,68.27%,士范围内的面积占正态曲线下面积的68.27,也就是说有68.27的变量值分布在此范围内。,.,18,士1.64范围内的面积占正态曲线下面积的90,也就是说有90的变量值分布在此范围内。,.,19,士1.96范围内的面积占正态曲线下面积的95,也就是说有95的变量值分布在此范围内。,.,20,士2.58范围内的面积占正态曲线下面积的99,也就是说有99的变量值分布在此范围内。,.,21,曲线下的面积的计算,对于任意一个区间的曲线下面积,在知道变量值x对应的概率密度函数f(x)后,都可以根据微积分的方法求出其面积的大小,.,22,实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。对于不同的参数和会产生不同位置、不同形状正态分布,(x1,x2)范围内的面积也不同,计算起来很麻烦。,.,23,为了计算方便,对于正态或近似正态分布的资料,只要得出均数和标准差,可通过标准转化,转化成求标准正态曲线下横轴自-到z的面积。为了便于应用,统计学家按(z)编制了标准正态分布曲线下的面积表,由此表可查出曲线下某区间的面积,这样就可对符合正态分布资料的频数分布作出估计。,三、标准正态分布,.,24,1.标准化变换若x服从正态分布N(,2),则z就服从均数为0、标准差为1的正态分布,这种正态分布称为标准正态分布或z分布,记为N(0,12),这一变换也称为标准化变换。,N(,2),N(0,1),从一般的正态分布转变为标准的正态分布,.,26,标准正态分布的密度函数为,.,27,对上式求积分可得到标准正态变量Z的分布函数。由于积分计算繁琐,统计学家按标准正态分布的累积概率分布函数(-Z)编制了附表2(P315),标准正态分布曲线下的面积,由表可查出曲线下某区间的面积。,.,28,标准正态分布曲线下面积(Z),Z0.00-0.02-0.04-0.06-0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.28100.00.50000.49200.48400.47610.4681,0,Z,.,29,标准正态分布查表,-2.62,Z=-2.62,StandardizedNormalProbabilityTable(p261),P=0.0044,概率,.,30,查附表2时注意事项:,曲线下横轴上的总面积为100%或1;表中曲线下面积为-到Z的面积;对于服从正态分布的变量x,先进行标准化变换(),然后借助标准正态分布表可得到任意(x1,x2)范围内的面积或频数比例。,.,31,图4.7查表法求标准正态曲线下面积示意图,Z1Z2,.,计算正态曲线下面积实例,例4.21,已知z1=-1.76,z2=-0.25,欲求标准正态下(-1.76,-0.25)范围的面积。查表(-1.76)=0.0392;(-0.25)=0.4013则D=(-0.25)-(-1.76)=0.3621,.,例4.22,已知z1=-1.20,z2=1.60,欲求标准正态下(-1.20,1.60)范围的面积。查表(-1.20)=0.1151;(1.60)=1-0.0548=0.9452则D=(1.60)-(-1.20)=0.8301,.,曲线下面积分布规律,.,35,四、正态分布的应用,估计频数分布制定医学参考值范围质量控制是许多统计方法的理论基础,.,36,1.估计频数分布,例1.某项目研究婴儿的出生体重服从正态分布,其均数为3150g,标准差为350g。若以2500g作为低体重儿,试估计低体重儿的比例。,.,37,首先计算标准正态离差z:查标准正态分布表:(-1.86)=?结果:估计低体重儿所占比例为_%,.,38,.,39,2.制定医学参考值范围(medicalreferenceinterval),又称正常值范围(normalrange),.,40,什么是医学参考值范围:是绝大多数正常人的的解剖、生理、生化等指标的波动范围绝大多数:90%,95%,99%等“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。,.,41,确定医学参考值范围的意义,作为判断正常与异常的参考标准,.,42,确定参考值范围的注意事项,确定观察对象和抽取足够的观察单位测定方法应统一、准确应采用得到公认的或权威机构推荐的标准方法,以利于结果的评价和比较。判断是否分组(性别,年龄组)单、双侧问题选择百分界值(90%,95%)根据资料特点,选用恰当计算方法,.,43,根据医学专业知识确定单双侧!,单侧下限-过低异常单侧上限-过高异常双侧-过高、过低均异常,单侧下限:肺活量,IQ,单侧上限:转氨酶,尿铅,双侧:红细胞计数、血清总胆固醇,.,44,计算医学参考值范围常用的方法,正态分布法:适用于正态或近似正态分布资料。双侧界值:单侧上界:;单侧下界:对数正态分布法:适用于对数正态分布资料双侧界值:百分位数法:常用于偏态分布资料双侧界值:P2.5和P97.5;单侧上界:P95;或单侧下界:P5,.,45,表4.6参考值范围的制定,.,46,例4.24某地调查正常成年男子200人的红细胞数,得均数=55.261012/L,标准差S=0.381012/L,试估计该地正常成年男子红细胞数的95%参考值范围。,.,47,解:该地正常成年男子红细胞数的95%参考值范围为下限:1.96S=55.261.960.38=54.52(1012/L)上限:1.96S=55.261.960.38=56.00(1012/L),.,48,正常人,病人,假阳性率,假阴性率,病人,正常人与病人的数据分布重叠示意图(双侧),.,49,例4.252005年某市进行的小学生体质评价研究中,测定了120名9岁男孩的肺活量,=1.672L,S=0.298L,试估计9岁男孩的肺活量的95%参考值范围。,.,50,解:因肺活量仅过低属异常,故取单侧下限。肺活量的95%参考值范围为:下限:即该地估计该地小学生中9岁男孩的肺活量的95%参考值范围为不低于1.183L。,.,51,例.测得某年某地282名正常人的尿汞值如下表所示,试制定正常人尿汞的95%参考值范围。,.,52,表1.某年某地282名正常人的尿汞值(g/L)测量结果,.,53,解:正常人的尿汞值为偏态分布,且过高为异常,故用百分位数法计算,且取单侧上限。其95%参考值范围为:上限:即该地正常人尿汞的95%参考值范围为不高于43.6g/L。,.,54,正常人,病人,假阳性率,假阴性率,正常人与病人的数据分布重叠示意图(单侧),.,55,3.质量控制,意义监控日常工作、科研过程、生产过程中误差的变化,分析变化的趋势是否出现异常,从而引起警觉和注意,以便分析原因,并及时采取措施。依据:实验中的检测误差服从正态分布。,.,56,质量控制图(qualitycontrolchart),UCL(上控制限)UWL(上警戒限)CL(中心线)LWL(下警戒限)LCL(下控制限),样本编号、取样时间,+2.58SD+1.96SD-1.96SD-2.58SD,.,57,4.正态分布是许多统计方法的理论基础,t检验、F检验及相关回归等多种统计方法均要求分析的指标服从(近似)正态分布;另有部分统计方法,如秩和检验,其一些检验统计量,在样本含量足够大时也近似正态分布。,.,5.如何判断一组数据是否符合正态分布:,1.根据文献报道例如:文
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国水产饲料行业市场发展分析及发展前景与投资研究报告
- 2025-2030年中国森林采伐机行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国柠檬色手镯行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国松粉行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国机场建设行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国木糖醇胶行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国有色玻璃行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国暖通空调设备行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国智能移动POS行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国智能手机配件行业市场现状供需分析及投资评估规划分析研究报告
- (完整版)医疗器械网络交易服务第三方平台质量管理文件
- 中国动漫发展史课件
- 【履职清单】2023新版安全生产责任体系重点岗位履职清单
- 门式起重机、架桥机作业前安全隐患排查表
- 安全阀在线校验及延期校验
- GB/T 19670-2023机械安全防止意外启动
- GB/T 9128.1-2023钢制管法兰用金属环垫第1部分:PN系列
- 幼儿园新生入园报名登记表
- 中国临床戒烟指南的指导意义
- (完整版)EORTC生命质量测定量表QLQ-C30(V3.0)
- 医院医学影像科CT-MR室诊疗指南和操作规范2022版
评论
0/150
提交评论