




已阅读5页,还剩107页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章定量资料的统计描述,卫生统计学教研室,统计分析,统计描述:是用统计图(表)、统计指标来描述群体的分布特征统计推断:抽样研究中,用观察得到的样本信息推断所代表的、未知的总体特征,2010年成都市“正常”人群身高及其影响因素调查,第一节频数分布表和频数分布图,原始资料以个体为对象收集的数据排列杂乱无章很难发现、总结出群体的特征和规律分组整理,用简明扼要的形式来全面反映资料(群体)的特点频数分布表频数分布图直方图,频数表(frequencytable)的构成分组标志:或称组段,是将资料(群体)按照某种标准(标志)划分成不同的组别频数:统计不同组别内发生的观察值个数,频数分布表,某班性别构成情况,取值为某实数范围区间的特定值以变量取值为分组标志,并列出相应频数,离散型定量变量频数表,表4.12005年某市102名高中男生引体向上完成次数的频数分布,标题,纵标目,横标目,顶线,底线,纵标目下横线,表4.12005年某市102名高中男生引体向上完成次数的频数分布,数字区,引例,例4.2在某市2005年进行的小学生体质评价研究中,测定了120名9岁男孩的肺活量(L),资料如下,根据该资料制作频数表。,其值可以取在某个实数范围区间的任意值,即在某个实数范围区间连续存在人为分割成若干个组段,再求频数,连续型定量变量的频数表,求全距(range/R):观察值中的最大值与最小值的差值即为全距(或极差)R=2.406-0.989=1.417(L)。确定组数a公式法经验法:一般观察对象在50以下时可分58组,在50以上时可分915组本例拟分a=11组,频数表的编制,确定组距i(classinterval):即每个组段包含的距离不等距划分专业意义等距划分i=R/a原始数据精度向上四舍五入1位本例i=1.417/11=0.1290.13,频数表的编制,确定组段:即确定各组段的上下限,明确各组段含义穷尽原则(不漏)互斥原则(不重),频数表的编制,确定最小组段下限最小组段必须包含最小值原始数据精度向上截取1位最小值0.989,取第一组段下限为0.98根据最小组段下限和组距确定各组段范围规定:半闭半开,含上限不含下限第一组段0.981.11,第二组段为1.111.24第一组段0.98,第二组段为1.11确定最大组段上限最大组段必须包含最大值最大值2.406,取2.282.41,频数表的编制,表4.22005年某市120名9岁男孩肺活量(L)频数分布,统计各组段频数,计算频率和累计频率,频数分布图直方图,图4.12005年某市120名9岁男孩肺活量频数分布,累计频率分布图,图4.22005年某市120名9岁男孩肺活量累计频率分布,累计频率(%),x,频数分布类型(分布形式)揭示频数分布特征集中趋势集中位置离散趋势变异性便于进一步计算指标和统计处理便于发现某些特大或特小的可疑值,频数表和直方图的用途,频数的分布是否对称对称分布:集中位置在正中,左右两侧频数分布大致对称。偏态分布:指频数分布不对称,集中位置偏向一侧正偏态分布:集中位置偏向数值小的一侧负偏态分布:集中位置偏向数值大的一侧,频数分布形式,图4.12005年某市120名9岁男孩肺活量频数分布,某年某地一次伤寒爆发潜伏期频数表,219名乳腺癌患者康复期生存质量评分,频数分布类型(分布形式)揭示频数分布特征集中趋势集中位置离散趋势变异性便于进一步计算指标和统计处理便于发现某些特大或特小的可疑值,频数表和直方图的用途,图4.12005年某市120名9岁男孩肺活量频数分布,集中趋势(centraltendency)一组数据向某一个位置聚集或集中的倾向该集中位置,反映一组数据的平均水平离散趋势(dispersiontendency)各个数据背离集中位置的倾向反映一组数据的分散性或变异度,频数分布特征,一组数据向某一个位置聚集或集中的倾向集中位置的刻画指标:平均数(Average)均数几何均数中位数统计学意义说明集中位置的准确水平说明数据的平均水平或中心位置常作为群体中最有代表性的值与其它群体进行比较,第二节集中趋势的刻画指标,是算术均数(arithmeticmean)的简称表示符号:总体均数用表示,样本均数用表示计算方法直接法频数表法,均数(Mean),表4.22005年某市120名9岁男孩肺活量(L)频数分布,均数的特点,优点计算简单、容易理解均衡的考虑了每个个体值的信息,利用信息全面一组单峰对称分布资料中最有代表性的值是正态分布的一个重要参数,缺点受极端值的影响大不适用于偏态分布或分布不明不适用于开口资料集中趋势的描述产生原因:测量工具的测量范围表现形式:一端或两端存在不确切值特点:在资料中所占比例不会太高,均数的特点,适用于描述单峰对称分布资料的集中趋势特别是正态分布或近似正态分布资料集中趋势的描述在描述正态分布特征方面具有重要意义是正态分布的一个参数,均数的应用,均数的应用,均数,偏态分布,有极端值的资料,开口资料,单峰对称分布,正态分布,分布不明,例4.5某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗体滴度测定结果如下,求平均滴度。,引例,表4.375名儿童的抗体滴度,75名儿童的抗体滴度分布,75名儿童的对数抗体滴度分布,75名儿童进行流脑疫苗免疫接种1个月后对数抗体滴度的均数为:,X,正偏态分布,观察值之间呈等比关系(或近似),lgX,对称分布,正态分布,对数正态分布,应用:观察值之间呈倍数或近似倍数变化(等比关系)资料,呈正偏态分布,但数据经过对数变换后呈对称分布,甚至正态分布的资料(对数正态分布)符号:用G表示计算方法,几何均数(GeometricMean),计算几何均数时观察值中不能有0或负数观察值均为负数时,去掉符号进行计算,计算结果加上负号为所求几何均数观察值中有0或正负同时存在时,观测值同时加上实数k,使所有值均为正数后进行计算,计算结果减去实数k所求为几何均数,几何均数注意事项,平均数,对数化后呈对称,几何均数,中位数,均数,偏态分布,有极端值的资料,开口资料,分布不明,中位数,用M表示是将资料从小到大排序后位置居中的数值使P(Xx)0.5与P(Xx)0.5同时成立的值计算方法直接法:例数较少时,排序后获得n为奇数时:n为偶数时:频数表法:例数较大时,不便排序累计频率,中位数(Median),表4.12005年某市102名高中男生引体向上完成次数的频数分布,百分位数(Percentile),是一种位置指标一组数据由小到大按顺序排列后处于第x百分位置上的数值,用Px表示理论上有x%的观察值比它小,有(100-x)%的观察值比它大中位数:特殊的百分位数,即P50,Px,x%,(100-x)%,累计频率分布图,图4.22005年某市120名9岁男孩肺活量累计频率分布,累计频率(%),x,Px,表4.22005年某市120名9岁男孩肺活量(L)频数分布,图4.22005年某市120名9岁男孩肺活量累计频率分布,累计频率(%),P50,P50,1.63,1.76,29,百分位数的计算,按所分组段由小到大计算累计频数和累计频率确定Px所在组段求百分位数Px,是将资料从小到大排序后位置居中的数值任何分布:对称分布、偏态分布,以及分布不明确开口资料对极端值不敏感,稳定性强资料中有极端值的资料利用信息不足,中位数(百分位数)的特点,偏态分布资料分布不明资料开口资料有极端值资料,中位数的应用,小结,对称分布,正态分布,对数化后呈对称,几何均数,中位数,均数,偏态分布,有极端值的资料,开口资料,分布不明,描述一组数据的分散性或变异度,即变量值背离集中位置(平均数)的倾向常用的指标全距(亦称极差)四分位数间距方差、标准差变异系数,第三节离散程度的描述,亦称极差,为一组同质观察值中最大值与最小值之差反映了个体变异的范围全距大,说明变异度大;反之,全距小,说明变异度小,1、全距(Range/R),优点:简单明了缺点稳定性差,易受极端值影响由于抽到极端值的可能性不同,不适用于例数相差悬殊资料变异性的比较利用信息不全不适用于开口资料应用:小样本资料变异性的初步分析,全距的特点,为上四分位数QU(即P75)与下四分位数QL(即P25)之差:IQR=QU-QL中间50%观察值的极差其数值越大,变异度越大,反之,变异度越小,2、四分位数间距(Inter-quartileRange/IQR),P25,P75,P50,50%,219名乳腺癌患者康复期生存质量评分累计频率分布图,优点稳定性增强实质为百分位数,不依赖于分布形式开口资料也可得到缺点利用信息不足,四分位数间距的特点,四分位数间距的应用,偏态分布资料分布不明确资料开口资料有极端值资料,219名乳腺癌患者康复期生存质量评分,离均差平方和SS、lxx,均方MS、方差Variance,标准差SD,随机变量能够自由取值的个数符号为,读作niu,自由度(DegreeofFreedom/df),亦称均方(MeanSquare/MS)总体方差用2表示,样本方差用S2表示全面考虑每个观察值的变异情况,充分利用资料的全部信息消除观察值个数的影响,客观的反映了资料的平均变异单位是观察值单位的平方,在实际工作中使用不方便,3、方差(Variance),恢复成原度量单位总体标准差样本标准差,标准差(StandardDeviation/SD),适用于描述单峰对称分布的离散趋势特别适用于正态分布或近似正态分布资料的离散趋势在描述正态分布特征方面具有重要意义,为正态分布的一个重要参数,方差、标准差的应用,引例,例4.17某年某市城区120名5岁女孩身高均数为110.10cm,标准差为5.90cm;体重均数为17.71kg,标准差为1.44kg,比较身高与体重的离散程度。能否认为5.901.44,故身高的离散程度与大于体重?单位不同不能直接比较两变量的数量级不同,用于进行两组(或多组)资料变异度的比较,尤其度量单位不同或均数相差悬殊的情况下计算公式,4、变异系数(CoefficientofVariation/CV),小结,分布形式,频数表直方图,分布特征,集中趋势,离散趋势,对称分布,偏态分布,分布不明,有极端值资料,开口资料,第四节正态分布及其应用,频数分布图直方图,图4.12005年某市120名9岁男孩肺活量频数分布,表4.22005年某市120名9岁男孩肺活量(L)频数分布,2005年某市120名9岁男孩肺活量频率密度直方图,频率密度,4.17,频率密度直方图和概率密度曲线,x,频率密度,概率密度,若X的概率密度函数(d.f.)为(Fisher,1915):其中为圆周率,e为自然底数,、为常数称X服从参数为,2的正态分布记作XN(,2)亦称高斯(Gauss)分布(1809),1、正态分布(NormalDistribution),正态分布曲线,XN(4,12),XN(5,12),x,f(x),XN(5,12),XN(5,1.52),XN(5,22),正态分布曲线,正态分布钟形曲线,在横轴上方均数处最高以均数为中心,左右对称,均匀下降以x轴为其渐近线有两个参数:,2XN(,2)曲线下面积表示相应的概率,概率分布函数,概率分布函数与密度函数几何意义,正态分布概率分布函数曲线,x,F(x),(=0,=1),zN(0,1),ZN(0,1),换元积分,F(x)定积分,XN(,2),P(Xx)=F(x),2、标准正态分布(StandardNormalDistribution),按式进行变量变换,得到标准正态分布:标准正态分布用zN(0,1)表示其概率分布函数(z)查附表2标准正态分布下的面积(z)值(P438),标准正态分布zN(0,1),标准正态分布查表,3、正态分布的应用,估计频率分布制定医学参考值范围质量控制正态分布是许多统计方法的理论基础,为了解大学生早餐前血糖水平,共对100名大学生进行了调查,得:x=6.0mmol/L,s=1.5mmol/L,设血糖水平服从正态分布,求:血糖水平3.0mmol/L以下的大学生所占比例;血糖水平3.07.5mmol/L的大学生所占比例。,(1)估计频率分布,查表(P438),查表(P438),正态分布概率分布函数曲线,x,F(x),为了解大学生早餐前血糖水平,共对100名大学生进行了调查,得:x=6.0mmol/L,s=1.5mmol/L,设血糖水平服从正态分布,求:中间95%大学生的血糖水平。,已知概率求界值,已知概率求界值,正态分布曲线下,中央部分面积为1-(90%,95%,99%)时x1,x2的值,1-,/2,/2,x1,x2,查表,-z/2,/2,-z/2,为了解大学生早餐前血糖水平,共对100名大学生进行了调查,得:x=6.0mmol/L,s=1.5mmol/L,设血糖水平服从正态分布,求:中间95%大学生的血糖水平。,已知概率求界值,如果随机变量X满足则称区间x1,x2为X(1-)水平的参考值范围。X取值在x1,x2内占所有可能取值的1-1-的X取值在x1,x2内波动,参考值范围,标准正态分布zN(0,1),1.645区间面积占总面积(或总观察例数)的90%1.96区间面积占总面积(或总观察例数)的95%2.58区间面积占总面积(或总观察例数)的99%,常用的三个区间,正态分布的应用,估计频率分布制定医学参考值范围质量控制正态分布是许多统计方法的理论基础,医学参考值范围(medicalreferencerange)也称医学正常值范围是指大多数“正常人”某解剖、生理、生化等指标的波动范围大多数:非所有人“正常人”:不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群波动范围:该范围包含了大多数正常人,(3)医学参考值范围,确定观察对象和抽取足够的观察单位确定是否分组制定参考值范围确定取双侧或单侧参考值范围专业意义确定适当的百分界限:“大多数”的具体定义习惯95%确定计算方法,医学参考值范围制定步骤,正态分布法:适用于正态或近似正态分布资料双侧界值:;单侧上限:;单侧下限:对数正态分布法:适用于对数正态分布资料双侧界值:百分位数法:常用于偏态分布资料双侧界值:P2.5和P97.5;单侧上限:P95;或单侧下限:P5,医学参考值范围常用方法,例4.22某地调查正常成年男子200人的红细胞数得均数x=55.261012/L,标准差s=0.381012/L,试估计该地正常成年男子红细胞数的95%参考值范围。,引例,因红细胞数过多或过少均属异常,故取双侧下限:x-1.96s=55.26-1.960.38=54.52(1012/L)上限:x+1.96s=55.26+1.960.38=56.00(1012/
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 供电公司门岗管理制度
- 便民市场消费管理制度
- 保健护理器具管理制度
- 保卫安全设备管理制度
- 保安公司例会管理制度
- 保安公司设备管理制度
- 页岩气开采技术
- 保安防汛工作管理制度
- 保密归口责任管理制度
- 保洁公司毛巾管理制度
- 新能源汽车全解析
- 2024年秋期国家开放大学《11809企业战略管理(统设课)》期末考试题库
- 卫氏并殖吸虫病
- 医务人员职业安全管理制度(4篇)
- 土木工程CAD-终结性考核-国开(SC)-参考资料
- 确认收货单-模板
- 人教版(2024新版)七年级上册英语期中复习课件
- 金融行业安全生产责任管理
- 设备日常维护及保养培训
- 上海市市辖区(2024年-2025年小学五年级语文)统编版期末考试(下学期)试卷及答案
- 一级建造师执业资格考试大纲(2024年版)
评论
0/150
提交评论