




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章个体变异与变量分布,一、个体变异二、频数分布三、定量资料的统计指标四、定性资料与等级资料的统计指标,个体变异(individualvariation),是同质观察对象间表现出的差异。变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。就个体而言:变异是随机的(random)。就总体而言:个体变异是有规律的。,幻灯片1,个体变异是统计学应用的前提,(一)定量资料的频数分布,例:某市1997年12岁男童120人的身高(cm)资料,1.频数分布表的制作步骤(1)计算极差(R)R=XmaxXmin=160.9-125.9=35(cm)(2)确定组数、组距:组数:812组距:i=R/组数=35/10=3.54(cm)(3)确定组段:含下限,不含上限第一组段下限Xmin最后一组上限Xmax(4)划记:计算频数、频率2.分布图,1997年某市120名12岁男童的身高(cm)频数分布,划记,正正,正正正正正正正正正正正正正正正正正正正正正,上一张幻灯片,某市120名12岁男童身高的频数分布,定性资料的整理:根据指标的自然属性归类,计数频数等级资料的整理:根据指标的不同等级归类,计数频数,507名傣族人血型的频数分布,(二)定性资料及等级资料的频数分布,709对肺癌患者和非肺癌患者吸烟情况,此表是Doll和Hill于1948年至1952年间采用回顾性配对调查方法研究了吸烟与肺癌的关系得到的资料(此表分类方法是交叉分类),例:某医院探讨不同期次矽肺的胸部平片肺门密度变化,资料如下表,问矽肺患者肺门密度的增加与矽肺期次有无关系?,245,19672169,6175578,合计50301141492,合计,矽肺期次,描述分布类型描述分布的特征便于发现特大、特小的可疑值便于计算有关指标、统计分析与处理,频数分布表和频数分布图的用途,(三)数据的分布类型,对称分布:非对称分布(偏态分布)对称分布:频数以中间最多,两侧逐渐减少,基本对称右偏态(正偏态):高峰在左侧,尾部拖在右侧左偏态(负偏态):高峰在右侧,尾部拖在左侧单峰分布:双峰或多峰分布:,正偏态(右),负偏态(左),分布的对称,峰的多少,某市120名12岁男童身高的频数分布,发汞含量(),239人发汞含量的频数分布,人数,自评分,某城市892名老年人生存质量自评分的频数分布,人数,生存时间(月),102名黑色素瘤患者的生存时间频数分布,人数,人数,死亡年龄(岁),某地某年10000例死亡者年龄分布,分布类型,对称分布正偏态(右)负偏态(左),幻灯片1,集中位置的描述离散趋势的描述,三、定量资料的统计指标,是描述一组变量值的集中趋势或平均水平的统计指标。是一组变量值的集中水平的代表值。种类:算术均数、几何均数、中位数、众数、加权均数等注意:同质的变量值才能在一起求平均数!,平均数(集中位置描述),(一)算术均数(arithmeticmean)简称均数(mean)1.适用条件:单峰对称分布、正态分布的资料2.计算公式:小样本:,加权系数,例:某门功课的成绩:平时占0.2,期中占0.3,期末占0.5则平均成绩为:,大样本:,各组段的频数各组段的组中值,1997年某市120名12岁男童的身高(cm),组中值,126130134138142146150154158162,例:五人血清抗体滴度:1:10,1:100,1:1000,1:10000,1:100000,看一个实例,1适用条件:各变量值成倍数或对数正态分布的资料2公式:,3计算,(二)几何均数(geometricmean),例、有5份血清的抗体效价分别为1:10,1:20,1:40,1:80,1:160,求平均抗体效价?,此5人血清的平均抗体效价为1:40。,使用注意:(1)变量值中不能有0;(2)同一组变量值不能同时存在正,负值;(3)若变量全为负值,计算时将负号除去,算完后再加上。,有25份血清的抗体效价分别为抗体效价1:10,1:20,1:40,1:80,1:160,人数25873,所以,这25份血清的平均效价是1:44.7。,(三)中位数(median)及百分位数(percentile)将一组变量值从小到大排列,居中的那个变量值。1.适用条件:任何分布(偏态、分布不明、两端无界限)2.计算公式:小样本:,当n为偶数,例、有10人的发汞值()1.1,1.8,3.5,4.2,4.8,5.6,5.9,7.1,10.5,16.3,当n为奇数:,L:M所在组的下限i:M所在组的组距fm:M所在组的频数:M所在组前一组累积频数,大样本:,5,7,发汞值,60,M,5,7,例2.16在某市测得239名正常人发汞,资料见表2.11,试计算其95参考值范围。表2.11某市239名正常人发汞值,某市239名正常人发汞值,累积频数,百分位数,0PxM100%,百分位数是一个位置指标,以PX表示。一个百分位数将全部观察值分为两部分:x%的变量值小于PX;(100-x)%的变量值大于PX。有10人的发汞值(umol/Kg)1.1,1.8,3.5,4.2,4.8,5.6,5.9,7.1,10.5,16.3,某市239名正常人发汞值,发汞值男性女性合计频数累积频数,应用中位数和百分位数时注意事项:所有分布类型的资料均可计算中位数和百分位数;例数较少时,接近两端的百分位数不稳定,不宜用两端的百分位数估计频数分布范围;中位数抗极端值的影响,比均数好,但不及均数精确;当资料可计算均数或几何均数时,不宜计算中位数。,描述集中趋势的指标:平均数种类适用条件计算公式正态分布对数正态任何分布,有甲、乙两组同性别同年龄儿童体重(公斤):甲组26,28,30,32,34乙组24,27,30,33,36,看一个实例,上述两组数据的特点:集中位置相同:均为30kg离散程度不同:各观察值与均数的差值不同,离散趋势的描述,全距(range)四分位数间距(interquartilerangeQ)方差、标准差(varianceandstandarddeviation)变异系数(coefficientofvariation),1.全距(极差)R=Xmax-Xmin反映资料的分布范围R大变异程度大,R小变异程度小优点:简单明了缺点:不灵敏:只考虑了最大、最小值抽样误差大,不稳定,2.四分位数间距(Q)即P75与P25之差P25:1/4的观察值小于它,称下四分位数P25QL。P75:1/4的观察值大于它,称上四分位数P75QU。Q=QU-QL,其间包含了中间的50%变量值,即中间50%变量值的极差。,Q值大变异程度大,Q小变异程度小,偏态分布资料,集中趋势中位数离散趋势四分位数,3.方差与标准差,离均差总和,离均差平方和,方差,标准差,自由度,(1-4)+(2-4)+(3-4)+(4-3-2-1+0+1+2+30,对于对称分布或正态分布资料其离均差总和恒等于0。,4)+(5-4)+(6-4)+(7-4),例:1、2、3、4、5、6、7,计算公式:,甲组:26,28,30,32,34乙组:24,27,30,33,36,标准差表示一组变量值与均数的平均距离直接、全面、平均地描述一组变量值的离散程度。,标准差是描述变量值变异程度的指标。标准差大变异程度大均数的代表性差标准差小变异程度小均数的代表性好,用途1表示变异程度的大小2计算标准误、变异系数3估计正常值范围,幻灯片31,标准差的意义,一个实例,例:某地20岁男子100人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.7kg,标准差为4.96kg,问:体重和身高,哪个变异大?,使用条件:均数相差较大时,比较各组资料的变异度;度量衡单位不同时,比较各组资料的变异程度。,4.变异系数(离散系数),某地6岁以下儿童身高(cm)的变异,绝对变异受平均水平的影响相对变异排除了平均水平的影响,描述离散程度的指标种类应用条件计算公式R任何资料R=Xmax-XminQ偏态分布资料S2(S)正态,单位同均数相差不大CV单位不同,均数差大,小结:定量资料的描述,列表描述:频数分布表、一览表图形描述:频数分布图、趋势图指标描述定量资料集中位置:算术均数、几何均数、中位数、百分位数离散程度:极差、四分位数间距、方差、标准差定性或等级资料相对数指标:率、构成比、比,平均数与变异度的关系,平均数表示的集中性与变异度表示的离散性,是从两个不同的角度阐明计量资料的特征变异度越小,平均数对各变量值的代表性越好变异度越大,平均数对各变量值的代表性越差,平均数与变异度的关系,通常,平均数与变异指标一起描述资料的分布特征。用均数和标准差描述正态分布资料的特征;用中位数和四分位数间距描述偏态分布资料的特征。,绝对数的概念与意义,调查研究和实验研究得到的定性资料或等级资料经过整理,清点数目得到的数值称为绝对数。如某病的发病人次数、医院收容人数、治愈人数等。绝对数反映一定条件下某种事物的规模或水平,是计划或总结工作的依据,绝对数是计算相对数与平均数的基础。绝对数往往不便于比较。,例:调查得某年小学生中流脑发病:甲地区63例,乙地区35例。,甲地区流脑流行比乙地区严重,如已知小学生总人数:甲地区50051人,乙地区14338人,可算出两个发病率:甲地区流脑发病率:63/500511000=1.26乙地区流脑发病率:35/143381000=2.44,乙地区流脑流行比甲地区严重,相对数的概念和意义,概念:相对数是两个有联系的指标之比。两个特点:表示事物出现的频度。把基数化作相等,便于比较。常用相对数率、构成比、相对比,率,率(rate)又称频率指标,用以说明某事物或某现象在其可能发生的范围内实际发生的频率或强度。计算公式为:,表1.5某市某年各区急性传染病发生数及其相对数市区年平均急性传染病各区与区构成比发病率人口数发生数发病数之比()(/万)163672324331.0018.938.21238954030331.2523.577.86369971216500.6812.823.58432836315030.6211.645.77528696712820.5310.044.67631750418530.7614.458.36715383811300.468.873.45合计281264712884100.045.81,关于率的几点说明(一),分子和分母都是计数值,从定义上来看,分子应为分母的一部分,但在实际应用中一些率的指标可能并不符合率的定义,但它们是约定俗成、沿习使用的。根据频率的稳定性,分母较大时,可以用率作为该事件发生机会(即概率)的近似值。例如:医治100例病人,90例痊愈,则:治愈率=90/100=90%。它近似的反映了病人治愈机会的大小。,关于率的几点说明(二),0rate1率常以百分率(%)、千分率()、万分率(1万)、十万分率(l10万)等表示。比例基数(K)可以是100、1000、,其选取是根据习惯用法和需要选用,主要使算得的率至少保留12位整数,便于阅读。患病率、发病率、感染率:百分率(%)人口出生率与死亡率:千分率()肿瘤死亡率:十万分率(l10万),构成比,构成比(proportion)又称构成指标,表示某一事物内部各组成部分所占的比重或分布,常以百分数表示,计算公式为:,设某事物个体数的合计由A1,A2,Ak个部分组成,构成比计算为:,构成比的特点:,同一事物内部的k个组成部分构成比总和为100%。各部分构成比之间是相互影响的,某一部分比重的变化受到两方面因素的影响:其一是这个部分自身数值的变化,其二受其他部分数值变化的影响。,相对比,相对比(ratio)亦称比,是A、B两个有关指标之比。说明A为B的若干倍或百分之几,它是对比的最简单形式。A、B两个指标可以是绝对数,也可以是相对数;可以性质相同,也可以性质不同;可以是定性资料,也可以是定量资料。,正确应用相对数(一),计算相对数的分母不宜过小例数较少,相对数波动较大。如:0/2,1/2,2/2例数较少时,宜用绝对数表示,必须用相对数时,可同时列出其可信区间。,分析时不能以构成比代替率率反映的是频率或者强度构成比反映的是比重或分布,正确应用相对数(二),正确应用相对数(三),正确计算合并率对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)例如用某疗法治疗肝炎,第一次治疗150人,治愈30人,治愈率20%;第二次治疗100人,治愈30人,治愈率30%。试计算两批的合并治愈率。观察单位数相等时?,正确应用相对数(四),计算率时要注意资料的同质性对比分析时应注意资料的可比性所谓可比,就是说除了要对比的因素外(如不同药物),其余的影响因素应尽可能的相同、相似或接近。观察对象同质,研究方法相同,观察时间相等,以及地区、周围环境、风俗习惯和经济条件应一致或相近。观察对象内部构成是否相同,若两组资料的年龄、性别构成不同,可以分组或进行标准化后再作比较。,正确应用相对数(五),样本率或构成比比较时,不能仅凭表面上的数值大小下结论,应考虑到其抽样误差,进一步作统计学处理。,例2.10,率的标准化,基本思想采用某种影响因素的统一标准构成,以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。,标准化率(standardizedrate),又称调整率(adjustedrate),实际上是一加权平均其中NiN来自标准组,pi来自实际资料,表2.6某病两种疗法的治愈率比较,应用标准化时的注意事项,“标准组”的选择两组中的任一组作为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 象棋胜负判断课件
- 诺病毒知识培训课件
- 2025年分布式光伏发电项目电力建筑工程安装劳务分包合同
- 2025年度教育机构场地租赁与课程合作合同
- 2025年新能源项目法律咨询与服务合同范本
- 2025版大型商业综合体水电安全运行管理合同
- 2025版建筑塔吊安装施工安全监督合同
- 2025年厨房空间利用优化与装修改造合同范本
- 2025年度商业地产项目投资风险评估与预警服务合同
- 2025年度房产租赁保证金退还合同书
- 路灯灯杆项目投资计划书
- 环保项目配电室电气安装方案
- 新概念第二册单词表(完整版)
- 初三考试化学试卷(含答案)
- 2024-2025学年小学信息技术(信息科技)五年级全一册义务教育版(2024)教学设计合集
- 【新课标】人音版五年级上册第一单元 朝夕 大单元整体教学设计
- 自然保护区管理中的生态系统恢复策略
- 试车跑道专项方案
- 2024年交管12123学法减分试题题库附答案
- 2024年湖南省长沙住房公积金管理中心招聘历年高频难、易点(公共基础测验共200题含答案解析)模拟试卷
- KA-T 20.1-2024 非煤矿山建设项目安全设施设计编写提纲 第1部分:金属非金属地下矿山建设项目安全设施设计编写提纲
评论
0/150
提交评论