版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一篇基本统计方法第二章计量资料的统计描述1ppt课件
统计描述(statisticaldescription)
:用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。目的使资料简洁、明了,便于人们了解资料的规律性。2ppt课件第一节频数分布3ppt课件
频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。
频数分布表(frequencydistributiontable)简称频数表(frequencytable):含有组段与频数的统计表,称频数表。
直方图(histogram):为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。4ppt课件例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.502.704.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.803.414.123.955.084.533.923.585.353.843.603.514.063.073.554.233.574.833.523.844.503.964.503.274.523.194.593.753.984.134.263.633.875.713.304.734.175.133.784.573.803.933.783.994.484.284.065.265.253.985.033.513.863.023.704.333.293.254.154.364.953.003.265ppt课件1.求极差极差(range)也称全距,记作R。本例R=5.71-2.35=3.36(mmol/L)。2.确定组段数(k)
组段数通常取10~15组,本例k=10。3.求组距(i)
i=R/k,本例i=3.36/10=0.336≈0.30。3.划组段每个组段的下限为L、上限为U,
起始组段和最后组段应分别包含全部变量值的最小值和最大值。4.划记归表6ppt课件表2-1某单位101名正常成年女子的血清总胆固醇(mmol/L)频数分布组段频数f组中值XfXfX2(1)(2)(3)(4)=(2)×(3)(5)=(2)×(3)22.30~12.452.456.002.60~32.758.2522.692.90~63.0518.3055.823.20~83.3526.8089.783.50~173.6562.05226.483.80~203.9579.00312.054.10~174.2572.25307.064.40~124.5554.60248.434.70~94.8543.65211.705.00~55.1525.75132.615.30~25.4510.9059.415.60~5.9015.755.7533.06合计101—409.751705.097ppt课件变量频数分布的类型:1)对称分布2)偏态分布:正偏峰(positiveskew)分布负偏峰(negativeskew)分布8ppt课件变量频数分布的两个特征1)集中趋势(centraltendency)2)离散趋势(tendencyofdispersion)9ppt课件频数表的主要用途:1.揭示分布类型2.描述频数分布的特征3.发现特大值和特小值4.计算集中趋势指标与离散趋势指标10ppt课件表2-2某医院1123名产后出血孕妇的人流次数分布人流次数产后出血人数累计频数累计频率(%)(1)(2)(3)(4)040240235.80133073265843118108296.35427110998.75511112099.73631123100.00合计1123——11ppt课件第二节集中趋势的描述12ppt课件描述集中趋势的统计指标(平均数average)1)算术均数(arithmeticmean),简称均数2)几何均数(geometricmean,G)3)中位数(median,M)13ppt课件1.算术均数(均数)意义:一组性质相同的观察值在数量上的平均水平。表示(总体)X(样本)计算:直接法、间接法、特征:∑(X-X)=0估计误差之和为0。应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义。14ppt课件例2-2用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。
==4.03(mmol/L)15ppt课件例2-3利用表2-1计算101名正常成年女子的血清总胆固醇的均数
==
注意:4.06与直接计算法的4.03的细微差异主要缘于归组误差,其次是四舍五入。16ppt课件2.几何均数意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:G
计算:应用:原始数据分布不对称,经对数转换后呈对称分布的资料。数值范围跨越多个数量级。例如抗体滴度。17ppt课件18ppt课件例2-4某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度倒数分别为10,20,40,40,160,求几何均数。
G=
=34.8或G=()=34.8故5份血清抗体效价的平均滴度为1:34.8。19ppt课件例2-569例类风湿关节炎(RA)患者血清EBV-VCA-IgG抗体滴度的分布见表2-5第⑴,⑵栏,求其平均抗体滴度。150.2778————69合
计4.00003.903016.021019.031024.245137.576539.28686.21441.00001.30101.60211.90312.20412.50512.80623.107210204080160320640128043101011151421:101:201:401:801:1601:3201:6401:1280flgⅹ(5)lgⅹ(4)滴度例数ⅹ(3)人数f(2)抗体滴度(1)表2-569例RA患者血清EBV-VCA-IgG抗体测定结果20ppt课件按公式(2-4)求平均抗体滴度,计算见表2-5第(3)~(5)栏。故69例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为1:150.6。21ppt课件3.中位数、百份位数意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。表示:M计算:百分位数(PX):将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。应用:偏态资料,开口资料22ppt课件中位数可用于各种分布的定量资料。指总体中有一半个体的数值低于这个数,一半个体的数值高于这个数。对于样本资料,有如下计算公式:n为奇数时:n为偶数时:23ppt课件例2-67名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。本例n=7,为奇数,按公式(2-5)n为奇数时:M=,得M=X()=X4=5(天)24ppt课件例2-78名患者食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。本例n=8,为偶数,按公式(2-6)得:M=(X()+X(+1))=(X4+X5)
=(3+5)=4(小时)25ppt课件例2-8试计算表2-2某医院1123名产后出血孕妇人工流产次数的中位数。本例为离散型计量资料。因n=1123,故中位数是从小到大排序后居于(n+1)/2=(1123+1)/2=562位的观察值。据表2-2,排在第1~402位的观察值均为“0”,其累计频率为35.80%,排在403~732位的观察值均为“1”,其累计频率为65.18%,余类推。第562位数属于第二个变量值,即人工流产次数为“1”,故某医院1123名产后出血孕妇人工流产次数的中位数M=X562=1。26ppt课件例2-9对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。患者:123456789…117118119120住院天数:122233445…40404245n=120,120×5%=6,为整数,用公式(2-8)
P5=(X(6)+X(7))=(3+4)=3.5(天)120×99%=118.8,带有小数,取整后trunc(118.8)=118,用公式(2-7)P99=X(trunc(118.8)+1)=X119=42(天)P5的意义是该医院有5%的细菌性痢疾治愈者的住院天数少于3.5天,或者说有99%的细菌性痢疾治愈者的住院天数多于3.5天。P99的意义是绝大多数(99%)细菌性痢疾治愈者的住院天数少于42天。27ppt课件例2-10某地118名链球菌咽喉炎患者的潜伏期频数表见表2-6第(1)、(2)栏,求中位数及第25、第75百分位数。中位数对应的累计频率是50%,对表中第(4)栏从上到下读累计频率,小于48天的累计频率为44.9%,小于60天的累计频率65.3%,故中位数所在组段为“48~”由此确定L=48,i=12,f=24,n=118,
L=53。代入公式(2-10),
得
M=P50=48+(
-53)=51(天)
同理,P25对应的累计频率为25%,位于“36~”组段;P75对应的累计频率为75%,位于“60~”组段。用公式(2-9)
计算,得:
P25=36+(118×25%-21)=39.2(天)
P75=60+(118×75%-77)=67.7(天)28ppt课件
3.417.844.965.380.590.794.998.3100.04215377951071121161184173224181254212~24~36~48~60~72~84~96~108~累计频率(%)(4)累计频数(3)人数f(2)天数(1)表2-6118名链球菌咽喉炎患者的潜伏期29ppt课件问题:算术平均数与中位数的区别与联系1、都是用来表示总体的一般水平或分布的集中趋势,都属于抽象化的代表值。2、代表的意义不同:算术平均数是对所有变量值来计算的平均数,它能概括反映整个数列中每个变量值的平均水平;中位数则是根据总体中处于中间位置上的少数变量值来确定的代表值。从这一点来说,算术平均数对数据的概括能力比中位数显然来的更强一些。30ppt课件3、与中位数相比,算术平均数对数据变化的“灵敏度”很高。但算术平均数极容易受到个别极端值的影响,即对极端值的“耐抗性”较低。实际应用中,可根据这些特点和分析的要求,审慎的选择有关指标。4、适用资料的类型:算术平均数和中位数均适用于定量资料,但中位数还适用于有序分类资料。31ppt课件第三节离散趋势的描述32ppt课件描述离散趋势(变异)的统计指标1)极差(range,R)2)四分位数间距(quartilerange,QR)3)方差(variance)4)标准差(standarddeviation)5)变异系数(coefficientofvariation)33ppt课件例2-11试计算下面三组同龄男孩身高(㎝)均数和极差.甲组:9095100105110
甲=100㎝R甲=110-90=20㎝乙组:9698100102104
乙=100㎝R乙=104-96=8㎝丙组:9699100101104
丙=100㎝R丙=104-96=8㎝
34ppt课件极差:计算方便;只考虑两个极值。
35ppt课件2)四分位数间距:
QR=P75–P2536ppt课件例2-12续例2-10。已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距
QR=67.7-39.2=28.5(天)由于QR包括了居于中间位置50%的变量值,故受样本大小波动的影响较极差小。37ppt课件四分位数间距:包抱总体中数值居中的50%的个体;计算时没用到每个个体的数值;其值越大,说明变量变异越大。38ppt课件标准差相关概念:离均差、离均差之和、离均差平方和、方差(2S2)
标准差的符号:S(Std.deviation)
意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数的代表性越好)应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围39ppt课件例2-13续例2-11,计算三组资料的标准差。甲组:n=5,∑ⅹ=90+95+100+105+110=500∑ⅹ2=902+952+1002+1052+1102=50250代入公式(2-14)
,得
S=同理得:乙组:S=3.16㎝,丙组=2.92㎝。由于丙组的标准差最小,故认为其均数的代表性较其他两组要好。40ppt课件例2-14计算例2-1中101名正常成年女子的血清胆固醇的标准差。1.直接计算法例2-2已算得=4.03,由公式(2-13),得S=
=0.659(mmol/L)2.频数表法由表2-1得知,∑f=101,∑fX=409.75,∑fX2=1705.09。代入公式(2-15),得S=
=0.654(mmol/L)41ppt课件变异系数意义:标准差与均数之比用百分数表示。符号:CV计算:CV=(S/X)100%无单位应用:单位不同的多组数据比较均数相差悬殊的多组资料42ppt课件变异程度指标总结:全距、四分位数间距:具有绝对数的形式方差:离均差平方的算术平均数标准差:离均差平均数的形式。
共同点:都有具体计量单位,都受计量单位的影响(英尺、米;美元、英镑)变异系数:是一类相对数形式的变异指标。排除计量单位对计算结果的影响。43ppt课件同样的变异指标值对于不同的平均水平通常具有不同的实际分析意义。只有当两个被比较事物平均数相同或相近时,直接利用标准差等有量纲的变异指标来进行分析,才是合理的。44ppt课件人均年收入标准差四分位数变异系数%甲市600015032002.5乙市1200018035001.5两个城市的居民年收入情况乙市年收入与标准差均高于甲市,是否可认为乙市收入差距高于甲市呢?变异系数显示:乙市居民的收入差距相对于他们的平均收入来说,比甲市要低的多。故以居民对收入差距所承受的压力而言,甲市比乙市要高。45ppt课件第四节正态分布46ppt课件正态分布正态分布是连续性变量的一种重要分布模型。很多医学现象服从正态分布或近似正态分布。此外正态分布还是许多统计方法的理论基础。47ppt课件德国大数学家高斯(C.F.Gauss,1777~1855)。调查、观察或测量中的误差,不仅是不可避免的,而且一般是无法把握的。高斯以他丰富的天文观察和在1821~1825年间土地测量的经验,发现观察值x与真正值μ的误差变异,大量服从现代人们最熟悉的正态分布。称高斯分布曲线,也就是正态分布曲线。
48ppt课件1、频率密度直方图与频率密度曲线图2-3120名健康成年男子血清铁含量频率密度直方图49ppt课件50ppt课件51ppt课件
n大时,频率密度曲线可估计概率密度曲线。医学中的许多变量,其概率密度曲线类似正态曲线。故可用正态曲线的特点来描述这些变量的统计规律。52ppt课件2、正态曲线(normalcurve):是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。其概率密度函数为:-∞<X<+∞正态分布有两个参数:位置参数:μ
变异度参数:σ2正态分布的表示方法:X~N(μ,σ2)53ppt课件54ppt课件55ppt课件正态分布密度曲线的特点:1.正态曲线在横轴上方,且均数所在处最高;2.正态曲线以均数为中心左右称;3.正态曲线下的面积为1。4.正态曲线在μ±σ各有一个拐点;56ppt课件57ppt课件3、正态曲线下面积的分布规律1)正态曲线可作为很多医学变量概率密度曲线的近似。2)正态分布曲线下的面积分布规律由μ和σ所决定。
58ppt课件3)当知道了密度函数f(x)时,概率密度曲线下的面积可通过对密度函数求定积分的方法获得。59ppt课件4)定积分的方法求正态曲线下的面积过于复杂,我们可用简便的查表法解决这一问题。60ppt课件设正态变量X~N(μ,σ2),令则变量
u~N(0,1),我们称u为标准正态变量,其密度曲线称为标准正态曲线,其概率密度函数为:-∞<Z<+∞正态曲线下的面积规律与标准正态曲线下的面积规律有什么关系呢?61ppt课件62ppt课件由积分知识可证明:式中,和分别是正态分布和标准正态分布的概率密度函数,F(X)和分别是它们的分布函数。注意:请正确理解分布函数的意义63ppt课件统计学家编制了标准正态分布分布函数表(附表1),故求正态曲线下的面积可通过查附表1获得。因为正态分布的对称性,为节省篇幅,附表1只给出Z取负值的情况。64ppt课件65ppt课件例2-15对例2-1,例2-2和例2-14已计算出101名正常
成年女子的血清总胆固醇均数=4.03mmol/L,标准差
S=0.659mmol/L.试估计该单位:①正常女子血清总胆固醇在4.00mmol/L以下者占正常女子总人数的百分比;②在4.00~5.00mmol/L之间者占正常女子总人数的百分比;③在5.00mmol/L以上者占正常女子总人数的百分比.由于此样本含量大,故用代替,S代替.将ⅹ=4.00、ⅹ=5.00分别代入公式(2-19)
,得u1==-0.05
u2==1.4766ppt课件
查附表1得:(-0.05)=0.4801,(-1.47)=0.0708,(1.47)=1-0.0708=0.9292.故该单位正常女子血清总胆固醇在4.00mmol/L以下者,估计占总人数的48.01%;在4.00~5.00mmol/L之间者,估计占总人数的44.91%;③5.00mmol/L以上者,占总人数的7.08%。67ppt课件第五节医学参考值范围的制定68ppt课件
概念:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。
单双侧:根据指标的实际用途,有的指标有上下界值(双侧)。某些指标只需确定上限(单);某些指标只需确定下限(单)。
估计的方法:
1、正态分布法
2、百分位数法69ppt课件
制定参考值的基本步骤A、从“正常人”总体中抽样:样本含量应较大B、控制测量误差:C、制定是否需要分组确定参考值范围:D、决定取单侧还是双侧:E、选用合适的百分界限
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 漳州卫生职业学院《工程热力学》2025-2026学年期末试卷
- 邢台应用技术职业学院《货币银行学》2025-2026学年期末试卷
- 中国矿业大学《临床免疫学检验技术》2025-2026学年期末试卷
- 漳州科技职业学院《旅游消费者行为学》2025-2026学年期末试卷
- 污水处理工操作评优考核试卷含答案
- 公共营养师班组管理测试考核试卷含答案
- 制药发酵液提取精制工岗前工作流程考核试卷含答案
- 钟表设计师班组协作竞赛考核试卷含答案
- 兔肉市场新篇章-拓展营销视野打造兔肉新品牌
- 第11课《山地回忆》课件 统编版语文七年级下册
- 乡村绿化指导手册
- 《价值判断与价值选择》名师课件
- 2024年广东乐控集团有限公司招聘笔试参考题库附带答案详解
- 《0-3岁婴幼儿保育与教育》课程标准
- 中考历史小论文常用观点及示例
- 知识产权模拟法庭案例
- 河南08定额及综合解释
- DB2201T49-2023站用储气瓶组定期检验规范
- 第2章 Spring Boot核心配置与注解
- 船舶能耗填写范本
- 网络传播法规(自考14339)复习必备题库(含答案)
评论
0/150
提交评论