健康管理师资料:医学统计学的基础知识_第1页
健康管理师资料:医学统计学的基础知识_第2页
健康管理师资料:医学统计学的基础知识_第3页
健康管理师资料:医学统计学的基础知识_第4页
健康管理师资料:医学统计学的基础知识_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学的基础知识1主要内容基本概念统计描述统计表和统计图统计推断2基本概念医学统计学的定义和研究对象统计学:关于数据收集、表达和分析的普遍原理和方法。医学统计学:根据统计学原理和方法,研究医学数据收集、表达和分析的一门学科医学统计学主要内容统计设计、统计描述、统计推断3基本概念医学统计学资料类型分组因素:不同干预措施、研究对象的属性等反应变量:研究效应计量资料计数资料等级资料生存资料4基本概念计量资料的特点又称定量资料;必须通过“量”才能获得;带有度量衡单位;每个个体拥有一个数值;可以转换为等级资料和计数资料。如:身高(cm)、体重(kg)5基本概念计数资料的特点又称定性资料、无序分类变量资料、名义变量资料等;必须通过“数”才能获得;不带有度量衡单位;每个个体拥有一个属性;分型两分类:HBsAg的阴性和阳性多分类:血型中的A、B、O、AB四种。6基本概念等级资料的特点又称半定量资料、有序分类资料;必须先“量”后“数”才能获得;不带有度量衡单位;每个个体拥有一个属性;如:治疗效果分为痊愈、显效、好转、无效等7基本概念资料类型的转化计量资料可以转化为等级资料和计数资料如:收缩压为计量资料,以90~140mmHg为界值可分为低血压、正常血压、高血压(等级资料);也可以分为正常和不正常(计数资料)。计量资料的信息最丰富,研究中尽可能收集计量资料。8基本概念医学统计工作的基本步骤研究设计(按有无干预分类)调查设计(无)、实验设计(有)收集资料资料来源:经常性资料、一时性资料资料要求:完整、正确、及时、充足、代表性和可比性9基本概念医学统计工作的基本步骤整理资料检查和核对:有无遗漏缺失、逻辑检查、正常值范围核查等分组和归类分析资料统计指标、统计图、统计表参数估计、假设检验10基本概念统计学中的几个重要概念同质:研究对象具有相同性质(背景、条件、属性)变异:同一性质的事物其个体观察值(变量值)之间的差异。如:上海市2014年18岁男青年的身高11基本概念统计学中的几个重要概念总体:根据研究目的确定的同质观察单位的全体更确切的说,是同质的所有观察单位某种变量值的集合有限总体、无限总体样本:从总体中随机抽取有代表性的一部分观察单位其测量值(或观察值)的集合12基本概念统计学中的几个重要概念参数:用于描述总体特征的统计学指标总体均数:(希腊字母)统计量:用于描述样本特征的统计学指标样本均数:(英文字母)参数估计:用统计量推断参数的方法13基本概念统计学中的几个重要概念误差:测量值与真实值之差误差类型系统误差:由可知的或可掌握的因素引起的误差,理论上可以避免。测量身高的仪器能精确到何种程度随机误差:由无法控制的因素的引起的误差,无法消除或不可避免抽样误差:参数与统计量的差异,多个统计量之间的差异14基本概念统计学中的几个重要概念频率:描述某随机事件实际发生情况的度量指标(样本)向上抛银币100次,其中51次银币落地后的结果是正面朝上,则正面朝上的频率为51%。概率:描述随机事件发生可能性大小的度量指标(总体)银币被上抛落地后,正面朝上的概率为50%。概率用P表示,0≤P≤1一般小于等于5%或1%称为小概率事件随着样本量的增加,频率越来越接近概率。15统计描述数值变量资料的统计描述频数表:将所有观察结果的频数(出现次数)一定顺序排列在一起。简化数据、考察分布特征基本概念:组段:一段取值范围(10个左右)上限:范围的最大值下限:范围的最小值组距:最大值与最小值的差组中值:最大值与最小值的平均进入组段的规则:大于等于下限、小于上限16表1138名正常成年女子的红细胞数(1012/L)频数分布组段

频数组中值3.07~23.173.27~33.373.47~93.573.67~143.773.87~223.974.07~304.174.27~214.374.47~154.574.67~104.774.87~64.975.07~45.175.27~25.37合计138-统计描述数值变量资料的统计描述频数分布图:以组段为X轴,以频数或频率为Y轴绘制而成的直方图。能直观反映变量各种取值出现的机会18正态分布正偏态分布图2-2某地居民238人发汞含量分布(µmol/kg)负偏态分布图2-3101名正常人的血清肌红蛋白含量统计描述数值变量资料的统计描述描述集中趋势的指标平均数指标用于描述一组变量值的集中位置或平均水平。算术均数、中位数、几何均数描述离散趋势的指标变异指标用于描述一组计量资料围绕中心位置散布的范围。极差、四分位数间距、方差和标准差、变异系数22统计描述数值变量资料的统计描述-集中趋势算术均数(简称均数)计算公式直接法例1计算138名正常成年女子的红细胞数(1012/L)的均数。23统计描述数值变量资料的统计描述-集中趋势中位数:将变量值从小到大排列,位置居于中间的那个数就是中位数。计算公式n为奇数n为偶数24统计描述数值变量资料的统计描述-集中趋势中位数计算例2患某病的7名病人潜伏期分别为2,3,4,5,6,9,16天,求其中位数。n=7为奇数,Md=5(天)例3食物中毒的8名患者潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。n=8为偶数,Md=(3+5)/2=4(小时)25统计描述数值变量资料的统计描述几何均数计算公式26表2

69例RA患者血清EBV-VCA-IgG抗体测定结果抗体滴度人数滴度倒数lgXf·lgX1:104101.00004.00001:203201.30103.90301:4010401.602116.02101:8010801.903119.03101:160111602.204124.24511:320153202.505137.57651:640146402.806239.28681:1280212803.10726.2144合计69--150.2778统计描述数值变量资料的统计描述几何均数计算公式69例RA患者血清EBV-VCA-IgG抗体的平均滴度为1:150.6。统计描述数值变量资料的统计描述-离散趋势例4描述以下三组4岁男童的身高(cm)甲组:9095100105110均数=100乙组:9698100102104均数=100丙组:9699100101104均数=100统计描述数值变量资料的统计描述-离散趋势极差计算公式:

R=Xmax-Xmin例4数据的极差情况

R甲=110-90=20(cm)R乙=104-96=8(cm)R丙=104-96=8(cm)统计描述数值变量资料的统计描述-离散趋势百分位数:位置指标,用PX表示。一个百分位数PX将全部变量值分为两个部分,其中变量值小于PX的比例小于X%,另外变量值大于PX的比例大于(100-X)%。中位数是第50百分位数。四分位数间距:Q=P75-P25数值变量资料的统计描述-离散趋势方差计算公式标准差计算公式例4数据的标准差统计描述3233统计描述平均数和变异指标的适用范围均数、方差和标准差:对称分布资料中位数、四分位数间距:偏峰分布资料变异系数:不同度量衡单位的资料或同类指标均数相差悬殊的资料几何均数:等比级资料众数、极差:粗略分析统计描述分类变量资料的统计描述频数表和相对数(比、比例和率)工种调查对象患者例数构成比(%)例数构成比(%)患病率(%)苯作业38934.92945.37.5塑料作业31127.91320.34.2化学药物26023.41320.35.0放射作业15413.8914.15.8合计1114100.064100.05.7表3不同工种调查对象和白细胞减少症患者的频率分布统计表和统计图统计表可以避免大量文字叙述,把相关数字罗列在一起,便于计算、比较和分析。统计图可使数字资料形象化,鲜明醒目,能给人留下较为深刻的印象,同样便于比较和分析。35表42007-2010年某科室出院病人疗效36年份出院人数疗效治愈好转无效未治死亡其他20074622361673536152008499252180533920200972246719723494201074844023446491537图42007-2010年某科室出院患者疗效统计表统计表的结构一般来说,统计表由标题、标目、线条和数字四部分组成。备注有时也被看作是统计表的一个部分,但备注并不是必需的内容,可以根据需要出现。38统计表的结构39横标目纵标目的总标目

纵标目的总标目纵标目纵标目

纵标目纵标目横标目(数字)...横标目合计

标题统计表制表原则:重点突出、简单明了主谓分明、层次清晰制表的基本要求统计表结构的要求40统计表标题的要求位于统计表的上方,用一段简明扼要的文字概括一张统计表的中心内容。如果在一篇文章中有多张统计表,则每张统计表的标题前应有表号。如果有必要,标题中可以包括时间和地点。41表52007-2010年某科室不同支付方式出院病人疗效42年份医保支付

自费例数治愈数治愈率(%)

例数治愈数治愈率(%)200736220055.2

1003636.0200838121355.9

1183933.1200956640170.8

1566642.3201056237867.3

1806233.3统计表标目的要求根据位置可分为横标目、纵标目和总标目横标目:位于表的左侧,说明各行数字含义,一般为分组因素,相当于主语纵标目:位于表的右上方,说明各纵栏数字含义,一般为统计指标,相当于谓语总标目:对纵标目内容的概括43表52007-2010年某科室不同支付方式出院病人疗效44年份医保支付

自费例数治愈数治愈率(%)

例数治愈数治愈率(%)200736220055.2

1003636.0200838121355.9

1183933.1200956640170.8

1566642.3201056237867.3

1806233.3统计表线条的要求三条基本线条:顶线、底线、纵标目下横线如有合计项,可加一条合计线如纵标目上有总标目,还需用短线加以分隔45统计表中的线条统计表数字的要求准确、整齐,以小数点为基准尽量用阿拉伯数字尽量不要出现空格,可用“-”或“…”表示47表6两个科室不同护龄护士专业技术考核成绩48护龄(年)甲科室乙科室人数平均成绩(分)人数平均成绩(分)<11076.231275.541~52280.241080.015~101686.81585.6510~151089.22187.32>15288.730—合计6083.102879.36统计表和统计图统计图用点的位置、线段的升降、直条的长短、面积的大小等各种几何图形,将研究对象内部结构、对比情况、分布特点与相互关系等特征形象而生动的表达出来。与统计表相比,统计图比较形象化,能给读者留下较为深刻的印象,但是有些统计图不能准确地表示数据的大小。49条图50(%)百分条图51圆图52线图53图72007年-2010年住院总费用、药品费用与检查费用的变化趋势箱图54图82009年、2010年不同性别住院病人的年龄散点图55图92010年20岁-40岁出院病人住院天数与总费用56100200300400500600700800直方图统计图制图的基本要求根据资料的性质和分析目的,选择合适的图形条图:用等宽直条的高度或长短表示数值的大小圆图和百分条图:表示各部分事物占所有事物的百分比线图:用线段的升降表示一个事物随另一个事物变化的趋势箱图:表示定量资料的分布特征散点图:表示两种定量资料的相关关系直方图:用矩形面积表示某个连续变量的频数(或)分布特征57统计图制图的基本要求标题一般位于统计图下方的中央纵横轴要有标目,标注原点、次度、单位等,纵横轴的比例以5:7为宜同一张图内比较不同事物时,须用不同颜色或样式的线条区别表示,并用图例说明。58统计图的结构59图域(长:宽=7:5)统计推断用样本信息推断总体特征总体参数的估计和假设检验数值变量的统计推断总体均数的估计、t检验、方差分析、秩和检验分类变量的统计推断总体率的估计、2检验和秩和检验60统计推断假设检验的基本原理利用样本信息判断假设是否成立的统计方法称为假设检验。基本思想:首先假设某种现象是存在的,然后按照该设想计算一个检验统计量,依据该统计量推断先前的假设是否成立。参数检验总体分布类型已知,对其参数进行假设检验非参数检验总体分布类型未知,或为偏态分布,对其分布进行假设检验61统计推断假设检验的步骤建立检验假设、确定检验水准无效假设:用H0表示,表示欲否定的假设备择假设:用H1表示,与H0对立的假设检验水准:用表示,事先确定的允许犯I类错误的概率,即是否拒绝H0的概率,通常取0.05。62统计推断假设检验的步骤计算检验统计量根据研究目的、资料类型、样本量大小等条件,选择适当的检验方法,计算相应的检验统计量。t检验的检验统计量为t值,方差分析的为F值,2检验的为2值等。63统计推断假设检验的步骤确定P值,做出统计推断P值的含义是指从H0所规定的总体中做随机抽样,获得等于及大于现有样本的检验统计量值的概率。P值与检验水准的关系P≤,则拒绝H0,接受H1,差异有统计学意义P>

,则不拒绝H0,差异无统计学意义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论