基础医学]医学统计学基础.ppt_第1页
基础医学]医学统计学基础.ppt_第2页
基础医学]医学统计学基础.ppt_第3页
基础医学]医学统计学基础.ppt_第4页
基础医学]医学统计学基础.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学基础 第二讲 第一节、医学统计学的基本概念和步骤 第二节、数值变量的统计描述及SPSS操作 第三节、数值变量的总体均数估计 第一节 统计学基本概念和步骤 一 总体和样本(population and sample) 概念:总体 - 根据研究目的确定的同质观察单 位的全体。 样本-总体中随机抽取有代表性的一部分 个体,其实测值的集合。 例如: 从某地2004年7岁正常女童中,随机抽取110 名女童进行身高测量。 总体是指该地2004年所有7岁正常女童的 身高值的集合。样本是指所测量的这110名女童 的身高值。 同质 - 同年同地7岁正常女童 变异 - 样本中的女童身高值各不相同 二、 随机抽样(random sampling) 概念 : 随机抽样,就是总体中每个个体都 有均等机会被抽取进入样本。 目的 :使得样本能更好地代表总体,可以根 据样本信息推断总体特征 三、 参数和统计量(parameter and statistic) 概念:- 参数是指总体指标,如总体均数( ),总体标准差(), 总体率()等。 - 统计量是指样本指标,如样本均数, 样本标准差 (s), 样本率 (p) 等。 一般情况下,参数是未知的,需要用统计 量去估计。 四、 误差(error) 医学科学研究中的误差通常指测量值与真值之差,其中包括系统误差 和随机测量误差;以及样本指标与总体指标之差,即抽样误差。 研究抽样误差的规律,是医学统计的重要内容之一。 误差 解释 解决办法 系统误差 不是偶然机遇所致, 尽可能避免, 或通过周 (systematic 而是某种必然因素所致, 密的研究设计解决 error) 具有一定的倾向性 随机测量误差 偶然机遇所致,是不可避免的 控制在一定的允许范围 (random measurement error) 内,数据仍可以使用 抽样误差 抽样研究中,即使消除了 可以通过统计方法估计 (sampling error)系统误差,控制 了随机测量 并减小 误差,样本指标和总体参数间 仍会存在差别。这是由个体变 异造成,是抽样波动所致, 不可避免的 五、 医学统计资料的类型 医学统计资料是由医学科学研究 产生的一系列观测结果组成,用于反 映观测结果的属性或标志,统计上称 为变量(variable),对变量的测量或 观察结果称为变量值(value of variable) 统计资料的类型 资料类型 变量类型 例子 统计指标 计量资料 数值变量 身高 (cm),体重(kg) 平均数, 标准差等 计数资料 分类变量 治疗40个病人的效果: 率, 有效: 27例 构成比等 无效: 13例 等级资料 有序分类 治疗40个病人的效果: 可计算构成比 变量 显效: 13例 好转: 30例 无效: 27例 例1:某地某年120名20岁健康男大学 生身高(cm) 它是一个样本数据(book1.xls ),所对应的总体 是该地该年所有20岁健康男大学生身高 例2:某年某地正常成人血铅(微克 /100克) 资料 第二节 数值变量的统计描述及SPSS操作 数值变量的数据分布特征 - 作频数表(frequency table) - 直方图(histogram) 根据数据分布类型计算统计指标 - 集中趋势指标(平均指标) - 离散趋势指标 (变异指标) 统计指标的应用 - 计算个体变量值的范围 (医学参考值范围) 一、频数分布 数据的分布类型 - 对称分布 (正态分布) - 偏态分布 进行数据核查,发现异常值和 missng值 120名学生身高(cm)的频数表 身高组段频数频率(%)累计频率(%) 162 3 2.5 2.5 164 3 2.5 5.0 182184 1 0.8 100.0 合计120 100.0 二、 平均指标 算术均数(mean) 变量值呈对称分布, 尤其正态分布 中位数(median)或称 P50 偏态分布或分布不清,一端(或 两端) 无确定值的资料 几何均数(geometric mean) 等比资料,对数正态分布 三、 变异指标 全距(range)R=最大值-最小值 四分位数间距 (Interquartile Range,偏态资料)Q = P75 -P25 方差和标准差(variance & standard deviation,对称资料) 变异系数(CV, 两种情况比较) 算术均数(简称均数)的公式 未分组样本资料 总体 特点:受异常值(特大或特小值)影响, 适用于对称分布,尤其正态分布的资料 中位数计算公式 当n为奇数时 当n为偶数时 特点:不受异常值(特大或特小值)的影 响,适用于偏态分布等资料 样本方差 样本标准差 总体方差 适用资料:对称分布尤其正态分布的资料 Descriptive statistics - frequencies - statistics Descriptive statistics - descriptives - options Descriptive statistics - explore - display statistics 例3:有69例类风湿关节炎(RA)患 者血清EBV-VCA-IgG抗体滴度资料 (book1.xls sheet3 ) ,求其平均滴度 步骤:将滴度倒数和例数输入SPSS,进行数据 加权(WEIGHT CASES)后,点击analyze - report - case summaries - 选入滴度倒数 - statistics里要求输出倒数第3个指标,几何均数 作业 对例2的资料进行描述统计,问 1)血铅原始值是什么分布类型的资料 2)选用何种指标反映其集中、离散趋势 3)血铅对数值是什么分布类型的资料 4)试采用几何均数反映资料的平均水平 要求:说明原因,写出计算公式和结果 三、 正态分布及其应用 正态分布及正态曲线下面积的分布规律 正态分布及其应用 正态分布及正态曲线下面积的分布规律 正态分布的特征 1)以均数为中心,左右对称,钟型曲线 2)均数决定整个曲线的位置,标准差决定 曲线的胖瘦,是正态分布两个重要参数 3)均数处最高,说明变量值易在附近出现 4)正态曲线下一定区间的面积,说明变量 值在这个区间里出现的可能性,有规律 要求记住95%,99%对应的区间公式 正态分布及其应用 正态分布及正态曲线下面积的分布规律 正态分布及其应用 估计观察值所在范围 (医学参考值范围) 95% 的健康成人血糖观察值所在范围: 例 : n = 132 , x =4.653 ( mmol/L) s = 0.401 (mmol/L) , x 1.96 s = x - 1.96 s = 4.653 - 1.96 0.401 x +1.96 s = 4.653 + 1.96 0.401 = 3.87 5.44 ( mmol/L) 即该地 95% 的5558岁健康健康成人血糖 观察值在 3.87 5.44 ( mmol/L)范围内 标准正态分布概念和特征 均数为0,标准差为1的正态分布称为标准正 态分布(z分布)。若X服从正态分布,经z变换 公式,所得的z值服从标准正态分布。 正态曲线有无数条,但标准正态分布曲线只 有一条。标准正态分布具有正态分布的所有特征 尤其要记住95%,99%对应的区间。 Descriptive statistics - descriptives - save standard value as variable 如何判断资料是否服从正态分布 对样本例数较大的资料,编频数表和绘直方 图,另外还可以点击 正态Q-Q图看散点是否与直线重合,正态性 检验看是否Sig值(即P值)是否大于0.10 对例数较小的资料,一般根据专业知识或着 仅仅是假定 Descriptive statistics explore - display plots - plots: nomality plots with tests 第三节 数值变量的总体均数估计 均数的抽样误差与标准误 来自同一总体的各样本均数间存在差异 ,称为均数的抽样误差。标准误是反映均数 的抽样误差大小的指标,它与样本含量n的平 方根成反比。即适当增加n可以减少均数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论