




已阅读5页,还剩255页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主 要 内 容 1 2 3 4 前言 医学研究资料的统计处理 统计表与统计图 医学统计资料的统计描述 统计是什么? What is Statistics? 若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。 Florence Nightingale 1820一 1910 一、前言 Florence Nightingale 在她的时代 , 各医院的统计资料非常不准确 。但是南丁格尔却有先知灼见 , 她认为医学上的统计资料 , 有助于改进医疗与护理的方法与措施 , 而最后可促进医学的进步 。 1858年 影响英国军队健康 、 效率以及医院行政的笔记 。 这本书被称为 “ 有史以来写得最好的一本统计图表书籍 ” 。 Florence Nightingale 在书中 , 有一个章节是她所做的统计图表;她是以图表陈述统计数据的先驱者 , 也是首位发明圆饼图 ( Polar-area Charts, 或称为Pie Charts) , 用来呈现统计数据比率的人 。 1858年,她获选为英国统计学会的第一位女性会员,不久又成为美国统计学会的荣誉会员。 6 统计学 是 收集 、 分析 、解释 与 呈现 数据资料的一门科学。 医学统计学 -是以 医学理论为指导,应用 概率论与数理统计 的有关原理和方法,研究医学资料的 搜集、整理、分析和推断 的一门科学。 什么是统计学 ? 天气预报 生活中的统计数据 数据处理的工具和技能 同质与变异 变量与变量值 参数与统计量 总体和样本 概率 误差 二、医学研究资料的统计处理 (一 )常用基本概念 (一 )常用基本概念 同质与变异 同质 :被研究指标的影响因素相同 。 e.g.比较两种不同 药物 的降 压 效果。 在医学研究中,对被观测指标 有影响的可控制的 非实验因素 达到 相同或基本相同 就可认为是同质。 同质性是构成研究总体的必备条件; 研究内容不同,对同质性的要求不同; 实验因素 观测指标 制定血红蛋白参考值范围时: 制定白细胞参考值范围时: 同质与变异 变异 (variation)是指在同质的基础上各观察单位 (或个体 )之间的差异。 e.g.同为 20岁健康男大学生,身高 有高有矮 、体重 有重有轻 ,这种差异就是变异。 不可控因素作用下所产生的一种综合表现。 结果是随机的。 个体变异是普遍存在的。 个体变异是有规律的。 没有个体变异,就没有统计学! (一 )常用基本概念 变量及变量值 变量 是指观察单位的某项特征或指标。 e.g. 人的年龄、性别、身高、体重等。 变量值 是变量的观察结果。 e.g. 定性结果:男、女;已婚、未婚 定量结果:厘米、千克 (一 )常用基本概念 (一 )常用基本概念 总体和样本 总体 是根据研究目的确定的 同质 观察单位某种变量值的集合。 有限总体:调查某地成年女性红细胞数。 无限总体:调查 A厂 30岁成年女性红细胞数。 样本 是指在研究总体中 随机 抽出一部分个体进 行观察或测量,这些个体的测量值构成的集合。 挪威统计学家凯尔 (A.N.Kiaer),1895年提出抽样调查。 参数与统计量 描述总体特征的有关指标,称为 参数 。 未知的,固有的,不变的! 反映样本特性的有关指标,称为 统计量 。 已知的,变化的,有误差的! (一 )常用基本概念 平均身高 总体 样本 平均身高 x总体参数 样本统计量 概率 又称机率。是描述事件发生可能性大小的一个度量,常用 P来表示,取值范围为 0P1 。 (一 )常用基本概念 1. 不可能事件: P=0 2. 必然事件: P=1 3. 随机事件 : 0 P 1 随机 机会均等 随机抽样 有相同的机会被抽到 随机分组 有相同的机会被分到不同的组中 实验顺序随机 先后接受处理的机会相同 (一 )常用基本概念 抛硬币试验在概率的统计学定义上的诠释 试验者 投掷次数 出现 “ 正面 ” 次数 频率 X X X 20 12 0.6000 Buffon 4040 2048 0.5069 K.Pearson 12000 6019 0.5016 K.Pearson 24000 12012 0.5005 (一 )常用基本概念 当观察次数 n越来越大,频率 f的随机波动幅度越来越小,并最终趋向于一个常数:随机事件 A发生的概率 。 频率 : 用随机事件 A发生表示观察到某个可能的结果,则在 n次观察中,其中有 m次随机事件 A发生了,则称 A发生的比例 为频率。显然有 。 (一 )常用基本概念 mfn01f小概率原理 当某事件发生的概率 P0.05或 P0.01时,统计学上称该事件为 小概率 事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生 ,此即为 小概率原理 。 小概率原理是进行统计推断的依据。 (一 )常用基本概念 小概率原理 小概率事件在一次试验中认为是不会发生的。 误差 指实际测量值与真实什之差。 (一 )常用基本概念 1. 系统误差: P=0 可避免 2. 随机测量误差: P=1 不可避免 ,可控 3. 抽样误差 : 0 P 1 不可避免 ,不可控 可避免随机测量误差: 不可避免 可控: 不可避免 不可控(一 )常用基本概念 抽样误差 指 由 抽样引起 的样本统计量与 总体参数间的差别。 原因:个体差异抽样 表现: 样本统计量与总体参数间的差别 不同样本统计量间的差别 抽样误差是有规律的! 数值变量资料 分类变量资料 (二 )医学统计资料的类型 无序多分类 有序多分类 (等级资料 ) 二分类 多分类 数值变量资料 以 定量方法 表达每个观察单位的某项观察指标,又称定量资料或计量资料。 变量值是固定的,有度量衡单位 :cm、 kg、 kPa 特征 数据间有连续性 :体重 55kg60kg 统计描述指标有 统计推断方法: t检验、 u检验、方差分析、相关回归 (二 )医学统计资料的类型 集中趋势:平均数 离散趋势:标准差 分类变量资料 将观察单位 按某种属性来分类 计数的资料,亦称定性或计数资料。 数据为整数,无度量衡单位 特征 统计描述指标常用相对数 :率、构成比、相对比 统计推断方法: u检验、 X2检验 分类 (二 )医学统计资料的类型 二分类:有效、无效;阴性、阳性 多分类:血型 : A、 B 、 O 、 AB 无序多分类 有序多分类: (等级资料 ) 治愈 、好转、无效、死亡; 、 住院号 年龄 身高 体重 住院天数 职业 文化程度 分娩方式 妊娠结局 2025655 27 165 71.5 5 无 中学 顺产 足月 2025653 22 160 74.0 5 无 小学 助产 足月 2025830 25 158 68.0 6 管理员 大学 顺产 足月 2022543 23 161 69.0 5 无 中学 剖宫产 足月 2022466 25 159 62.0 11 商业 中学 剖宫产 足月 2024535 27 157 68.0 2 无 小学 顺产 早产 2025834 20 158 66.0 4 无 中学 助产 早产 2019464 24 158 70.5 3 无 中学 助产 足月 2025783 29 154 57.0 7 干部 中学 剖宫产 足月 观察单位observations 个体 individuals 变量variables Quantitative data 计量资料 Qualitative data 计数资料 Units; elements 三类资料间关系 例:一组 2040岁成年人的血压 以 12kPa为界分为正常与异常两组,统计每组例数 60, 60 平均存活天数 ? ( 一 ) 中位数 ( median) 是将每个变量值从小到大排列, 位置居于中间的那个变量 值 。 计算 公式 : n为奇数时 n为偶数时 1()2nMX ( ) ( 1 )2212nnM X X例 2-3 9名中学生甲型肝炎的潜伏期分别为 12, 13, 14, 14, 15, 15, 15, 17, 19天,求其 中位数 。 8 8 4 51222 2 1 4 1 5 2 1 4 .5 ( )M X X X X 如 果 只 调 查 了 前 八 位 中 学 生 , 则 : ( ) ( ) 天)(155219 天 XXM频数表资料的中位数 ( 50 % )( 50 % )LmMnnfM L if 所 在 组 段 下 限 值至 该 下 限 值 的 累 计 频 数组 距所 在 组 段 下 限 值 至 上 限 值 间 的 频 数下限值 L 上限值 U i; fm 中位数 M )%50( Lfn 例 2 1频数表中位数的计算 脉搏组段 频数,f相对频数( % ) 累积频数 累积 相对 频数 (1 ) ( 3 ) (4 )= (3 ) / N (5 )= (3 ) (6 )= (5 )/ N56 2 1.54 2 1.54 59 5 3.85 7 5.38 62 12 9.23 19 14.62 65 15 1 1.54 34 26.15 68 25 19.23 59 45.38 71 26 20.00 85 65.38 74 1 9 14.62 104 80.00 77 15 1 1.54 1 19 91.54 80 10 7.69 129 99.23 83 85 1 0.77 130 100.00 合 计 130 N f 中位数 71+3x(130x50% 59)/26 71.69 应用 1、各种分布类型的资料 2、特别适合大样本 偏态 分布资料或者一端或两端无确切数值的资料 。 %X( 1 0 0 ) %XXP百分位数示意图 (二)百分位数( percentile) 1直接计算法 设有 n个原始数据从小到大排列,第 X 百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时: %nX t r u n c ( % ) 1 X n XPX ( % ) ( % 1 )12X n X n XP X X %nX 例 对某医院细菌性痢疾治愈者的住院天数统计, 120名患者的住院天数从小到大排列如下,试求 第 5百分位数和 第 99百分位数。 患 者 : 住院天数 : ( 1) n=120, , 为整数 : 5 ( 6 ) ( 7 )11 ( 3 4 ) 3 . 5 ( )22P X X 天1 2 0 5 % 61 2 3 4 5 6 7 8 9 1 1 7 1 1 8 1 1 9 1 2 0 1 2 2 2 3 3 4 4 5 4 0 4 0 4 2 4 5 ( 2) , 带有小数, 故取整 trunc( 118.8) = 118 1 2 0 9 9 % 1 1 8 . 8 9 9 ( 1 1 9 )( % ) 1 4 2 ( )t r u n c n XP X X 天患 者 : 住院天数 : 1 2 3 4 5 6 7 8 9 1 1 7 1 1 8 1 1 9 1 2 0 1 2 2 2 3 3 4 4 5 4 0 4 0 4 2 4 52频数表法 公式: ( % )XX X LXiP L n X ff XL :第 X 百分位数所在组段下限 Lf :小于XL 各组段的累计频数 Xi :第 X 百分位数所在组段组距 n :为总例数 当 时 , 公式 ( 2-9)即为中位数的计算公式 505 0 5 050()2Li nM P L ff 1% 5 0 %2X 例 2-9 试分别求例 2 1频数表的第 25、第 75百分位数。 脉搏组段 频数,f相对频数( % ) 累积频数 累积 相对 频数 (1 ) ( 3 ) (4 )= (3 ) / N (5 )= (3 ) (6 )= (5 )/ N56 2 1.54 2 1.54 59 5 3.85 7 5.38 62 12 9.23 19 14.62 65 15 1 1.54 34 26.15 68 25 19.23 59 45.38 71 26 20.00 85 65.38 74 1 9 14.62 104 80.00 77 15 1 1.54 1 19 91.54 80 10 7.69 129 99.23 83 85 1 0.77 130 100.00 合 计 130 P25 65+3x(130x25% 19)/15 65.90 P75 74+3x(130x75% 85)/19 74.66 众数( mode) 众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。 适用于大样本;较粗糙。 例 2-7 有 16例高血压病人的发病年龄 (岁 )为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。 众数( mode) 众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。 适用于大样本;较粗糙。 例 2-7 有 16例高血压病人的发病年龄 (岁 )为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。 正态分布时: 均数中位数众数 正偏态分布时: 均数 中位数 众数 负偏态分布时: 均数 P5 ) 3. 有 90%、 95%、 99% 等医学参考值范围, 最常用的是 95% 。 计算医学参考值范围的常用方法: 1、 正态分布法 2、百分位数法 二、正态分布法 公式: 双侧 1 参考值范围: /2X u S 单侧 1 参考值范围: X u S X u S 或 式中 X 为均数, S 为标准差, u 值可由表 2 - 6 查出。 单侧下限 单侧上限 Z Z Z Z 例 2 - 13 利用例 2 - 1 资料求健康成年男子脉搏 95% 参考值范围。 图 2 - 1 显示资料近似服从正态分布,因脉搏跳动次数过多或过少均为异常,故按双侧估 95% 参考值范围。已知7 1 . 3 1 5 4 ( )X 次 / 分,5 . 8 0 1 6 8 ( )S 次 / 分,0 . 0 5 21 . 9 6Z ,故 下限:27 1 . 3 1 5 4 1 . 9 6 5 . 8 0 1 6 8 5 9 . 9 4 4 1 ( )X Z S 次 / 分上限:27 1 . 3 1 5 4 1 . 9 6 5 . 8 0 1 6 8 8 2 . 6 8 6 7 ( )X Z S 次 / 分三、百分位数法 适合偏态分布资料,样本含量较正态分布法要多( 100 ), 其 计 算 公 式 为 双侧1 参考值范围:1 0 0 2 1 0 0 1 0 0 2PP 单侧1 参考值范围: 1 0 0 1 0 0 1 0 0PP 或单侧下限 单侧上限 尿 汞 值 频 数 f 累计频数 f 累计频率( % ) 0 45 45 1 6 . 0 8 . 0 64 109 3 8 . 6 1 6 . 0 96 205 7 2 . 7 2 4 . 0 38 243 8 6 . 2 3 2 . 0 20 263 9 3 . 3 4 0 . 0 11 274 9 7 . 2 4 8 . 0 5 279 9 8 . 9 5 6 . 0 2 281 9 9 . 6 6 4 . 0 7 2 . 0 1 282 1 0 0 . 0 例 2-16 测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的 95%参考值范围。 表 2-7 282名正常人尿汞值 ( ) 测量结果 g / L鉴 于 正 常 人 的 尿 汞 值 为 偏 态 分 布 ,且 过 高 为 异 常 ,故 用 百 分 位 数法计算上侧界值即第 95 百分位数 95958 . 0( 9 5 % ) 4 0 . 0 ( 2 8 2 9 5 % 2 6 3 ) 4 3 . 6 ( g / L )11LiP L n ff 故该地正常人的 尿汞值 的 95% 医学参考值范围为 4 3 . 6 ( g / L ) 。 单侧上限 (一)数值变量资料的统计描述 常用的相对数 率 构成比 比 相对数应用的注意事项 率的标准化 调查得知: 甲地区的小学生中流脑发病 63例, 乙地区的小学生中流脑发病 35例。 是否甲地区较为严重? 甲地区共有小学生 50051人, 乙地区共有小学生 14338人, 甲地区流脑发病率: 乙地区流脑发病率: 635005114338351000=2.44 1000=1.26 相对数两个作用 第一,表示事物出现的频度。 第二,便于比较。 1 常用相对数 (1) 1.1 率 (rate)、速率 说明某现象发生的频率与强度: (1000 ,或 10万 /10万,等 ) 1 0 0 %( 单 位 时 间 内 ) 实 际 发 生 某 现 象 的 观 察 单 位 数率( 单 位 时 间 内 ) 可 能 发 生 某 现 象 的 观 察 单 位 数1 常用相对数 (2) 1.2 构成比 (proportion) 说明某一事物内部各组成部分所占比例。 1 0 0 %某一组成部分的观察单位数构成比同一事物各组成部分的观察单位数1231 常用相对数 (3) 1.3 比 (ratio) 说明 A 是 B的多少倍,或百分之几。 AB比相对数的例子 (1) 年度 (1) 发病人数 (2) 病死人数 (3) 病死率 (4) 构成比 (5) 1993 584 8 1.37 8.8 1994 571 10 1.75 11.0 1995 714 12 1.68 13.2 1996 748 16 2.14 17.6 1997 942 21 2.23 23.0 1998 1095 24 2.19 26.4 合计 4654 91 1.96 100.0 表 19931998年某地损伤与中毒病死率 %与构成比 % 血型 频数 (%) O 205 40.43 A 112 22.09 B 150 29.59 AB 40 7.89 合计 507 100.00 相对数的例子 (2) 表 某市 1980年和 1990年 5种传染病发病情况 疾病 1980年 1990年 病例数 (%) 病例数 (%) 痢 疾 3604 49.39 2032 37.92 肝 炎 1203 16.49 1143 21.33 流 脑 698 9.56 542 10.11 麻 疹 890 12.20 767 14.31 腮腺炎 902 12.36 875 16.33 合 计 7297 100.00
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年叠加式平衡阀行业当前发展现状及增长策略研究报告
- 2025年检验检测行业当前发展趋势与投资机遇洞察报告
- 收割小麦劳动课件
- 2025年全国道路交通安全法律法规知识考试题(附含答案)
- 2024年夏季防暑降温教育培训试题及答案
- 2025执业药师继续教育考试题库(含答案)
- 2025年实验室安全环保及突发事故紧急处理技能知识考试题与答案
- 2025年重症监护室实习生练习题试题与答案
- 2025年手足口病防治知识测试题及参考答案
- (2025年)广东省肇庆市中级会计职称经济法预测试题含答案
- 医院综合门诊部综合管理体系建设
- 2025至2030年中国SCADA行业市场运行现状及投资规划建议报告
- 2025年中医师承出师考试题库
- 2025年宜昌市猇亭区招聘化工园区专职工作人员(6人)笔试备考试题及答案详解(夺冠)
- uom无人机考试题库及答案2025
- 预防接种基础知识课件
- 护栏生产及安装方案(3篇)
- 厂区参观流程规范
- 污水厂培训课件
- 科协单位涉密管理制度
- 夏季安全生产试题及答案
评论
0/150
提交评论