基础医学]医学统计学.ppt_第1页
基础医学]医学统计学.ppt_第2页
基础医学]医学统计学.ppt_第3页
基础医学]医学统计学.ppt_第4页
基础医学]医学统计学.ppt_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学医学统计学 姜长青 首都医科大学附属北京安定医院 Date1 医学统计学 第一章 概论 第二章 集中趋势与离散趋势的统计描述 第三章 t检验 第四章 方差分析 第五章 卡方检验 第六章 非参数检验 第七章 相关与回归 Date2 第一章 概论 第一节 医学统计学的意义 第二节 医学统计工作中的内容和资料类型 第三节 医学统计中的基本概念 Date3 第一节 医学统计学的意义 统计分析是科研工作中的一种有力工具。它同 科研的总体设计、资料采集、资料整理、资料 分析直到最后作出结论都有密切关系。掌握了 这个工具可以使用较少的人力、物力和时间获 得比较可靠的结果。 只有正确运用统计分析方法,才不致于造成不 应有的缺陷或得出错误的结论。 Date4 第二节 医学统计工作中的内容和资料类型 医学统计工作的内容 资料的类型 Date5 医学统计工作中的内容 收集资料 收集资料就是根据研究的目的,实验设计的要求, 收集准确的、完整的、充满信息的原始资料。 整理资料 整理资料就是把收集到的原始资料,有目的地进行 科学加工,使资料系统化、条理化,以便进行统计 分析。 分析资料 分析资料就是把经过统计整理的资料,作一系列统 计描述和统计推断,阐明事物的规律性。 Date6 资料的类型 计量资料 是对每个观察对象的观察指标用定量方法测定该项指标 的数值大小所得的资料,一般用度量衡单位表示。 计数资料 是先将观察对象的观察指标按性质或类别进行分组,然 后计数各组该观察指标的数目所得的资料。 等级分组资料 在医学实践中,有些资料具有计数资料的特性,同时又 兼有半定量的性质,被称为按等级分组资料。 Date7 第三节 医学统计中的基本概念 变异 总体和样本 抽样 配对设计与随机区组设计 误差 概率 Date8 变 异 医学研究的对象是有机的生命体,其机能是十 分复杂的。不同的个体在相同的条件下,对外 界环境因素可以发生不同的反应。这种现象称 只为个体差异或称为变异。 由于医学统计研究的对象是有变异的事物,因 此,用观察12例的结果来推论出一般规律是 不恰当的。科学研究工作的主要任务就是要从 表现为偶然的大量数据中,分析出其中必然性 的规律。 Date9 抽 样 代表性 就是要求样本中的每一个个体必须符合总体的规定。 随机性 抽签法 机械抽样法 分层抽样 随机数字表 可靠性 指对实验的结果要有可重复性,即由科研课题的样本的结果 推论总体的结论有较大的可靠性。 可比性 如果进行两个或多个样本之间的比较,那么要求每两个样本 之间应具有可比性,也称为齐性对比原则。 Date10 配对设计与随机区组设计 完全随机设计 是将受试对象随机分配到各个处理组或对照组,或 分别从不同总体中随机抽样进行研究。 配对设计 它是将受试对象按一定条件配成对子,称为配对样 本,将它们随机分到两个组中,分别给以不同处理 。 随机区组设计 它也称为配伍组设计,是配对设计的扩展。配对设 计的每一“对子”分别随机分到两个处理中,而配伍 设计中的每个“配伍组”,包含有多个受试对象,要 将它们分别随机分到各处理组。 Date11 误 差 系统误差 在收集资料过程中,由于仪器初始状态未调到零、标准试剂 未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察 结果造成倾向性的偏大或偏小,叫做系统误差。 随机测量误差 在收集资料过程中,由于各种偶然因素的影响而造成同一对 象多次测定结果的不完全一致。这种误差往往没有固定的倾 向,有时高有时低,被称为随机测量误差。 抽样误差 个体之间存在变异,而抽样有时只能抽去总体中的一小部分 作为样本。 Date12 概 率 概率是描述某一事件发生的可能性大小的一个量度。 用A表示某一事件,P表示该事件可能发生的概率。 在一定条件下,肯定发生的事件称为必然事件,概率 为1;肯定不发生的事件称为不可能事件,概率为0; 可能发生也可能不发生的事件称为随机事件或偶然事 件,其概率介于0与1之间。 在统计学上,习惯将P0.05或P 0.01称为小概率事件 ,表示该事件发生的可能性很小。 在医学研究中,常把P 0.05作为事物差别有统计学意 义, P 0.01作为事物差别有高度统计学意义的界限. Date13 第二章 集中趋势与离散趋势的统计描述 第一节 集中趋势的描述统计 这一部分的主要内容涉及统计图表和描述平均水平 和集中趋势的统计量,目的在于有效地组织、整理 和表现统计资料的信息。 第二节 离散趋势的描述统计 衡量变异程度大小的指标有多种,但大体可以分为 两类:一类是按间距计算,有极差和四分位数间距 ;另一类则按平均差距计算,有离均差平方和、均 方差、标准差和变异系数等。 Date14 第一节 集中趋势的描述统计 频率分布 平均数 算术均数 几何均数 中位数 百分位数 Date15 频率分布 类型 频率表 直方图 用途 作为陈述资料的形式,可以代替繁复的原始资料, 便于进一步分析。 便于观察数据的分布类型。 便于发现资料中某些远离群体的特大或特小的可疑 值。 当样本含量比较大时,可用各组段的频率作为概率 的估计值。 Date16 算术均数 直接法 加权法 Date17 几何均数 通用式: 直接法: 分组法: Date18 中位数 直接法 当观察例数为奇数时: M = X(n+1)/2 当观察例数为偶数时: M = (Xn/2+Xn/2+1) 分组法 其中L、iM、fM、分别为所在组段的下限、组距和频数 ,fL为M所在组之前各组段的累积频数。 Date19 百分位数 百分位数用符号Px表示,x即百分位,所谓百分位数Px 是指在一组数据中找到这样一个值,全部观察值的x% 小于Px,而其余(100-x)%大于Px。 其中L、ix、fx、分别为Px所在组段的下限、组距和频 数,fL为Px所在组之前各组段的累积频数。 Date20 第二节 离散趋势的统计描述 极差和四分位数间距 平均偏差 离均差平方 方差 标准差 变异系数 Date21 积差和四分位数间距 积差 也称全距,即一组观察值中最大值和最小值之差, 符号为R,是变异指标中最简单的一种。 四分位数间距 将所有的观察值排序后,分成四个数目相等的段落 ,每个段落的观察值数目各占总例数的25%,去掉 两端的25%,取中间50%观察值的数值范围即为四分 位数间距。 四分位数间距用符号Q表示,它可以通过计算百分 位数P75和P25之差得到,即Q=P75-P25 Date22 平均偏差 计算各观察值偏离平均数的平均差距,为了避免正负 抵消,将每个观察值与均数之差的绝对值相加,然后 取平均,称作平均偏差,它可以表示为: 平均偏差是一个很直观的变异量度,但由于用了绝对 值,在数学上不便于继续处理,使它在应用上受到很 大限制,实际中很少使用。 Date23 离均差平方和 为了克服平均偏差使用绝对值不便进一步运算的缺点 ,可以不通过取绝对值,而是通过取平方来避免正负 抵消,即使用离均差平方和,其公式为: 它描述了每个观察值相对于集中位置“均数”的分散程 度。通过计算可化为下式: Date24 方 差 将离均差平方和再取平均,其结果称作均方差 ,简称方差。 需要注意的是,对于样本资料,在对离均差平 方和取平均时分母用n-1代替n,于是有: 式中s2为样本方差,分母n-1称为自由度。 Date25 标准差 在统计分析中为了方便,通常将方差取平方根 ,还原成与原始观察值单位相同的变异量度, 即标准差,计算公式如下: 也可写为: Date26 变异系数 在两组数据的均数相差不大,单位也相同时, 从标准差的大小就可以直接比较两个样本的变 异程度。 当均数相差较大或单位不同的几组观察值的变 异程度进行比较时,标准差就不适宜了,在这 种情况下可以使用变异系数,其计算公式为: Date27 第三章 t 检验 第一节 假设检验的意义和步骤 第二节 单个样本 t 检验 第三节 配对样本 t 检验 第四节 两独立样本 t 检验 Date28 第一节 检验假设的意义和步骤 检验假设的基本概念 检验假设是对估计的总体首先提出一个假设,然后通过样本 数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可 能不是来自这个总体;否则,很可能来自这个总体。 建立检验假设和确定检验水平 假设:无效假设(H0) / 被择假设(H1) 检验水平: 选择检验方法和统计推断分析 选择检验方法和计算检验统计量 确定P值和作出统计推断结论 Date29 第二节 单个样本 t 检验(1) 例:根据大量调查,已知健康成年男子 的脉搏均数为72次/分,某医生在某山区 随机调查30名健康男子,求得脉搏均数 为74.2次/分,标准差为6.5次/分。能否认 为该山区的成年男子的脉搏均数高于一 般成年男子的脉搏均数? Date30 第二节 单个样本 t 检验(2) 建立检验假设,确定检验水平 H0:=0 H1;0 =0.05 计算检验统计量 确定P值,做出推断结论 本例自由度v30-1=29 查附表得t0.05(29)=2.045 今t0.05, 无统计学意义 Date31 第三节 配对样本 t 检验(1) 将受试对象按某些重要特征相近的原则配成对子,每对中的两个 个体随机地给予两种处理,称为随机配对设计。 配对设计资料主要有三种情况: 两种同质受试对象分别接受两种处理; 同一受试或同一样本的两个部分,分别接受两种不同处理; 同一受试对象处理(实验或治疗)前后的结果比较。 配对设计的检验统计量为: Date32 第三节 配对样本 t 检验(2) 例:有12名接种卡介苗的儿童,八周后用两批不同的结核菌素, 一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的 前臂,问两种结核菌素的皮肤浸润反应性有无差别? 编号 标准品 新制品 差值d d2 1 12.0 10.0 2.0 4.00 2 14.5 10.0 4.5 20.25 3 15.5 12.5 3.0 9.00 . . . . . 12 10.5 9.5 1.0 1.00 合 计 39 195 Date33 第三节 配对样本 t 检验(3) 建立检验假设,确定检验水平 H0:d=0 H1;d0 =0.05 计算检验统计量 确定P值,做出推断结论 自由度v-12-1=11, t0.05(11)=2.201 t0.01(11)=3.106 本例 t t0.01(11),Pt0.05(23)=2.069,PF0.05(11,12),Pt0.05, P F0.01(2,33), P0.4921, P0.05。 按=0.05水平不能拒绝H0。 Date54 第三节 多个样本均数的多重比较 q检验法 用于对多个样本均数每两个作比较,检验统计量为: 式中 为两个对比组的样本均数,Mse是方差分 析中的误差均方(或组内均方),nA、nB为两对比组 的样本例数,e为方差分析中误差均方的自由度。 Date55 第五章 卡方检验 第一节 22表卡方检验 第二节 行列表卡方检验 第三节 配对资料卡方检验 Date56 第一节 22表卡方检验 四格表卡方检验 四格表资料卡方检验的连续性校正 四格表卡方检验的精确概率检验法(略) Date57 四个表卡方检验(1) 使用卡方检验的基本公式 卡方检验的基本公式为: 这里R是Row(行)的字头,C是Column(列)的字 头,ARC是位于R行C列交叉处的实际频数,TRC是位 于R行C列交叉处的理论频数。 nR是ARC所在的行的合计,nC是ARC所在列的合计 ,n是多个样本例数的合计。 Date58 四个表卡方检验(2) 例:某药品检验所随机抽取574名成年人,研究某抗生 素的耐药性。其中179例未曾使用该抗生素,其耐药率 为40.78%;而在395例曾使用过该药的人群中,耐药率 为45.57%,试问两种人群的耐药率是否一样? 用药史 不敏感 敏感 合计 耐药率(%) 曾服该药 180 215 395 45.57 未服该药 73 106 179 40.78 合计 253 321 574 44.08 Date59 四个表卡方检验(3) 建立检验假设 H0:两种人群对该抗生素的耐药率相同,即1=2 H1:两种人群对该抗生素的耐药率不相同,即12 计算检验统计量 查表及统计推断 20.05(1)=3.84,本例 20.05 在=0.05的检验水准下,接受H0 。 Date60 四个表卡方检验(4) 四格表资料 2检验专用公式 22表格式 B1 B2 合计 A1 a b a+b A2 c d c+d a+c b+d n=a+b+c+d Date61 四格表资料卡方检验的连续性校正(1) 在四个表资料中,当n40且某一理论值1T0.05 在=0.05的检验水准下,接受H0 。 Date64 四表格卡方检验的确切概率计算法 在四表格的卡方检验中,若遇到总例数n20.05(2) ,P0.050.017,在0.017的 水平下不拒绝H0。 Date69 多个实验组间的两两比较(3) 西药与中西药结合治疗肝炎疗效比较 组 别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中西药结合 59 15 74 79.73 合 计 110 64 174 63.22 查表20.01(1)=6.63,而220.01(1),则P 20.01(1),则P20.05(2),P 20.01(1),则P 20.01(1),则P 20.01(1),则P0.05 在=0.05的检验水准下,接受H0 。 Date78 第六章 非参数检验方法 第一节 配对资料的秩和检验 第二节 两样本比较的秩和检验 第三节 多个样本比较的秩和检验 Date79 第一节 配对资料的秩和检验(1) 一 般 步 骤 求出各对数据的差值 建立检验假设 编秩次,求秩和 依差值绝对值,从大到小排秩,并按差值的正负,标上正负 号; 编秩时,对正负号不同的差数中,若有绝对值相等时,则取 其平均秩次; 分别求正负秩次之和T+与T,并以绝对值较小者为统计量T值 。 查表,确定P值范围 当n25时,可查附表的T界值表,T越小,P越小。 当n25时,可按近似正态分布用u检验,其公式为: Date80 第一节 配对资料的秩和检验(2) 例:临床某医生研究白癜风病人的IL-6指标在白癜风部位与正常 部位有无差异,调查的资料如下: 病人号 白斑部位 正常部位 d=正常-白斑 秩次 1 40.03 88.57 48.54 6 2 91.13 88.00 -17.13 -3 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 2 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计 T+=33 T=3 Date81 第一节 配对资料的秩和检验(3) 建立检验假设 H0:差值总体的中位数为0 H1:差值总体的中位数不为0 计算统计量 首先计算每个对子的差值d ,根据8个d 的绝对值,由小到大 排秩,并根据d 的正负号给予正负号。然后分别相加正负秩次 ,得到T+=33 ,T=3,取较小者为统计量T= T=3。 查表及结论 现n=8,查T值表T0.05(8)=333,T=3恰好落在界点上,所以 P0.05,按=0.05水准拒绝H0,可认为白斑部位与正常部位的 白介素有差异。 Date82 第二节 两样本比较的秩和检验(1) 一 般 步 骤 建立检验假设 编秩号,求秩和 两样本观察值从小到大混合编秩; 设n1与n2分别为两样本的含量,规定n1159,超 出范围,P 20.05(3), Pt0.001(10),P0.001, 结果与查r值表一致。 Date93 第二节 线性回归(1) 线性回归方程的计算 其中: Date94 第二节 线性回归(1) 例:有人研究了温度对蛙的心率的影响,建立了下表 所示的资料,试进行回归分析。 对象 温

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论