版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学,华北理工大学附属医院,评审办 陈 超,医学统计学的用途 指导人们如何对科研问题进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断,帮助揭示疾病或现象的发生、发展规律,为预防疾病、促进健康提供客观依据。 在卫生决策制定、基金申请、药物开发、科研论文 撰写与审稿等方面,都需要应用到统计学的知识。,(一) 研究设计(experiment design) (二) 收集资料(collecting data) (三) 整理资料(sorting data) (四) 分析资料(analyzing data),第二节 医学统计工作的基本步骤,6,(一)研究设计,定义:是在保证科学性、可重复性
2、和高效性的前提下,为验证研究假说而制定周密的医学研究计划。是对资料收集、整理和分析全过程的总设想和安排。 实验设计是整个工作中最重要的环节。,过程:按研究设计的要求,及时取得准确、完整的原始数据。,医学统计资料的来源主要有三个方面: 1)统计报表:如传染病报表、职业病报表、医院工作 年报表等,报表应做到完整、准确、及时。 2)工作记录:如医院的病案首页,各种化验 单,检测单,出生、死亡登记卡。 3)专项调查表:实验研究,调查研究等。,(二)收集资料,1、资料的逻辑检查 2、一致性检查 3、原始数据的加工,原始资料,分析资料,(三)整理资料 过程:按研究设计的要求,使原始数据系统化、条理化, 便
3、于进一步计算统计指标和进行统计分析。,表1 数据的Excel输入格式(原始记录),表2 数据的Excel输入格式(数据整理),过程:按研究设计的要求,计算有关指标, 阐明事物的内在关系和规律。,(四)分析资料,一、同质与变异 二、总体与样本 三、抽样 四、误差 五、概率 六、参数与统计量,第三节 医学统计学的基本概念,同质(homogeneity)是针对被研究指标来讲,其影响因素相同。简单地理解同质就是指对研究指标影响较大的,可以控制的主要因素应尽可能相同。如研究方法相同,观察时间相等,以及民族、地区、年龄、性别等客观条件一致。 同质基础上的个体差异称为变异(variation)。,一、同质(
4、homogeneity)与变异(variance),同质与变异的例子,例 调查2014年唐山市7岁男童身高和体重 同质因素:2014年、唐山市、7岁男童 变异因素:身高和体重各不相同,二、总体(population)和样本(sample),总体:根据研究目的确定的同质个体所构成的全体。,例如:研究唐山市区居民的健康状况,则所有唐山市区居民就构成一个总体。,样本:从总体中随机抽取具有代表性的部分个体。,三、抽样(sampling),抽样(sampling):从总体中抽取部分个体的过程。 抽样时必须遵循随机化原则,即总体中每个个体都有相同的机会被抽取为样本 。,医学统计中常用的抽样方法: 单纯随机
5、抽样 先对总体中全部观察单位编号,然后用抽签、随机数字表或计算机产生随机数字等方法从中抽取一部分观察单位组成样本。 系统抽样 如要在1000名新生中抽取200人,其抽样间隔为1000/200=5, 若随机抽取的第一号为2,则抽取的个体号依次为2、7、12、17、22、27 分层抽样 一项研究欲调查某农村妇女下生殖道感染情况,可按乡镇分层(好、中、差三层),在各层中再进行随机抽样。 整群抽样 ,四、误差(error),误差,系统误差,随机误差,随机测量误差,抽样误差,泛指观测值与真实值,以及样本指标与总体指标之间的差值。,系统误差与随机误差之间的关系,五、概率(probability) ,描述某
6、一事件发生的可能性大小的一个量度。 概率的范围在0与1之间。 当某事件不可能发生时,概率为0;必然发生时概率为1。 小概率事件:在统计学上,习惯将P0.05或P 0.01称为小概率事件,表示该事件在一次抽样(试验中)发生的可能性很小,几乎为零。 常以P 0.05作为差异有统计学意义; P0.01作为差异有高度统计意义的界限。,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。,总体参数是固定的常数,统计量是在总体参数 附近波动的随机变量。,六、参数与统计量 paramet
7、er and statistic,第四节 医学统计学的资料类型,对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般有度量衡单位。 身高值 (m) :1.65,1.70 1.58 . 住院天数(天): 15,18,10. 脉搏数(次/分):72,66,80 .,(一)计量资料 (定量资料、测量资料),二项分类资料: 性别:男、女; 疗效:有效、无效 各种检验结果:阴性、阳性; 多项分类资料: 血 型:A、B、AB、 O; 婚姻状况:未婚、已婚、离婚、丧偶。,(二)计数资料 (定性资料),有些资料具有计数资料的特性,同时兼有半定量的性质。 尿蛋白: - + + + ; 问卷调查常对某
8、事情的满意程度: 极不满意 有点满意 中度满意 很满意 极满意。,(三)等级分组资料,Quantitative data 计量资料,Qualitative data 计数资料,一组20-40岁成人的血压值 8.2 7.6 9.4 10.5 11.5 13.0 18 17 19 21 13.6 ,以12kPa为界限分为正常与异常两组,分别统计两组的例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,计量资料,计数资料,等级资料,要注意只能由高级向低级转化。,比较差别:2、t、F、q、log-rank 、 秩和检验等 联系:相关、回归分析 分类:回归分析、判别分析
9、 推测:回归分析 筛选影响因素:回归分析 综合变量信息:主成分分析 寻找潜在支配因素:因子分析,假设 检验 方法,常用的统计学方法,统计分析常用软件 SPSS (可视化便于操作,鼠标操作,易入门) SAS (Statistical Analysis System,需编程基础) Stata R (方法新、提供源程序、免费),假设检验基本思想:,小概率反证法思想。 小概率思想是指小概率事件(P0.01或P0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。,假设检
10、验的基本步骤,第一步:提出检验假设(又称无效假设null hypothesis, H0)和备择假设(alternative hypothesis, H1)。 H0:假设两总体均数相等,即样本与总体或样本与样本间的差异是由抽样误差引起的。 H1:假设两总体均数不相等,即两样本与总体或样本与样本间存在本质差异。 预先设定的检验水准(size of test )为0.05。 选择单双侧检验,第二步:选定统计方法,计算出统计量的大小。 根据资料的类型和特点,可分别选用t检验,则计算t值,u检验则计算u值, 或其他检验方法:秩和检验和卡 方检验等。 第三步:根据统计量的大小及其分布确定检验假设成立的可能
11、性P值的大小并判断结果。 p值指:在由H0所规定的总体中做随机抽样时,获得等于及大于(或等于及小于)现有统计量的概率。,若P值小于预先设定的检验水准,即P0.05 , 则H0成立的可能性小,即拒绝H0; 若P值不小于预先设定的检验水准,即P0.05,则H0成立的可能性还不小,还不能拒绝H0。 P值的大小一般可通过查阅相应的界值表得到,一、t检验,条件: 1.相互独立的随机样本; 2.样本来自正态分布的总体; 3.两总体方差相等-齐(两样本均数比较时)。 用一句话来概括就是:独立、正态、方差齐,同样适用于方差分析 用途 1.一个未知总体均数与已知总体均数比较。 2.两个未知总体均数的比较。 类型
12、 配对t检验(配对资料或自身对照的比较) 成组t检验(两组独立样本t检验) 不满足正态分布或方差不齐:采用t检验或Wilcoxon秩和检验,例 用两种方法测定12份血清样品中Mg2+(mmol/L)的结果见表5-2,试问两种方法测定结果有无差异?,适用于配对t检验的资料,适用于独立样本t检验的资料,例 分别测得15名健康人和13名度肺气肿患者痰中1抗胰蛋白酶含量(g/L)如表5-3所示,问健康人与度肺气肿患者1抗胰蛋白酶含量是否不同?,二、方差分析,应用条件 与t检验相同,要求样本独立、正态、方差齐性。 用途 用于分析比较多组均数间的差别 类型 1.完全随机设计的方差分析 2.随机区组设计的方
13、差分析 3.析因设计的方差分析 4.拉丁方设计的方差分析 5.重复测量资料的方差分析,完全随机设计 服从正态分布、方差齐性 完全随机设计方差分析 两两比较:LSD、 SNK-q 、Dunnett-t检验 不服从正态分布或方差不齐性 多个独立样本比较 Kruskal-Wallis H 检验 两两比较:Nemenyi 检验,例 为了比较三种不同护理带教方式的效果,将150名实习护士随机分成三组,每组50人,甲组为传统带教法,乙组为标准化病人法,丙组为临床路径法。带教结束后进行综合考核并打分,结果见下表,请比较三种护理带教方式的效果是否不同? 表 三种不同带教方式护理考核结果的比较(分),三、 2检
14、验,适用于构成比、率等资料间的比较 包括:四格表的2检验 配对四格表的2检验 四格表的Fisher确切概率法 行乘列表的2检验 多个样本率间的多重比较 有序分组资料的线性趋势检验,(1)两组完全随机设计 N 40 且 T 5 Pearson 2 检验 N 40 但 5 T 1 Pearson 2 检验 (Yates 校正公式) N 40 或 T 1 Fisher 确切概率法 (2)配对设计 McNemar 2 检验,独立设计四格表的2检验 例 将23名精神抑郁症患者随机分到两组,分别用两种药物治疗,结果见下表,问两种药物的治疗效果是否不同。,表 两种药物治疗精神抑郁症的效果,配对设计四格表的2检验 例 某医生现有90份胃肠消化病患者的标本,把每份标本分成两份,分别用细菌培养法和快速脲酶试验诊断患者幽门螺杆菌的感染情况,结果如表9-5所示,问两种方法的检测结果有无差别?,四、相关与回归,直线相关分析 医学研究中存在着许多相互联系的现象。如年龄与血压、药物剂量与效果等,可以利用相关与回归来分析。 多变量资料的回归分析 包括:多重线性回归(用于分析一个应变量Y与多个自变量X的线性关系) Logistic回归(Y为二分类或多分类变量,以分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国化工新材料市场分析及竞争策略研究报告
- 中国会展行业融资渠道与资本运作模式报告
- 中国会展营销创新与客户体验优化研究报告
- 中国会展私域流量构建与转化效率研究报告
- 环境监测实验室管理规范-质量监督制度
- 安贞医院影像技术2025招聘笔试高频考题及答案详解
- 2026初级运维面试题及答案
- 2026升职面试题目及答案
- 2025-2026学年植树问题例题1教学设计
- 2025-2026学年血糖平衡调节教案
- 2026年中学新团员入团测试题及答案
- (一模)东北三省三校2026年高三第一次联合模拟考试语文试卷(含答案详解)
- 2026河南郑州建设集团所属公司社会招聘工作人员44名笔试备考题库及答案解析
- 2026辽宁大连理工大学后勤处自聘管理岗位招聘2人笔试备考题库及答案解析
- 2026年吉安职业技术学院单招综合素质考试题库含答案详解
- 2026年春五年级下册数学教学计划(附教学进度表)
- 薄抹灰施工方案
- 2025年青岛农商银行春招笔试及答案
- 雨课堂学堂在线学堂云《船》单元测试考核答案
- 大学生创新创业基础(创新创业课程)完整全套教学课件
- 瑞幸CMO杨飞:互联网营销的流量池思维PP课件
评论
0/150
提交评论