




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学方法的基本概念和基本步骤,2,医学统计学的学习要求:,理解基本的统计原理 正确选择、运用统计分析方法 培养基本的统计思维能力,不要求: 公式的推导和记忆、 复杂的手工计算,内容:,1、 医学统计学方法的基本概念和基本步骤 2、 数值变量的统计描述 3、 数值变量的统计推断 4、 分类变量的统计描述 5、 分类资料的统计推断 6、 秩和检验 7、 直线相关与回归分析 8、 统计表和统计图,本节主要内容,第一节 统计学的几个基本概念 第二节 医学统计工作的基本步骤,一、什么是医学统计学?,例1:比较两种疗法对活动期十二指肠球部溃疡 一组:口服呋喃硝铵,有效率90%; 另一组:口服西咪替丁
2、,有效率85% 问:能否立即下结论,呋喃硝铵疗效高于西咪替丁?,医学统计学:应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的一门应用性学科。 指导人们如何对科研问题进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断的科学,帮助揭示疾病或现象的发生、发展规律,为预防疾病、促进健康提供客观依据。,二、为什么要学统计学?,1. 采用统计学方法,发现不确定现象背后隐藏的规律。 变异(variation):是社会和医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。,2.用统计学思维方式考虑有关医学研究中的问题 “阳性”结果
3、是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。,3. 保证你的研究论文能通过统计学审查 据国外6080年代对不同医学杂志发表论文的调查结果显示,有统计错误的论文所占比例高达72%,最低也有20%。 某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用55.7%。,第一节 统计学的几个基本概念,同质:是指除了实验因素外,影响被研究指标的
4、非实验因素相同。即研究对象的性质相同。 变异:是指在同质的基础上,被观察个体之间观察指标的差异。,同质和变异,homogeneity and variation,例1 调查2007年上海市7岁男童的身高和体重 同质:2007年、上海市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同,一、同质和变异,二、总体和样本,总体:是指根据研究目的确定的性质相同的观察单位的全体。 更确切地说,是同质的所有观察单位某项观察值(变量值)的集合。,population and sample,总体和样本,研究目的,总 体,该地2002年全部正常成人的
5、白细胞数,观察单位,每个正常成人,变 量 值,每人测得的白细胞数,研究某地2002年正常成人白细胞数,同质基础:同一地区、同一年份、同为正常人、,有 限 总 体,例如:研究用珍菊降压片高血压患者治疗后的疗效 同质基础:同为高血压患者、同用珍菊降压片治疗 总体:包括设想用该药治疗的所有高血压患者的治疗效果 这个结果没有时间和空间的限制,观察单位数无限,无限总体,无限总体,有限总体:总体中所包含的个体数目是可以掌握的,有空间、时间的限制。 无限总体:没有具体的空间、时间的限制,所包含的个体数目是未知的。(设想的、或抽象的),有限总体和无限总体,调查某地2002年正常成人的白细胞数 总体 从某地20
6、02年正常成人随机抽取150人,分别测其白细胞数,组成样本。 样本,总体,样本,抽取部分观察单位,统计量,参 数,推断inference,样本: 是从总体中随机抽取的具有代表性的一部分观察单位其某项指标的实测值的集合。 抽样(sampling):从总体中抽取部分个体的过程。,如何正确地由样本反映总体呢?,抽样时必须遵循随机化原则,随机性: 总体中每个个体都有相同的机会被抽取到样本 随机不等于随意 随机抽样的实现:随机数字表,三、参数和统计量,parameter and statistic,参数: 根据总体个体值计算出来的描述总体特征的的指标 希腊字母表示:如总体均数、总体标准差、总体率等。 是
7、固定的常数 但一般未知。 普查,统计量: 根据样本个体值计算出来描述样本特征的指标 拉丁字母表示:如样本均数、样本率p等。 在参数附近随机波动。 抽样调查,由于抽样所引起的样本统计量与总体参数之间的差异称为抽样误差。 产生的原因: 1.个体之间存在变异 2.抽样时只能抽取总体中的一部分作为样本 不可避免 但有一定的分布规律,可估计;并在一定范围内控制抽样误差,四、抽样误差( random sampling error):,概率( probability ):是反映某一随机事件发生的可能性大小的一个量度。 记为P,取值0,1。 必然事件:P1 不可能事件:P0 随机事件:0P1,五、概率(pro
8、bability ),P0.05或P0.01的随机事件称为小概率事件 统计学上认为1次抽样中不大可能发生。,Certain,Impossible,0.5,0,1,第二节 统计数据的类型,实验或调查研究中的观察指标称为随机变量(random variable); 变量的观测值称为变量值(variable value)或观察值(observed value) 由变量值构成资料(data),根据变量值是否定量可分为 数值变量(numerical variable):计量资料 分类变量(categorical variable): 无序分类变量(unordered categorical variab
9、le ) 计数资料 有序分类变量(ordinal categorical variable ) 等级资料,26,1. 计量资料(measurement data): 定义:用定量方法对观察单位准确测量后所得的资料。 变量值是定量的,表现为数值大小 ,多有度量衡单位。 特点: 有度量衡单位 多为连续性资料 例如:身高(cm)、体重(kg) 血压(mmHg)、脉搏(次/分) 红细胞计数(1012/L),27,2.无序分类变量 (计数资料) 定义:用定性的方法得到的资料。 按观察单位某种性质或特征分组后,再分别清点各组观察单位的个数 特点:没有度量衡单位 多为间断性资料 变量表现为互不相容的类别或属
10、性 例如:肤色(黑、白)二项分类 血型(ABO)多项分类 职业(工农兵)多项分类 性别(男女) 二项分类,3.等级资料 (ranked data) 定义:将观察单位按某种属性的不同程度分成等级后分组计数所得的资料。 是介于计量资料和计数资料之间的一种资料 特点:其变量值具有半定量性质 表现为等级大小或属性程度 例如: 癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。 尿蛋白: ,+,+及以上,实例数据1,4. 三类资料间关系,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压
11、,计量 资料,等级资料,计数 资料,第三节 医学统计学的基本步骤,1. 设 计:包括观察性研究设计和实验性 研究设计 2. 收集资料:取得准确可靠的原始资料 3. 整理资料:对资料进行清理、改错,数量化 4. 分析资料:统计描述、统计推断,定义:是在保证科学性、可重复性和高效性的前提下,为验证研究假说而制定周密的医学研究计划。 在广泛的查阅文献、全面了解现状、广泛征询意见的基础上,对将要进行的研究工作所作的全面的设想。,1、设计(design),1、设计(design)的分类: 调查设计(survey design):对研究对象不施加任何干预,通常建立随机抽样(random sampling)
12、方案。 搜集资料在整个研究设计中占主要地位. 实验设计(experiment design):对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(random allocation)方案。,2、设计(design)的内容 (1)明确研究目的和研究假说。 (2)确定研究对象与观察单位、样本含量和抽样方法。 (3)是否施加干预,如何施加干预?如何设置对照? (4)设置观察指标。 (5)需搜集哪些原始资料,用什么方法 ? (6)如何对取得资料作进一步的整理和汇总,计算统计 指标。 (7)如何控制误差。 (8)预期会得到什么结果。 (9)研究进度和经费的安排等。,Fisher 在他的著作中
13、多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。 “试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。 统计学家或许只能告诉你试验失败的原因。”,2、收集资料(data collection),资料的来源: 1、统计报表:疫情报表、医院工作报表等; 2、登记和报告卡(单):传染病和职业病发病报告卡,肿瘤发病及死亡报告卡,出生及死亡报告单等; 3、日常医疗卫生工作记录:如门诊病例、住院病例、健康检查记录、卫生监测记录等 4、专题调查或实验研究:开展医学科研的主要资料来源前三种都有局限性。,资料收集计划 选择搜集资料的地点、人员和时间; 搜集资料人
14、员的培训方案; 预调查或预实验方案拟定; 资料的记录方式; 调查表的拟订和印刷; 调查或实验仪器、试剂的准备; 调查资料的抽样复核比例和方法; 搜集资料所需经费的准备等。,目的是对搜集到的原始资料其系统化和条理化,便于进一步计算统计指标和深入分析。 资料整理前要对资料再次检查与核对,发现缺项或错项较多的调查表,须补查或剔除。审查无误后,设计分组。,3、整理资料(data sorting),资料整理的过程,1、对原始数据进行核对和检查。 2、设计分组。 (1)质量分组:按属性或类别归类分组; (2)数量分组:按数值大小分组。 3、按分组要求设计整理表,汇总资料。,可借助于计算机软件(EpiDat
15、a, Study -Builder, Excel)来完成。 1、编码,将数据输入计算机 2、纠错改错、补漏等,运用统计学的基本原理和方法,根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计分析方法,进行一系列的统计描述和统计推断,揭示事物内部的规律。 可借助于计算机(常用软件:SPSS、SAS、STATA)完成。,4、分析资料(data analysis),4、分析资料(data analysis),统计描述(descriptive statistics) 是指用统计指标和适宜的统计图、统计表等方法,描述统计资料的分布规律及其数量特征。 统计推断(inferential statis
16、tics) 是通过随机样本信息推断总体特征的过程。 参数估计(parameter estimation) 假设检验(hypothesis test),常用统计分析软件简介,一、SPSS(PASW)软件: 二、SAS软件:统计专业用户 三、STATA软件:分析能力强,速度极快! 图形精美 四、EPI INFO:流行病学调查得数据管理软件。,SPSS软件,美国斯坦福大学研制,目前已被IBM兼并。最新版本19.0. 特点:界面友好、使用方便、功能齐全。,小结:,1.医学统计工作的基本步骤是 A .调查、搜集资料、整理资料、分析资料 B .统计资料收集、整理资料、统计描述、统计推断 C .设计、搜集资料、整理资料、分析资料 D .调查、统计描述、统计推断、统计图表 E. 设计、统计描述、统计推断、统计图表,C,2.抽样误差是指 A. 不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.由于抽样产生的观测值之间的差别 D.样本中每个个体之间的差别 E.随机测量误差与过失误差的总称,B,3.概率是描述某随机事件发生可能性大小的数值,以下对概率的描述哪项是错误的 A. 其值的大小在0和1之间 B.当样本含量n充分大时,我们有理由将频率近似为概率 C.随机事件发生的概率小于0.05或0.01时,可认为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 弹簧工程师岗位面试问题及答案
- 危机响应指挥官岗位面试问题及答案
- 2025届宁夏银川市兴庆区长庆高级中学高二化学第二学期期末调研试题含解析
- 华为集团干部管理办法
- 园区转租房屋管理办法
- 公务接待管理办法清远
- 国企车辆购置管理办法
- 团体标准管理办法释义
- 古典美学在现代小说中的体现
- 公司本部薪酬管理办法
- 安徽青硕建设有限公司招聘笔试真题2024
- 中药学电子版教材
- 第五版-FMEA-新版FMEA【第五版】
- 火龙罐综合灸技术课件
- 退役军人事务系统公考综合基础知识考试能力测试(含答案)
- LS/T 3244-2015全麦粉
- GB/T 6414-2017铸件尺寸公差、几何公差与机械加工余量
- GB/T 20957.4-2007精密加工中心检验条件第4部分:线性和回转轴线的定位精度和重复定位精度检验
- 电缆桥架施工图集
- 信念的力量课件
- 接力初三赢在暑假-八年级下学期期末家长会课件
评论
0/150
提交评论