医学统计学绪论ppt课件.ppt_第1页
医学统计学绪论ppt课件.ppt_第2页
医学统计学绪论ppt课件.ppt_第3页
医学统计学绪论ppt课件.ppt_第4页
医学统计学绪论ppt课件.ppt_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医 学 统 计 学,1,.,理论课(30学时) 实习课 (15学时) 考试 闭卷考试 最终成绩=平时成绩(30-40%)+考试成绩(60-70%),教学安排,2,教学内容,1.绪论 2.定量资料的统计描述 3.总体均数估计、假设检验及t检验 4.定性资料的统计描述 5.卡方检验 6.统计分析结果的正确表达,3,为什么要学习统计学?,采用统计学方法,发现不确定现象背后隐藏的规律。 相同父母所生的子女为什么身高、体重各不相同? 同一个教室里的学生学习成绩为什么各有千秋? 采用同样的药物治疗某病患者疗效为什么会有差异? 变异(variation)是社会和生物医学中的普遍现象,变异使得实验或观察的结果具有不确定性。,4,为什么要学习医学统计学?,2. 用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足导致? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。,5,为什么要学习医学统计学?,3. 保证研究论文通过统计学审查 国内1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。,6,第一章 绪 论,一、医学统计学的地位和作用 二、统计工作的基本内容和步骤 三、统计学的几个基本概念,7,第一节 医学统计学的地位和作用,8,当人们研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效? 最基本的方法:比较 患者,一组服用对照药,一组服用新药,观察疗效,然后分析该新药的有效性和安全性,9,统计学扮演什么角色? 在这个临床试验中有很多问题需要回答:,第一节 医学统计学的地位和作用,10,医学统计学的概念,Hermann ConringStatistik 1660(政府部门记录人群出生、死亡信息的工作) Statedatastatistics,11,医学统计学的概念,应用统计学的原理与方法研究生物医学领域(临床和基础医学领域)中数据的收集、整理、分析和推断的一门科学,12,第二节 医学统计学 基本内容和统计工作基本步骤,13,统计工作的步骤,设计(design) 收集资料(collection of data) 整理资料(sorting data) 分析资料(analysis of data),14,设 计(Design),根据研究目的,对某项医学研究工作的全过程(资料收集、整理和分析)所作的总的设想和安排; 是统计工作的第一步和最关键的一步。,15,一个常见和普遍的误解认为: “统计”就是分析数据,第二节 医学统计学基本内容和统计工作基本步骤,16,第二节 医学统计学基本内容和统计工作基本步骤,“做完实验后才找统计学家无异于请他作尸体解剖,他能做的全部事情就是告诉你这实验死于什么原因”。,Fisher,17,没有科学严谨的统计设计,数据的收集以及分析常常是没有价值的。 对于不准确或不可靠的数据,统计分析所得出的结论常常是站不住脚的,甚至是误导的。,第二节 医学统计学基本内容和统计工作基本步骤,18,任务:遵循统计学原理,按照设计要求,采取必要措施得到准确可靠的原始资料。 原则:及时、准确、完整。,收集资料,19,整理资料,编码,将数据输入计算机 纠错改错、补漏等 根据研究目的将原始数据进行归纳、分组或计算,20,对于不同研究设计所获得的数据,采用的统计分析方法常常是不同的,而且所得研究结论也存在差异。,21,第二节 医学统计学基本内容和统计工作基本步骤,统计分析,统计描述 (statistical description),统计推断 (statistical inference),参数估计,假设检验,22,23,第三节 统计学的若干基本概念,24,1、变量与资料 2、同质与变异 3、总体与样本 4、参数与统计量 5、频率与概率 6、误差,25,1.变量与资料(Variable and Data),变量:观测单位的某种特征或属性 观察单位:亦称个体(人、动物、家庭、地区、样品、采样点) 变量值(资料):变量的观察结果,可以是定量的,也可以是定性的。 例:三岁儿童身高、性别 根据变量值的获取方法把变量进行分类: 定量变量和定性变量。,26,定量变量,数值变量或计量数据。 定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。 特点: 有度量衡单位; 举例:调查某地某年七岁女童的身体发育状况。 每个人的身高(cm)、体重(kg)、脉搏(次/分)、血压(kPa)、坐高指数(%,坐高/身高)等均属定量变量。,27,离散型变量:变量取值可以一一列举的资料 例:家庭人口数,脉搏数 连续型变量:变量取值不能一一列举的资料(变量取值为一定范围内的任意值) 例:人体的身高、体重、总胆固醇,定量变量的类型,28,定性变量(分类资料),定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 特点:没有度量衡单位, 多为间断性变量(通过枚举或记数得来) 分为无序分类变量和有序分类变量(等级变量)。,29,阴性和阳性 男和女 生与死 ,二分类变量,血型: A、B、O、AB 职业:教师、医生、工人,多分类变量,无序分类变量:类与类之间无程度 大小的差别,30,有序分类变量(等级变量),类与类之间有程度大小的差别: 疗效:治愈、好转、无效; 尿蛋白:(、) 文化程度:小学及以下、中学、大专、本科及以上,31,Quantitative data 定量变量,Categorical data 定性变量,实例数据1,32,实例数据2,33,变量与变量值,34,各类变量互相转化,35,*:1为Hg升高,2为正常,3为贫血;*:0为正常,1为异常,36,资料类型间关系,例:一组2040岁成年人的血压,分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,定量变量,等级变量,二项分类变量,37,定量变量:直接录入原始数据。 定性变量:需进行编码(仅为一个数字代码,并无实际意义)后方可录入,否则不便于进一步运算。 性别: 女(1),男(2); 血型: A(1), B(2), AB(3), O(4) 化验结果 :-(1),+(2),+(3),+(4),变量的编码,38,连续型变量:如:身高,体重,离散型变量:如家庭人口数,脉搏数,39,2. 同质与变异 homogeneity and variation,一个总体中有许多个体,他们之所以汇集起来共同成为人们研究的对象,必定存在共性。我们说些个体处于同一总体,就是指他们大同小异,具有同质性。即具有相同的背景、条件、属性等。,40,在统计学中可以把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。 例如研究儿童的身高时,要求影响身高较大的、易控制的因素如性别、年龄、民族、地区要相同,而不易控制的遗传、营养等影响因素可以忽略。,41,然而,同一总体内的各观察单位间存在差异又是绝对的,这种现象称为变异。 如同性别、同年龄、同民族、同地区健康儿童的身高、体重不尽相同;相同病种、病程的病人,使用同一疗法,却未必有相同疗效。这些不同就是变异。 “医学统计学是处理医学资料中的同质性和变异性的科学与艺术”。,42,变异示例,在研究事物的颜色时,在研究相同事物的形状时,43,变异示例,44,3、总体与样本,举例:2015年福州市12岁健康女孩的身高情况,45,总体:是根据研究目的所确定的同质观察对象的全体,或者说所有同质的某指标实测值的集合。,样本:根据随机化的原则从总体中抽取有代表性的部分观察单位,其变量实测值构成样本。,3、总体与样本,46,有限总体,定义:总体是假想的,没有时间和空间限制,观察单位数无限。,总 体,定义:限定于特定的时间与空间范围之内的有限个观察单位。,无限总体,举例:福建医科大学2015年大学生的血压值,举例:高血压患者使用卡托普利后的血压值,Finite Population,Infinite Population,3、总体与样本,47,样本含量:样本所包含个体或个体值的个数。,List of Individuals 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17,单纯随机抽样,3、总体与样本,48,研究总体中的个体往往很多,甚至无限多。一个不漏地观察其中的所有个体常常不可能;有时即使可能,也没有必要。 科学的办法是从总体中抽取一部分有代表性的个体,这一过程称为抽样(sampling);从总体中随机抽取的部分观察单位,称为样本(sample) 。,49,总体与样本的关系:,统计的作用是用较少的投入揭示随机现象的规律性。,50,既然是由部分推断全体,统计学的结论从来就不是完全肯定或完全否定的。 能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术,这些是统计学的核心内容。,51,4.参数和统计量*,总体参数 Parameter 总体、唯一性、稳定性、未知(不可知) 统计量 Statistic样本、不唯一、可变性、可知 通常用希腊字母表示参数; 用拉丁文字母表示统计量 统计学通常用统计量估计参数(参数估计),52,5.频率和概率,频率 Frequency : 称f为事件A在这n次试验中出现的频率,53,频率和概率,抛硬币试验在概率的统计学定义上的诠释,54,频率和概率,概率的统计学定义:当观察次数n越来越大,频率f的波动幅度越来越小,并最终趋向于一个常数p随机事件A发生的概率 (Probability)。 概率描述了随机事件发生的可能性的大小,是一种参数;频率作为概率的估计值,是统计量 0P 1 P=1 必然事件 P=0 不可能事件,55,小概率事件,小概率事件 概率小于等于0.05的事件(医学) 小概率原理 在某一次试验中,由于其发生的可能性十分小,近似认为是不会发生的,56,频率与概率间的关系,概率是参数,频率是统计量; 频率总是围绕概率上下波动; 观察单位(实验次数)越多,频率越接近概率。可将频率作为概率的估计值。反之用频率估计概率是不可靠的。,57,并非每一位吸烟患者都会患肺癌,忠实的烟民们还振振有辞地举出若干吸烟有利长寿的反例来:,林彪不抽烟不喝酒只活了63岁; 周恩来只喝酒不抽烟,活了73岁; 毛泽东只抽烟不喝酒,活了83岁; 邓小平既抽烟又喝酒,活了93岁; 张学良吃喝嫖赌抽,活了103岁 现在还不抽烟不喝酒的同志们,要汲取历史上沉教训啊!,如何反驳?,58,6.误差,误差 error:实际观察值与真实值之差 误差分类:,误差 error,59,随机误差,无法控制的因素、不可避免、大小方向不一的随机变化、一定范围内 随机测量误差random measurement error:提高操作者熟练程度、增加重复次数取均值可以减少这种误差 随机抽样误差 random sampling error:可通过增加样本含量使之减小,60,系统误差,非随机(由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成)、一定倾向性(机械性、系统性、周期性)、又称为偏倚(bias) 理论上可以通过严格的实验设计和技术措施消除,61,过失误差,非随机(由于研究者失误而造成)、不具有系统性、方向性、周期性等系统误差的特征 必须通过严格的实验设计和技术措施消除,62,第四节 统计思维的培养和本门内容的安排,63,第四节 统计思维的培养和本书内容的安排,医学生学习统计学,并非要成为医学统计学的专业人员,其目的是: 培养统计思维 掌握基本的统计设计方法和收集准确可靠的数据 运用基本统计分析方法来正确分析数据 了解操作统计软件的技能 正确解释和表达分析结果,2,统计思维的培养,64,五、小 结,1.统计工作的基本步骤。 2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论