1绪论(研究生)(修改).ppt_第1页
1绪论(研究生)(修改).ppt_第2页
1绪论(研究生)(修改).ppt_第3页
1绪论(研究生)(修改).ppt_第4页
1绪论(研究生)(修改).ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

流行病与卫生统计学教研室乔慧副教授,医学统计学(MedicalStatistics),学习目的和要求学习重点学习难点教学方法授课时数基本内容,教学要求:1.掌握:统计学基本概念总体与样本、变量的类型、统计工作的步骤2.熟悉:同质与变异、概率与频率的概念3.了解:医学统计学的发展史,学习重点:,1、统计学的基本概念、变量的类型2、统计工作的步骤,学习难点,总体与样本、同质与变异的概念的理解、变量类型的判断,本章教学方法,讲授法、案例法,授课时数,2学时,本章内容,目录,2.医学统计工作的基本步骤,1.统计学的基本概念,3.统计学发展简史,统计学是是认识世界的一种重要手段,是指导人们对科学探索活动进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断的科学,帮助人们揭示疾病或现象的发生、发展规律,为预防疾病、促进健康提供客观依据。医学统计学是运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。,收集数据:实验设计、调查设计(25、26、27、28章),分析数据:统计学描述(2、5、6、10章)、统计学推断(3、4、7、8、9、11、12、15章),解释数据:根据专业等解释统计结果(穿插各个章节),第一节统计学的基本概念一、变量与资料观察单位的某项特征称为变量。变量的观察结果(测得值)称为变量值或观察值资料。变量可分为以下类型:(一)计量资料:其变量值是定量的,即对每一个观察对象用定量的方法测定某项指标量的大小。有度量衡单位。,(二)计数资料:将观察单位按某种属性或类别分组,然后分类汇总各组的观察单位数后所得的资料。可分为:二项分类:两类观察结果互相对立。多项分类:结果表现为互不相容的多个属性或类别。(三)等级资料:将观察单位按某种属性的不同程度分组,分类汇总各组的观察单位数后所得的资料,但所分各组之间有等级顺序。,观察单位observations个体individuals,变量variables,Measurementdata计量资料,Enumerationdata计数资料,Rankeddata等级资料,实例数据1,血红蛋白量,正常异常,计数资料,量的多少,60(重度贫血)60(中度贫血)90(轻度贫血)120160(正常)160(增高),等级资料,变量间的转化:,(计量资料),变量转化只能由高级向低级转化,但不能做相反方向的转化,计量资料,计数资料,等级资料,提示:在研究设计中,对于能测量的指标,尽可能设计为定量指标,可为资料分析过程中资料转化带来方便。,计量资料按照观察值取值是否连续分为:1.连续型变量(continuousvariable):即连续变化的变量,其取值是数轴上某一区间内的一切数值,理论上它们是无限可分的。如身高、体重。2.离散型变量(discretevariable):其取值是0,1,2等不连续的量,是数轴上有限或无限的可数的值,两个数之间没有小数。如年新生儿数、月手术病人数、人的牙齿数等。,二、同质与变异同质是指针对被研究指标来讲,其影响因素相同。理解:同质就是指对研究指标影响较大的,可以控制的主要因素应尽可能相同(如研究方法相同,观察时间相等,以及民族、地区、年龄、性别等客观条件一致),而不能控制的因素可以忽略(营养、遗传、行为等因素)。,统计学研究的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。,同质基础上的个体差异称为变异。如一组同年龄、同性别、同民族、同地区儿童的身高值各不相同,即为身高的变异。,三、总体与样本总体:根据研究目的确定的同质观察单位的全体,确切的说,是同质的所有观察单位某种变量值的集合。样本:从总体中随机抽取部分观察单位,其实测值的集合。,总体,有限总体:有时间、空间范围的限制。,无限总体:(假设总体或虚拟总体),随机抽样randomsampling,为了保证样本的可靠性和代表性,需要采用随机的抽样方法(保证总体中每个个体具有相同的机会被抽到)。,轻松一刻!,一个著名的案例在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响统计结果的可靠性,下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件,它可以帮助我们理解为什么一个好的样本如此重要。,在1936年美国总统选举前,一份颇有名气的杂志(LiteraryDigest)的工作人员作了一次民意测验,调查兰顿(A.Landon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发放了调查表,通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜。,实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:候选人预测结果(%)选举结果(%)Roosevelt4362Landon5738,1936年电话和汽车只有少数富人拥有,抽取的样本不符合随机化原则,参数与统计量,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。,四、误差error,误差:实际观察值与客观真实值之差,1.随机误差2.非随机误差,系统误差非系统误差,1.系统误差systematicerror,在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。特点:观察值有系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。,2.随机误差randomerror,排除上述误差后尚存的误差,受多种无法控制的因素的影响。特点:大小方向不一的随机变化。随机测量误差(randommeasurementerror)提高操作者熟练程度可以减少这种误差随机抽样误差(randomsamplingerror):由抽样造成的样本统计量和总体参数间的差异。不可避免,但有一定的分布规律,可估计。,3.非系统误差(过失误差)grosserror在实验过程中由研究者偶然失误而造成的误差。,五、概率与频率概率:描述随机事件发生的可能性大小的数值,用P表示。实践证明,虽然随机事件A在一次试验或观察中可能出现也可能不出现,但在大量重复试验中却呈现出明显的统计规律性。假设在相同的条件下,独立的重复做n次试验,随机事件A在n次试验中出现了m次,则比值m/n称为随机事件A出现的频率。,实验者投掷次数出现“正面”次数频率Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005,在一定条件下,肯定发生的事件称为必然事件,肯定不发生的事件称为不可能事件,可能发生也可能不发生的事件称为随机事件或偶然事件,必然事件的概率为1,不可能事件的概率为0,随机事件的概率介于0和1之间。P0.05或P0.01称为小概率事件,表明在一次观察或实验中该事件发生的可能性很小,可以看作很可能不发生。,分析资料,搜集资料,整理资料,设计,第二节医学统计工作的基本步骤,一、设计,是否对研究对象施加干预,调查设计,实验设计,调查研究:研究者旨在客观的描述研究总体,未施加任何干预措施,目的在于了解某一事物的实际情况。,实验研究:研究者根据研究目的主动施加干预措施,控制非实验因素的干扰,观察总结其结果,并回答研究假设所提出的问题。,设计就是根据研究目的,制定总的研究方案。首先应确定研究目的和内容;确定观察对象和观察单位;需要搜集哪些原始资料;用什么方式和方法获得这些原始资料;怎样对获得的原始资料做进一步的整理汇总和计算统计指标;如何控制误差;预期会得到什么结果;需要多少经费?,二、搜集资料任务:按研究设计的要求,及时取得准确、完整的原始数据。医学统计资料的来源主要有四个方面:1)统计报表:2)经常性工作记录:3)专题调查:4)统计年鉴和统计数据专辑,统计报表:如传染病报表、职业病报表、医院工作年报表等等,可全面经常地提供居民健康状况和医疗卫生机构工作的主要数字,为拟定卫生工作计划与措施、检查与总结工作提供依据,也给科学研究提供基础资料。报表应做到完整、准确、及时。,经常性工作记录:如医院的病历、各种化验单、检测单,出生、死亡登记卡。,专题调查:实验研究、调查研究等,包括实验数据和现场调查资料。实验数据指在实验过程中获得的数据,现场调查资料来源于大规模的流行病学调查所获得的资料。,三、整理资料任务:按研究设计的要求,使原始数据净化、系统化、条理化,便于进一步计算统计指标和进行统计分析。1.检查和核对收集到的数据和资料,1)质量分组:将观察单位按某种属性或类别分组,适用于计数资料。,2)数量分组:将观察单位按变量值的大小分组,适用于计量资料。,2.设计分组,四、分析资料任务:按研究设计的要求,计算有关指标,阐明事物的内在关系和规律。,统计描述:指由统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定和描述,不涉及由样本推论总体的问题。,统计推断:指如何抽样,以及如何由样本信息推论总体特征。,统计分析,第三节统计学发展简史(一)古典统计学的起源及其演变1.记述学派或国势学派。最早使用“统计学”这一术语的是德国国势学派。国势学派虽然创造了统计学这一名词,但他们主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。代表作是近代欧洲各国国情学概论。2.政治算术学派。它起源于17世纪的英国,主要代表人物是威廉.配弟。他的代表作是政治算术。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。,(二)近代统计学时期1.数理统计学派,创始人是比利时统计学家凯特勒(AdolpheQuetelet,17961874年)。他所著的代表作社会物理学等将概率论和统计方法引入社会经济方面的研究。认为统计学是一门通用的方法论科学。从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。英国生物学家高尔顿提出并阐述了“相关”的概念;皮尔逊提出了计算复相关和偏相关的方法。戈塞特建立了“小样本理论”,即所谓的“t分布”;费歇在样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。到20世纪中期,数理统计学的基本框架已经形成。数理统计学派成为英美等国统计学界的主流。,2.社会统计学派1850年,德国的统计学家克尼斯(K.G.A.knies)发表了题为独立科学的统计学的论文,提出统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学,他主张以“国家论”作为国势学的科学命名,而以“统计学”作为“政治算术”的科学命名。在德国、日本和前苏联,社会统计学派都曾有相当大的影响。各国学者在社会经济统计指标的设定与计算、指数的编制、资料的收集与整理、统计调查的组织和实施、经济社会的数量分析和预测等方面做出的贡献已成为现代统计学的重要组成部分。例如,“恩格尔系数”,至今仍为人们广泛使用。国民收入和国内生产总值的核算方法被称为“20世纪最伟大的发明之一。”,(三)现代统计学(20世纪),统计学的主流从描述统计学转向推断统计学。20世纪30年代R费希尔的推断统计理论标志着现代数理统计学的确立。(1)数理统计学派哥塞特(18761936):首创小样本t-分布理论费希尔(18901962):提出实验设计等。,(2)社会统计学派弗拉斯卡姆波(1886)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论