《医学统计学》教学课件-绪论_第1页
《医学统计学》教学课件-绪论_第2页
《医学统计学》教学课件-绪论_第3页
《医学统计学》教学课件-绪论_第4页
《医学统计学》教学课件-绪论_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

预防教研室黄品贤,医学统计学MedicalStatistics,学习目的,明确医学统计学的基本概念、基本思想、主要内容、特点与作用,激发学习兴趣,树立学好医学统计学的信心。,学习要点,医学统计学的概念,同质与变异、总体与样本、参数与统计量、抽样研究与抽样误差、小概率事件等基本概念,资料类型,统计工作的基本步骤。,北京某医院某医生使用乌贝散治疗胃溃疡出血107例,101例有效,有效率为94.4。那么其它医生使用该药,有效率会是多少呢?,案例1,医学研究中有关统计学的常见问题,(90.0498.76),随机抽取5059岁男性正常人、糖尿病患者各11人,测定其血浆胆固醇含量分别为3.200.70(mmol/L)、5.351.19(mmol/L),问两组人的血浆胆固醇有无差别?为什么?,案例2,t5.136p0.01,P=0.061,案例3,问:甲校高血压预防工作不如乙校吗?,案例4,问:流脑的预防工作1990年不如1985年吗?,案例5,当人类科学家在探索问题的丛林中遇到难以逾越的障碍时,唯有统计学工具可以为其开辟一条前进的通道。法兰西斯.高而顿,国内著名的经济学家、人口学家马寅初:,学者不能离开统计学而研学;政治家不能离开统计学而施政;事业家不能离开统计学而执业;军事家不能离开统计学而谋略。,“医学统计学是国内外临床医学专业的一门重要的基础学科,是21世纪临床医生在从事临床工作和科学研究过程中必须掌握和了解的基本知识,统计学方法被医学界比喻为整个医学大厦中的支柱”。,学习方法:理解课堂讲授内容通过课后练习题加以巩固通过实际工作中文献资料的阅读、统计方法的运用进一步理解医学统计学的精髓。,成绩评定:平时成绩:20(考勤、作业)考试成绩:80(上机考试),14,参考书:1.申杰主编.中医统计学(第二版).科学出版社,20122.马斌荣主编医学统计学人民卫生出版社,20063.颜虹主编医学统计学人民卫生出版社,20064.张文彤主编SPSS统计分析基础教程高等教育出版社,20045.张文彤主编SPSS统计分析高级教程高等教育出版社,20046.方积乾主编医学统计学与电脑实验上海科学技术出版社,2001,15,医学统计学主要讲授内容,第一章绪论第二章计量资料的统计描述第三章总体均数的估计与假设检验第四章t检验第五章方差分析第六章相关与回归第七章计数资料的统计描述第八章计数资料的统计推断第九章非参数检验第十章圆形分布资料的分析第十一章统计表与统计图第十二章医学研究设计基础,第一章绪论,第一节概述第二节统计学的几个基本概念第三节资料类型第四节医学统计工作的基本步骤第五节医学统计学的作用与学习方法,第一节概述,Statistics:“asciencedealingwiththecollection,analysis,interpretationandpresentationofmassesofnumericaldata”-Webster国际大辞典,统计学是对令人困惑费解的数字问题做出设想的艺术。-DavidFreedman,一、医学统计学的概念,统计学(statistics)是研究随机现象数量规律性的应用数学,是从随机现象数据中提取信息、知识的一门科学与艺术,是一门方法性学科。它分为理论统计学和应用统计学两大类。理论统计学(theoreticalstatistics)应用统计学(appliedstatistics),一、医学统计学的概念,理论统计学(theoreticalstatistics)即数理统计学(mathematicalstatistics)是以概率论为基础,从纯理论的角度,对统计方法加以推导论证,中心的内容是统计推断问题,实质是以归纳方法研究随机现象的一般规律。,一、医学统计学的概念,应用统计学(appliedstatistics)是数理统计学的原理方法在不同学科领域的具体应用。如:数理统计学在生物学中的应用形成了生物统计学(biostatistics);在医学中的应用形成医学统计学(medicalstatistics)、卫生统计学(healthstatistics)和中医药统计学(statisticsfortraditionalchinesemedicine)等。,医学统计学是研究医学领域中随机现象客观规律的一门方法性学科,它运用数理统计学的基本原理与方法,结合医学实际,阐述医学领域研究设计、收集资料、整理资料、分析资料、结果报告与结论表达。它属于应用统计学,是医学科学研究的重要工具与手段。,一、医学统计学的概念,二、统计学的发展简史,人类由统计实践上升到统计学,却只有300多年的历史17世纪中叶至18世纪初期为古典统计学的发展时期18世纪后叶至20世纪初期为近代统计学的发展时期20世纪初期至今为现代统计学的发展时期,二、统计学的发展简史,现代统计学的发展趋势:随着数学的发展,统计学依赖和吸收的数学方法越来越多;统计方法与计算机技术相结合,已渗透到了所有学科部门,以统计学为基础的边缘学科不断形成;统计与实质性学科、统计软件、现代信息相结合,所发挥的功效日益增强;统计学的作用与功能已从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展,已成为具有方法论性质的综合性学科。,三、统计学的研究对象,具有变异的事物(现象),其变异为同质基础上的变异。,三、统计学的研究对象,同质(homogeneity)指观察单位间被研究指标的影响因素相同。由于被研究指标的影响因素往往难以完全控制,甚至未知,因此在实际工作中观察单位的同质是指对被研究指标的影响较大的、可以控制的主要因素相同或基本相同。,三、统计学的研究对象,同质(homogeneity)指观察单位间被研究指标的影响因素相同。如研究某地区儿童的身高,则要求影响身高这一指标的主要因素(如年龄、性别、民族)要相同,而不能控制的因素(遗传、营养等)可不要求相同。同质是相对的,对于身高指标,成年男女有别不同质;而对于脉搏指标,成年男女无别同质。,三、统计学的研究对象,变异(variation)指在同质基础上各观察单位间某观察指标的差异。医学研究,在同类的对象中往往存在着变异,如同为健康人,即使是性别与年龄相同,他们的身高、体重、脉搏、血压、体温、肺活量等生理生化指标数值都会有所不同;同为某病的病人,其病情病程也各自有所差异;对病情相同的患者用同一种疗法治疗,有治愈、显效、无效等不同转归。,三、统计学的研究对象,医学事物(现象)大多数是具有变异的事物(现象),概率论称具有变异的事物(现象)为随机事件。随机事件是指一次试验结果不确定而在一定数量重复条件下呈现出某种规律性的事件。医学统计学可将医学随机事件通过一定数量的观察、对比、分析与推断,由偶然性(不确定性)现象的剖析,发现事物内在的必然性(确定性)规律。统计学是处理变异数据的科学,没有变异就无需统计学。,四、医学统计学的主要内容,1.研究设计(researchdesign):是按照研究目的和统计学要求制定具有针对性、具体性、专业性的工作方案。专业设计(specializeddesign):用什么方式、方法等内容验证假说或回答有关的专业问题。统计学设计(statisticaldesign):如何合理地安排实验内容,对实验结果如何进行有效地分析。2.统计描述(statisticaldescription):用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律。3.统计推断(statisticalinference):有两个重要领域:参数估计(estimationofparameter):以样本指标推断总体参数范围假设检验(hypothesistesting):利用样本信息,根据一定的概率水准,推断指标间的差别有无统计学意义,五、统计学的特点和基本思想,统计学认识事物现象有数量性、群体性、具体性和概率性等特点。数量性:从客观事物数量特征和数量关系入手反映其质量,经过分析研究,探索客观现象的本质和规律。如通过体格检查(测量血压、脉搏等)了解个体健康质量。群体性:从整体上反映和分析事物数量特征。例如,以治疗足够数量的肺癌患者疗效情况数据为前提来归纳推断反映其整体的疗效水平。具体性:通过研究在一定时间、地点、条件下的客观现象具体的数量特征来反映抽象的数量关系。如以某一时间、地点、条件下的病死率、生存率评价医疗质量。概率性:采用随机抽样研究,用样本的特征指标估计或推测总体的特征指标,估计正确与否是以概率大小来确定的,所以统计学结论具有概率性。,五、统计学的特点和基本思想,统计学的基本思想可归纳为变异的思想、随机抽样研究的思想和概率的思想。正是由于客观事物的变异性和复杂性才需要统计学;随机抽样研究可通过研究样本特征估计或推测总体特征,但是,为了得出正确的结论,在随机抽样时必须有效地控制各种误差;由于统计学主要采用抽样研究方法探求总体的规律性,所以统计结论具有概率性,统计结论中没有“证明”,只有在一定概率水平上的推论。,第二节统计学的几个基本概念,1.总体与样本2.参数和统计量3.误差及其分类4.频率与概率5.随机、随机变量及变量值6.随机抽样,总体:根据研究目的确定的同质研究对象的全体。更确切地说,是同质的所有观察单位某种观察值的集合。用N来表示。有限总体和无限总体样本:从总体中随机抽取的部分观察单位,其实测值的集合。总体中有代表性的一部分。用n来表示。观察单位(个体):最基本的研究单位样本量(samplesize):样本中所包含的观察单位数,1.总体与样本(populationandsample),参数(parameter):根据总体的分布特征而计算的总体的统计指标。如总体均数、总体标准差、总体率等。固定的常数,但一般未知。例:上海2008年全体正常8岁男童身高值的平均数统计量(statistics):根据样本的分布特征而计算的样本的统计指标。如样本均数x、样本标准差s、样本率p。在参数附近随机波动例:随机抽取的1000男童测得的身高值的平均数,2.参数和统计量(Parameterandstatistics),3.误差(error),误差:泛指测量值与真值之差。,(1)抽样误差:由于抽样所引起的样本统计量与总体参数之间的差异称为抽样误差。有一定的规律性,但不可避免。误差变量一般服从正态分布,可通过统计处理估计随机误差。(2)随机测量误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。如测量一个人身高:178.12178.09178.15cm。不可避免。误差变量一般服从正态分布,可通过统计处理估计随机误差。(3)系统误差:数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。误差变量有方向性,规律性和周期性。可以避免。(4)过失误差:粗心大意误差变量无方向性,无规律性。可以避免。,频率:在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。例如投掷硬币,历史上有人对此做过实验得到如下结果:,4.概率和频率(probabilityandfrequency),概率:描述随机事件发生的可能性大小的度量,用大写的P表示;取值:01之间。P越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。小概率事件:通常一个事件的发生P0.05(5)或P0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。频率是概率的估计值。,5.随机、随机变量及变量值(variableandvalueofvariable),随机(random)指在抽样、分组、实验顺序安排过程中,每个观察单位都不受研究者的主观意愿驱使,具有同等的机会被抽中、分配或安排,目的是保证样本的代表性。随机变量:随机事件的各种特征或指标称为变量。离散型变量、连续型变量。如人的性别、年龄、体重、身高等。变量值:对变量的测得值称为变量值或观察值,亦称为资料,6.抽样(sampling),抽样应遵循的原则,代表性:样本中每个个体符合总体的规定即同质的要求。随机性:随机性:总体中个体有相同的机会被抽取到样本中。可靠性:结果可重复性。“足够”的样本量可比性:比较的组别之间,除处理因素不同外,其他可能影响结果的因素要求基本齐同,也称作齐同对比原则。,附表17(1)随机数字表,随机抽样的方法:单纯随机抽样:随机数字表和随机排列表机械抽样法:又称等间隔抽样和系统抽样,按比例分配分层抽样法:先分层,每层内按比例抽样整群抽样:随机数字:随机数字表、软件产生随机数字,从48人中抽取10人,N=100,需抽取n=20N/n=100/20=5从1-5中随机抽取一个号选中4从第4号开始,每隔4个,抽选一个样本,系统抽样Systemicsampling,可按年龄、性别、经济收入、教育水平等分层,分层抽样Stratifiedsampling,将总体分成若干群组,抽取其中部分群组作为观察单位组成样本,被抽到的群组中的全部个体均作为调查对象。(例如,按地理区域、行政区域、组织单位等划分群组)。,整群抽样Clustersampling,第三节资料类型,中医统计资料的来源:1.常规保存的记录(routinelykeptrecords):指医疗卫生机构作为历史档案保存的常规活动记录,如住院患者病历、法定传染病报表、职业病报表、医院工作报表、病伤死亡年报表、肿瘤发病及肿瘤死亡报告卡、出生报告单、死亡报告单等。2.现场调查记录(surveyedrecords):指用现场调查的方法获取的所需数据。3.实验记录(experimentalrecords):包括实验室记录和临床试验记录。4.文献信息(literatureinformation):如医学图书、期刊、会议论文集等。5.计算机网络信息(computernetworkinformation),第三节资料类型,根据变量值的性质(是否定量)可将资料分为:1.计量资料2.计数资料3.等级资料,1.计量资料(measurementdata),定义:计量资料(measurementdata)又称定量资料(quantitativedata)或数值资料(numericaldata),是由仪器、工具或其它定量方法测定的某项指标量的大小所得到的资料。特点:变量值大多有度量衡单位,其具体取值通常是正实数(零、正整数和小数)。多为连续性资料。连续数据:例:身高、体重、年龄、体温、血压离散数据:例:心率、白细胞计数、24小时早博次数,2.计数资料(enumerationdata),定义:计数资料(enumerationdata)又称定性资料(qualitativedata)或无序分类资料(unorderedcategoricaldata),是将事物按不同的属性归类,清点每一类的数量多少所得到的资料。根据类别数的不同,计数资料分为二分类资料和无序多分类资料。特点:变量值表现为互不相容的属性或类别,无度量衡单位。二分类资料(dichotomousdata):是按互不相容的属性加以分类的资料。如有效、无效;治愈、未愈;阳性、阴性。无序多分类资料(multipleclassificationdata):是按不同的类别加以分类的资料。如中医病证的辨证分型;血型A、B、O、AB等。,3.等级资料(ordinaldata),定义:等级资料(ordinaldata)又称半定量资料(semi-quantitativedata)或有序多分类资料(orderedcategoricaldata),是将事物属性按组别之间有程度或等级差别进行归类所得到的资料。如病情的轻、中、重;治疗结果的治愈、显效、好转、无效、恶化、死亡;尿蛋白的、等。根据分析的需要,各种资料可进行相互转化。可将计量资料转化为计数资料或等级资料,反过来,计数资料和等级资料可通过数字编码,即数值化方式,转化为计量资料。,不同类型资料间的转化,第四节医学统计工作的基本步骤,包括研究设计、收集资料、整理资料、分析资料、结果报告与结论表达等。这几个步骤是密切联系不可分割的,任何一个环节发生缺陷都会影响研究结果的质量和认证。,一、研究设计,就是拟订一份合理的实验计划,将有关的研究方法与步骤的纲目拟订出来,用以保证取得一个较为客观的研究结果。根据对研究对象是否施加干预措施,可将研究分为观察研究和实验研究两大类。无论是调查设计还是实验设计,均涉及专业设计与统计设计。,二、搜集资料,1.真实搜集资料的灵魂。坚持实事求是的科学态度,注重事物的客观性,确保资料的真实、可靠。2.及时搜集资料的前提。资料的搜集料是时间性很强的工作,通常要求以最少的时间、最快的速度及时搜集各种资料。3.完整搜集资料的基础。要求数据的全面性、系统性和多样性。4.准确搜集资料的核心。准确与研究者的科学态度、经验和判断水平以及实验室条件等紧密相关。,搜集资料的注意事项:1内容与分析要求相吻合2避免易误解的问题3力避漏填项目4分析项目及其记录格式5有效数字的取舍6数据的精度(precision),二、搜集资料,三、整理资料,整理资料(sortingdata)是指根据统计研究的任务与要求,对搜集的各种原始资料进行综合与加工,使之系统化、条理化,从而得出反映总体特征或规律的综合资料的工作过程。统计资料整理主要包括:整理方案、审核资料、设计分组、归纳汇总四个步骤。,三、整理资料,(一)整理方案:资料整理方案设计,即对资料整理的各个环节做出具体的安排与规定,拟定工作计划。确定资料的审查内容与方法。确定汇总的指标与综合表。确定分组方法。确定汇总的组织工作与时间安排。,(二)资料审核:1.对资料质量的基本要求:及时、完整和准确。2.原始资料的审核逻辑性审查:专业检查:统计检查:计算机检查:目前较流行的数据软件有:EPIData、ORCALE、MS-Access、SAS、CHISS、EXCEL等。3.缺项(missingdata)处理,三、整理资料,(三)设计分组:根据研究目的和研究现象的本质特征,按照某种分组标志将研究对象的全体分为若干组段或组别的过程。目的是揭示现象内部各部分之间存在的差异,显示组内的共性、相似性和组间的差异性,认识它们之间的矛盾,表明事物的本质与规律。1.分组的作用:利于发现事物特点与规律将复杂的医学现象划分为不同类型分析总体内部构成与相互关系揭示现象之间的依存关系,三、整理资料,2.设计分组标志的选择原则根据研究目的选择最恰当的分组标志分析证型的构成,应选证型作为分组标志。分析病情与疗效的关系,应选病情的不同程度进行分组。研究某方药对某病不同证型的疗效,就应按中医辨证分型进行分组。选择最能够反映事物本质或主要特征的标志研究糖尿病患者治疗情况,可按证型、病情和并发症作为分组标志。反映糖尿病患者的疗效、并发症及其严重程度等预后标志,宜选用有无并发症及其严重程度作为分组标志。结合研究对象所处的具体条件选择具有现实意义的标志某一指标在一定时间、地点、条件下,可以作为最重要的标志,但事过境迁,标志可能失去其当初所具有的重要意义。如:早期发现肾功能减退的顺序为SUABUNScr,但随着肾衰竭的进展,SUA增高的程度不如BUN和Scr,SUA在尿毒症时一般只增高1倍。,三、整理资料,3.设计分组方法按标志的不同表现形式分组:数量分组:按被研究对象的数量大小来分组,从量的变化分析事物的差别和规律。如按年龄大小、疗程长短、脉搏快慢、血压高低等分组。品质分组:按被研究对象的性质、特征或类型等品质标志来分组。如疾病按病因或证型分组;病情按轻、中、重分组;疗效按治愈、显效、好转、无效、恶化分组;化验检查按阳性、阴性或、分组等。按分组标志的多少分组:简单分组:只按一个标志进行的分组。如:为了验证某方药的疗效,可按证型或疗程、年龄、性别等单一标志进行分组。复合分组:采用两个或两个以上标志结合起来进行分组。如:将证型、疗程、性别等标志结合起来分组,以认识某方药治疗某病的基本情况,三、整理资料,4.设计分组的程序选择分组标志选择分组方法确定组数:组数(numberofclass)即分组的个数,亦称组段数,符号为。组数的多少取决于研究目的、资料性质和观察单位的多少。,三、整理资料,四、分析资料,分析资料(analysisdata)包括统计描述(statisticaldescription)与统计推断(statisticalinference)。统计描述是指用适合资料性质的统计指标、统计图表等,对资料的数量特征及其分布规律进行表达,以反映变量值的水平、频率、联系强度。统计推断是通过抽样研究,根据样本资料所提供的信息,对未知总体做出具有一定概率性的估计和推断,它包括参数估计和假设检验两方面。,五、结果报告与结论表达,统计学既是一门科学又是一门艺术,其艺术性是通过表达来体现的。医学研究性论文主要由摘要、引言、材料与方法、结果和讨论等组成,而每一部分或多或少都涉及统计表达。需要明确指出所使用的统计设计与分析方法,观察对象的纳入与剔除标准,是否随机抽样与随机分组,使用的何种统计软件及其版本,样本统计量、总体参数可信区间,检验统计量、值,并结合各学科专业知识对统计分析结果作出合理的解释,进而得出可信赖的专业结论。另外,可借助统计图表直观、形象表达统计结果。统计结果的规范化报告和结论的正确表达,能提高研究的认证度,也便于各层次的学术交流与研究。,统计学发展简史,古典统计学、近代统计学、现代统计学统计学发展过程中出现过几次重大的争论:“政治算术”与“国势学”的争论,明确了统计学的学科性质;“描述统计学”与“推断统计学”的争论,构筑了统计学的完整体系;“经典统计学”与“贝叶斯统计学”的争论,带来了统计哲学观的新变化;信念统计学与经典统计学、贝叶斯统计学的争论,使统计推断科学化问题的研究日趋深入。正是通过这些争论完善了现代统计学的思想和方法体系。,现代统计学,统计方法随着计算机和统计软件的出现,使统计学得到了突飞猛进的发展。统计软件如SAS、SPSS、Excel、S-plus、Stata、Minitab、Statistica、Eviews、PEMS、Matlab、马克威软件模型在统计和科学工作中的作用现已被广泛承认。许多新的分支或专门化和应用已经被发展了:决策论,时间序列,多元分析,经济计量学,博奕论,临床试验,非参数推断,序贯分析,数学生物分类学,及可靠性。数量统计及其应用正在继续发展和扩大。,那些教给我们运用偶然性的数学家们,从概率论的发展这一独特视解,我们反观这个领域的数学们,他们是一群会运用偶然性的人。数学家们不但教会我们运用确定的真理:太阳东升,四季变迁,他们也教会我们发现在偶然性中的真理,回答我们黑色豌豆和白色豌豆结出的果子什么颜色。这里给出个这群伟人的全家福(按出生年排坐坐)。,雅各布伯努利(JacobBernoulli,16541705),瑞士数学家(荷兰人)。1713年出版猜度术,给出伯努利数、伯努利大数定律。他的主要贡献是建立了概率论中的第一个极限定理,我们称为“伯努利大数定理”,即“在多次重复试验中,频率有越趋稳定的趋势”。这一定理在他死后,即1713年,发表在他的遗著猜度术中。,哈雷(EdmondHalley,16561742),英国著名天文学家、数学家。著名的哈雷彗星的发现者。哈雷还发现了天狼星、南河三和大角这三颗星的自行,以及月球长期加速现象。,Halley,Edmond1656-1742,棣美弗(DeMoivre,16671754),法国数学家。1730年,分析杂论著作中包含了著名的“棣莫弗拉普拉斯定理”。接着拉普拉斯在1812年出版的概率的分析理论中,首先明确地对概率作了古典的定义。1733年建立了关于“正态分布”及“最小二乘法”的理论,为整个大样本理论奠定了基础。另一在概率论发展史上的代表人物是法国的泊松。他推广了伯努利形式下的大数定律,研究得出了一种新的分布,就是泊松分布。概率论继他们之后,其中心研究课题则集中在推广和改进伯努利大数定律及中心极限定理。,贝叶斯(Bayes,Thomas,17021761),英国数学家,是一位自学成才的数学家贝叶斯发表论机会学说问题的求解中,提出了一种归纳推理的理论,以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。,欧拉(LeonhardEuler,17071783),瑞士人,在数学、物理、天文、建筑以至音乐、哲学方面都取得辉煌成就。在数学领域以欧来命名的公式、定理和重要常数。f(x)(1734年),(1736年)e、sin和cos(1748年),tg(1753年),x、(1755年),i(1777年)等。歌德巴赫猜想也是在他与歌德巴赫的通信中提出来的。,欧拉首先完成月球绕地球运动的精确理论,创立了分析力学、刚体力学等力学学科,深化望远镜、显微镜的设计计算理论。19世纪伟大数学家高斯曾说:“研究欧拉的著作永远是了解数学的最好方法。,拉普拉斯(MarquisdeMierre-SimonLaplace,17491827),法国数学家、天文学家。拉普拉斯是天体力学的主要奠基人,是天体演化学的创立者之一,是分析概率论的创始人,是应用数学的先躯。用数学方法证明行星的轨道大小只有周期性变化,即著名拉普拉斯的定理。他发表的天文学、数学和物理学的论文有270多篇,专著合计有4006多页。其中最有代表性的专著有天体力学、宇宙体系论和概率的分析理论。1796年,他发表宇宙体系论。因研究太阳系稳定性的动力学问题被誉为法国的牛顿和天体力学之父。,阿德利昂玛利埃勒让德(AdrienMarieLegendre,17521833,法国数学家。从事数学分析、几何学、数论以及天体力学研究,建立数论和椭圆积分的对数定理和二次互反律。勒让德曾与拉格朗日(Lagrange)、拉普拉斯(Laplace)并列为法国数学界的“三L”,为18世纪末19世纪初法国数学家的复兴做出重要贡献,并曾担任众多的官方职务,马尔萨斯(ThomasRobertMalthus,17661834),是英国人口学家和政治经济学家。于1798年根据百余年人口统计资料提出了著名的人口指数增长模型“人口论”很悲观。他认为人口以几何级数上升,而物品供应只能以等差级数上升,僧多粥少无可避免,最后的人口均衡点,是仅足以餬口的物质享受,以饥饿淘汰不适者。,他的学术思想悲观但影响深远。虽然马尔萨斯的人口论存在一些问题,但是,它是第一部较为系统的人口学著作。,高斯(Gauss,17771855),德国人,发现正态分布方程,并成功地将正态分布理论用于描述观察误差的分布,并用于行星轨迹的预测。正态分布又称Gauss分布。,泊松(Poisson,Simeon-Denis)(17811840),泊松是法国数学家、物理学家和力学家建立了描述随机现象的一种概率分布泊松分布发表了关于球体引力和关于引力理论方程泊松的主要著作还有毛细管作用新理论和热学的数学理论等。,高尔顿(FGalton,18221911),是英国人,是生物统计学最早创立者。为了研究人的智力遗传和进化规律,高尔顿在伦敦开设了“人体测量研究所”,广泛招募志愿人员,采集到大量的有关人的自然属性的资料。先后出版了两本著作,一本是关于人的能力及其发展问题,另一本是遗传的自然规律。在这两本书及相关的论文中,高尔顿提出了诸如“相关”、“回归”、“中位数”、“四分位数”、“四分位数差”、“百分位数”等概念和计算方法。,格雷戈尔孟德尔(GregorJohannMendel,18221884),奥地利生物学家,“现代遗传学之父”,1865年发现遗传定律。1.分离定律孟德尔第一定律基因作为独特的独立单位而代代相传。细胞中有成对的基本遗传单位,在杂种的生殖细胞中,成对的遗传单位一个来自雄性亲本,一个来自雌性亲本,形成配子时这些遗传单位彼此分离。,2.独立分配定律孟德尔第二定律在一对染色体上的基因对中的等位基因能够独立遗传,与其他染色体对基因对中的等位基因无关;并且含不同对基因组合的性细胞能够同另一个亲本的性细胞进行随机的融合。,皮尔逊(KarlPearson,18571936),皮尔逊是高尔顿的学生,他全面继承和发展了高尔顿的统计相关与回归思想,并建立了相应的数学基础。是现代统计学之父。1893年提出了标准差1900年提出了2检验根据他的儿子E皮尔逊(EPearson)的总结,主要为:(1)提出和研究了复相关、偏相关的问题(2)提出了似然函数、矩估计方法(3)导出了重要的卡方分布(4)研究了许多概率分布曲线等高尔顿、皮尔逊为在开展生物遗传学研究的同时,提出了许多处理变异数据的统计方法,统计史上一般把他们的工作称作描述统计学。1894开设第一门统计学理论高级课程。,斯皮尔曼,查尔斯爱德华(Spearman,CharlesEdward18631945),英国著名的心理学家。对认知心理学、差异心理学以及心理测量学有特别重要的贡献。发明了智力理论、相关系数衰减效应的校正,以及因素分析;发明等级相关系数以及提出关于测验信度和测验长度之间关系的准确公式,即斯皮尔曼布朗预测公式。,戈塞特(WilliamSealeyGosset,18761937),英国统计学家,他发现小样本,平均数对其标准误差(t)的分布不遵循正态曲线。Gosset基于在酿酒公司多年的实验观察,洞察到大样本统计方法并不适用于所有场合,有的时候人们还只能根据少量观察就必须做出结论.戈塞特终于在1908年导出了重要的t分布,首次以Student为笔名,在生物计量学杂志上发表了“平均数的概率误差”文章。这是小样本统计推断的基石。以此为标志,统计学逐渐由描述统计学向推断统计学过渡。,威布尔(Weibull,Wallodi,18871979),瑞典人,1932年於UniversityofUppsala获得博士学位。1949年WeibullW.用概率统计方法处理疲劳试验数据。建立威布尔分布,寿命数据的Weibull分析。,费暄(RAFisher,18901962),费希尔(RAFisher,)是推断统计学的建立者,他在统计学上有着崇高的地位,对统计学的许多领域进行了深入独到的研究,开辟了方差分析、试验设计等统计学研究的理论分支,论证了戈塞特相关系数的抽样分布,提出了t分布检验、F分布检验、相关系数检验,并编制了相应的检验概率表。由于费暄的突出贡献,统计史上一些人把费暄所处的时期,称为“统计学的费暄时代”。,FrankWilcoxon,(18921965),FrankWilcoxon,是英国生物化学家、统计学家。Wilcoxon利用统计学方法研究植物病理学。一生共发表论文70余篇。他首次引入了两样本非参数检验方法。两个著名的非参数方法:Wilcoxonsigned-ranktest、Wilcoxonrank-sumtest就是以他的名字命名的。,EgonSharpePearson(18951980),E.S.Pearson,英国生物学家和统计学家,是KarlPearson之独子。1919年毕业于CambridgeUniversity。1926年开始和Neyman在学术上共同研究。对假设检验理论方面认为应该考虑与待检验的零假设相对应的备选假设。他和Neymann合作的主要论文有:关于统计推断的某些检验准则的运用和解释、关于两组样本问题、关于统计假设的最有效检验问题等。,内曼(JerzyNeyman,18941981),JerzyNeyman及EgonsharpePearson在一系列的杰出的文章中澄清了推断理论,特别是有关显著性检验的基本原理一其合理性以往是常被批评。早期的显著性检验为关于二项变量之间或均值之间的,它们被K.Pea

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论