医学统计学基本概念(马修强)_第1页
医学统计学基本概念(马修强)_第2页
医学统计学基本概念(马修强)_第3页
医学统计学基本概念(马修强)_第4页
医学统计学基本概念(马修强)_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学医学统计学(medical statistics)卫生统计学教研室卫生统计学教研室马修强马修强 副教授副教授2011-9-13名人名言名人名言学者不能离开统计学而研学;学者不能离开统计学而研学;政治家不能离开统计学而施政;政治家不能离开统计学而施政;事业家不能离开统计学而执业;事业家不能离开统计学而执业;军事家不能离开统计学而谋略。军事家不能离开统计学而谋略。马寅初马寅初统计学的定义统计学的定义nA science dealing with the collection, analysis, interpretation and pre-sentation of messes of

2、numerical data. (关于关于数据的收集、分析、解数据的收集、分析、解释和表达的学科释和表达的学科) - Websters International Dictionary统计学的定义统计学的定义nThe science and art of dealing with variation through collection, classifi-cation, and analysis in such a way as to obtain reliable result. (通过数据的收集、分通过数据的收集、分类和分析来处理变异以获得类和分析来处理变异以获得可靠结果的一门学科和艺术

3、可靠结果的一门学科和艺术)-John M. Last, A Dictionary of Epidemiology统计学与医学统计学与医学n统计学在医学方面应用的分支名称:统计学在医学方面应用的分支名称:q生物统计学生物统计学(biostatistics)q医学统计学(医学统计学(medical statistics)q卫生统计学(卫生统计学(health statistics)n医学统计学医学统计学q运用统计学原理和方法研究医学科研中有关数据的运用统计学原理和方法研究医学科研中有关数据的收集、整理和分析的应用学科。收集、整理和分析的应用学科。1.学会驾驭变异性(学会驾驭变异性(variatio

4、n) 变异性是社会和生物医学中的普遍现象。变异性是社会和生物医学中的普遍现象。 WHO报告中国期望寿命:平均报告中国期望寿命:平均 71(岁)(岁) 实际上每个人的实际寿命是不确定,有些用现有实际上每个人的实际寿命是不确定,有些用现有的知识可以解释,有些不能解释。统计试图为不能解的知识可以解释,有些不能解释。统计试图为不能解释的问题(困惑费解的问题)提供线索和依据。释的问题(困惑费解的问题)提供线索和依据。 统计学就是处理数据中变异的科学。统计学就是处理数据中变异的科学。为什么要学习医学统计学?为什么要学习医学统计学?The odds of finding two identical fing

5、erprints were 1 in 64 billion.Francis Galton两个随机个体具有相同DNA图形的概率为310-11;如果同时用两种探针进行比较,两个个体完全相同的概率小于510-19。每支枪的枪管都有独一无二的特征,这种特征影响了它所发射的每一发子弹。司法弹道学120名正常成年男子红细胞计数值名正常成年男子红细胞计数值(1012/L) 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64 5.14 5.46 4.66 4.204

6、.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4

7、.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.692. 设计你的研究设计你的研究 随机对照试验,随机对照试验,Randomized Controlled Trial(RCT) 不一定是最好的医学研究方法不一定是最好的医学研究方法, 但是最好的试验方法。但是最好的试验方法。 国际生物医学杂志编辑协会一般要求国

8、际生物医学杂志编辑协会一般要求(包含了包含了统计学要求统计学要求):Uniform Requirements for Manuscripts Submitted to Biomedical Journals国际医学杂志编辑委员会对随机对照试验论文国际医学杂志编辑委员会对随机对照试验论文报告要求报告要求:CONSORT (Consolidated Standards of Reporting Trials) /Statement/revisedstatement.htm#ref53. 论文的统计学审查论文的统计学审查论文段(主题)论文

9、段(主题)序号序号论文段(主题)论文段(主题)序号序号题目与摘要题目与摘要1统计学方法统计学方法12序言序言2结果结果13方法与参与方方法与参与方3招募受试者招募受试者14受试者受试者4基线数据基线数据15干预措施干预措施5纳入分析的例数纳入分析的例数16结局指标结局指标6结局和估计值结局和估计值17样本量样本量7辅助分析辅助分析18随机数的产生随机数的产生8不良事件不良事件19随机分组(密封的方案)随机分组(密封的方案)9局限性局限性20随机的实施随机的实施10可推广性可推广性 21盲法盲法11解释解释22在全世界报告的在全世界报告的122个关于个关于Selective Sero-tonin

10、 Reuptake Inhibitors (SSRI) 抗抑郁作抗抑郁作用的用的RCT研究报告中,仅有一个研究报告中,仅有一个(0.8%)报告报告符合符合CONSORT的描述规范。的描述规范。“良好愿望的医学良好愿望的医学”(well-meaning medicine)转入转入“基于证据的医学基于证据的医学” (evidence-based medicine,EBM)。所有临床试验的结果都是先有统计学结论所有临床试验的结果都是先有统计学结论(统计指标比较、统计指标比较、P 值值),再给出专业结论。,再给出专业结论。 4. 统计学结论是重要的科学证据之一统计学结论是重要的科学证据之一统计学与数值

11、计算统计学与数值计算n统计学的结论是建立在正确的数值计算的基础上;统计学的结论是建立在正确的数值计算的基础上;数值计算可以由多种途径完成,如心算、手工计算、数值计算可以由多种途径完成,如心算、手工计算、计算器、电脑(统计软件);计算器、电脑(统计软件);n使用统计软件仅仅是解决复杂统计计算的快速实现使用统计软件仅仅是解决复杂统计计算的快速实现问题,其真正的精髓并不在于如何操作软件,而在问题,其真正的精髓并不在于如何操作软件,而在于你是否具有足够的统计学知识选择合适的统计方于你是否具有足够的统计学知识选择合适的统计方法,并对结果作出合理的解释。法,并对结果作出合理的解释。产生的问题:产生的问题:

12、1. 数据的可靠性:数据的可靠性:数据造假问题数据造假问题2. 统计方法的选择:统计方法的选择:误用非常严重误用非常严重舍恩舍恩(Schon)事件事件维克托维克托 尼努夫化学尼努夫化学元素发现造假事件元素发现造假事件黄禹锡事件黄禹锡事件数据造假数据造假20052005年年6 6月月9 9日,日,自然自然杂志公布了一份杂志公布了一份令人震惊的调查结果。令人震惊的调查结果。美国调查人员对美国调查人员对3247名科学家的问卷调查结果显示:名科学家的问卷调查结果显示: 约约5%的科学家承认,由于得到的信息与他们正在进的科学家承认,由于得到的信息与他们正在进行的研究相抵触,他们曾丢弃某些数据;行的研究相

13、抵触,他们曾丢弃某些数据;10%的科学家承认,他们在发表研究报告时,曾的科学家承认,他们在发表研究报告时,曾不适当地将自己或他人的名字列为作者;不适当地将自己或他人的名字列为作者;超过超过15%的科学家承认,他们曾改变原来的设计或的科学家承认,他们曾改变原来的设计或结果,或忽略一些观测以便使赞助商满意。结果,或忽略一些观测以便使赞助商满意。统计方法的误用统计方法的误用70%左右的文章有统计学错误;其中,左右的文章有统计学错误;其中,70%的错误的错误出在初等的、基本的统计学方法,出在初等的、基本的统计学方法,30%的错误出在的错误出在高等的、复杂的统计学方法。高等的、复杂的统计学方法。1966

14、年,据对美国医师协会杂志(年,据对美国医师协会杂志(JAMA)等医学)等医学杂志的来稿的统计显示,杂志的来稿的统计显示,149篇投稿论文中,仅有篇投稿论文中,仅有28%可以接受,可以接受,67%有统计缺陷但尚可以纠正,有统计缺陷但尚可以纠正,5%不可救药。不可救药。“生物统计学者是我们的可贵盟友。生物统计学生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱本学科,就像大厦中的一个支柱”。 美国医师协会杂志编辑美国医师协会杂志编辑 “非常痛心地看到,因为数据分析的缺陷和非常痛心地看到,因为数据分析的

15、缺陷和错误,那么多好的生物研究工作面临着被错误,那么多好的生物研究工作面临着被葬送的危险葬送的危险”。 Yates和和HealyHow to lie with statistics-Darrell Huff如何用统计学说谎或统计数字会撒谎如何用统计学说谎或统计数字会撒谎n统计这种神秘的语言,在一个用事实说话的社会统计这种神秘的语言,在一个用事实说话的社会里是如此吸引人,但有时它却被利用并成为恶意里是如此吸引人,但有时它却被利用并成为恶意夸大或迷惑他人的工具。统计方法和统计术语是夸大或迷惑他人的工具。统计方法和统计术语是必不可少的。但必不可少的。但如果不能准确理解和恰当使用这如果不能准确理解和恰

16、当使用这些统计语言,不能正确了解其含义,统计结果只些统计语言,不能正确了解其含义,统计结果只能是一堆废话能是一堆废话。n统计不仅是一门科学,更是一门艺术统计不仅是一门科学,更是一门艺术(加工、处理、加工、处理、升华升华)。统计学的几个基本概念统计学的几个基本概念n同质与变异同质与变异n总体与样本总体与样本n参数与统计量参数与统计量n变量与资料变量与资料n误差误差n频率与概率频率与概率n同质同质:指事物的性质、影响条件或背景相:指事物的性质、影响条件或背景相同或非常相近。同或非常相近。 例:调查例:调查20102010年上海市年上海市7 7岁男童的身高和体重岁男童的身高和体重 同质:同质:201

17、02010年、上海市、年、上海市、7 7岁男童岁男童:同质个体间测量结果的差异。:同质个体间测量结果的差异。 变异:变异: 上海市上海市7 7岁男童的身高和体重各不相同岁男童的身高和体重各不相同5.805.605.405.205.004.804.604.404.204.003.8035302520151050总体总体(population)n定义:根据研究目的确定的、同质的全部研究定义:根据研究目的确定的、同质的全部研究对象的观测值的全体。对象的观测值的全体。q如研究如研究18岁男青年的生长发育情况,指标为身高、岁男青年的生长发育情况,指标为身高、体重,则所有体重,则所有18岁男青年的身高测量

18、值为一个总体,岁男青年的身高测量值为一个总体,体重测量值为另一个总体。体重测量值为另一个总体。n有限总体有限总体(finite population) 如如2011年上海市在校大学生年上海市在校大学生n无限总体无限总体(infinite population) 如高血压病人如高血压病人样本样本(sample)n来自总体的部分研究对象的观测值。来自总体的部分研究对象的观测值。n抽样抽样(sampling):总体中的每个研究单位被抽:总体中的每个研究单位被抽取作为样本的过程。取作为样本的过程。n样本量样本量(sample size):样本包含的研究对象的:样本包含的研究对象的个数。个数。Today

19、: 7 April 2022参数参数:反映:反映总体特征总体特征的的统计指标,如总体均数、统计指标,如总体均数、标准差,采用希腊字母标准差,采用希腊字母分别记为分别记为、。固定固定的常数。的常数。总体总体样本样本抽取部分观察单位抽取部分观察单位 推断推断统计量统计量:反映:反映样本样本特征的统计指标,如样本均数、标特征的统计指标,如样本均数、标准差,采用拉丁字母分别记为准差,采用拉丁字母分别记为 。 参数附近波动参数附近波动的随机变量。的随机变量。SX、参数与统计量参数与统计量 (parameter and statistic)误差误差(error)n误差的定义:实测值与真实值之间的差异误差的

20、定义:实测值与真实值之间的差异n误差的分类:误差的分类:q随机误差随机误差(random error)q非随机误差非随机误差(nonrandom error)n系统误差系统误差(systematic error)n非系统误差非系统误差(nonsystematic error)随机误差随机误差n由多种尚无法控制的因素引起的误差。由多种尚无法控制的因素引起的误差。n无法消除或不可避免,但有规律可循。无法消除或不可避免,但有规律可循。n抽样误差(抽样误差(sampling error)q在抽样过程中由于抽样的偶然性而出现的误差。在抽样过程中由于抽样的偶然性而出现的误差。q表现为总体参数与样本统计量的

21、差异,以及多个样本表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。统计量之间的差异。q可用标准误描述其大小。可用标准误描述其大小。系统误差系统误差n由可知的或可掌握的因素引起的误差。由可知的或可掌握的因素引起的误差。n其值恒定不变或遵循一定变化规律,产生原因其值恒定不变或遵循一定变化规律,产生原因往往是已知或可能掌握的往往是已知或可能掌握的n理论上可以通过周密的研究设计和严格的技术理论上可以通过周密的研究设计和严格的技术措施消除,实际操作上要看具体情况。措施消除,实际操作上要看具体情况。q实验者感觉或操作上的差异;实验者感觉或操作上的差异;q仪器设备的测量精度;仪器设备的测量精

22、度;q抽样不均匀,分配不随机等。抽样不均匀,分配不随机等。n举例:举例:用动脉血压计测量某人血压用动脉血压计测量某人血压( (实际值为实际值为80mmHg)80mmHg),各次测量的均值为,各次测量的均值为100mmHg100mmHg。下图为。下图为系统误差和随机误差的示意图。系统误差和随机误差的示意图。随机误差随机误差80100舒张压舒张压(mmHg)系统误差系统误差发发生生频频次次血压计法测量舒张压值的分布血压计法测量舒张压值的分布非系统误差非系统误差n又称过失误差又称过失误差(gross error)n由研究者偶然失误造成的误差。由研究者偶然失误造成的误差。n可通过研究者的认真检查核对避

23、免此类误差。可通过研究者的认真检查核对避免此类误差。q仪器失灵仪器失灵q记录错误(点错小数点、指标弄错等)记录错误(点错小数点、指标弄错等)确定性现象和不确定现象确定性现象和不确定现象n确定性现象:在一定条件下,必定会发生的现确定性现象:在一定条件下,必定会发生的现象。象。q必然事件必然事件(P1)和不可能事件和不可能事件(P0)。n随机现象:在同样条件下会出现两种或多种结随机现象:在同样条件下会出现两种或多种结果,事先不能确定可能发生何种结果的现象。果,事先不能确定可能发生何种结果的现象。q在一定条件下可能发生的事件为随机事件在一定条件下可能发生的事件为随机事件(0P1)。频率与概率频率与概

24、率n频率频率(relative frequency):在相同条件下,独:在相同条件下,独立地重复立地重复n次试验,随机事件次试验,随机事件A出现出现 f 次,则称次,则称 f/n 为随机事件为随机事件A出现的频率。出现的频率。实实 验验 者者Buffon(法法)k.pearson(英英)k.pearson(英英)投掷次数投掷次数 4040 12000 24000“正面正面”次数次数 2048 6019 12012 频频 率率 0.5069 0.5016 0.5005频率与概率频率与概率n概率概率(probability):随机事件发生可能性大小:随机事件发生可能性大小的度量指标。的度量指标。q

25、当当n趋近无穷大时,频率趋近无穷大时,频率f/n始终在一个常数左右微始终在一个常数左右微小摆动,称该常数为随机事件小摆动,称该常数为随机事件A的概率的概率q用用 P 表示,表示,0 P 1。q随着样本量的增加,频率越来越接近概率。随着样本量的增加,频率越来越接近概率。q只要观察单位数足够多,可将频率作为概率的估计只要观察单位数足够多,可将频率作为概率的估计值。值。Probability = Frequency?Patient: Will I survive this risky operation? Surgeon: Yes, Im absolutely sure that you will

26、survive the operation. Patient: How can you be so sure? Surgeon: Well, 9 out of 10 patients die in this operation, and yesterday my ninth patient died. Surely not变量(变量(variable)n研究者对每个观察单位的某项特征进行观察研究者对每个观察单位的某项特征进行观察或测量,该特征称为变量。或测量,该特征称为变量。n观察或测量的结果称为变量值或观察值。观察或测量的结果称为变量值或观察值。n变量值可以是数值,也可以是某种属性。变量值可

27、以是数值,也可以是某种属性。n变量值构成资料(变量值构成资料(data)。)。医学研究中常见的资料类型医学研究中常见的资料类型n计量资料计量资料(measurement data)n计数资料计数资料(enumeration data)n等级资料等级资料(ranked data)计量资料计量资料n又称定量资料又称定量资料(quantitative data),即观测每个,即观测每个观察对象某项指标的大小而得到的资料;观察对象某项指标的大小而得到的资料;n必须通过必须通过“量量”才能获得;才能获得;n带有度量衡单位;带有度量衡单位;n每个个体拥有一个数值;每个个体拥有一个数值;n可以转换为等级资料

28、和计数资料。可以转换为等级资料和计数资料。计量资料的类型计量资料的类型n离散型:在一定范围内取值的个数为有限。离散型:在一定范围内取值的个数为有限。q如:出生婴儿数、死亡人数等。如:出生婴儿数、死亡人数等。n连续型:在一定范围内取值的个数为无限。连续型:在一定范围内取值的个数为无限。q如:身高、体重等。如:身高、体重等。计数资料计数资料n又称定性资料又称定性资料(qualitative data),或称无序分,或称无序分类变量类变量(unordered categorical variable),即将,即将观察单位按某种属性或类别分组计算各组的例观察单位按某种属性或类别分组计算各组的例数,分组

29、汇总各组观察单位数后得到的资料。数,分组汇总各组观察单位数后得到的资料。n必须通过必须通过“数数”才能获得;才能获得;n不带有度量衡单位,每个个体拥有一个属性。不带有度量衡单位,每个个体拥有一个属性。计数资料的类型计数资料的类型n两分类:阳性或阴性;存活或死亡;两分类:阳性或阴性;存活或死亡; 有效或无效;男性或女性有效或无效;男性或女性n多分类:如血型中的多分类:如血型中的A、B、O、AB四种四种等级资料的特点等级资料的特点n又称有序分类资料又称有序分类资料(ordinal categorical data),即,即将观察单位按某种属性的大小程度分成等级后分将观察单位按某种属性的大小程度分成

30、等级后分组计算各组的例数,分组汇总各组观察单位数后组计算各组的例数,分组汇总各组观察单位数后得到的资料。得到的资料。n必须先必须先“量量”后后“数数”才能获得;才能获得;n不带有度量衡单位,每个个体拥有一个属性;不带有度量衡单位,每个个体拥有一个属性;q如治疗效果分为痊愈、有效、无效、恶化等如治疗效果分为痊愈、有效、无效、恶化等练习:资料类型的判断练习:资料类型的判断病例号病例号年龄年龄(岁岁)性别性别身高身高(cm)血型血型 心电图心电图尿尿WBC职业职业血血RBC(1012/L)135女女1.65A正常正常教师教师4.67244男男1.74B正常正常工人工人5.21326男男1.80O正常

31、正常职员职员4.10425女女1.61AB正常正常农民农民3.92541男男1.71A异常异常+工人工人3.49645女女1.58B正常正常+工人工人5.48750女女1.60O异常异常+干部干部6.78828男男1.76AB正常正常+干部干部7.10931女女1.62O正常正常军人军人5.24资料类型的转化资料类型的转化n计量资料可以转化为等级资料和计数资料计量资料可以转化为等级资料和计数资料q如血压中收缩压为计量资料;如血压中收缩压为计量资料;q按照按照90160mmHg为界值,可分为低血压、正常为界值,可分为低血压、正常血压、高血压(等级资料);血压、高血压(等级资料);q也可以分为正常

32、和不正常(计数资料)。也可以分为正常和不正常(计数资料)。n计量资料的信息最丰富,研究中尽可能收集计量资料的信息最丰富,研究中尽可能收集计量资料。计量资料。 医学统计学的基本步骤医学统计学的基本步骤设计设计(design) 收集资料收集资料(collection of data) 整理资料整理资料(sorting data) 分析资料分析资料(analysis of data) 一、设计一、设计(design)统计设计:对资料收集、整理和分析全过程总的统计设计:对资料收集、整理和分析全过程总的设想和安排。是后续步骤的依据,是最关键的一设想和安排。是后续步骤的依据,是最关键的一环。是提高观察或实

33、验质量的重要保证。环。是提高观察或实验质量的重要保证。科研设计科研设计专业设计专业设计统计设计统计设计成果:先进性、创新性成果:先进性、创新性 科学性和可行性科学性和可行性 研究者在统计设计过程中的几个关键问题:研究者在统计设计过程中的几个关键问题:(1 1)如何进行抽样,如何安排设计所规定的)如何进行抽样,如何安排设计所规定的干预措施?干预措施?(2 2)要达到研究目的应抽取多少个观察单位?)要达到研究目的应抽取多少个观察单位?(3 3)如何在诸多的影响因素中,分离出研究)如何在诸多的影响因素中,分离出研究因素对结果的效应?因素对结果的效应? 二、收集资料二、收集资料(collection

34、of data) 根据设计方案,取得准确可靠的原始数据,根据设计方案,取得准确可靠的原始数据,是统计分析的基础。是统计分析的基础。 来源来源统计报表资料统计报表资料经常性工作记录经常性工作记录专题调查或实验研究专题调查或实验研究统计年鉴和统计数据专辑统计年鉴和统计数据专辑 三、整理资料三、整理资料(sorting data) 将原始数据将原始数据净化、系统化、条理化净化、系统化、条理化,以便,以便为进一步计算和统计分析。为进一步计算和统计分析。 净化净化是指对原始数据的清理、检查、核对是指对原始数据的清理、检查、核对和纠正错误等;和纠正错误等; 系统化和条理化系统化和条理化是指根据研究目的,将

35、原是指根据研究目的,将原始数据合理分组并归纳汇总等。始数据合理分组并归纳汇总等。 资料整理包括:资料整理包括:1 1、首先对原始数据进行核对和检查、首先对原始数据进行核对和检查2 2、设计分组、设计分组 质量分组:将观察单位按其属性或类别归质量分组:将观察单位按其属性或类别归类分组。如性别、职业分类等。类分组。如性别、职业分类等。 数量分组:将观察单位按数值大小进行分数量分组:将观察单位按数值大小进行分组。如年龄大小、血压高低等。组。如年龄大小、血压高低等。3 3、按分组要求设计整理表,汇总资料。、按分组要求设计整理表,汇总资料。 数据的预处理:数据的预处理: 把原始数据转化为能被统计软件识别

36、的把原始数据转化为能被统计软件识别的数据集。数据集。例:性别:男、女例:性别:男、女 sex: =1(男)(男) =2(女)(女)数据录入工具:数据录入工具:EpiData、Ecxel等等 四、分析资料四、分析资料(analysis of data) 计算有关统计指标,反映数据的综合特计算有关统计指标,反映数据的综合特征,阐明事物的内在联系和规律。征,阐明事物的内在联系和规律。统计分析分为:统计分析分为: (1)统计描述)统计描述 (2)统计推断)统计推断统计学发展简史统计学发展简史统计学的发展史可分为三个时期:统计学的发展史可分为三个时期:n17世纪世纪70年代年代18世纪末:古典统计学世纪

37、末:古典统计学n18世纪末世纪末19世纪末:近代统计学世纪末:近代统计学n20世纪初世纪初现在:现代统计学现在:现代统计学Statisticians are very careful!As a biologist, a physicist, and a statistician are riding on a train through Wisconsin, they pass a herd of cows, one of which is completely white. “Oh look, there are white cows in Wisconsin,” says the biol

38、ogist. “You mean,” says the physicist with an air of superiority, “there is at least one white cow in Wisconsin.” “No,” says the statistician, “there is at least one cow in Wisconsin thats white on at least one side!”现代统计学的开端现代统计学的开端nFrancis Galton(1822-1911),维多利亚维多利亚女王时代最博学的人,女王时代最博学的人,创用和发展了创用和发展了

39、“相关相关”与与“回归回归”。n平生著书平生著书15种,撰写各种学术论文种,撰写各种学术论文220篇,涉猎范围包括地理、天文、气象、篇,涉猎范围包括地理、天文、气象、物理、机械、人类学、社会学、统计学、物理、机械、人类学、社会学、统计学、教育学、医学、生理学、心理学、遗传教育学、医学、生理学、心理学、遗传学、优生学、指纹学、音乐、美术等,学、优生学、指纹学、音乐、美术等,是一位百科全书式的学者。是一位百科全书式的学者。生物统计学生物统计学派创始人派创始人nKarl Pearson是是Galton的学生的学生n开创了统计方法学,把这门开创了统计方法学,把这门学科由描述性统计改变为推学科由描述性统

40、计改变为推断性统计。断性统计。n创造创造“标准差标准差”术语,术语,提出提出 2检验、检验、线性相关与回归。线性相关与回归。n1911年,在伦敦大学创立了年,在伦敦大学创立了世界首个综合大学统计系。世界首个综合大学统计系。现代统计学的开端现代统计学的开端现代统计学之父现代统计学之父Karl Pearson对相对论的贡献对相对论的贡献爱因斯坦爱因斯坦23岁时设立岁时设立 Olympia专业研究组,专业研究组,向成员推荐的第一本书向成员推荐的第一本书Pearson认为自然的法则认为自然的法则与观察者的理解能力有关。与观察者的理解能力有关。自然进程的不可逆纯粹是自然进程的不可逆纯粹是相对的概念。一个

41、能以光相对的概念。一个能以光速前进的观察者将看到永速前进的观察者将看到永恒的现在。他推测如果研恒的现在。他推测如果研究者的速度超过了光速将究者的速度超过了光速将会看到时光倒流,就像电会看到时光倒流,就像电影回放一样。该书介绍的影回放一样。该书介绍的某些主题后来成为爱因斯某些主题后来成为爱因斯坦理论的部分内容。坦理论的部分内容。Biometrika shall serve as a means not only of collecting or publishing under one title biological data of a kind not systematically collected or published elsewhere in any other periodical, but also of spreading a knowledge of such statistical theory as may be requisite for their scientific treatment. 19061936 Karl Pears

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论