10讲讲义--大话统计第一讲-绪论-刘炜达-2018 11 01_第1页
10讲讲义--大话统计第一讲-绪论-刘炜达-2018 11 01_第2页
10讲讲义--大话统计第一讲-绪论-刘炜达-2018 11 01_第3页
10讲讲义--大话统计第一讲-绪论-刘炜达-2018 11 01_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2019/1/5大纲n 流行病与统计及线上课程介绍20世纪统计学如何变革了科学统计分析方法的选择n 统计描述中的统计表n 课堂练习题流行病与统计及线上课程介绍20世纪统计学如何变革了科学Francis GaltonKarl Pearsonn 分布观测到的现象只是一种随机的映像,不是真实的,所谓的真实是概率分布。科学中真实的东西并不是我们所能观测到或能把握到的,它们只是通过用来描述我们所观测事物随机性的数学函数来反应现象的“发现者”n 回归的由来n 参数科学调查中我们真正想确定的,是分布的四个参数。从某种意义上说,我们永远不能确定这四个参数(平均数,标准差,对称性,峰度)的真实数值,而只可能从资

2、料中估计它们。n 最先使用了“相关”n 拟合优度检验n 政治情怀1统计思维(绪论)刘炜达阜外医院国家心血管病中心医学统计部2019/1/5Biometrika生物统计William Sealy Gosset由于资金充裕,该期刊成为世界上第一本印有全彩照片的期刊。吉尼斯酿造公司接下来的25年里,生物统计发表了通讯员们从各地发来的数据:有的深入非洲 The Probable Error of the Mean 的丛林,测量原住民的胫骨和腓骨;有的从洲的雨林抓到奇特的热带鸟类,测量其喙长;还有的甚至偷盗古墓,揭开死人头盖骨灌铅,以测量其脑的容量。在1910年,该期刊发表了几幅全彩照片,画Willia

3、m Sealy GossetWilliam Sealy Gosset麦芽糖准备发酵的时候,需要仔细地测量所用酵母的量。吉尼斯酿造公司酵母太少,发酵不充分;太多了,啤酒又会发苦 The Probable Error of the Mean 酵母生活在液体里,工人们得 测量清楚某个给定的瓶中有多 少酵母,以便决定用多少液体,它们提取一定量的液体,在显微镜下检验,计量他们所看到的酵母细胞数。这种测量有多准确?William Sealy GossetThe Design of Experiments实验的设计费歇尔讨论了这个实验的各种可能结果,他叙述了如何确定这样一些问题: The Design of

4、 Experiments “不幸”的童年与老皮尔逊的矛盾 高尔顿相关系数的统计分布作物收成变动研究统计量变异数分析,极大似然算法n 应该为那位女士奉上多少杯茶?n 这些茶应该按什么样的顺序奉上?n 对所奉各杯茶的顺序应该告诉那位女士多少信息?n 22019/1/5William Sealy GossetThe Design of Experiments实验的设计费歇尔讨论了这个实验的各种可能结果,他叙述了如何确定这样一些问题:n The Design of Experiments n “不幸”的童年n 与老皮尔逊的矛盾 高尔顿相关系数的统计分布n 作物收成变动研究n 应该为那位女士奉上多少杯茶

5、?n 这些茶应该按什么样的顺序奉上?n 对所奉各杯茶的顺序应该告诉那位女士多少信息?n n 统计量n 变异数分析,极大似然算法回顾一下高尔顿所发现的“向平均数回归”,他试图找到一个数学公式,将随机 彼此联系在一起。费歇尔建立了某个给定地块小麦收成与年份之间的一般数学关系n 他将小麦产量的时间趋势分成几个部分统计量作物收成变动研究 n 一个是由于土地导致产量稳定地整体性地下降n 另一个是长期的缓慢的变化, 每个阶段都要花几年时间n 第三个是一组更快的移动变化, 考虑的是气候在不同年份的差异。William Sealy Gosset20世纪统计学如何变革了科学n The Design of Exp

6、eriments n “不幸”的童年n 与老皮尔逊的矛盾 高尔顿相关系数的统计分布n 作物收成变动研究n 统计量n 变异数分析,极大似然算法3 在费歇尔提出的三项基本准则中,“无偏性”准则最引人关注,这或许是由于“偏误”(bias)这个词带有某种贬义。一个有偏的统计量似乎是谁都不想要的某个东西。 有一种非常奇怪的分析方法, 叫做“意向性分析”(intent to treat),已经成为占优势的医学试验法,因为,这种方法仍能保证结果是无偏的, 尽管它忽略了有效性的准则。 一致性(consistency):样本数目越大,估计量就越来越接近总体参数的真实值。 无偏性(unbiasedness估计量抽

7、样分布的数学期望等于总体参数的真值。 有效性(efficiency):指估计量与总体参数的离散程度, 如果两个估计量都是无偏的, 那么离散程度较小的估计量相对来说是有效的,离散程度用方差来衡量。2019/1/5统计分析方法的选择统计分析方法的选择统计分析一般遵循以下思路:(1)先确定研究目的,根据研究目的选择方法。(2)明确数据类型,根据数据类型进一步确定方法。(3)选定统计方法后,需要利用统计软件具体实现统计分析过程。(4)统计结果的输出并非数据分析的完成。一般统计软件都会输出 很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计结论不同于专业结论,最终还需要结合实际做出合理的专业

8、结论。思考题某大学对全校师生都关心的5个问题进行问卷调查,每个问题采用线性模拟评分方法,让调查对象在他们认为适当的线性尺度位置上作出标记。每个问题从很不满意(0)到非常满意(10)。表列出来对20名学生和20名教师的抽样调查结果。问同学和教师的调查结果是否吻合?统计描述中的统计表统计描述中的统计表1. 概念将统计分析的事物及其指标用表的形式表示出来,就是统计表。数字:用阿拉伯数字表示。 无数字用“”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。2. 结构及要求备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*”标题:概括表的主要内容,包括研究的时间、地

9、点和研究内容,放在表的上方。标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标号,在表下方说明。明指标的单位。线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。42019/1/5统计表的结构统计表的结构统计表由以下几个部分组成:标题、标目、线条、数字、备注表号标题(包括何时、何地、何事)横标目的总 标 目总 标 目(单位)总 标 目 纵 标 目纵 标 目纵 标 目纵 标 目表1 某省某工厂 1994、1998年四项检测指标异常检出率横 标 目. . . . 1994年1998年检测 指标 受检人数 异常人数 检出率(%)受检人数 异常人数 检出率(%)合计血压心率TTTD GPT#5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75. . 备注:D:TTT(麝香草酚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论