




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学,第一章 绪论,统计学与医学统计学 医学统计学的内容 医学研究的三个步骤 三类资料 医学统计中的基本概念 建立统计学思维,统计学是当今最重要的科学技术之一,美国“科学84年”杂志选出“20世纪对人类生活影响最大的20项科技成果”;统计学入选其中(其它如:相对论、激光、电视、DNA等).,统计学定义:,Statistics is the science dealing with the collections, analysis, interpretation and presentation of masses of numerical data. (Webster) Statist
2、ics is the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable result. (Armitage),“统计学是收集和分析数据的科学与艺术。” 不列颠百科全书,不像其他学科,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。 GudmundR.lversen,Believe it or not? You are using statistics almost
3、every day! 我要在中午12:40赶到新街口,12:00走比较好 天气预报说今天有70的几率会下雨,我还是带伞吧! 我这次找张大夫治疗效果不错,下次还要找他!,医学统计学(medical statistics),是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。,数理统计学与生物医学的结合,生物统计学(Biostatistics) 应用于生物学研究,又称生物测量学Biometrics 医学统计学(Medical Statistics) 应用于医学研究,侧重于医学的生物性 卫生统计学(Health Statistics) 应用于医学
4、研究,侧重于医学的社会性,三个步骤:,研究设计 运用医学统计学的起点,也是高质量地完成整个研究的重要基础。 资料分析 在研究设计基础上,通过实验(试验)或调查,将所得数据进行统计学处理的过程。 结论 在数据分析的基础上,应用统计学处理的结果,进行统计学推断;同时,依据相应的专业知识,作出专业性的结论。,Example:,1936年美国总统选举; literary digest,民意调查; 堪萨斯州州长A1f landon ? 当任总统,Franklin D. Roosevelt ? 电话簿和车辆登记簿上的名单 “A1f landon win!” In fact,Franklin win! wh
5、y?,三类资料:,(1) 定量资料(quantitative data) (2) 定性资料(qualitative data) (3) 等级资料(ranked data,ordinal data),资料类型的判断:,另一种分类:,数值变量资料(numerical variable) 分类资料(categorical variable),二分类(binary( dichotomous) variable) 多分类(polytomous variable ),无序多分类(multinomial) 有序多分类(ordinal) (等级资料,ranked data),数学上的分类,连续型资料(cont
6、inuous data) 离散型资料(discrete data),1950-2003年全国法定报告传染病病死率,1990-2003年全国甲肝、乙肝发病率,19852001年全国报告的STD发病率,近年来全国性病年报告例数不断增加,1989年,1998年,1995年,1985年,1955-2003年全国狂犬病发病率,基本概念(1):,同质与变异: 同质(homogeneity):观察单位具有相的性质。 异质(heterogeneity):性质不同。 同质性是构成研究总体的必备条件; 研究内容(指标/变量)不同,对同质性的要求不同;,制定血红蛋白参考值范围时:,制定白细胞参考值范围时:,基本概念
7、(2):,个体变异(individual variation) 同质个体间的差异。 一种或多种不可控因素(已知的或未知的)作用下所产生的反映的综合表现。 结果是随机的(无法绝对正确地预测)。 个体变异是普遍存在的。 个体变异是有规律的。 没有个体变异,就没有统计学!,例1:个体变异的表现,某地所有20岁健康男生的血红蛋白 某地所有20岁健康男生和女生的血红蛋白 江苏和西藏所有20岁健康男生的血红蛋白 某地所有20岁健康男生和女生的白细胞计数 ,总体(population) 有限总体(finite) 无限总体(infinite) 个体(individual) 样本(random sample)
8、代表性,包含了总体的特性,基本概念(3):,总体参数(population parameter) 未知的,固有的,不变的,! 样本统计量(sample statistics) 已知的,变化的,有误差的! 样本含量(sample size),基本概念(4):,基本概念(5):,随机(random) 机会均等 随机抽样(random sampling) 有相同的机会被抽到 随机分组(random allocation) 有相同的机会被分到不同的组中,基本概念(6):,随机变量(random variable), 变量 个体观察指标,频率:在n次随机试验中,事件A发生了m次,则比值 称为事件A在这n
9、次试验中出现的频率(frequency),基本概念(7):,频率和概率,抛硬币试验在概率的统计学定义上的诠释,概率(probability):描述了随机事件发生的可能性的大小。是一种参数。 数理统计学中的大数定理表明:当观察次数n越来越大,频率f 的随机波动幅度越来越小,并最终趋向于一个常数:随机事件A 发生的概率(又称为统计学上的概率定义)。,小概率事件(rare event) 小概率原理如果某事件的发生概率很小则在一次试验中,认为不发生。,基本概念(8):,抽样误差(sampling error) 由抽样引起的样本统计量与总体参数间的差别 原因:个体变异抽样 表现: 样本统计量与总体参数间
10、的差别 不同样本统计量间的差别 抽样误差是有规律的!,基本概念汇总,总体 个体、个体变异,总体参数 未知,样本 代表性、抽样误差,随机 抽样,样本统计量已知,统计推断,风 险,医学统计学思维,归纳型思维 推理型思维 从样本到总体 从个别到一般,建立医学统计学思维,生物体的变异是普遍存在的,这种变异是有规律的; 抽样误差是不可避免的,抽样误差是有规律的; 统计推断是有风险的,这种风险是可以控制的。,统计学的作用:,统计学上得到的结论都具有概率性,它不能证明什么,但可以提供结论成立或不成立的概率,从而提高研究者的分辨能力,为科学决策提供依据。 发现规律,而不是创造规律,统计学不能创造原本不存在的结
11、论。 统计方法是一个中立性的工具。,学习医学统计学的要求:,建立统计学思维 学会从不确定性、机遇、风险和推断的角度去思考医学问题提高自身的科学素质和医学研究能力; 学会设计 结合专业作出严密的试验设计并获得可靠、准确、完整的资料; 学会分析与表达 学会运用统计方法充分挖掘资料中蕴含的信息,恰如其分地进行理性概括,写出具有科学认证的研究报告和学术论文。,第二章、统计资料的整理与描述,频数分布 描述集中趋势的指标 描述离散程度的指标,例2:乱七八糟的原始数据,某地120名14岁女童身高(cm)资料如下,给我给我一双慧眼吧,让我把这纷扰看个清清楚楚明明白白真真切切,计量资料的频数、频率分布,2.1
12、频数分布,原因:由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。 现状:医学研究得到的原始数据(raw data)往往是庞大的、混乱的。 解决:频数分布的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组的频数,得到频数分布表;在将频数表绘制成频数分布图。,120名14岁女童身高的频数分布图,某城市892名老年人生存质量自评分的频数分布,自评分,人 数,102名黑色素瘤患者的生存时间频数分布,生存时间(月),人 数,某地某年10000例死亡者年龄分布,死亡年龄(岁),人 数,分类资料
13、的频数分布,血型频数频率(%) O205 40.43 A112 22.09 B150 29.59 AB 40 7.89 合计507100.00,频数分布所提供的信息,频数分布图用以表示数据的分布规律。 观察有无可疑值 。 考察分布的类型 。 对称分布 非对称分布(偏态分布) 左偏态(负偏态) 右偏态(正偏态) 考察分布的特征 集中趋势(Central Tendency) 离散程度(Tendency of Dispersion),289名近视患者Lasik术后1月裸眼视力,偏态分布1:老年人生存质量自评分,自评分,人 数,偏态分布2: 黑色素瘤患者的生存时间,生存时间(月),人 数,偏态,正偏态
14、和负偏态,分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。,集中趋势和离散程度,2.2 定量资料的统计描述,集中趋势的描述算术均数,算术均数(arithmetic mean, mean,),加权均数(weighted mean) 均数是加权均数的一个特例,集中趋势的描述几何均数,几何均数(geometric mean,G),例3、几何均数(P14),1:10, 1:20, 1:40, 1:80, 1:160,集中趋势的描述中位数,中位数(median,M) 将一组数据按从小到大的顺序排列,位置居中的数即是中位数。 The Median is that value for which 50 percent of the observations, when arranged in order of magnitude, lie on each side.,例4、中位数,9例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 10例正常人的发汞值: 1.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 健康作息时间的科学制定方法
- 2025-2030年中国立体声蓝牙耳机行业市场现状供需分析及投资评估规划分析研究报告
- 电影院影厅布局与观影体验研究
- 2025-2030年中国横向流量分析行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国婴幼儿辅食行业市场深度调研及竞争格局与投资研究报告
- 高效储能集装箱消防解决方案:行业分析市场动态与未来趋势
- 行业新兴发展趋势解析:宠物美容师速成班探讨
- 病人入院的护理流程图
- 互联网广告行业报告:市场规模与增长趋势
- 核心理论培训课件
- 地下连续墙成槽垂直度控制
- 【超星尔雅学习通】《老子》《论语》今读网课章节答案
- 中国农业银行笔试题库(含答案)
- simufact教程基础部分从Simufact得到支持
- NB-T 10651-2021 风电场阻抗特性评估技术规范
- 电缆电线出厂检验报告参考
- YY/T 0500-2021心血管植入物血管假体管状血管移植物和血管补片
- YY/T 0148-2006医用胶带 通用要求
- GB/T 4745-2012纺织品防水性能的检测和评价沾水法
- GB/T 39480-2020钢丝绳吊索使用和维护
- GB 14934-2016食品安全国家标准消毒餐(饮)具
评论
0/150
提交评论