已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学,方积乾中山大学公共卫生学院医学统计与流行病学系2011.11,卫生统计学,第一章绪论,什么是统计学(statistics)?,“Asciencedealingwiththecollection,analysis,interpretation,andpresentationofmassesofnumericaldata”(WebstersInternationalDictionary)。“Thescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults”(JohnM.Last,ADictionaryofEpidemiology),什么是统计学(statistics)?,内容:收集、分析、解释和表达数据统计学:处理数据中变异性的科学与艺术目的:求得可靠的结果统计学的现实地位:合作、审稿、基金申请(NIH)、药物开发与申报(FDA)、卫生决策,统计学的若干概念,1.总体与样本总体(population):大同小异的对象全体。抽样(sampling):从研究总体抽取部分个体样本(sample):抽取的部分个体数据(data):观察所得资料informationdatadataknowledge推断(inference):分析样本数据,获得关于总体的知识统计推断的工具:有关概率的理论。推断的结论:不是完全肯定或完全否定。关键与核心:抽样方法、样本的代表性和推断的方法,同质与变异同质性(homogeneity)共性,大同小异变异(variation)个体间差异,多样性没有同质性就构不成一个总体;总体内没有变异性就无需统计学。统计学的任务:在变异的背景上,描述同一总体的同质性,揭示不同总体的异质性(heterogeneity)。,.变量的类型变量(variable):个体特性的数量描述(1)定性变量(i)分类变量(categoricalvariable)或名义变量(nominativevariable)。分类变量的水平(level):用1、2、3、4、5等代码(code)表示水平。二分类变量(binaryvariable),也称0-1变量或假变量(dummyvariable)分类变量与二分类变量相比,信息较丰富。(ii)有序变量(ordinalvariable)种种可能的“取值”中自然地存在着次序。有序变量与分类变量相比,信息较丰富。,(2)定量变量(i)离散型变量只能取整数值。例如,手术病人数;新生儿数(ii)连续型变量可以取实数轴上的任何数值。由测量而得到的大多属于连续型变量例如,血压、身高、体重等“连续”指该变量可在实数轴上连续变动。连续型变量信息最丰富,离散型变量次之。变通:红细胞记数也视为连续型变量。(数值很大,个位数之间的差别并不重要),变量类型的转化:,连续型有序分类二值只能由信息丰富的(高级)向信息不丰富的(低级)转化,不能作相反方向的转化离散型变量常常通过适当的变换或连续性校正后,借用连续型变量的统计方法来分析。,4.因果与联系公共卫生领域常常要探究危险因素与疾病之间的因果关系(causation)。首先应当问存在不存在联系(association)然而,存在联系未必有因果关系在解释统计分析的结果以及下结论时,务必对“因果”二字慎之又慎。,学习目的与方法,(1)统计思维享用一生事件的不确定性-概率由样本推断总体,结论的不确定性-有可能犯错误统计学任务-限定犯错误概率的大小,在此前提下,作决策,(2)理解概念是首位研究设计的原则确定样本量的依据参数估计的精度决策的两类错误案例辨析:在辨析中提高,从反面吸取教训-平时争论、课堂讨论,(3)重在理解和解释结果通过计算,体验统计概念和思想正确理解、解释和表达计算结果中英文结果报告:内容齐全,表达规范-作业要按照规格撰写(4)电脑实验用电脑模拟现实世界,从实验中看随机现象统计软件:反复实践,灵活运用-机房开放,勤动手!,(5)考试*笔试:理论、方法不记公式,无数学推导,无复杂计算*上机考试:已做过的电脑实验;不编程序,第二章定量资料的统计描述,把握数据的基本特征为统计分析打下基础统计表描述性统计量统计图,统计描述-从数据中获取知识最直观的方法,第一节频数与频数分布,频数分布表(frequencydistributiontable)又称频数表一、离散型定量变量的频数分布例2-11998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7,直条图(barchart)横坐标:产前检查次数;纵坐标:频率,检查k次的妇女所占的比例(%)等宽矩形长条:高度相当于检查次数的频率,二、连续型定量变量的频数分布,例2-2抽样调查某地120名18岁35岁健康男性居民血清铁含量(mol/L),数据如下:,直方图,(1)频率直方图横轴:血清铁含量纵轴:频率矩形直条高度=频率,直条高度之和=100%(2)频率密度直方图横轴:血清铁含量纵轴:频率密度=频率/组距矩形直条的面积=频率,直条面积之和=100%注:组距相等时,两种直方图形状相同,图2-3某地居民238人发汞含量(mol/kg)分布,正偏峰分布(positivelyskeweddistribution),负偏峰分布(negativelyskeweddistribution),频率密度,第二节定量变量的特征数,定量地描述集中趋势与离中趋势是统计描述的重要内容一、描述集中趋势的统计指标对于连续型定量变量,描述集中趋势常用的统计量为算术均数、几何均数和中位数。,1.算术均数简称均数(mean),适合描述对称分布资料的集中位置(也称为平均水平)。其计算公式为,n:样本含量X1,X2,Xn:观察值或:观察值之和,例2-3测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。按式(2-1),算术均数为,对于偏峰分布资料算术均数不能较好地反映分布的集中趋势。,频率密度,2.几何均数(geometricmean),适用于观察值变化范围跨越多个数量级的资料频数图一般呈正偏峰分布,例2-57名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。,3.中位数(median),可用于各种分布的定量资料总体中有一半个体的数值低于这个数,一半个体的数值高于这个数。基于样本资料将n例数据按升序排列,第i个数据记为n为奇数时n为偶数时例2-7某药厂观察9只小鼠口服高山红景天醇提取物(RSAE)后在乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。,百分位数(percentile),总体中,数值小于它的个体恰有X%,大于它的个体恰有1-X%中位数=样本估计:按照升序排列的数列里,其左侧(即小于它)的个体数在整个样本中所占百分比为X%。,4.众数(mode),总体中出现机会最高的数值。样本估计:在样本中出现次数最多的数值。例2-11998年某山区96名孕妇产前检查次数资料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7众数为4(次),二、描述离散趋势的特征数,同一总体中不同个体之间的离散趋势又称为变异(variation)。例2-11试观察三组数据的离散状况。(均数都是30)A组:26,28,30,32,34B组:24,27,30,33,36C组:26,29,30,31,34,1.极差(range),R=最大值最小值计算简便,但仅利用了两个数据的信息一般,样本量n越大R也往往会越大,不够稳定例2-12计算上述三组数据的极差A组R=34-26=8B组R=36-24=12C组R=34-26=8,2.四分位数间距(quartilerange),Q=P75-P25P25与P75之间恰好包含50%的个体四分位数间距Q是总体中数值居中的50%个体散布的范围Q越大意味着数据间变异越大,3.方差(variance)与标准差(standarddeviation)用于反映一组对称分布的观察值在数量上的变异程度。总体中:,样本中:,例2-14分别计算例2-11中三组数据的标准差。按照公式(2-11)与标准差的定义C组数据的离散趋势最小,B组的最大,5.变异系数(coefficientofvariation,CV),例2-151985年通过十省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm。体重的变异大还是身高的变异大?,体重的变异系数身高的变异系数,用于量纲不同的变量间变异程度的比较或均数差别较大的变量间变异程度的比较,四、描述分布形态的统计指标,1.偏度系数(coefficientofskewness,SKEW),总体偏度系数为0时,分布是对称的;取正值时,分布为正偏峰;取负值时,分布为负偏峰。例2-2中血清铁含量(mol/L)数据偏度系数SKEW=-0.19389,2.峰度系数(coefficientofkurtosis,KURT),正态分布的总体峰度系数为0;取负值时,其分布较正态分布的峰平阔;取正值时,其分布较正态分布的峰尖峭。,例2-2中血清铁含量(mol/L)数据的峰度系数KURT=-0.01824,第六节案例讨论,案例2-1某市1974年留驻该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞值(mol/kg)检测结果如表2-6的第1和3列所示。试对该市居民发汞水平进行统计描述。,该市居民发汞的均数=7.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 46633-2025土方机械挖掘机运行能效评价方法
- 2025年衡阳辅警招聘考试题库及答案详解(各地真题)
- 2025年甘孜藏族自治州辅警招聘考试真题附答案详解(轻巧夺冠)
- 2025年漳州辅警招聘考试真题及答案详解(有一套)
- 2025年苗栗县辅警招聘考试题库附答案详解(b卷)
- 2025年白银辅警招聘考试题库有答案详解
- 2025年韶关辅警招聘考试题库附答案详解(轻巧夺冠)
- 2025年苗栗县辅警招聘考试题库含答案详解(考试直接用)
- 2025年衡阳辅警协警招聘考试备考题库(含答案详解)
- 2025年海西州辅警协警招聘考试备考题库及答案详解(有一套)
- 《猪精液稀释保存剂 生产工艺与质量技术规范》
- 2025年贵州省新事业单位面试真题及参考答案
- 2025年消防月主题培训全民消防生命至上安全用火用电
- 2025年VTE护理防治小组培训考试试题(附答案)
- 2025成都农商银行社会招聘(综合柜员)考前自测高频考点模拟试题及答案详解(有一套)
- JJF(石化)063-2023汽油辛烷值机(研究法)校准规范
- UHPC裂缝控制技术-洞察及研究
- 思政课爱国主义课件
- 2025年安全员c证试题库及答案
- 香蕉病虫害防治技术
- 2025年重特大事故一览
评论
0/150
提交评论