




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 计量资料的统计描述,卫生统计学教研室任艳峰,Qualitative dataanalysis (ranked),Quantitative data analysis,Statistical description,Statistical Inference,Statistical Inference,Statistical description,Design,Collection of data,Sorting data,Statistical analysis,Statistical analysis,Statistical description,Statistical description,Statistical Inference,Statistical Inference,Parameter Estimation,Hypothesis Test,熟悉频数表的划记步骤,频数表的用途。 掌握集中趋势指标的定义、适用范围和计算。 掌握离散趋势指标的定义、适用范围和计算。,学习目标,定量资料进行描述时,如果样本量较大,需要对原始资料进行整理,列出频数分布表,通过频数表以显示资料的分布类型。,第一节 频数分布表与频数分布图,频数(frequency) 某数值在数据中出现的次数。相对频数(frequency) 也叫频率,数值在总观察例数中所占的比例。频数表(frequency table) 将所有“互相排斥的情形”的频数毫无遗漏地排列在一起。由频数与组段组成。,如1998年某山区96名孕妇产前检查次数资料: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7。这是什么类型的资料?,一、离散型定量资料的频数分布,1998年某地96名孕妇产前检查次数分布,图中横坐标表示产前检查次数,纵坐标表示各检查次数的孕妇例数占总孕妇数的频率(比例)。从直条高度和分布情况看出,产前检查次数分布呈负偏态分布。,二、连续型定量资料的频数分布,1.找出最大值 和最小值,(一)频数分布表的编制方法,2.计算全距 (range,R)也叫极差,(1)根据数据多少,组段数一般515个左右(10);(2)根据(R/预计组段数)估计组距大小 (22.22/10=2.22);(3)确定组段数和组距;两端的组段包含最大值和最小值;尽量取整数作为组段的端点;组距尽量取相等为宜。,3.确定组段数和组距(class interval),4.列表:根据下限X上限的原则确定每一例数据所归属的组段。,标 题,120名正常成年男子血清铁含量(mol/L)频数表,1.揭示资料的分布特征;(1)集中趋势:大部分数据向中间集中,中间数据居多。(2)离散趋势:从中央到两侧,频数分布逐渐减少。2 .揭示资料的分布类型; 正态分布:中间高两侧低、左右对称的单峰分布。 偏态分布:集中位置偏向一侧,分布不对称。3.便于发现某些特大或特小的可疑值;4.便于计算指标和统计分析。,(二)、频数分布表的用途,正偏态,正态分布,负偏态,120例健康成年男子血清铁含量分布,频数分布图,120例健康成年男子血清铁含量分布,频数分布图,频率密度=频率/组距,第二节 集中趋势的描述,集中趋势指某计量资料大多数观察值所在的中心位置。常用指标有:1.算术均数(arithmetic mean),简称均数(mean)2.几何均数(geometric mean)3.中位数 (median),算术均数(mean),1.定义:算术平均数是由所有数据之和除以数据个数所得的商数。反映一组同质的观察值在数量上的平均水平。总体均数用希腊字母,样本均数用 表示。,2. 适用范围:(1)描述对称分布资料的集中趋势;(2)描述正态分布资料的集中趋势。,3.均数的计算公式:,(1)直接法:,(2)加权法,f 为组段的频数X0为组段的组中值X0=(上限+下限)/2,例:测得8只正常大鼠的血清中酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试计算算数均数。,几何均数(geometric mean),1. 定义: n个观察值的连乘积的n次方根,几何均数用G表示。2. 适用范围:(1)成倍数关系或等比关系的资料(2)对数正态分布资料,3. 计算公式:,(1)直接法:,(2) 加权法:,例:7名慢性迁延性肝炎患者的HBsAg滴度资料为:1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。,4.几何均数的特点:,(1) 观察值不能同时存在大于和小于0的数据,不能有等于0的数据。 (2)同一组资料所得几何均数小于等于均数。,中位数(median),1.中位数:将一组观察值按照从小到大,或者大到小的顺序排列,位次居中的观察值水平。中位数用M表示。百分位数(percentile):一个位置指标,用Px表示。描述观察值序列在某百分位置的水平。,PX,理论上适用于任何分布类型 ;(2)尤其偏态分布资料;(3)开口资料;(4)分布类型不清的资料;,2.中位数的适用范围:,(1)直接法,3. 计算公式:,(2) 加权法:,Px :百分位数 L : Px所在组段的下限值 i : 组距 fx : Px所在组段的频数 n : 样本例数 f L : 该组段之前的累计频数,例: 某药厂观察9只小鼠口服山红景醇提物(RSAE)后在缺乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。,中位数实例,10例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2,对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人, 6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。本资料属于“开口”资料。本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。,例:试对下表资料求其中位数M。,M = P50,描述离散趋势的指标,第三节、离散趋势的描述,离散程度指某计量资料的所有观察值与中心位置的发散程度。,描述离散趋势的指标,极差(range),极差(range,R):又称全距,一组观察值中最大值和最小值的差。2. 计算公式:,3. 特点,(1)简单明了,计算简单,应用广泛。(2)只能反映最大值和最小值的变异,不能反映所有数据的变异。(3)样本含量n变大时,R也会变大。(4)样本含量不变时,R抽样误差也较大,不稳定。,4. 适用范围:任何分布类型资料,资料做粗略分析。,四分位间距,2. 计算公式:,1.四分位数(quartile):是特定的百分位数,下四分位数P25,记作QL;上四分位数P75,记作QU。上四分位数P75,与下四分位数P25之差即是四分位间距。,(1)避免了极差受极端值的影响;(2)样本含量n变大时,Q比R稳定;(3)只能反映中间50%的数据的变异,不能反映所有数据的变异;(4)去头弃尾,丢失大量的信息。,3. 特点,(1) 偏态分布资料;开口资料;分布类型不清的资料(2) Q与M一起使用,描述偏态分布资料的集中趋势和离散趋势。,4. 适用范围,方差 (variance),1.方差 (variance,2/S2):总体(样本)内所有个体观察值与总体(样本)均值的离均差平方和(sum of square)的均值。,2. 计算公式:,自由度:df/ 表示随机变量能“自由”取值的个数 例如有一四个数据的样本,受到均数为5的条件的限制,在自由确定4、2、5三个数据后,第四个数据只能是9,=3任何统计量自由度的个数为=n-限制条件的个数。,(1) 能够反映所有观察值之间的离散程度(2) 考虑到每一个观察值,信息利用充分(3) 对数据的变化反应灵敏,3. 特点,4. 适用范围: 正态分布资料或近似正态分布资料.,标准差 (standard deviation),1.标准差 (standard deviation,S ) :即方差的正平方根;其单位与原变量X的单位相同。总体标准差:样本标准差:S,2. 计算公式:,(1) 能够反映所有观察值之间的离散程度(2) 考虑到每一个观察值,信息利用充分(3)对数据的变化反应灵敏,3. 特点,(1) 正态分布资料或近似正态分布资料(2) 标准差和均数相结合,描述正态分布资料的集中趋势和离散趋势,4. 适用范围,变异系数 (coefficient of variation),1.变异系数 (coefficient of variation,CV ):标准差与相应均数的比值;其意义是标准差为均数的多少
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心理驱动的学习教育心理学的奥秘
- 教育信息化背景下的科技型议题式教学研究
- 大数据背景下的智慧学习环境建设
- 教育驱动乡村振兴-以在线水稻种植课程为例
- 数字教育资源库的版权管理方案设计
- 儿童心理辅导与教育策略实训
- 基于用户情感的在线教育平台界面优化策略
- 中职招生宣传课件
- 提升劳动者自我效能感的教育心理学方法
- 基于教育心理学的个性化学习方案
- GB/T 15298-1994电子设备用电位器第一部分:总规范
- 泥水平衡盾构简介课件
- 新教科版六下科学4-6《生命体中的化学变化》教案
- 2023高中学业水平合格性考试历史重点知识点归纳总结(复习必背)
- 自然指数NatureIndex(NI)收录的68种自然科学类期刊
- 手术报告审批单
- 《专业导论光电信息科学与工程》教学大纲
- 广东省湛江市各县区乡镇行政村村庄村名明细
- 煤矿智能化综采工作面系统运行维护管理制度
- 少儿美术国画- 少儿希望 《紫藤课件》
- 建立良好的同伴关系-课件-高二心理健康
评论
0/150
提交评论