




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 集中趋势的统计描述 Descriptive Statistics,频数分布 计量资料的统计描述 计数资料的统计描述,第一节 频数分布,计量资料的频数分布表 频数分布图 频数分布表的用途,一、频数与频数分布表,频数(frequency) 对一个随机事件进行重复观察,其中某变量值出现的次数 频数分布表(frequency distribution table) 是用表格的形式将各变量的取值与之相对应的频数用以表达的一种统计计算或分析表,例2.1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示: 如何有效地组织、整理和表达数据的信息,频数表的编制步骤,计算极差 决定组段
2、数 确定组距 确定组段 列表划记,1)求极差(range):即最大值与最小值之差,又称为全距。 本例极差: R=5.953.82=2.13 (2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分8-15个组,为方便计,组距参考极差的十分之一, 再略加调整。 本例i= R /10=2.13/10=0.210.2。 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数,表2-2 某地140名正常男子红细胞数的频数表,频数分布表的观察,频数分布有两个重要的特
3、征 集中趋势(central tendency) 所有观察值的集中(中心)位置 离散趋势(tendency of dispersion) 所有观察值偏离中心位置的分布情况,图2-1 140名正常男子红细胞计数的直方图,二、直方图(Histogram) 直观、形象地表示频数分布的形态和特征,分布的类型,对称分布 (symmetric distribution) 偏态分布 (skewed distribution) 正偏态分布 (skewed positively distribution) 负偏态分布 (skewed negatively distribution,分布的类型,负偏态分布:长尾向
4、左侧偏斜延伸,正偏态分布:长尾向右侧偏斜延伸,对称分布:中部高,两侧低,左右对称,三、频数表和直方图的用途 1.作为陈述资料的形式 2.便于观察数据的分布类型 3.便于发现资料中含有的异常值 4.可用各组段的频率作为概率的估计值,计量资料的统计描述,集中趋势的描述 离散趋势的描述,一、集中趋势的描述,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平 算术均数(arithmetic mean) 几何均数(geometric mean) 中位数 (median) 众数(mode,算术均数,简称均数 (mean),它是一组已知性质相同的数值之和除以数值个数所得的商数
5、 总体均数用希腊字母表示,样本均数用 表示,1)直接计算法,当观察例数不多(如样本含量n小于30)时,或观察例数虽然很多,但有计算机及统计软件,均可选择直接法。 公式,式中(读作sigma)为求和的符号, Xi为各观察值,n为总例数,2)加权法,当观察例数很多又缺乏计算机及统计软件时,若用直接法很容易出错,运用频数表资料,可以用加权法处理。 公式,k:频数表的组段数, f :频数, X:组中值,均数669.2/1404.78,几何均数,表示符号:G 适用对象:对数正态分布资料 当一组观察值不呈正态分布、且其差距较大时,若用均数表示其平均水平会受少数特大或特小值的影响;但数值按大小顺序排列后,各
6、观察值呈倍数关系或近似倍数关系,如抗体的平均滴度、药物的平均效价、食物中毒的平均潜伏期等,几何均数,适用对象 本身呈正偏态分布,经对数转换后呈对称分布或正态分布的资料,仅适用于右偏态分布,不适用于左偏态分布 变量x服从对数正态分布,即表示变量lg(xi)服从正态分布。对于lg(xi),具有正态分布的所有特性,1)直接计算法,几何均数:变量对数值的算术均数的反对数,其他对数(如自然对数)变换获得相同的几何均数,几何均数(Geometric Mean ) 例2.2 测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度,例 有8份血清的抗体效价分别为1:5, 1:
7、10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价,平均抗体效价为: 1:57,2)加权法,公式,例 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度,几何均数的适用条件与实例,适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料,血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数,此例的算术均数为22222,显然不能代表滴度的平均水平,几何均数的应用注意事项,计算几何均数时,观察值不能小于或等于零 观察值不能同时有正值
8、和负值 同一组资料求得的几何均数小于算术均数,先将观察值按从小到大顺序排列,再按以下公式计算,特点:仅仅利用了中间的12个数据,三、中位数和百分位数(一)中位数 (Median,M ) 将一组观察值从小到大按顺序排列,居中心位置的数值即为中位数。计算公式,1.原始资料 如测得5个人的VLDL中的apo_B的含量(mg/dl)为0.84、2.85、5.46、8.58、9.60,则 M=5.46(mg/dl) 若测量结果:0.84、2.85、8.58、9.6,则 M=(2.85+8.58)/2=5.72(mg/dl,频数表法,下限值L,上限值U,i; fm,中位数M,表2-4 某地630名正常女性
9、血清甘油三脂含量(mg/dl,L、iM、fM分别为M所在组段的下限、组距和频数, fL为M所在组段之前各组段的累积频数,中位数的特征,计算时只利用了位置居中的测量值 优点:对极值不敏感 缺点:并非考虑到每个观测值 对于正态分布或对称分布的资料,理论上中位数等于均数,正态分布时: 均数中位数正偏态分布时:均数 中位数 负偏态分布时:均数 中位数,中位数的适用条件:适合各种类型的资料。尤其适合于 大样本偏态分布的资料; 资料有不确定数值; 资料分布不明等,二)百分位数(Percentile,L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。 例2.5 计算例2.4的百分位数P25 、 P75 、 P90,三)百分位数的应用 1.中位数是百分位数的特例。其特点是不易受异常值的影响,适用于描述明显偏态分布、或两端无确定数值数据的平均水平。 2.描述数据序列在某百分位置的水平。多个百分位数结合使用如P25和P75可以描述数据的分散程度,用P2.5和P97.5计算医学95%的参考值范围等,小 结 1. 运用频数表、直方图和统计指标这些技巧能够有效地组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司月末会活动策划方案
- 公司茶会活动方案
- 公司春游游戏活动方案
- 公司播放电影策划方案
- 公司组织境外团建活动方案
- 公司组织午间运动活动方案
- 公司竞走活动方案
- 公司联欢晚会策划方案
- 2025年游戏设计师职业资格考试试卷及答案
- 2025年智能制造工程师考试试卷及答案
- 小学数学课件和复习
- 儿童舒适化口腔治疗
- 普通高中生物学课程标准-(2024修订版)
- 2022届湖南省普通高等学校对口招生语文试题真题(原卷版)
- 《电气化公路运输系统 架空接触网技术标准》
- 心理疾病 课件
- 室壁瘤三明治手术
- 民主建国会会史课件
- 安徽省2011年普通高校招生第一批本科院校投档分数及名次
- 时代音画学习通超星期末考试答案章节答案2024年
- GB/T 6003.2-2024试验筛技术要求和检验第2部分:金属穿孔板试验筛
评论
0/150
提交评论