已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲计量资料的统计描述,频数分布,一、频数分布表(frequencytable)编制频数分布表可了解其分布的范围、数据最集中的区间以及分布的形态。例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇()的测量结果如下,试编制频数分布表。,2.354.213.325.354.174.134.483.984.732.784.263.584.344.844.413.993.803.874.783.953.923.583.664.283.784.574.263.263.502.704.614.752.913.933.784.133.914.593.264.193.002.684.524.913.843.683.184.833.873.953.914.524.285.133.274.154.554.803.414.123.954.065.715.265.253.985.033.513.863.023.704.174.954.153.254.363.294.333.633.303.755.084.533.923.583.843.603.194.504.505.353.514.063.073.553.964.593.524.834.233.57,频数分布,编制步骤如下:求极差(range,R):也称全距,即最大值和最小值之差,本例R=5.71-2.35=3.36(mmol/L)。确定组段数和组距:组段数(10-15组)。组距可通过极差除以组段数求得,本例i=3.36/10=0.30。3写出组段:每个组段的下限为L、上限为U,起始组段和最后组段应分别包含全部变量值的最小值和最大值,见表2-1第(1)栏。4分组划记并统计频数:各组段的频数见表2-1第(2)栏,然后求频数合计,完成频数表。,频数分布,组段频数f组中值Xfxfx2(1)(2)(3)(4)=(2)(3)(5)=(2)(3)22.3012.452.456.002.6032.758.2522.692.9063.0518.3055.823.2083.3526.8089.783.50173.6562.0526.483.80203.9579.00312.054.10174.2572.25307.064.40124.5554.60248.434.7094.8543.65211.705.0055.1525.75132.615.3025.4510.9059.415.605.9015.755.7533.06合计101409.751705.09,频数分布,二、频数分布图根据表2-1资料,以各组段血清总胆固醇含量为横坐标、频数为纵坐标,可绘制频数分布图(graphoffrequencydistribution),,图2-1,频数分布,三、频数表和图的用途1、描述频数分布的类型对称分布:各组段的频数以频数最多组段为中心左右两侧大体对称;偏态分布:频数最多组段不在中心位置,其两侧组段数不对称。正(右)偏态分布(见图2-2)负(左)偏态分布(见图2-3),频数分布,图2-2,频数分布,图2-3,频数分布,2描述频数分布的特征从表2-1可看出这些数据的分布特征有两点:变异的范围在;有明显的统计分布规律,数据主要集中在之间,尤以组段的人数最多,且上下组段数的频数分布基本对称。3便于发现一些特大或特小的可疑值4便于进一步做统计分析和处理,集中趋势的描述,集中趋势描述数据的集中位置和平均水平。常用指标:算术均数几何均数中位数,集中趋势的描述,1、算术均数(Mean):适应于对称分布的资料。1)直接计算法:计算公式为式中X1,X2和Xn为所有观察值,n为样本含量,(希腊字母,读作sigma)为求和的符号。例2-1资料得:,集中趋势的描述,2)频数表法:计算公式为表2-1资料得:,集中趋势的描述,2.几何均数几何均数(geometricmean)可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。其计算公式为,集中趋势的描述,例2-4某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,求几何均数。或故5份血清抗体效价的平均滴度为。,集中趋势的描述,对于频数表资料,几何均数的计算公式为例2-5,见表2-4资料.计算结果如下:,集中趋势的描述,3.中位数中位数(median)是将个变量值从小到大排列,位置居于中间的那个数。适用范围:各种分布类型的资料(如是偏态分布资料和一端或两端无确切数值的资料。奇数:次居中的变量值偶数:次居中的两个变量值的均数。,集中趋势的描述,例:8名患者食物中毒的潜伏期分别为1,2,2,3,4,8,15,24小时,求其中位数。本例,为偶数,得,集中趋势的描述,4.百分位数百分位数(percentile)是一种位置指标,用来表示。一个百分位数将全部变量值分为两部分,在不包含的全部变量值中有的变量值比它小,变量值比它大。故百分位数是一个界值,其重要用途是确定医学参考值范围(referencerange)。中位数实际上是第百分位数。,集中趋势的描述,百分位数的计算公式为式中LX、iX和fX分别为第百分位数所在组段的下限、组距和频数,fL为小于各组段的累计频数,LX为总例数。即为中位数的计算公式,离散趋势的描述,1.极差极差:一组变量值最大值与最小值之差。极差不能反映所有数据的变异大小,且受样本含量的影响较大。即使在不变的情况下,每次抽样得到的极差值相差也大,故其稳定性较差。,离散趋势的描述,2.四分位数间距四分位数(quartile)是把全部变量值分为四部分的百分位数,即第1四分位数(QL=P25)、第2四分位数(M=P50)、第3四分位数(QU=P75)。四分位数间距(quartilerange)是由第3四分位数和第1四分位数相减而得,记为QR。它一般和中位数一起描述偏态分布资料的分布特征。,离散趋势的描述,3.方差与标准差方差(variance)也称均方差(meansquaredeviation),反映一组数据的平均离散水平。离均差:每一个变量值与均数的差值,离均差平方和(sumofsquares):离均差平方后相加得到的值方差:离均差平方和除以得到的值总体方差用表示,离散趋势的描述,方差计算公式为标准差:,离散趋势的描述,4.变异系数变异系数(coefficientofvariation)记为,多用于观察指标单位不同时的变异程度的比较。其计算公式为,正态分布,正态分布(normaldistribution)是最常见、最重要的一种连续型分布。图2-4中的直条就不断变窄,其顶端则逐渐接近于一条光滑的曲线。曲线形态呈钟形,两头低、中间高,左右对称,近似于数学上的正态分布。,正态分布,图2-4,正态分布,1、正态分布的特征(1)在直角坐标上方呈钟型曲线,两端与X轴永不相交,且以X=为对称轴,左右完全对称。(2)在X=处,f(X)取最大值;X越远离,f(X)值越小。,正态分布,(3)正态分布有两个参数,即位置参数和形态参数。若固定,改变值,曲线沿着X轴平行移动,其形状不变(见图2-5)。若固定,越小,曲线越陡峭;反之,越大,曲线越平坦(见图2-6),正态分布,图2-5,正态分布,图2-6,正态分布,(4)正态曲线下的面积分布有一定的规律。轴与正态曲线所夹面积恒等于或;区间的面积为68.27%,区间的面积为95.00%,区间的面积为99.00%。见图2-7。,正态分布,图2-7,正态分布,标准正态分布正态分布是一个分布族,对应于不同的参数和会产生不同位置、不同形状的正态分布。为了应用方便,令即将的正态分布转化为的标准正态分布(standardnormaldistribution),式中的称为标准正态变量,参考值范围的制定,1.基本概念医学参考值(referencevalue)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围(medicalreferencerange)作为判定正常和异常的参考标准。通常使用的医学参考值范围有、等,最常用的为。,参考值范围的制定,2.制定方法1)正态分布法许多生物医学数据服从或近似服从正态分布,如同年龄同性别儿童的身高值、体重值,同性别健康成人的红细胞数等;有些医学资料虽然呈偏态分布,但若能通过适当的变量变换转换为正态分布,也可采用正态分布法制定参考值范围。采用此方法前一般要对资料进行正态性检验,且要求样本含量足够大(如10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络游戏开发与运营成本控制研究
- 2025海南省建设集团限公司校园招聘50人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上学期高一化学珠算文化背景试题
- 2025年小升初数学试题手册
- 十五五规划纲要:农村土地制度改革的深化与产权保护
- 企业年度工作计划与目标分解实施方案
- 公司战略部主管工作计划及企业战略规划方案
- 仓储管理员试用期工作总结
- 元数据指标分析师数据资产评估报告
- IT系统工程师敏捷开发方法论指南
- 电子版申请书怎么弄
- 2025年工伤事故赔偿标准协议书
- 北京城的历史沿革
- 2025-2031年中国动压油膜滑动轴承行业市场深度研究及投资策略研究报告
- DB32T 4116-2021 里氏硬度计法建筑结构钢抗拉强度现场检测技术规程
- 电子特气行业报告:中国电子特气
- 客服的英文(多篇)
- 员工人事档案
- 《计算机网络》00805国家开放大学期末考试复习题库
- 实验室安全准入考试题库答案
- DB34T 3677-2020 公路桥梁维修与加固质量检验评定标准
评论
0/150
提交评论