


全文预览已结束
付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 专题四 定量资料的统计描述 一、频数表与频数图 频数表 :表达变量取值及其不同取值频数分布情况的统计表。 频数表的编制 连续型定量资料的频数表 求极差(全距): R=xmax-xmin 确定组数和组距: 根据样本含量的大小及研究目的确定组数,一般设为 815组。用 R除以组数得到的商,取与此接近较为整齐的数值作为组距,组距即为各组的上、下限之差。 注:各组的组距可以相等,可以不等,一般多采用等距分组。 确定 组段 :即 确定每一组的起点和终点(下限与上限) 注: 第一组段包括全部观察值中的最小值,最末组段包 含全部观察值中的最大值;各组段包含的数值范围是大于等于下限,小于上限;频数表中除最末组同时写出下限和上限外,其余各组均只写出下限; 归组计数整理成表; 离散型定量资料的频数表的编制:将变量值及其对应的频数列出即可。 频数表的用途 揭示资料的频数分布特征和频数分布类型 : 分 布特征:集中趋势、离散趋势,对于定量资料可从两个方面去描述其分布特征。 分布类型:对称分布,即高峰位中,两侧对称。 偏态分布 ,高峰偏于一侧,偏向数值小的一侧,称为 正偏态分布 ;偏向数值大的一侧,为 负偏态分布 。 便于发现某些特 大或特小的可疑值; 便于进一步计算指标和统计处理。 频数图 : 更直观、形象。 以变量值为横坐标,以频数为纵坐标(等距分组时可以频率为纵坐标,不等距分组时以频率 /组距 =频率密度作为纵坐标),即每个等宽长方形面积表示每组频数(或频率)。 注:连续型定量资料,其频数图中各长方形是相连的,又称为直方图;离散型 定量资料,其频数图中各长方形是 间隔 的,又称为直 条 图 。 二、集中趋势的描述 对于定量资料集中趋势的描述常用平均数,平均数表达了一组同质定量数据的平均水平或集中位置。 算术平均数(均数) 几何均数(倍数均数) 符号 x (样本), (总体) G 计 算 方 法 (直接法) nxxxnxx n 21 (加权法) i iik kk f kffff xfxfxfx 21 2211k为组段数, xk为各组段相应频数。 (直接法 ,用于样本含量较少时 ) G=nn xxx 21=lg-1 nxxx nlglglg 21 =lg-1nxlg (加权法 ,用于观察值较多,或资料已编成频数表 时 ) G=lg-1 k kkfff xfxfxf 21 2211 lglglg=lg-1 i ii f xf lg应用 应用于对称分布,特别是正态分布资料集中趋势的描述。 对数对称(含对数正态分布),即数据经 对数变换后呈对称分布或正态分布的资料。 等比级数资料,即观察值之间呈倍数或近似倍数变化的资料,如抗体滴度、抗体效价。 说明 计算几何均数时,观察值中不能有 0,因为 0不能取对数,此时可以加上 1个很小的数,算后再减去该数值即可。 观察值不能同时有正有负。 续表 中位数 百分位数 符 号 M Px 观察个数为奇时, M=x 21n 2 计 算 方 法 观察个数为偶时, (直接法) M= 12221nn xx(频数表法) M=L+ LMfnfi 2 L为频数表中 M所在组段的下限, i为 M所在组段的组距,fM为 M 所在组段的频数, fL为小于 L 的各组段累积频数。 Px=L+ Lx fxnfi % 其中 L为 Px所在组段下限, i为组距, fx为 Px所在组段频数, fL为小于 L的各 组段的累积频数。 应用 适用于描述偏态分布资料、一端或两端无确切值的资料及总体分布不确定资料的集中趋势 用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征; 用于确定非正态分布资料的医学参考值范围。 说明 将观察值由小到大排序后,居于中间位置的数值。 在全部观察中,小于和大宇中位数的观察值个数相等。 Px 是指将观察值由小到大排序后,将其平均分为 100份,对于每一分割位置上的数值即为一个百分数。 四分位数: P25( Ql)、 P50(中位数)、 P75( Qu) ; 应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数。 三、 离散趋势的描述 离散 趋势 ,反映了观察值之间的变异情况。 极差 四分位数间距 方差 符号 R Q 2( 总体 ) , s2( 样本 ) 计 算 方 法 R=minmax xx Q=Qu-Ql=P75-P25 2=离均差平方和 /N= ( x-n) 2 N s2= ( x-x ) 2 ( n-1为自由度) n-1 应用 仅用于初步了解资料的 变异程度,概括地描述全部数据所在范围。 描述偏态分布以及分布的一端或两端无确切数值资料的离散程度。 描述对称分布,特别是正态分布或近似正态分布资料的离散程度。 说明 R 大,反映了全部观察值所在范围的变异程度大,数据较为分散; R小 ,反映了全部观察值所在范围的变异程度 小 ,数据较为 集中 ; 不能反映组内其他观察值的变异程度。 不受两端极大值或极小值影响 ,较全距稳定,但仍不能概括所有观察值的变异情况 。 相同指标,方差越大,说明数据围绕均属分布越分散,变异程度越大;反之, 方差越 小 ,说明数据围绕均属分布越 集中 ,变异 程度越 小 ; 续表 标准差 变异系数 符号 ( 总体 ) , s( 样本 ) CV 计 算 方 法 2 = Nx 2 s=122 nnXX(直接法) s= 122iiiiiffxfxf i(加权法) CV=xS 100% 应用 描述对称分布,特别是正态分布或近似正态分布资料的离散程度。 常用于比较度量单位不同或单位相同均数相差悬殊的两组或 多组资料的变异程度。 说明 表示每个观察值与均数之间距离(绝对距离)的平均水平。 没有单位,是一种相对变异指标 四、正态分布及其应用 正态分布的概念 如果连续型随机变量 x的概率密度函数为 f( x) = 21 222 xe , - x ;则称随机变量 x服从参数为 和 3 的正态分布,记作 XN( , )。式子中 为圆周率, e为自然对数的底, 为总体均数, 为总体标准差, x为正态变量。 正态分布的特征 正态曲线:横轴上方均数处最 高,向两侧下降,并以均数为中心,左右对称,但两端与横轴永不相交,呈钟型曲线。 正态分布有两个参数,即均数 和标准差 。 为位置均数,固定不变时,越大,曲线沿横轴越向右;反之,越小,曲线沿横轴越向左。 为形状均数,固定不变时,越大,曲线越平阔;越小,曲线越尖峭。 正态曲线下面积的分布有一定的规律。 正态曲线下 一定区间内的 面积 代表了取值于相应区间内的观察值个数在全部观察值总数中所占的比例(频率),或者是观察值落在该区间内的概率。 无论 和 取何值,正态曲线下面积分布规律有: 正态曲线与横轴之间的面积恒等于 1或 100% 正态分布为对称分布,其对称轴两侧面积各为 50% 区间( -, +)的面积为 68.27%;区间( -1.96, +1.96)的面积为 95.00%;区间( -2.58, +2.58)的面积为 99。 00%; 标准正态分布 (教材图 4-4,正态分布于标准正态分布曲线 ) 由总体时 z=x, 由样本估计时 z=sxx若 X 服从正态分布 N( , ),则 z服从 N( 0,1)。 在区间 ( -z, +z)内,若 求 一般正态分布曲线下某区间内面积,则需先进行 z变换,然后借助标准正态分布表(教材附表 3)求得 。 正态分布的应用 估计正态分布或近似正态分布资料的频数分布 举例:求在某值及其以下者所占比例、求在某范围内者所占比例、求大于等于某值者所占比例。 制定医学参考值范围(正常值范围) 制定医学参考值范围 时:确定一批样本含量足够大的“正常人”;根据研究目的和使用要求选定适当的百分界值,常用 95%;根据专业知识确定单侧或双侧界值;根据资料分布特点,选用恰当的计算方法。 制定 医学参考值范围 的常用方法有: 正态分布法( 适用于正态分布或近似正态分布的资料 ) 双侧界值: x Z/2S 单侧上界: x + ZS或单侧下界: x - ZS Z和 Z/2为标准正态分布在给定小概率 (如 =0.05)时相应的单侧界值或双侧界值。 Z 表示 z Z 或 z -Z 的概率为 ,只考虑单侧尾部的概率分布。 Z/2表示 z Z/2和 z Z/2的概率为 ,同时考虑两侧 尾部的概率分布。 常用 z值表 参考值范围 单侧 双侧 80 0.842 1.28
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电竞内容编辑岗位面试问题及答案
- 车间主任岗位面试问题及答案
- 江苏省淮安市盱眙县2025届化学高二下期末调研试题含解析
- 2025届福建省晋江市四校化学高一下期末质量跟踪监视试题含解析
- 2025届上海延安中学化学高二下期末达标检测试题含解析
- 兽药监督抽样管理办法
- 农村保洁经费管理办法
- 2025届高三英语一轮复习高频词性转换清单(素材)
- 北京早教机构管理办法
- 村镇应急车辆管理办法
- 非甾体抗炎药围术期镇痛专家共识(2024 版)解读
- GB/T 44828-2024葡萄糖氧化酶活性检测方法
- 2024年三级直播销售员(高级)职业技能鉴定考试复习题库(含答案)
- Unit 1 A new start 词汇教学设计-2024-2025学年高中英语外研版必修第一册
- 异位妊娠的课件
- 血管内超声IVUS简介
- DL∕T 2528-2022 电力储能基本术语
- 上海2024年上海市教育评估院招聘笔试上岸历年典型考题与考点剖析附带答案详解
- 渣土清运综合项目施工组织设计
- 苏教版八年级生物下册期末试卷及答案【苏教版】
- 书面检查材料(通用6篇)
评论
0/150
提交评论