




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 计量资料的统计描述 卫生统计学教研室 任艳峰 Qualitative data analysis (ranked) Quantitative data analysis Statistical description Statistical Inference Statistical Inference Statistical description Collection of data Statistical analysis Sorting data Design Design Collection of data Sorting data Statistical analysis Statistical analysis Statistical description Statistical description Statistical Inference Statistical Inference Parameter Estimation Hypothesis Test 熟悉频数表的划记步骤,频数表的用途 。 掌握集中趋势指标的定义、适用范围和 计算。 掌握离散趋势指标的定义、适用范围和 计算。 学习目标 定量资料进行描述时,如果样本量较大 ,需要对原始资料进行整理,列出频数 分布表,通过频数表以显示资料的分布 类型。 第一节 频数分布表与频数分布图 频数(frequency) 某数值在数据中出现的次数。 相对频数(frequency) 也叫频率,数值在总观察例数中所占的比例 。 频数表(frequency table) 将所有“互相排斥的情形”的频数毫无遗漏地 排列在一起。由频数与组段组成。 检查次数 (1) 频 数 (2) 频率(%) (3) 0 4 4.2 1 7 7.3 21111.5 31313.5 42627.1 52324.0 51212.5 合计96 100.0 1998年某地96名孕妇产前检查次数分布 图中横坐标表示产前检查次数,纵坐标表示各检查次数的 孕妇例数占总孕妇数的频率(比例)。从直条高度和分布 情况看出,产前检查次数分布呈负偏态分布。 二、连续型定量资料的频数分布 1.找出最大值 和最小值 (一)频数分布表的编制方法 2.计算全距 (range,R)也叫极差 (1)根据数据多少,组段数一般515个左右(10); (2)根据(R/预计组段数)估计组距大小 (22.22/10=2.22); (3)确定组段数和组距; 两端的组段包含最大值和最小值; 尽量取整数作为组段的端点; 组距尽量取相等为宜。 3.确定组段数和组距(class interval) 4.列表:根据下限X上限的原则确定每一 例数据所归属的组段。 组组 段划记记频频 数 6/1 8/3 10/, /6 12/, /8 14/, /, /12 16/, /, /, /20 18/, /, /, /, /, /27 20/, /, /, /18 22/, /, /12 24/, /8 26/4 2830/1 合 计计120 最小值 最大值 标 题 组组 段 (1) 频频 数 (2) 频频率() (3) 累计频计频 数 (4) 累计频计频 率( ) (5) 频频率密度( ) (3) 组组距 610.8310.830.42 832.5043.331.25 1065.00108.332.50 1286.671815.003.34 141210.003025.005.00 162016.675041.678.34 182722.507764.1711.25 201815.009579.177.50 221210.0010789.175.00 2486.6711595.833.34 2643.3311999.171.67 283010.83120100.000.42 合 计计120100.00 120名正常成年男子血清铁含量(mol/L)频数表 1.揭示资料的分布特征; (1)集中趋势:大部分数据向中间集中,中间数据居多。 (2)离散趋势:从中央到两侧,频数分布逐渐减少。 2 .揭示资料的分布类型; 正态分布:中间高两侧低、左右对称的单峰分布。 偏态分布:集中位置偏向一侧,分布不对称。 3.便于发现某些特大或特小的可疑值; 4.便于计算指标和统计分析。 (二)、频数分布表的用途 正偏态 正态分布 负偏态 120例健康成年男子血清铁含量分布 频数分布图 120例健康成年男子血清铁含量分布 频数分布图 频率密度 =频率/组距 第二节 集中趋势的描述 集中趋势指某计量资料大多数观察值所在的中 心位置。常用指标有: 1.算术均数(arithmetic mean),简称均数(mean) 2.几何均数(geometric mean) 3.中位数 (median) 算术均数(mean) 1.定义: 算术平均数是由所有数据之和除以数据个数所得的商数。 反映一组同质的观察值在数量上的平均水平。 总体均数用希腊字母,样本均数用 表示。 2. 适用范围: (1)描述对称分布资料的集中趋势; (2)描述正态分布资料的集中趋势。 3.均数的计算公式 : (1)直接法: (2)加权法 f 为组段的频数 X0为组段的组中值 X0=(上限+下限)/2 例:测得8只正常大鼠的血清中酸性磷酸酶(TACP) 含量(U/L)为4.20,6.43,2.08,3.45,2.26, 4.04,5.42,3.38。试计算算数均数。 几何均数(geometric mean) 1. 定义: n个观察值的连乘积的n次方根,几何均数用G表示 。 2. 适用范围: (1)成倍数关系或等比关系的资料 (2)对数正态分布资料 3. 计算公式: (1)直接法: (2) 加权法: 例:7名慢性迁延性肝炎患者的HBsAg滴度资料为:1 :16,1:32,1:32,1:64,1:64,1:128,1: 512。试计算其几何均数。 4.几何均数的特点: (1) 观察值不能同时存在大于和小于0的数据,不能有 等于0的数据。 (2)同一组资料所得几何均数小于等于均数。 中位数(median) 1.中位数:将一组观察值按照从小到大,或者大到小的 顺序排列,位次居中的观察值水平。中位数用M表示 。 百分位数(percentile):一个位置指标,用Px表示。描 述观察值序列在某百分位置的水平。 XminXmaxP25P50P75 PX (1)理论上适用于任何分布类型 ; (2)(2)尤其偏态分布资料; (3)开口资料; (4)分布类型不清的资料; 2.中位数的适用范围: (1)直接法 3. 计算公式: (2) 加权法: Px Px :百分位数:百分位数 L : P L : P x x 所在组段的下限值所在组段的下限值 i : i : 组距组距 f f x x : : P P x x 所在所在组段的频数组段的频数 n : n : 样本例数样本例数 f f L L : : 该组段之前的累计频数该组段之前的累计频数 例: 某药厂观察9只小鼠口服山红景醇提物(RSAE) 后在缺乏氧条件下的生存时间(分钟)如下:49.1, 60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试 求其中位数。 中位数实例 10例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2 对于某项风险较高的新手术术后的生存时间 进行跟踪,共调查了7人, 6人死亡之前分 别生存了5天、6天、10天、16天、25天、29 天,还有一人术后30天随访时仍存活。 本资料属于“开口”资料。 本例数据已经按从小到大的升序排列,n=7 ,为奇数,其中位数为16天。 例:试对下表资料求其中位数M。 120名正常成年男子血清铁铁含量(mol/L) 组组段频频数f累计频计频 数f累计频计频 率% 6110.83 8343.33 106108.33 1281815.00 14123025.00 16205041.67 18277764.17 20189579.17 221210789.17 24811595.83 26411999.17 28301120100.00 合计计120 50% M = P50 描述离散趋势的指标 第三节、离散趋势的描述 离散程度指某计量资料的所有观察值与中心位置 的发散程度。 变异度 极差(Range) 四分位数间距(interquartile range) 方差(Variance) 标准差(Standard Deviation) 变异系数( coefficient of variation ) 描述离散趋势的指标 极差(range) 1. 极差(range,R):又称全距,一组观察值中最大值 和最小值的差。 2. 2. 计算公式: 3. 特点 (1)简单明了,计算简单,应用广泛。 (2)只能反映最大值和最小值的变异,不能反映所有 数据的变异。 (3)样本含量n变大时,R也会变大。 (4)样本含量不变时,R抽样误差也较大,不稳定。 4. 适用范围:任何分布类型资料,资料做粗略分析。 四分位间距 2. 计算公式: XminXmaxP25P50P75 1.四分位数(quartile):是特定的百分位数,下四分位 数P25,记作QL;上四分位数P75,记作QU。上四分位 数P75,与下四分位数P25之差即是四分位间距。 (1)避免了极差受极端值的影响; (2)样本含量n变大时,Q比R稳定; (3)只能反映中间50%的数据的变异,不能反映所 有数据的变异; (4)去头弃尾,丢失大量的信息。 3. 特点 (1) 偏态分布资料;开口资料;分布类型不清的资料 (2) Q与M一起使用,描述偏态分布资料的集中趋势和 离散趋势。 4. 适用范围 方差 (variance) 1.方差 (variance,2/S2):总体(样本)内所有个体 观察值与总体(样本)均值的离均差平方和(sum of square)的均值。 2. 计算公式: 自由度:df/ 表示随机变量能“自由”取值的个 数 例如有一四个数据的样本,受到均数为5的条件的限 制,在自由确定4、2、5三个数据后,第四个数据只 能是9,=3 任何统计量自由度的个数为=n-限制条件的个数。 (1) 能够反映所有观察值之间的离散程度 (2) 考虑到每一个观察值,信息利用充分 (3) 对数据的变化反应灵敏 3. 特点 4. 适用范围: 正态分布资料或近似正态分布资料. 标准差 (standard deviation) 1.标准差 (standard deviation,S ) :即方差的正平 方根;其单位与原变量X的单位相同。 总体标准差: 样本标准差:S 2. 计算公式: (1) 能够反映所有观察值之间的离散程度 (2) 考虑到每一个观察值,信息利用充分 (3)对数据的变化反应灵敏 3. 特点 (1) 正态分布资料或近似正态分布资料 (2) 标准差和均数相结合,描述正态分布资料的集中趋 势和离散趋势 4. 适用范围 变异系数 (coefficient of variation) 1.变异系数 (coefficient of variation,CV ):标准差与 相应均数的比值;其意义是标准差为均数的多少
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版停薪留职期间员工权益保护合同范本
- 2025年高新技术产业园区承包经营权永久转让合同
- 2025年度通讯行业人才培养合作合同样本
- 2025年度智能照明灯具系统集成合同范本集
- 2025年度生态农业项目复杂运营适用合同
- 2025版在线教育平台外教直播课程聘用与教学合同
- 2025版危险品道路运输合同规范文本
- 2025版淘宝平台电商虚拟货币交易合同
- 2025版试用员工劳动合同及薪资福利标准
- 2025年车辆抵押借款担保与绿色金融创新合作协议
- 音乐游戏 花巴掌拍拍教学设计-2025-2026学年小学音乐二年级上册人音版(2024 主编:赵季平杜永寿)
- 肿瘤护理学高级进阶2025年测试答案及解析
- 2025年宣城市总工会招聘社会化工会工作者13名笔试参考题库附答案解析
- 2025-2026学年苏科版(2024)初中物理九年级上册教学计划及进度表
- 2025至2030年中国电热毛巾架行业市场发展现状及投资战略咨询报告
- 2025重庆对外建设(集团)有限公司招聘41人笔试模拟试题及答案解析
- 2025年四川省成都市中考数学真题(含答案卷)
- 2025至2030年中国泥炭行业市场深度分析及投资战略咨询报告
- 工会帮扶救助课件
- 2025年新高考全国一卷地理试题及答案解析
- 热压罐安全操作规程
评论
0/150
提交评论