已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第二章 计量资料的统计描述 2 讲述内容: 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 3 计量资料(定量资料、数值变量资料 ) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值 : X1,X2,X3,Xn n为样本例数(样本大小、样本含量 ) 4 统计描述描述数据的分布规律 1、用频数分布表(图) 2、用统计指: 集中趋势、离散趋势 5 第一节 频数分布 频数分布:(样本) 连续变量:为n个变量值在各变量值区间 内的变量值个数的分配。 离散变量:为n个变量值在各(或各几个 )变量值处的变量值个数的分配。 6 一、频数分布表(frequency table) 了解分布 例2-1 从某单位1999年的职工体检资料中获得 101名正常成年女子的血清总胆固醇( )的测量结果如下,试编制频数分布表。 7 101名正常成年女子的血清总胆固醇值 8 制表步骤 1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R 。本例 9 2确定组段数和组距(i) : 组段数通常取组 10-15组 本例组距 调整 10 3写组段(区间): 组段下限(L):每个组段的起点 组段上限(U):每个组段的终点 11 4分组划记并统计频数 第1组段 2.30 第2组段 2.60 第3组段 2.90 第4组段 3.20 第5组段 3.50 第末组段 5.605.90 12 A B 0 04 5 5 9 10 10 14 70 7074 7575 例年龄分组: 13 表2-1 101名正常成年女子的血清总胆固醇(mmol/L)频数分布 14 表2-2 某医院1123名产后出血孕妇的人流次数分布 资料类型? n例2-1 某地用随机抽样方法检查了140名成 年男子的红细胞数,检测结果如表所示: n如何有效地组织、整理和表达数据的信息 ? 4.765.024.63 4.524.785.054.944.444.714.975.24 5.504.635.274.405.044.934.814.70 5.344.474.735.004.884.774.274.92 5.184.314.574.465.955.615.264.76 54.4 22.9 32 4.60 100.0 -140合计 100.0 0.7 1 5.80 6.00 99.4 1.4 2 5.60 98.0 2.9 4 5.40 95.1 9.3 13 5.20 85.8 12.1 17 5.00 73.7 19.3 27 4.80 31.5 17.9 25 4.40 13.6 7.9 11 4.20 5.7 4.3 6 4.00 1.4 1.4 2 3.80 累积频率(%) 频 率(%) 频 数 红细胞数 表2-2 某地140名正常男子红细胞数的频数表 frequency tablefrequency table 17 二、频数分布图 横坐标指标 纵坐标频数 形象化 n直方图:直观、形象地表示频数分布的形态 和特征 18 图2-1 140名正常男子红细胞计数的直方图 Histogram 20 三、频数表和频数分布图用途 (1)对称分布 :若各组段频数的分布以频数最多 的组段为中心左右两侧大体对称(总体则完全 对称),就认为该资料是对称分布。 (2)偏态分布 : 1描述频数分布的类型* 21 右偏态分布(正偏态分布):频数最多组段右侧 的组段数多于左侧的组段数,频数向右侧拖尾。 表2-3 115名正常成年女子血清转氨酶(mmol/L)含量分布 22 23 左偏态分布(负偏态分布):频数最多组段左侧的 组段数多于右侧的组段数,频数向左侧拖尾。 表2-4 101名正常人的血清肌红蛋白( )含量分布 24 25 2描述频数分布的特征 变异的范围在2.305.90 有明显的统计分布规律,数据主要集中在 3.504.70 之间,尤以组段的人数 3.804.10 最多,且上下组段数的 频数分布基本对称。 26 3便于发现一些特大或特小的可疑值* 27 4便于进一步做统计分析和处理 28 第二节 集中趋势的描述 用平均数(average)来描述一组变 量值的集中位置或平均水平: 不同的分布使用不同的平均数 (算术)均数 几何均数 中位数 29 一、算术均数(mean) 意义:可用于反映一组呈对称分布的 变量值在数量上的平均水平或者说是 集中位置的特征值。 适用范围:对称分布,尤其是正态分布 符号: 30 1、计算方法 (1)直接法 31 举例:试计算4,4,4,6,6,8,8,8 ,10的均数? 32 例2-2 用直接法计算例2-1某单位101名正常成年女子的血 清总胆固醇的均数。 33 34 (2)加权法(频数表法): k:频数表的组段数, f :频数, X:组中值。 例2-3 利用表2-1计算101名正常成年女子的血总胆固 醇的均数。 36 计算结果: 37 二、 几何均数(geometric mean) 意义:可用于反映一组经对数转换后呈对 称分布的变量值在数量上的平均水平。 适用范围:对数转换后呈对称分布,尤 其是对数正态分布 符号: (样本) 38 1、计算方法 (1) 直接法 公式: 或 例:某公司五名职员的薪水分别是 :10,100,1000,10000,100000。 40 例2-4 某地5例微丝蚴血症患者治疗七年后用 间接荧光抗体试验测得其抗体滴度倒数分别为, 10,20,40, 40, 160,求几何均数。 故5份血清抗体效价的平均滴度为 41 三、中位数与百分位数 42 (一)中位数(median) 意义:是将n个变量值从小到大排列,位置 居于中间的那个变量值。 适用范围: 理论上:任何分布资料; 实际上:偏态分布资料,和一端或两端无确 切数值的资料,分布不明的资料。 符号: (样本) 43 计算公式: n为奇数时 n为偶数时 44 例2-6 7名病人患某病的潜伏期分别为 2,3,4,5,6, 9,16天,求其中位数。 本例n=7,为奇数 例2-7 8名患者食物中毒的潜伏期分别为1,2,2,3,5, 8,15,24小时,求其中位数。 本例n=8,为偶数 45 (二)百分位数(percentile) 46 1直接计算法 设有X个原始数据从小到大排列,第 X百分位数的计算公式为: 当 带有小数位: 当 为整数时: 47 例2-9 对某医院细菌性痢疾治愈者的 住院天数统计,120名患者的住院天数从小 到大的排列如下,试求第5百分位数和第99 百分位数。 患 者: 住院天数: 48 49 (2) 带有小数,故取 整后trunc(118.8)= 118 P5的意义是该医院有5的细菌性痢疾治愈者的 住院天数少于3.5天,或者说有95的细菌性痢 疾治愈者的住院天数多于3.5天。 P99的意义是绝 大多数(99)细菌性痢疾治愈者的住院天数 少于42天。 50 2频数表法 51 当 时,公式(2-9) 即为中位数的计算公式 2.频数表资料(例2-4) 表2-4 某地630名正常女性血清甘油三脂含量(mmol/L) - -630 合计 100.0 630 13.10 99.8629 32.80 99.4626 42.50 98.7622 142.20 96.5608 281.90 92.1580 421.60 85.4538 811.30 72.5457 941.00 57.6 M3631670.70 31.11961690.40 4.3 27 270.10 累积频率(%) 累积频数频数 甘油三脂 Median L、iM、fM分别为M所在组段的下限、组距和频数, fL为M所 在组段之前各组段的累积频数。 Median 54 例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表见 表2-6第(1)、(2)栏,试分别求中位数及第25、第75百分位数 。 55 56 小结: 集中趋势的描述平均数 平均数:描述一组变量值的集中 位置或平均水平的指标体系。 不同的分布使用不同的指标 (算术)均数:对称分布,尤其是正态分布 几何均数:对数转换后呈对称分布,尤其是 对数正态分布 中位数 :一般偏态分布 57 第三节 离散趋势的描述 用变异指标来描述一组变量值的变 异程度或离散趋势: 不同的分布使用不同的变异指标 极差 四分位数间距 方差或标准差 变异系数 58 例2-11 试计算下面三组同龄男孩的身高均数 和极差。 甲组: 乙组: 丙组: 59 一、 极差 极差(R):即一组变量值最大值与最小值之差 。 适用范围:任何计量资料,是参考变异指标 60 二、四分位数间距 四分位数:把全部变量值分为四部分的分位数 四分位数间距,用QR表示: 下四分位数: 上四分位数: 适用范围:与中位数配套用 61 四分位数间距可以看成一半变量值的极差。 62 三、方差与标准差 1.方差(variance)也称均方差(mean square deviation),反映一组数据的平均离 散水平。 总体方差、标准差用 、 表示; 样本方差、标准差用 、 表示。 适用范围:与均数配套用 63 2. 总体标准差公式: 样本标准差公式: 64 标准差的公式还可以写成 : 利用频数表计算标准差的公式为 65 例2-13 续例2-11,计算三组资料的标准差。 甲组: 66 1.直接计算法 S 2.频数表法 S= 67 四、变异系数(coefficient of variation) 变异系数记为 ,多用于观察指标单位不同 时,如身高与体重的变异程度的比较;或均数相 差较大时,如儿童身高与成人身高变异程度的比 较。其计算公式为 主要用于描述对称分布(特别是正态分布) 资料的相对变异程度 68 某地7岁男孩
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年危险废物管理培训效果评估考核试卷
- 2025年交通运输行业Cybersecurity资格考试全链条安全防护考核试卷
- 2025年公共服务行业城市智慧化创新研究报告及未来发展趋势预测
- 光电探测器材料响应度测试考核试卷
- 2025贵州民族大学采用简化考试程序招聘工作人员 (第二批)笔试考试参考题库及答案解析
- 招24人!2025年达日县紧密型医共体自主招聘编外(临聘)人员考试笔试模拟试题及答案解析
- 2025广东佛山市顺德区水藤小学语文学科临聘教师招聘考试笔试备考试题及答案解析
- 2026年中国铁路郑州局集团有限公司招聘全日制普通高等院校大专(高职)学历毕业生1288人考试笔试备考题库及答案解析
- 2025年甘肃开放大学引进高层次人才笔试考试参考试题及答案解析
- 2025北京广播电视台招聘200人考试笔试备考题库及答案解析
- 大数据与人工智能导论(厦门大学)学习通网课章节测试答案
- 业务数据修改管理办法
- 行人交通安全知识培训课件
- 高速公路声屏障设计计算(完整版)
- 电力现场抢修知识培训课件
- “错题本”+升级计划+-+从+“错”+到+“会”+的复盘法则+课件-2025-2026学年高一上学期学习方法指导主题班会
- 合作推广数字化营销项目协议
- 湖北省潜江市2025年上半年事业单位公开招聘试题含答案分析
- 企业合规管理岗位实战演练题库
- 医学检验技术入门课件
- 医院常用消毒剂使用规范
评论
0/150
提交评论