




已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学 第二章 定量资料的统计描述 Date1 n 把握资料的基本特征 n 为统计分析打下基础 统计表 描述性统计量 统计图 统计描述 -从资料中获取信息最基本的方法 Date2 第一节 频率分布表与频率分布图 频数分布表(frequency distribution table), 又称频数表 一、 离散型定量变量的频率分布 例2-1 1998年某山区96名孕妇产前检查次数资 料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6, 5,1,3,3,4,7 Date3 Date4 直条图(bar chart) 横坐标:产前检查次数; 纵坐标:频率, 检查k次的妇女所占的比例(%) 等宽矩形长条:高度为检查次数的频率 Date5 二、连续型定量变量的频率分布 例2-2 抽样调查某地120名1835岁健康男性居 民血清铁含量(mol/L),数据如下: Date6 Date7 手工编制的步骤: (1) 找出 最小值= 7.42 最大值= 29.64 (2)计算全距(range,R),又称极差 R = 最大值最小值 = 29.64-7.42 = 22.22 (3)确定组段数与组距 组段数一般在1015之间(本例拟取10个组段 ) 下限:组段的左端点 上限:右端点 组距=R/(预计的组段数)-以相等为宜 本例组距 22.22/10=2.22 (4)列表 Date8 直方图(频率直方图) 横轴:血清铁含量 纵轴:频率密度 = 频率/组距 面积 = 频率 注:组距相等时,矩形直条的高度与相应组段 的频率成正比。 Date9 图2-2 120例健康成年男子血清铁含量分布 单峰、对称 - 对称分布 Date10 图2-3 某地居民238人发汞含量(mol/kg)分布 单峰,不对称 - 偏峰分布 正偏峰分布:峰偏向左侧,数轴的正向有尾 负偏峰分布:峰偏向右侧,数轴的负向有尾 Date11 第二节 定量变量的统计指标 定量地描述集中趋势与离散趋势是统计描述的重 要内容 一、 描述集中趋势的统计指标 对于连续型定量变量,描述集中趋势常用的统计 量为算术均数、几何均数和中位数。 Date12 1. 算术均数 简称均数(mean),适合描述对称分布资料的集中 位置(也称为平均水平)。其计算公式为 n:样本含量 X1,X2,Xn:观察值 或 :观察值之和 例2-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含 量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42 ,3.38。试求其算术均数。 按式(2-1),算术均数为 Date13 频数表基础上近似计算 (样本量较大时) 组中值的加权平均 :组段的频数 :组段的中值 =(组段上限+组段下限)/2 Date14 例2-4 试应用加权法近似地计算例2-2资料的算 术均数 Date15 2. 几何均数(geometric mean,G) 适用于观察值变化范围跨越多个数量级的资料 频数图一般呈正偏峰分布 例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资料 为1:16,1:32,1:32,1:64, 1:64,1:128,1:512。试 计算其几何均数。 Date16 频数表资料,可用加权法计算几何均数 Date17 3. 中位数(median,M) 可用于各种分布的定量资料 总体中有一半个体的数值低于这个数,一半个体的数 值高于这个数。 基于样本资料 将n例数据按升序排列,第i个数据记为 n为奇数时 n为偶数时 例2-7 某药厂观察9只小鼠口服高山红景天醇提取物 (RSAE)后在乏氧条件下的生存时间(分钟)如下: 49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6, 69.0。试求其中位数。 Date18 Date19 百分位数(percentile) 总体中, 数值小于它的个体恰有X %,大于它的个 体恰有1-X % 样本估计:按照升序排列的数列里, 其左侧(即 小于它)的个体数在整个样本中所占百分比为 X%。 Date20 Date21 4. 众数(mode) 总体中出现机会最高的数值。 样本估计:在样本中出现次数最多的数值。 例2-1 1998年某山区96名孕妇产前检查次数资料 : 0,3,2,0,1,5,6,3,2,4,1,0,6,5 ,1,3,3,4,7 众数为4(次) Date22 二、描述离散趋势的统计指标 同一总体中不同个体之间的离散趋势又称为变异( variation)。 例2-11 试观察三组数据的离散状况。(均数都是30) A组:26,28,30,32,34 B组:24,27,30,33,36 C组:26,29,30,31,34 Date23 1. 极差(range,R) R = 最大值最小值 计算简便,但仅利用了两个数据的信息 一般,样本量n越大R也往往会越大, 不够稳定 例2-12 计算上述三组数据的极差 A组 R=34-26=8 B组 R=36-24=12 C组 R=34-26=8 Date24 2. 四分位数间距(quartile range,Q) Q= P75-P25 P25与P75之间恰好包含50%的个体 四分位数间距Q是总体中数值居中的50%个体散 布的范围 Q越大意味着数据间变异越大 Date25 Date26 3.方差(variance) 又称均方差(mean square deviation) :总体均数 N:总体中个体的总数 分子:离均差平方和 方差越大意味着数据间变异越大 样本方差: 或 n-1称为自由度(degrees of freedom): 总体方差: Date27 4. 标准差(standard deviation,S) 标准差是方差的算术平方根。 标准差的量纲与原变量一致。 标准差越大意味着个体间变异越大。 标准差适合用来表达对称分布的离散趋势。 Date28 例2-14 分别计算例2-11中三组数据的标准差。 按照公式(2-11)与标准差的定义 A组 B组 C组 C组数据的离散趋势最小,B组的最大 Date29 5.变异系数(coefficient of variation ,CV) 例2-16 1985年通过十省调查得知,农村刚满周 岁的女童体重均数为8.42kg,标准差为0.98kg; 身高均数为72.4cm,标准差为3.0cm。体重的变 异大还是身高的变异大? 体重的变异系数 身高的变异系数 用于 量纲不同的变量间变异程度的比较 或 均数差别较大的变量间变异程度的比较 Date30 * 第四节 描述分布形态的统计指标 (自学,不考) * 第四章 常用统计图表(自学,要考) Date31 小 结 1. 频数表、频率分布图: 描述资料的分布特征(集中趋势
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 送受话器装调工创新改进考核试卷及答案
- 钢材热处理工信息保密意识考核试卷及答案
- 飞机钣金工班前会考核试卷及答案
- 推土机司机岗位现场作业技术规程
- 2025授权代理协议书范本样式
- 安徽省郎溪二中学2026届数学八上期末质量检测模拟试题含解析
- 内蒙古赤峰市翁牛特旗2026届数学九年级第一学期期末学业质量监测试题含解析
- 2026届咸宁市通城县数学七上期末教学质量检测模拟试题含解析
- 2026届浙江省杭州市英特外国语学校数学九年级第一学期期末质量跟踪监视模拟试题含解析
- 专利知识点培训课件
- 生猪定点屠宰场申请书
- 2025年《公共基础知识》试题库(附答案)
- 高二《复活》课文解读
- 大圆满前行考试题及答案
- 【衢州】2025年浙江衢州市柯城区属事业单位招聘工作人员17人笔试历年典型考题及考点剖析附带答案详解
- 钢构农业大棚建设项目可行性研究报告
- 非货币支付管理办法
- 湖北省武汉2025-2026学年度高一上学期开学分班考试-英语(解析版)
- 2024-2025学年九年级化学人教版上册检测试卷(1-4单元)
- 辅警考试题《公安基础知识》综合能力测试题(附答案)
- 高中数学重要函数图像(共62个高考压轴题必考)
评论
0/150
提交评论