




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章统计描述 统计分析 统计描述计算描述数据特征的指标来反映数据的规律统计图 统计表反映数据规律是统计推断的基础统计推断用样本信息来推论总体信息 第一节频数分布 数据分析的第一步是 了解数据分布范围 集中位置 分布形态等特征频数 某个测量值的个 例 数 频数分布表 frequencydistributiontable 又称频数表 是将原始数据进行适当分组后得到各组的频数而形成的表格 编制方法 手工 软件 如SAS SPSS等 例4 11998年某山区96名孕妇产前检查次数资料如下 0 3 2 0 1 5 6 3 2 4 1 0 6 5 1 3 3 4 7等共96个数值 一 计量资料的频数分布 分别清点每一种取值的个数 也可以将尾部的多个取值作为一个组进行计数 本例编制频数表如下 制作要点 例4 2抽样调查某地120名18岁 35岁健康男性居民血清铁含量 mol L 数据如下 手工编制频数表步骤 1 找出最小值和最大值 2 计算最大值与最小值之差R 最大值 最小值 29 64 7 42 22 22 mol L 3 确定组段数与组距 组段数一般可在10 15之间选择 组距 R 预计的组段数 本例如果预计取12个组段 则组距长度约为22 22 12 1 85 取整数2 4 列表划记列出组段 要求第一组包括最小值 最后一组包括最大值 各组段不能重叠 故每一组段均为半开半闭区间 6 表示 6 8 最后一组应写出上限和下限 最终经过整理的频数表 用图形表示 直方图 histogram 二 计数资料及等级资料的频数分布表 直接清点每种类别或属性的频数 整理成表格 如 100名大学生性别的频数分布 三 频数表的用途 1 陈述资料的重要形式2 揭示资料的分布类型3 描述集中位置和离散程度4 发现数据中的离群值 四 频数分布特征及类型 1 频数分布的两个特征 集中趋势离散趋势2 频数分布的类型 对称分布偏态分布 集中位置偏向小的一侧叫正偏态 反之叫负偏态 第二节计量资料的统计描述 请问 以下两组同学的成绩是否相同 从集中位置和离散程度 变异大小 两个方面进行描述 一 描述集中趋势的统计指标 通常以集中位置来描述集中趋势 也称为位置度量指标 measuresoflocation 常用的位置度量指标有 算术均数几何均数中位数 1 算术均数 arithmeticmean 简称均数 mean 适用范围 适合描述对称分布资料的集中位置 也称为平均水平 1 直接法 表示符号 mu 总体 x bar 样本 计算公式 例4 3测得8只正常大鼠血清总酸性磷酸酶 TACP 含量 U L 为4 20 6 43 2 08 3 45 2 26 4 04 5 42 3 38 试求其算术均数 算术均数 4 20 6 43 2 08 3 45 2 26 4 04 5 42 3 38 8 3 9075 U L 2 加权法 此为加权均数 f指权重 加权均数 2228 120 18 57直接法均数 18 61 2 几何均数 GeometricMean 适用范围 适用于观察值变化范围跨越多个数量级的资料 其频数图一般呈正偏峰分布 在医学研究中常见的如抗体滴度 效价等 表示符号 G计算公式 1 直接法 例4 57名慢性迁延性肝炎患者的HBsAg滴度资料为1 16 1 32 1 32 1 64 1 64 1 128 1 512 试计算其几何均数 2 加权法 实际上是求取对数后的加权算术均数 然后取反对数 例4 652例慢性肝炎患者的HBsAg滴度数据如表4 4 试计算滴度的几何均数 52例慢性肝炎患者的HBsAg滴度的几何均数为1 120 3 中位数 Median M 含义 指将一组观察值从小到大排序后 位置居中的那个值 适用范围 可用于各种分布的定量资料 主要用于偏态分布资料 有离群值或不确定值的资料 表示符号 M计算公式 n为奇数 n为偶数 常用的描述离散趋势的统计指标有 1 全距 极差 2 四分位数间距 3 方差 4 标准差 5 变异系数 二 描述离散趋势的统计指标 1 全距 极差 Range R 定义 一组数据中最大值与最小值之差 特点 简单 稳定性较差 用途 粗略反映一组数据的变异大小 例前面两组同学成绩的极差甲组R 90 50 40乙组R 80 60 20 2 四分位数间距 QuartileRange Q 百分位数 percentile Xp 是一个数值 该数值将一组资料的全部观察值分为两部分 有p 的观察值比它小 有 100 p 的观察值比它大 显然 中位数就是p 50时的百分位数X50 从表4 2可判断出位于 18 这个组段 将相应数据代入式 4 8 请确定X75 计算式中的相关数据 例4 8试利用表4 2的频数表求例4 2中血清铁含量的中位数 该组血清铁资料的中位数为18 74 mol L 四分位数间距定义为Q X75 X25 其中 X75 称为上四分位数X25 称为下四分位数特点 类似极差 比极差稳定用途 一般与中位数一起描述偏态分布资料的分布特征 注意 很多统计书直接用P加上相应数字表示分位数 如上四分位数 P75 下四分位数 P25 中位数 P50 定义 3 方差 Variance 特点 全面反映一组数据的平均变异水平 度量单位与原指标不同 用途 描述对称分析资料变异程度 实际运用中 多采用样本方差计算公式为 定义 方差的算术平方根 4 标准差 StandardDeviation S 特点 同方差 但度量单位与原指标相同 使用更广泛 用途 同方差 描述对称分析资料变异程度 定义 5 变异系数 CoefficientofVariation CV 特点 无单位 相对变异程度 百分比形式用途 用于量纲不同变量间变异程度的比较 用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省连云港市灌云县部分学校2024-2025学年高二下学期5月月考地理试题(解析版)
- 安徽省阜阳市临泉县田家炳实验中学(临泉县教师进修学校)2025-2026学年高一上学期开学考试英语试题
- 羽毛球扣杀课件
- 群监员业务知识培训课件
- 电弧焊基础知识培训
- 山东省师范大学附属中学2017-2018学年高二上学期第六次学分认定(期末)考试化学(文)试题
- 内蒙古包头市2024-2025学年高一下学期期末考试数学试题1
- 航空航天年度安全投入提取计划
- 农业测绘项目安全操作措施
- 寺管会开展僧尼忠诚教育措施
- 风电发电机组电控系统知识-安全链部分课件
- PMBOK指南第6版中文版
- 第五章-针织服装设计与样板制作经典版课件
- 肿瘤的介入治疗课件最新版
- 医疗质量管理工具课件
- 急性上呼吸道感染病人的护理
- 小学教师量化考核表
- 房建监理平行检查记录表格模板(参考版)
- 计算机操作系统(第四版)-汤小丹-课后习题答案
- 12生物分子网络ppt课件
- 手术室护士长工作手册-精品完整版
评论
0/150
提交评论