数值变量资料的统计分析之统计描述ppt课件.ppt_第1页
数值变量资料的统计分析之统计描述ppt课件.ppt_第2页
数值变量资料的统计分析之统计描述ppt课件.ppt_第3页
数值变量资料的统计分析之统计描述ppt课件.ppt_第4页
数值变量资料的统计分析之统计描述ppt课件.ppt_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十六章数值变量资料的统计分析 学习目的和要求 掌握 1 集中趋势指标的计算与应用意义2 离散趋势指标的计算与应用意义3 数值变量资料的t检验 熟悉 1 总体均数的区间估计2 假设检验的意义和步骤了解 数值变量资料的统计描述中频数表的制作 第一节数值变量资料的统计描述 一 编制频数表 了解 120名12岁男孩身高 cm 资料142 3156 6142 7145 7138 2141 6142 5130 5132 1135 5134 5148 8134 4148 8137 9151 3140 8149 8143 6149 0145 2141 8146 8135 1150 3133 1142 7143 9142 4139 6151 1144 0145 4146 2143 3156 3141 9140 7145 9144 4141 2141 5148 8140 1150 6139 5146 4143 8150 0142 1143 5139 2144 7139 3141 9147 8140 5138 9148 9142 4134 7147 3138 1140 2137 4145 1145 8147 9146 7143 4150 8144 5137 1147 1142 9134 9143 6142 3143 3140 2125 9 132 7152 9147 9141 8141 4140 9141 4146 7138 7160 9 154 2137 9139 9149 7147 5136 9148 1144 0137 4134 7138 5138 9137 7138 5139 6143 5142 9146 5145 4129 4142 5141 2148 9154 0147 7152 3146 6139 2139 9 1 计算全距 极差 R 最大值 最小值2 确定组距 确定组段数 8 15组 确定组距 组距i 全距 组段数3 划分组段4 统计频数 120名12岁男孩身高 cm 资料的频数分布 二 集中趋势指标 掌握 数值变量资料的集中趋势指标用平均数来描述 常用的平均数有算数均数 几何均数 中位数 一 算数均数 样本均数用表示 2 应用条件适用于呈对称分布或近似对称分布的资料 3 计算方法 直接法 变量值个数不多公式为 加权法 n 100 公式为 例 某年某市120名12岁健康男孩身高 cm 资料如下表 求其平均数 142 3156 6142 7145 7138 2141 6142 5130 5132 1135 5134 5148 8134 4148 8137 9151 3140 8149 8143 6149 0145 2141 8146 8135 1150 3133 1142 7143 9142 4139 6151 1144 0145 4146 2143 3156 3141 9140 7145 9144 4141 2141 5148 8140 1150 6139 5146 4143 8150 0142 1143 5139 2144 7139 3141 9147 8140 5138 9148 9142 4134 7147 3138 1140 2137 4145 1145 8147 9146 7143 4150 8144 5137 1147 1142 9134 9143 6142 3143 3140 2125 9 132 7152 9147 9141 8141 4140 9141 4146 7138 7160 9 154 2137 9139 9149 7147 5136 9148 1144 0137 4134 7138 5138 9137 7138 5139 6143 5142 9146 5145 4129 4142 5141 2148 9154 0147 7152 3146 6139 2139 9 120名12岁男孩身高 cm 资料 120名12岁男孩身高 cm 资料的频数分布 120名12岁健康男孩身高 cm 均数的加权法计算 二 几何均数 1 定义将n个变量值的乘积开n次方所得的根即为几何均数 符号用G表示 2 适用条件 数值变量呈倍数关系或呈对数正态分布 如抗体效价 抗体滴定度 疾病潜伏期 3 计算 例 5人的血清滴度分别为1 2 1 4 1 8 1 16 1 32 求平均滴度 加权法 变量值个数较多或变量值为频数表资料 二 几何均数 几何平均数 例2 4 某年某市100名儿童接种某种疫苗后 测定抗体滴度的资料如第 1 2 列所示 求该疫苗的抗体平均滴度 三 中位数和百分位数 中位数1 定义将一组变量值按大小顺序排列 位次居中的变量值即为中位数 符号用M表示 2 适用条件 变量值中出现特小或特大的数值资料的分布呈明显偏态变量值分布一端或两端无确定数值 只有小于或大于某个数值资料的分布类型不清 3 计算方法 直接法当变量值个数为奇数时计算公式为M 当变量值个数为偶数时计算公式为 例 某地11例某传染病患者 其潜伏期 天 分别为2 2 4 3 5 6 3 8 9 11 15 求其平均潜伏期 例 如上例资料在第21天又发生1例该传染病患者 其平均潜伏期又为多少 先将变量值按从小到大的顺序排列 2 2 3 3 4 5 6 8 9 11 15 21 频数表法 编制中位数计算表 确定中位数所在的组段 计算中位数 计算公式 例 现有145例食物中毒病人 其潜伏期分布如下表的第 1 2 栏 求中位数 145例食物中毒病人潜伏期分布表 可确定中位数所在组段是12 故L 12 i 6 fm 38 n 145 63 代入公式 得M 12 6 38 145 50 63 13 5 小时 百分位数 1 定义指将n个观察值从小到大依次排列 再把它分成100等份 对应于x 位的数值即为第x百分位数 中位数是第50百分位数 用P50表示 第25 第75 第95百分位数记为P25 P75P95是统计学上常用的指标 PX X 100 X 2 计算方法 L Px所在组段下限i 组距n 总例数f Px所在组段频数 fL 小于L的各组段累计频数 145例食物中毒病人潜伏期分布表 求P25和P75 P25 6 6 46 145 25 17 8 51 小时 P75 18 6 32 145 75 101 19 45 小时 练习题 1 适用于对称分布或近似对称分布的资料的平均数为A 算数均数B 几何均数C 中位数D 百分位数答案 A 描述正态分布资料集中趋势的指标是 A 中位数B 几何均数C 算术平均数D 标准差答案 C 全国2011年4月高等教育自学考试预防医学 二 试题 2 描述一组偏态分布资料的平均水平 下列哪个指标较好A 算术均数B 几何均数C 百分位数D 中位数答案 D 3 计算某抗体滴度的平均水平 一般宜选择A 算术均数B 几何均数C 中位数D 百分位数答案 B 描述呈倍数关系的数值变量的指标是A 算术均数B 几何均数C 中位数D 百分位数答案 B 三 离散趋势指标 掌握 离散趋势指标 掌握 三组同龄男孩体重 kg 如下 甲组9095100105110均数 100 cm 乙组9698100102104均数 100 cm 丙组9699100101104均数 100 kg 平均水平指标仅描述一组数据的集中趋势 可作为总体均数的一个估计值 由于变异的客观存在 需要一类指标描述资料的离散趋势 常用指标 全距 四分位数间距 方差 标准差 变异系数 科学出版社卫生职业教育出版分社 极差 又称全距 R甲 110 90 20 cm R乙 104 96 8 cm R丙 104 96 8 cm 甲组9095100105110均数 100 cm 乙组9698100102104均数 100 cm 丙组9699100101104均数 100 kg 缺点 只用到最大 最小值 样本信息没能充分利用 不能反映所有数据的变异程度 受样本含量影响较大 样本例数越多 R可能越大 2组观察值例数悬殊时不用R比较 样本含量不变时 每次抽样得到的极差值相差较大 R稳定性较差 优点 表示变异范围 简单明了 各种分布类型的资料均可用 练习题 关于极差的描述错误的是A 极差值大 离散度就大B 极差可以反映所有数据的变异大小C 极差受样本含量的影响较大D 极差只能粗略的说明变量值的变动范围答案 B 四分位数间距 四分位数间距 用Q表示 Q 四分位数间距越大 说明变异度越大 反之 说明变异度越小 方差 方差也称均方差 反映一组数据的平均离散水平 方差愈小 说明变量值的变异程度愈小 方差愈大 说明变异程度愈大 样本方差用表示 标准差 公式 样本标准差用表示公式 标准差的公式还可以写成 利用频数表计算标准差的公式为 测定了5名健康人第一小时末红细胞沉降率 分别是6 3 2 9 10mm 求标准差 例 某年某市120名12岁健康男孩身高 cm 资料如下表 求其标准差 142 3156 6142 7145 7138 2141 6142 5130 5132 1135 5134 5148 8134 4148 8137 9151 3140 8149 8143 6149 0145 2141 8146 8135 1150 3133 1142 7143 9142 4139 6151 1144 0145 4146 2143 3156 3141 9140 7145 9144 4141 2141 5148 8140 1150 6139 5146 4143 8150 0142 1143 5139 2144 7139 3141 9147 8140 5138 9148 9142 4134 7147 3138 1140 2137 4145 1145 8147 9146 7143 4150 8144 5137 1147 1142 9134 9143 6142 3143 3140 2125 9 132 7152 9147 9141 8141 4140 9141 4146 7138 7160 9 154 2137 9139 9149 7147 5136 9148 1144 0137 4134 7138 5138 9137 7138 5139 6143 5142 9146 5145 4129 4142 5141 2148 9154 0147 7152 3146 6139 2139 9 练习题 描述离散趋势的指标是A 标准差B 中位数C 几何均数D 算术均数答案 A 全国2014年4月高等教育自学考试预防医学 二 试题 关于样本标准差的描述正确的是A 样本标准差就是总体标准差B 样本方差是样本标准差的正平方根C 标准差有量纲 其量纲与原变量值相同D 标准差可能为负值答案 C 均数和标准差的关系是A 均数愈大 s愈大B 均数愈大 s愈小C s愈大 均数对各变量值的代表性愈好D s愈小 均数对各变量值的代表性愈好答案 D 各观察值均加 或减 同一个不等于零的数后A 均数不变 标准差改变B 均数改变 标准差不变C 两者均不变D 均数不变 标准差不一定改变答案 B 变异系数 变异系数 coefficientofvariation 记为 CV 多用于观察指标单位不 同时 如身高与体重的变异程度的比较 或均数相差较大时 如儿 童 身高与成人身高变异程度的比较 例 某地20岁男子160人 身高均数为166 06cm 标准差为4 95cm 体重均数为53 72kg 标准差为4 96kg 试比较身高与体重的变异程度 例 某地130名10岁女生体重均数为26 96kg 标准差为3 9kg 150名17岁女生体重均数为49 18kg 标准差为5 3kg 试比较两个年龄别女生体重的离散程度 练习题 关于变异系数下列描述错误的是A 变异系数可以反映变量值的绝对值离散程度B 变异系数是无量纲单位C 变异系数可以用来比较不同单位指标间的变异度D 变异系数消除了均数的大小对标准差的影响答案 A 比较血压和脉搏两组数据变异度大小宜采用A 变异系数B 方差C 极差D 标准差答案 A 设同一组7岁男童身高的均数是110cm 标准差是5cm 体重的均数是25kg 标准差是3kg 则比较二者变异程度的结论为A 身高的变异程度小于体重的变异程度B 身高的变异程度等于体重的变异程度C 身高的变异程度大于体重的变异程度D 单位不同 无法比较答案 A 正态分布 正态分布 normaldistribution 又称高斯分布 Gaussiandistribution 是一种重要的连续型分布 应用甚广 是许多统计方法的理论基础 正态分布曲线 正态分布的特征 4 正态曲线下的面积分布有一定的规律 1 范围内的面积占68 27 1 96 范围内的面积占95 00 2 58 范围内的面积占99 00 标准正态分布 练习题 正态曲线的位置参数是指A 均数 B 标准正态变量uC 标准差 D 样本标准差s答案 A 正态分布N 2 当 恒定时 越大 则A 曲线沿横轴越向右移动B 曲线沿横轴越向左移动C 曲线形状和位置都不变D 观察值变异程度越大 曲线越 胖 答案 D 对于均数为 标准差为 正态分布 95 的变量值分布范围为A B 1 96 1 96 C 2 58

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论