




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 离散趋势的描述 离散趋势的概念离散趋势描述的指标各指标的计算及意义 2 二 百分位数 百分位数 percentile 是一种位置指标 用来表示 一个百分位数将全部变量值分为两部分 在不包含的全部变量值中有的变量值比它小 变量值比它大 3 1 直接计算法 设有x个原始数据从小到大排列 第x百分位数的计算公式为 当为带有小数位时 当为整数时 例2 9对某医院细菌性痢疾治愈者的住院天数统计 名患者的住院天数从小到大的排列如下 试求第5百分位数和第99百分位数 患者 住院天数 n 120 120X5 6 为整数 例2 9对某医院细菌性痢疾治愈者的住院天数统计 名患者的住院天数从小到大的排列如下 试求第5百分位数和第99百分位数 患者 住院天数 带有小数 取整后trunc 118 8 118 6 2 频数表法 公式 式中 和 分别为第 X 百分位数所在组段 的下限 组距和频数 为小于 各组段的累计频数 n 为总例数 7 8 例2 10某地118名链球菌咽喉炎患者的潜伏期频数表见表2 5第 1 2 栏 试分别求中位数及第25 第75百分位数 9 10 某地120名正常成人血清铜含水量umol L频数表 组段频数f频率 累积频数fc累积频率pc 9 0 32 532 510 0 43 375 811 0 1210 01915 812 0 1310 83226 613 0 1714 24940 814 0 2218 37159 115 0 1815 08974 116 0 1310 810284 517 0 119 211394 118 0 54 211898 319 0 20 021 7120100 0合计120100 请求出M 75 95 的值及算术均数的值 思考题 反映集中趋势的指标 平均数 表示一组观察值的平均水及集中特性 并可作为总体的一个代表值加以应用 但是它没有表达其所代表的总体中各个个体之间的差异 统计学中把个体间的差异称为变异性 variation 所谓变异性是指在同质条件下的观察单位 其同一标志的数据间的差异性 用以描述一组数值变量资料观察值之间参差不齐的程度 即离散程度或变异度的指标 称为离散指标或变异指标 三离散趋势的描述 例 设甲 乙 丙三人 采每人的耳垂血 然后作红细胞计数 每人数5个计数盘 得结果如下 万 mm3 甲 乙 丙 常用统计指标 全距或极差 range 四分位数间距 quartileinterval 方差和标准差 variance standarddeviation 变异系数 CVcoefficientofvariation 全距 用R表示 即一组变量值最大值与最小值之差 亦称极差 对于书中例8 1数据 有 简单 但仅利用了两端点值 稳定性差 一 全距 Range R 5 59 3 60 1 99 mol L R越大 变异度越大 R越小 变异度越小 二 四分位数间距 quartilerange 四分位数间距 用Q表示 若将一组资料分为四等份 上四分位数和下四分位数之差就是 Q P75 P25下四分位数 上四分位数 比全距稳定 可用于一端或两端无确切数值的偏态资料 未考虑每一个观察值 全距和四分位数间距都未全面考虑观察值的变异情况 为了克服该缺点 需计算总体中每个观察值x与总体均数 的差值 x 称为离均差 由于 x 0 不能反映变异的大小 而用离均差平方和 x 2 sumofdeviationfrommean 反映 同时还要考虑到观察值个数N的影响 用其均数 即得到总体的方差 用 2表示 公式为 三 方差与标准差 1 方差 variance 是离均差平方和的均数 反映一组数据的平均离散水平 由于在实际工作中 往往得到的样本资料 总体均数 是未知的 所以只能用样本均数作为 的估计值 即用代替 用样本例数n代替N 但按公式计算的结果通常比实际的低 所以用n 来代替n进行校正 得到样本方差 离均差平方和SS 总体方差 样本方差 自由度 标准差 standarddeviation 方差可以比较全面地反映变量值的变异情况 但其方差的单位是原单位的平方 故引入标准差的概念 标准差 将方差开平方 恢复成原度量单位 得到总体的标准差 和样本标准差S 样本标准差用表示 其度量单位与均数一致 所以最常用 离均差平方和SS 3 总体标准差用 表示 公式 公式 标准差的公式还可以写成 利用频数表计算标准差的公式为 例对以下数据 75 76 72 69 66 72 57 68 71 72 用直接法计算标准差 例利用表中的数据和频数表法计算标准差 四 变异系数 变异系数 coefficientofvariation CV 常用于比较度量单位不同或均数相差悬殊的两组 或多组 资料的变异程度 例 某地7岁男孩身高的均数为123 10cm 标准差为4 71cm 体重均数为22 29kg 标准差为2 26kg 比较其变异度 25 某地7岁男孩身高的均数为123 10cm 标准差为4 71 体重均数为22 59kg 标准差为2 26kg 试比较其变异度 应用一 观察指标单位不同 26 应用二 均数相差较大时 27 血糖 mol L 人数 图某地区2002年55 58岁健康成人的空腹血糖 mmol L 测定值的频数分布图 四 正态分布 正态分布 29 正态分布 又称为Gauss分布 Gaussiandistribution 设想当原始数据的频数分布图的观察人数逐渐增加且组段不断分细时 图2 4中的直条就不断变窄 其顶端则逐渐接近于一条光滑的曲线 这条曲线形态呈钟形 两头低 中间高 左右对称 近似于数学上的正态分布 在处理资料时 我们就把它看成是正态分布 注意 一组数据是否真正符合正态分布 还需进行相关的检验 见以后内容 30 正态分布的概念和特征 1 正态分布曲线的数学函数表达式如果随机变量的分布服从概率密度函数 2 正态分布的特征 32 正态分布位置变换图 33 正态分布位置变换图 34 4 正态曲线下的面积分布有一定的规律 对公式 2 17 积分 35 图2 7正态曲线面积分布示意图 正态分布是一个分布族 对应于不同的参数 m 和 s 会产生不同位
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 销售团队出差费用报销及市场拓展合同
- 个人艺术收藏借款合同范本
- 民政殡葬专业考试题及答案
- 孤独症康复专业试题及答案
- 医师专业面试题及答案
- 转专业考试语言试题及答案
- 社交媒体医械信任度提升-洞察及研究
- 木材加工技术革新与政策法规应对策略-洞察及研究
- 2025至2030中央商务区行业产业运行态势及投资规划深度研究报告
- 2025至2030中国湿喷混凝土机行业运营态势与投资前景调查研究报告
- 1.2 连续分类(课件)数学青岛版二年级上册(新教材)
- 8000字法律毕业论文
- 2025年哈尔滨市呼兰区人民法院公开招聘聘用制书记员、辅警、文员4人考试参考试题及答案解析
- 【2025年】蚌埠市12345政务服务便民热线岗位招聘20名考试笔试试题(含答案)
- 反诈知识竞赛试题及答案
- 钢筋加工棚租赁合同范本
- 眼整形课件教学课件
- 公司法务知识培训会课件
- 2025-2026学年秋季第一学期学校德育工作安排表
- 2025年全面质量管理知识竞赛题库及参考答案
- 医药行业KA经理工作汇报
评论
0/150
提交评论