




已阅读5页,还剩64页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本资料来源 第二章统计数据的描述 第2节分布集中趋势的测度 一 众数二 中位数三 四分位数四 均值五 几何平均数六 切尾均值七 众数 中位数和均值的比较 集中趋势 centraltendency 一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据 但高层次数据的测度值并不适用于低层次的测量数据 众数 mode 一组数据中出现次数最多的变量值一般情况下 只有在数据量较大且集中趋势明显的情况下 才能用众数作为总体的代表值 众数是一个位置代表值 不受极端值的影响主要用于定类尺度数据 也可用于定序尺度数据和定比尺度数据 众数的种类 无众数data 10591268一个众数data 659855双众数data 252828364242多众数data 3232323334343435363636 定类尺度数据的众数 例题分析 解 众数为 SP09 05 即Mo SP09 05 某专卖店新品球衣销售情况 单位 件 定序尺度数据的众数 例题分析 解 众数为 副教授 这一级别 即Mo 副教授 例 已知某企业某日工人的日产量资料如下 解 该企业该日全部工人日产量的众数为12件 定比尺度数据的众数 单变量值分组 符号含义 A L为众数组的下限 B 1 fm fm 1 即众数组的次数与前一组次数之差 2 fm fm 1 即众数组的次数与后一组次数之差 C i为众数组的组距 定比尺度数据的众数 组距分组 组距分组计算众数 某地区的人均月收入调查数据 排序后处于中间位置上的值不受极端值的影响主要用于定序尺度数据 也可用于定比尺度数据 但不能用于定类尺度数据 中位数 median 1 确定中位数的位置 定序尺度数据的中位数 2 确定中位数 定序尺度数据的中位数 例题分析 解 中位数的位置为300 2 150从累计频数看 中位数在 一般 这一组别中中位数为Me 一般 1 由未分组资料确定中位数 2 由单变量值分组确定中位数 3 由组距分组数据确定中位数 定比尺度数据的中位数 计算方法 1 由未分组资料确定中位数排序 确定中位数位置 奇数 中间位置的变量值为中位数 偶数 中间位置相邻两个变量值的简单平均数是中位数 定比尺度数据的中位数 计算方法 中位数 9个数据的算例 例 9个家庭的人均月收入数据原始数据 15007507801080850960200012501630排序 75078085096010801250150016302000位置 123456789 中位数Me 1080 中位数 10个数据的算例 例 10个家庭的人均月收入数据排序 66075078085096010801250150016302000位置 12345678910 2 由单变量值分组确定中位数 中位数位置 从累计频数看 中位数在 80 这一组别中 中位数为Me 34 台 某公司销售人员月销售冰箱中位数计算 3 由组距分组数据确定中位数 第一步 确定中位数位置 其中 L是中位数所在组的下限fm是中位数所在组的次数Sm 1是中位数所在组前面各组累计次数i是中位数所在组的组距 第二步 采用公式计算 某地区家庭收入分组 中位数的位置在第46 92 2 位 应在第二组 分位数1 四分位数2 十分位数3 百分位数 四分位数 quartile 不受极端值的影响 排序后处于25 和75 位置上的值 3 主要用于定序尺度数据 也可用于定比尺度数据 但不能用于定类尺度数据 1 由定序数据确定四分位数 2 确定四分位数 1 确定位置 四分位数 定序尺度数据的四分位数 例题分析 解 Q1位置 300 4 75Q3位置 3 300 4 225从累计频数看 Q1在 不满意 这一组别中 Q3在 一般 这一组别中四分位数为Q1 不满意Q3 一般 四分位数 2 由未分组数据确定四分位数 1 确定位置 四分位数 2 确定四分位数 例 9个家庭的人均月收入数据原始数据 15007507801080850960200012501630排序 75078085096010801250150016302000位置 123456789 四分位数 例 10个家庭的人均月收入数据排序 66075078085096010801250150016302000位置 12345678910 四分位数 均值 mean 集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于定比尺度数据 不能用于定类尺度数据和定序尺度数据 简单平均数与加权平均数 simplemean weightedmean 设一组数据为 x1 x2 xn各组的组中值为 M1 M2 Mk相应的频数为 f1 f2 fk 简单平均数 加权平均数 加权平均数 例题分析 加权平均数 权数对均值的影响 甲乙两组各有10名学生 他们的考试成绩及其分布数据如下甲组 考试成绩 x 020100人数分布 f 118乙组 考试成绩 x 020100人数分布 f 811 几何平均数 geometricmean n个变量值乘积的n次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为 5 当数据中出现零值或负值时不宜计算几何平均数 某电器销售公司2003 2008年销售量的环比增长率分别为 7 6 2 5 0 6 2 7 和2 2 求这期间销售量的平均增长率 几何平均数的计算示例 销售量的平均增长率 103 1 1 3 1 G 切尾均值 trimmedMean 1 去掉大小两端的若干数值后计算中间数据的均值2 在电视大奖赛 体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用3 计算公式为 n表示观察值的个数 表示切尾系数 例 某次比赛共有11名评委 对某位歌手的给分分别是 经整理得到顺序统计量值为 去掉一个最高分和一个最低分 取1 11 众数 中位数和平均数的比较 众数 中位数和平均数的关系 众数 中位数 平均数的特点和应用 众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用 第3节分布离散程度的测度 一 极差 全距 二 内距 四分位差 三 方差和标准差四 离散系数 离散程度 数据分布的另一个重要特征反映各变量值远离其中心值的程度 离散程度 从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值 极差 range 一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响 计算公式为 例B 空调耐用性分组测试表 单位 小时 甲组R 300 0 300 小时 乙组R 200 100 100 小时 例C 某季度某工业公司18个工业企业产值计划完成情况如下 计算极差 内距 Inter QuartileRange IQR 也称四分位差上四分位数与下四分位数之差内距 QU QL反映了中间50 数据的离散程度不受极端值的影响可用于衡量中位数的代表性 例 某数学补习小组11人年龄 岁 为 17 19 22 24 25 28 34 35 36 37 38 结论 该小组约有50 的人年龄在22 36岁之间 并且他们之间最大差异为14岁 解 方差和标准差 VarianceandStandardDeviation 数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的 称为总体方差或标准差 根据样本数据计算的 称为样本方差或标准差 总体方差和标准差 PopulationvarianceandStandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差和标准差 samplevarianceandstandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 根据以下资料 计算企业职工平均工资的标准差 已知平均工资为760元 某企业职工工资分组数据表 总体方差和标准差计算示例 总体方差和标准差计算示例 总体方差为 总体标准差为 样本标准差 例题分析 样本标准差 例题分析 含义 每一天的销售量与平均数相比 平均相差21 58台 离散系数 coefficientofvariation 标准差与其相应的均值之比对数据相对离散程度的测度消除了数据水平高低和计量单位的影响用于对不同组别数据离散程度的比较计算公式为 例 甲乙企业职工的年均收入分别为20000元和50000元 收入的标准差分别为3000和5000元 哪家企业职工的收入差距小一些 甲企业离散系数 乙企业离散系数 结论 乙企业职工收入差距小于甲企业 结论 比较两组数据的离散程度时 如两组均值相等 可以直接比较标准差 也可以比较离散系数 如两组均值相差很大 则需比较两组的离散系数 不能直接比较标准差 第4节分布偏态与峰度的测度 偏态与峰态分布的形状 偏态 峰态 偏态 skewness 统计学家Pearson于1895年首次提出数据分布偏斜程度的测度偏态系数 0为对称分布偏态系数 0为右偏分布偏态系数 0为左偏分布 偏态系数 skewnesscoefficient 根据原始数据计算根据分组数据计算 偏态系数 例题分析 偏态系数 例题分析 结论 偏态系数为正值 但与0的差异不大 说明电脑销售量为轻微右偏分布 即销售量较少的天数占据多数 而销售量较多的天数则占少数 偏态与峰态 从直方图上观察 按销售量分组 台 结论 1 右偏分布2 略有平峰 某电脑公司销售量分布的直方图 峰态 kurtosis 统计学家Pearson于1905年
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新质生产力与企业出海
- 新媒体主播:新质生产力的新职业代表
- 新质生产力带来的发展机遇
- 圆轴扭转的概念及内力
- 2025年口腔颌面外科特殊手术处理模拟测试答案及解析
- 新质生产力的国内与国际视野
- 2025年神经外科常见手术操作技能评估答案及解析
- 2025年眼科青光眼手术前后护理注意事项模拟考试卷答案及解析
- 2025年法医学法医鉴定常见案例答案及解析
- 2025年骨科手术常见并发症的应急处理模拟考试卷答案及解析
- 企业消防安全管理中的突发事件处理与善后工作指南
- 汉字基本笔画与书写训练
- 数控铣工(四级)职业技能理论知识考试题库附答案(新版)
- 儿童常见疾病的防治 OK课件
- 软件工程导论课件(第六版)(张海潘编著)(1-13章)
- 中建硅墨烯保温板外墙保温施工方案
- 第三讲 神话学
- 山东大学核心期刊目录(文科)
- 中医基础理论-脏象学说
- GB/T 8566-2007信息技术软件生存周期过程
- GB/T 13452.2-2008色漆和清漆漆膜厚度的测定
评论
0/150
提交评论