




已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章数据的概括性度量 甲 乙两个班的统计学成绩 请对两个班的成绩进行对比分析 你会从哪几个方面着手 两班成绩的对比分析 甲班成绩的描述性指标 乙班成绩的描述性指标 学习目的和重难点提示 本章学习目的领会数据分布的各种特征 集中趋势 离散趋势 偏斜程度和峰度 掌握数据分布特征各测定值的计算方法 特点及其应用场合 本章重难点提示数据分布特征的描述方法 如何使用一些统计量来对数据进行概括性测定 数据分布特征各测定值的计算方法 特点及其应用场合 数据分布的特征和测度 峰度 偏度 4 1集中趋势的度量 一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势测度值适用于高层次的测量数据 反过来 高层次数据的集中趋势测度值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势 要根据所掌握的数据的类型来确定 集中趋势指标的种类 从总体各单位变量值中抽象出具有一般水平的量 这个量是根据各个单位的具体标志值计算出来的 有算术平均数 调和平均数 几何平均数等形式 数值平均数 取得集中趋势代表值方法的不同 可分为数值平均数和位置平均数 先将总体各单位的变量值按一定顺序排列 然后取某一位置的变量值来反映总体各单位的一般水平 位置平均数有众数 中位数 四分位数等形式 位置平均数 4 1 1众数 1 定义 出现次数最多的变量值 是集中趋势的测度值之一 不受极端值的影响 因而在实际工作中有时有它特殊的用途 诸如 要说明一个企业中工人最普遍的技术等级 说明消费者需要的内衣 鞋袜 帽子等最普遍的号码 说明农贸市场上某种农副产品最普遍的成交价格等 都需要利用众数适用 主要用于定类数据 也可用于定序数据和数值型数据注意 有些数据可能没有众数或有几个众数 众数 众数的不唯一性 无众数原始数据 10591268 一个众数原始数据 659855 多于一个众数原始数据 252828364242 众数的计算方法 品质变量的众数 观察次数 出现次数最多的变量值就是众数 例如 企业的所有制结构分布 人口的城乡分布 数值变量的众数未分组资料 观察次数 出现次数最多的数据就是众数 分组资料 1 单项式数列 直接观察 次数最多的组的变量值即为众数 定类数据的众数 例 根据表4 1中的数据 计算众数 解 这里的变量为 广告类型 这是个定类变量 不同类型的广告就是变量值 我们看到 在所调查的200人当中 关注商品广告的人数最多 为112人 占总被调查人数的56 因此众数为 商品广告 这一类别 即Mo 商品广告 定序数据的众数 例 根据表4 2中的数据 计算众数 解 这里的数据为定序数据 变量为 回答类别 甲城市中对住房表示不满意的户数最多 为108户 因此众数为 不满意 这一类别 即Mo 不满意 例 单项式变量数列确定众数实例 表4 3某市居民家庭按家庭人口数分组 由上表可以看出 家庭人口数为3人的家庭数最多 因此本例中家庭人口数的众数为3人 数值型分组数据的众数 1 众数的值与相邻两组频数的分布有关 该公式假定众数组的频数在众数组内均匀分布 2 相邻两组的频数相等时 众数组的组中值即为众数 3 相邻两组的频数不相等时 众数采用下列近似公式计算 算例 4 1 2顺序数据 中位数和分位数1 中位数me集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响主要用于定序数据 也可用数值型数据 但不能用于定类数据各变量值与中位数的离差绝对值之和最小 即 原始数据 2422212620 位置 12345 中位数的计算 排序 2021222426 原始数据 10591268 位置 123456 排序 56891012 中位数 8 9 2 8 5 计算公式 例 某企业50名工人加工零件中位数计算表 计算50名工人日加工零件数的中位数 Sm 1 Sm 1 2 四分位数人们经常会将数据划分为4个部分 每一个部分大约包含有1 4即25 的数据项 1 集中趋势的测度值之一2 排序后处于25 和75 位置上的值3 不受极端值的影响4 主要用于定序数据 也可用于数值型数据 但不能用于定类数据 四分位数 位置的确定 未分组数据 组距分组数据 计算甲城市家庭对住房满意状况评价的四分位数 解 下四分位数 QL 的位置为 QL位置 300 4 75上四分位数 QL 的位置为 QU位置 3 300 4 225从累计频数看 QL在 不满意 这一组别中 QU在 一般 这一组别中 因此QL 不满意QU 一般 原始数据 23213032282526排序 21232526283032位置 1234567 QL 23 QU 30 数值型未分组数据的四分位数 原始数据 232130282526排序 212325262830位置 123456 QL 21 0 75 23 21 22 5 QU 28 0 25 30 28 28 5 数值型分组数据的四分位数 计算公式 上四分位数 下四分位数 计算50名工人日加工零件数的四分位数 QL位置 50 4 12 5 QU位置 3 50 4 37 5 4 1 3数值型数据 均值1 集中趋势的测度值之一2 最常用的测度值3 一组数据的均衡点所在4 易受极端值的影响5 用于数值型数据 不能用于定类数据和定序数据 均值的种类及计算 1 算术平均数 1 概念算术平均数又称平均值 是用一组数据中所有值之和除以该组数据的个数 2 基本公式 平均数计算公式 设一组数据为 X1 X2 XN简单均值的计算公式为 设分组后的数据为 X1 X2 XK相应的频数为 F1 F2 FK加权均值的计算公式为 简单均值 算例 原始数据 10591368 加权均值 算例4 7 1 算术平均数的大小 不仅取决于研究对象的变量值 x 而且受各变量值重复出现的频数 f 或频率 f f 大小的影响 频数或频率较大 该组数据的大小对算术平均数的影响就大 反之则小 2 权数的表现形式问题 绝对权数与相对权数 注意事项 是非标志的平均数 是非标志 如果按照某种标志把总体只能分为具有某种特征的单位和不具有该种特征的单位两部分 这个标志就是是非标志 平均数的计算 把具有某种特征的用 1 表示 不具有该种特征的用 0 表示 加权平均数 权数对平均数的影响 甲乙两组各有10名学生 他们的考试成绩及其分布数据如下甲组 考试成绩 X 020100人数分布 F 118乙组 考试成绩 X 020100人数分布 F 811 平均数 数学性质 1 各变量值与均值的离差之和等于零 2 各变量值与均值的离差平方和最小 性质 3 4 3 给每个变量值增加或减少一个任意数A 则算术平均数也相应增增加或减少这个任意数A 4 给每个变量值乘以或除以一个任意数A 则算术平均数也相应扩大或缩小A倍 2 调和平均数 1 概念 调和平均数又称倒数平均数 是各个变量值倒数的算术平均数的倒数 2 计算简单调和平均数 针对未分组资料 计算公式为 2 调和平均数 加权调和平均数 针对分组资料 计算公式为 其中 是一种特殊权数 它不是各组变量值出现的次数 表示各组标志总量 即 例 根据某商场职工月工资资料计算月平均工资 某商场职工月工资资料 3 几何平均数 1 概念 几何平均数 geometricmean 又称对称平均数 它是各变量值乘积的n次方根 2 计算基本公式 对数公式 在实际工作中 由于变量个数较多 通常要应用对数来进行计算 即 3 几何平均数的应用及特点 应用条件现象的总比率是若干项变量的乘积 或现象的总发展速度是各时期发展速度的连乘积时 计算平均比率或平均发展速度 特点a 如果数列中有一个标志值等于零或负值 则无法计算 b 受极端值影响较小 故较稳健 几何平均数 算例 例4 10 一位投资者持有一种股票 2001 2004年收益率分别为4 5 2 1 25 5 1 9 计算该投资者在这四年内的平均收益率 平均收益率 108 0787 1 8 0787 例1 某企业的一条生产流水线有四道工序 每一道工序完成的产品都要作一次质量检查 只有合格的中间件才进入下一道工序 请问 平均合格率 适用于连续作业的情况 例2 据网上报到 成都温江的兰花节 2006年2月27日 上 一盆兰花卖价是1100万元 这背后是迅速壮大的10万户成都养兰 炒兰户 不少人是在借高利贷炒兰 图谋暴利 红荷 黄金海岸 龙女 彩蝶 设某炒兰投资者从朋友处借得一笔高利贷 以季度为结算单位 每个季度生成的利息到期自动转为本金 一年连本带利付清 各季利率根据兰花价格变化适当调整 实际一年下来 第一季度的利率是3 第二季度的利率是3 2 第三季度的利率是3 6 第四季度的利率是2 8 问 平均利率是多少 解答 本题需要注意的是 不能够直接对利率进行几何平均 而应该通过连本带利计算 即若借款总额为L万元 则一年之后的付款额 本息和 为 如果平均利率为G 则应该有 1 算术平均数易受极端值影响 2 调和平均数也受极端值影响 但受极小值影响较大 3 几何平均数受极端值影响较小 对同一资料来说 几何平均数大于调和平均数而小于算术平均数 即有 一般来说 各种平均数的比较 一 各种平均数的特点及应用场合是就全部数据计算的 具有优良的数学性质 实际中应用最为广泛 其主要缺点是易受极端值的影响 对偏态分布其代表性较差 H主要用于不能直接计算的数据易受极端值的影响 G主要用于计算比率数据的平均数 易受极端值的影响 不受极端值大小的影响 对偏态分布其代表性较好 但不是根据所有的变量值计算的 不受极端值的影响 对偏态分布其代表性较好 但不是根据所有的变量值计算的 中位数 众数和算术平均数的关系 4 2离散程度的度量 数据分布的另一个重要特征离中趋势的各测度值是对数据离散程度所作的描述反映各变量值远离其中心值的程度 因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值 4 2 1分类数据 异众比率 1 离散程度的测度值之一2 非众数组的频数占总频数的比率3 计算公式为 4 用于衡量众数的代表性 异众比率 算例 根据表中的数据 计算异众比率 解 在所调查的200人当中 关注非商品广告的人数占44 异众比率还是比较大 因此 用 商品广告 来反映城市居民对广告关注的一般趋势 其代表性不是很好 4 2 2顺序数据 四分位差1 离散程度的测度值之一2 也称为内距或四分间距3 上四分位数与下四分位数之差QD QU QL4 反映了中间50 数据的离散程度5 不受极端值的影响6 用于衡量中位数的代表性 四分位差 定序数据的算例 根据表中的数据 计算甲城市家庭对住房满意状况评价的四分位差 解 设非常不满意为1 不满意为2 一般为3 满意为4 非常满意为5已知QL 不满意 2 QU 一般 3四分位差 QD QU QL 3 2 1 4 2 3数值型数据 方差和标准差1 极差 1 一组数据的最大值与最小值之差2 离散程度的最简单测度值3 易受极端值影响4 未考虑数据的分布 未分组数据R max Xi min Xi 5 计算公式为 第一组 60 70 80 90 100第二组 78 79 80 81 82很明显 两个小组的考试成绩平均分都是80分 但是哪一组的分数比较集中呢 如果用全距指标来衡量 则有R甲 100 60 40 分 R乙 82 78 4 分 这说明第一组资料的标志变动度或离中趋势远大于第二组资料的标志变动度 例 有两个学习小组的统计学开始成绩分别为 2 平均差 1 离散程度的测度值之一2 各变量值与其均值离差绝对值的平均数3 能全面反映一组数据的离散程度4 数学性质较差 实际中应用较少 5 计算公式为 未分组数据 组距分组数据 平均差 计算过程及结果 某厂按月收入水平分组的组距数列如表中前两列 计算平均差 3 方差和标准差离散程度的测度值之一最常用的测度值反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的 称为总体方差或标准差 根据样本数据计算的 称为样本方差或标准差 总体方差和标准差 计算公式 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 总体标准差 计算过程及结果 根据表中的数据 计算工人日加工零件数的标准差 样本方差和标准差 计算公式 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差自由度一组数据中可以自由取值的数据的个数当样本数据的个数为n时 若样本均值 x确定后 只有n 1个数据可以自由取值 其中必有一个数据则不能自由取值例如 样本有3个数值 即x1 2 x2 4 x3 9 则 x 5 当 x 5确定后 x1 x2和x3有两个数据可以自由取值 另一个则不能自由取值 比如x1 6 x2 7 那么x3则必然取2 而不能取其他值样本方差用自由度去除 其原因可从多方面来解释 从实际应用角度看 在抽样估计中 当用样本方差去估计总体方差 2时 它是 2的无偏估计量 样本方差与标准差 算例 原始数据 10591368 方差 简化计算公式 样本方差 总体方差 方差 数学性质 各变量值对均值的方差小于对任意值的方差设X0为不等于X的任意数 D2为对X0的方差 则 是非标志的标准差 如前 是非标志的平均数为P 由于标准差有良好的数学性质 相比较而言 它的应用最为广泛 4 2 4相对离散程度 离散系数1 标准差与其相应的均值之比2 消除了数据水平高低和计量单位的影响3 测度了数据的相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 附着升降脚手架安装拆卸工岗位操作规程考核试卷及答案
- 锯材定长切割工艺考核试卷及答案
- 稀土金属热处理精炼沉积工艺考核试卷及答案
- 2024新版2025秋青岛版科学六三制三年级上册教学课件:第三单元 第10课 哪杯水热
- 职业适应性测试(带答案)
- 高职课程思政教学评价的价值意蕴、实践痛点与行动路向
- 许昌职业技术考试试题及答案
- 安全生产与特种设备相关法规知识试卷含答案
- 银行主任面试题目及答案
- 银行营销技术试题及答案
- 《国际中文教育概论》课件全套 第1-12章 从对外汉语教学到国际中文教育- 国际中文教育前瞻
- 高血压 糖尿病 健康宣教
- 高职高专院校《作物遗传育种》课程的教学探索获奖科研报告论文
- 孕产妇增补叶酸培训课件
- 传奇类手游运营计划书
- 2024年云南文山交通运输集团公司招聘笔试参考题库含答案解析
- 新视野商务英语视听说(第三版)(下) Unit 1-电子教案
- 《高二化学反应原理》课件
- 计算与人工智能概论智慧树知到课后章节答案2023年下湖南大学
- 盘扣式钢管脚手架验收记录表
- 历史环境中的传统建筑保护与再利用
评论
0/150
提交评论