




免费预览已结束,剩余148页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 4 8 1 第一节分布集中趋势的测度第二节集中趋势 位置平均数第三节离中趋势的测度第四节偏度与峰度的测度第五节总量指标与相对指标本章小结 第三章数据分布特征的描述 2020 4 8 2 本章重点与难点 重点是了解和掌握算术平均数 众数 中位数 方差 标准差的含义及其计算方法 正确使用离散系数比较不同均值的代表性 难点是偏度和峰度的含义及其计算方法 2020 4 8 3 学习目标 通过本章的学习 正确理解平均指标与变异指标的概念的 意义与作用 明确其种类和区别 掌握平均指标和变异指标的计算方法 以及应用的原则和条件 掌握偏度和峰度的含义及其计算方法 了解各种分位数的概念与意义 2020 4 8 4 一 总量数据的描述 总量数据是总量指标的取值 也称绝对数 反映了总体规模或绝对水平的指标 是认识社会经济现象的起点 也是计算相对指标和平均指标的基础 一般通过计数 测量得到 可以是单位总量和标志总量 分为时期指标 流量 和时点指标 存量 时期指标大小与时间长短有关 不同时间范围的时期指标可以直接相加 加起来反映现象在更长时间的总量 时点指标的大小与时点间的间隔长短没有直接关系 不同时点上的指标相加没有实际意义 2020 4 8 5 二 相对数据的描述 相对数据即相对指标 常称为相对数 是有联系的统计数据对比的比率 根据研究目的和对比的指标不同 可以形成不同类型的相对数 分别反映现象的相对水平 结构和分布 比例关系 发展速度 普遍程度等 计量形式有 无名数和复名数 2020 4 8 6 二 相对数据的描述 2020 4 8 7 结构相对指标和比例相对指标例题 比较指标和比例指标例题 两个类型相同的工业企业 甲企业全员劳动生产率为18542元 人 年 乙企业全员劳动生产率为21560元 人 年 则两个企业全员劳动生产率的比较相对指标为 2020 4 8 8 强度相对指标例题 动态相对指标例题 2007年我国国内生产总值为24 96万亿元 2006年为20 94万亿元 若以2006年作为基期 则动态比较相对指标为 我国土地面积960万平方公里 第五次人口普查人口总数为129533万人 则强度相对指标为 2020 4 8 9 二 相对数据的描述 当计划任务是以比上期提高或降低的百分比形式表示时 计划完成程度相对指标不应直接用提高率或降低率对比 而应以报刊基数在内的百分率对比 降低率形式时 提高率形式时 2020 4 8 10 例题 某工业企业1998年工人劳动生产率计划规定提高5 单位产品成本计划降低3 实际上 工人劳动生产率提高10 单位产品成本降低4 则 结果表明 该企业1998年劳动生产率计划完成程度为104 76 超额完成4 76 单位产品成本计划完成程度为98 97 比计划超额降低1 03 对于越高越好的正指标 计算结果大于100 为超额完成计划 反之 对于越低越好的逆指标 计算结果小于100 为超额完成计划 2020 4 8 11 例题 某季度某企业18个工业企业产值计划完成程度资料 如表所示 计算平均产值计划完成程度 解 2020 4 8 12 第一节分布集中趋势的测度 一 算术平均数二 调和平均数三 几何平均数 2020 4 8 13 一 算术平均数 一 简单平均数算术平均数是指将一组数据相加后除以数据的个数所得到的一个数值 1 简单算术平均数如果是未分组整理的原始资料 则直接将各个数据加总再除以数据的个数即得到平均数 2020 4 8 14 一 算术平均数 例3 1 根据表3 1中的数据 分别计算50个考生政治课和统计学课的平均成绩 2020 4 8 15 一 算术平均数 根据分组整理的数据计算平均数时 需要先用每个组的变量值或组中值分别乘以各自的频数或频率 然后加总再除以总次数或总频率 即得算术平均数 其计算公式为 2020 4 8 16 一 算术平均数 如果各组的频数是以频率 比重 比例等百分数 表示 3 2 式表示如下 2020 4 8 17 一 算术平均数 例3 2 2005年某市红星幼儿园共有458名儿童 其年龄资料如表3 2所示 要求 试计算该幼儿园儿童的平均年龄 2020 4 8 18 一 算术平均数 2020 4 8 19 一 算术平均数 例3 3 对表3 1中50个学生的统计学成绩分组整理得到下表3 4 要求 试计算50个学生统计学考试的平均成绩 2020 4 8 20 一 算术平均数 2020 4 8 21 一 算术平均数 用各组的组中值代表其实际数据计算算术平均数时 通常假定各组数据在组内是均匀分布的 相应的组中值近似等于各组的平均数 权数 衡量变量值相对重要性的数值称为权数 各个变量值的权数要起作用必须具备两个条件 一是各个变量值之间有差异 二是各个变量值的权数有差异 简单算术平均数是加权算术平均数在权数相等时的特例 2020 4 8 22 一 算术平均数 三 算术平均数的性质1 各变量值与其算术平均数的离差之和等于零 即 2020 4 8 23 一 算术平均数 2020 4 8 24 二 调和平均数 调和平均数也称 倒数平均数 它是对变量的倒数求平均 然后再取倒数而得到的平均数 以表示 根据掌握的资料不同 调和平均数也有简单调和平均数和加权平均数两种形式 其计算公式分别为 2020 4 8 25 二 调和平均数 2020 4 8 26 二 调和平均数 例3 4假设甲 乙 丙三种苹果的价格分别为每斤2 4元 1 8元及1 5元 1 若三种苹果各买1斤 试问所购苹果的平均价格为多少 2 若三种苹果各买1元 试问所购苹果的平均价格又为多少 3 如果甲 乙 丙三种苹果分别购买5元 8元和10元 试问其平均价格为多少 2020 4 8 27 二 调和平均数 解 计算平均价格的是用所付金额除以所购数量 因此 只要算出所支付的金额及其所购买的数量 就可以很容易得出平均价格 1 若不同价格的三种苹果各买1斤 共买了3斤 支付金额5 7元 则采用简单算术平均法计算平均价格 2020 4 8 28 二 调和平均数 注意 上式中的分子实质上是三个金额相加 而不是三种价格相加 商品的价格是不能直接加总的 2020 4 8 29 二 调和平均数 2 若三种苹果各买1元钱 则不能采用简单算术平均法计算 必须从计算平均价格的基本公式出发 计算所支付的金额和购买的数量 计算所付金额 三种不同价格的苹果各买1元 所付金额则为3元 计算所购买的数量 分别用1元除以三种不同的价格则得每1元所购买的数量 即甲种苹果购买了0 42斤 乙种苹果购买了0 56斤 丙种苹果购买了0 67斤 3元总共买了1 65斤 2020 4 8 30 二 调和平均数 计算平均每1元购买了多少苹果 用1 65斤除以3元得到每1元购买了0 55斤苹果 换成价格表现形式 每斤多少元 用1元除以0 55斤则得每斤1 82元 2020 4 8 31 二 调和平均数 整个计算过程用公式表示如下 2020 4 8 32 二 调和平均数 3 如果甲 乙 丙三种苹果分别购买5元 8元和10元 则应该采用加权调和平均法计算 即根据公式 3 5 计算如下 2020 4 8 33 二 调和平均数 在实际工作中 由于所获得的数据不同 有时不能直接采用算术平均数的公式计算平均指标 这时就需要使用调和平均数的形式计算 2020 4 8 34 二 调和平均数 2020 4 8 35 二 调和平均数 例3 5 某水果批发市场某日苹果 梨子及桔子三种水果的批发价格及成交量资料如表3 6所示 试计算该三种水果的平均批发价格 2020 4 8 36 二 调和平均数 解 根据平均价格的计算公式 成交额 成交量 由于成交量未知 需要利用批发价格和成交额先求出成交量数据 再用成交额除以成交量则得平均价格 此时 应采用加权调和平均法计算三种水果的平均批发价格 即 2020 4 8 37 二 调和平均数 2020 4 8 38 二 调和平均数 注意 1 从数学定义角度看算术平均数与调和平均数是不一样的 但在社会经济应用领域 调和平均数实际上只是算术平均数的另一种表现形式 二者本质上是一致的 惟一的区别是计算时使用了不同的数据 2 计算比率的平均数时 如果已知比率及其基本计算式的分母资料 则采用加权算术平均法 如果已知比率及其基本计算式的分子资料 则采用加权调和平均法 2020 4 8 39 调和平均数 例3 7 某市某行业150个企业的产值利润率及相关资料如表3 8 要求 试分别计算该行业150企业第一季度和第二季度的平均产值利润率 2020 4 8 40 二 调和平均数 解 表中给出的是按产值利润率分组的企业个数 每个组的实际产值和实际利润资料 企业个数在此不起权数的作用 应该注意 产值利润率是一个相对指标 比率 而不是平均指标 为了计算全行业的平均产值利润率 必须以产值利润率的基本公式为依据 即 2020 4 8 41 二 调和平均数 并选择适当的权数资料 适当的平均数形式 对各组企业的产值利润率进行加权平均 容易看出 计算第一季度的平均产值利润率 应该采用实际产值加权 利用算术平均法计算 即有 2020 4 8 42 二 调和平均数 2020 4 8 43 二 调和平均数 而计算第二季度的平均产值利润率 则应该采用实际利润加权 利用调和平均法计算 即有 比较上述结果可知 第二季度的产值利润率比第一季度有所下降 需要查找原因 采取适当的措施以提高该行业的产值利润率 2020 4 8 44 三 几何平均数 几何平均数也称几何均值 它是n个变量值乘积的n次方根 几何平均法是计算平均比率或平均发展速度最适用的一种方法 如果分布数列中各变量值呈几何级数变化或频率分布极不对称 也常采用几何平均法来计算平均数 根据统计资料的不同 几何平均数也有简单几何平均数和加权几何平均数之分 2020 4 8 45 三 几何平均数 2020 4 8 46 三 几何平均数 例3 8 已知某市2001 2005年国内生产总值的发展速度 以上年为100 依次分别为112 108 114 116 和113 试计算这5年国内生产总值的平均发展速度 如果已知的是各年的增长速度 要计算若干年的平均增长速度 则需要先将增长率加上100 得到发展速度 再根据上述方法计算平均发展速度 最后用平均发展速度减100 则得到平均增长速度 2020 4 8 47 三 几何平均数 例3 9 甲投资银行某项投资的年利率是按复利计算的 若将过去20年的年利率资料整理为如表3 9所示的数列 要求 试计算20年的平均年利率 2020 4 8 48 三 几何平均数 解 根据公式 3 7 计算20年的平均本利率 2020 4 8 49 三 几何平均数 例3 10 某流水生产线有前后衔接的五道工序 某日各工序产品的合格率分别为95 92 90 85 80 要求计算整个流水生产线产品的平均合格率为 2020 4 8 50 三 几何平均数 几何平均数在实际应用中受到很多限制 如果被平均的变量值中有一个为零 则不能计算几何平均数 如果变量值为负数 开奇次根会形成虚根 失去意义 几何平均数在实际应用中的范围比算术平均数要窄 2020 4 8 51 三 几何平均数 三 几何平均数的特点1 几何平均数受极端值的影响较算术平均数小 2 如果变量值有负值 计算出的几何平均数就会成为负数或虚数 3 它仅适用于具有等比或近似等比关系的数据 4 几何平均数的对数是各变量值对数的算术平均数 2020 4 8 52 第二节集中趋势 位置平均数 一 众数二 中位数三 中位数的扩展四 几种平均数简评 2020 4 8 53 集中趋势 位置平均数 位置平均数 就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值 对于整个总体来说 具有非常直观的代表性 常用来反映分布的集中趋势 常用的位置平均数有众数和中位数 2020 4 8 54 一 众数 一 众数的含义众数是指一组数据中出现次数最多的变量值 用表示 众数直观地说明分布的集中趋势 并用它作为反映变量值一般水平的代表值 在某些场合只有众数才适合作为总体的代表值 2020 4 8 55 二 众数的计算方法 1 观察法求众数如果数据已按单个变量值整理成频率分布表或者是分类数据表 则次数出现最多或频率最大的那个变量值即为众数 例3 11 某制鞋厂要了解消费者最需要哪种型号的男皮鞋 调查了某百货商场2005年10月男皮鞋的销售情况 得到资料如表3 10所示 2020 4 8 56 众数的计算方法 要求 试根据上表资料计算男皮鞋销售量的众数 2020 4 8 57 众数的计算方法 解 从表3 10可以看到 销售量最多的是规格为25 5厘米的鞋号 销售量320双 占32 故众数为25 5公分 如果我们计算算术平均数 则平均号码为25 52公分 而这个号码显然是没有实际意义的 而直接用25 5厘米作为顾客对男皮鞋所需尺寸的集中趋势既便捷又符合实际 2020 4 8 58 众数的计算方法 例3 12 某高校电影院在安排2005年影片放映计划时 为了更好地满足学生的需要 分别按性别随机抽取100名男女学生 登记其对影片类型的取向 统计结果如表3 11所示 要求 试分析学生对影片取向的集中趋势 2020 4 8 59 众数的计算方法 解 从上表3 11的数据分布可以看出 7种类型的影片中 男生最喜欢看动作片 人数为24人 占24 众数则为 动作片 这种影片类型 女生则最喜欢看言情片 人数为23人 占23 众数则为 言情片 这种影片类型 男女生对影片类型的取向 综合而言是动作片 人数为36人 占18 相应地 众数为 动作片 这种影片类型 2020 4 8 60 众数的计算方法 从上述例题可知 众数不仅适用于测度顺序数据和数值型数据的集中趋势 而且适用于测度不能计算平均数的分类数据的集中趋势 2020 4 8 61 众数的计算方法 2 插值法求众数对于组距分组形成的分布数列 当频率分布属于完全对称分布 而众数所在组的变量值分布比较均匀时 可用观察法求众数 即以众数组的组中值作为所求的众数 完全对称分布不存在 众数组前后各组的次数不一定相等 众数就不等于组中值 因此需要采用插值法求众数 2020 4 8 62 众数的计算方法 先找到众数所在的组 然后按该组次数与前后相邻两组分布次数之差所占的比重来推算众数值 如果众数组前一组的次数大于后一组的次数 则众数值小于其所在组的组中值 反之 众数值则大于其所在组的组中值 若众数组前后相邻组的次数相等 则众数值等于其所在组的组中值 计算众数有上限和下限公式之分 2020 4 8 63 众数的计算方法 2020 4 8 64 众数的计算方法 例3 13 某车间实行计件工资 2005年10月120名工人的月工资资料如表3 12所示 要求 试计算月工资的众数 2020 4 8 65 众数的计算方法 解 从表3 12中的数据可以看出 月工资变量值中最大的次数是48人 即众数组为1000 1200这一组 根据公式 3 8 和 3 9 式可得120名工人月工资的众数为 2020 4 8 66 众数的计算方法 2020 4 8 67 三 众数的特点 1 众数不受分布数列的极大或极小值的影响 众数对分布数列有好的代表性 2 数据的分布没有明显的集中趋势或最高峰点 众数可能不存在 3 有两个或多个高峰点 可以有两个或多个众数 3 众数缺乏敏感性 2020 4 8 68 二 中位数 一 中位数的含义中位数是将数据按大小顺序排列起来 形成一个数列 居于数列中间位置的那个变量值称为中位数 中位数用Me表示 在一个等差数列或一个正态分布数列中 中位数就等于算术平均数 中位数不受极端变量值的影响 2020 4 8 69 二 中位数 二 中位数的计算1 根据未分组数据计算中位数 2020 4 8 70 二 中位数 例3 14 某班第一 二两个小组统计学期末考试成绩排序结果如表3 13所示 要求 试根据上述资料分别计算第一 二两个小组考试成绩的中位数 2020 4 8 71 二 中位数 解 两个学习小组的考试成绩已经分别按由低到高排列 第一小组有7个学生 第四位为中位数所处的位置 即第四个学生的成绩75分就是中位数 第二小组有8个学生 中位数的位置处于第四和第五个学生之间 即处于中间位置的两个学生成绩的平均数即为中位数 2020 4 8 72 二 中位数 2 由分组资料确定中位数如果由组距数列确定中位数 应先按的公式求出中位数所在组的位置 然后再按下限公式或上限公式确定中位数 2020 4 8 73 二 中位数 例3 15 续例3 13 试根据表3 12中的数据确定120名工人月工资的中位数 2020 4 8 74 二 中位数 三 中位数的特点1 不受分布数列的极大或极小值影响 2 有些离散型变量的单项式数列 当次数分布偏态时 中位数的代表性会受到影响 3 中位数缺乏敏感性 2020 4 8 75 三 中位数的扩展 中位数是根据其在数列中所处的位置来确定的一个平均数 作为各变量值的一个代表值 以反映分布数列的集中趋势 为了进一步了解一组数据分布的内部结构 观察变量值在各个区间的一般水平 还可以计算四分位数 十分位数和百分位数 2020 4 8 76 三 中位数的扩展 一 四分位数四分位数是指将按大小顺序排列的一组数据划分为四等分的三个变量值 用以说明按大小顺序排列的变量值在某个等分点上的一般水平 四分位数是通过3个点将全部数据等分为四个部分 其中每部分包含25 的数据 2020 4 8 77 三 中位数的扩展 1 根据未分组数据计算四分位数时 先对数据进行排序 然后再确定四分位数所在的位置 当四分位数的位置不在某一个具体数值时 可根据四分位数的位置 按比例分摊四分位数所在位置两侧变量值之差的数值 2020 4 8 78 三 中位数的扩展 例3 16 将例3 14中两个学习小组的统计学考试成绩合并如下 要求 1 计算前15个学生统计学考试成绩的四分位数 2 如果增加一个学生的成绩95分 试计算16个学生统计学考试成绩的四分位数 2020 4 8 79 三 中位数的扩展 2020 4 8 80 三 中位数的扩展 2 根据组距数列计算四分位数 2020 4 8 81 三 中位数的扩展 2020 4 8 82 三 中位数的扩展 2020 4 8 83 2020 4 8 84 三 中位数的扩展 二 十分位数十分位数是指将按大小顺序排列的一组数据划分为10等分的9个变量值 用以反映一组数据在各个区间的一般水平 2020 4 8 85 三 中位数的扩展 十分位数的具体计算方法与计算四分位数类似 即先计算出各个十分位数所处的位置 如果为整数 与计算的位置相对应的变量值就是所求的十分位数 如果不是整数 每个位置的值出现小数 此时 所求的十分位数等于整数位的变量值加上小数乘以前后两项变量值之差的数值 2020 4 8 86 三 中位数的扩展 三 百分位数 2020 4 8 87 三 中位数的扩展 求出各个百分位数所处的位置后 具体计算每个百分位数的方法与四分位数类似 故不再详细介绍 如果数据比较多 计算百分位数可以更详细地反映数据分布中每个小区间的一般水平 用以补充说明平均数所反映的集中趋势 2020 4 8 88 四 几种平均数简评 一 评价标准1 严格确定 2 感应灵敏 3 易于理解 4 易于计算 5 受抽样的影响较小 6 易于用代数处理 2020 4 8 89 四 几种平均数简评 二 简评1 算术平均数 算术平均数符合上述六个条件 应用范围最广 易受极端值的影响 当分布数列中存在开口组时 会影响平均数的准确性 算术平均数适用于数值型数据 2020 4 8 90 四 几种平均数简评 2 调和平均数 调和平均数符合上述第1 2 5 6四个条件 适用于计算比率的平均数 它容易受极端值的影响 数列中只要有一个变量值为零 则不能计算调和平均数 故其应用范围受到限制 调和平均数适用于数值型数据 2020 4 8 91 四 几种平均数简评 3 几何平均数 几何平均数符合上述第1 2 5 6四个4个条件 适用于各比率连乘积等于总比率的条件下计算比率的平均数 数列中若有一项为零或负数 计算几何平均数无意义 应用范围较小 几何平均数适用于数值型数据 2020 4 8 92 四 几种平均数简评 4 众数 众数的意义易于理解 有时容易计算 且不受极端值的影响 当数据分布没有明显的集中趋势而趋于均匀分布时 则无众数可言 对不等距分布数列 众数不易确定 当分布数列中出现双众数或多众数时 难以反映所有数据的一般水平 变量值的变化反映不灵敏 众数适用于分类数据 顺序数据和数值型数据 2020 4 8 93 四 几种平均数简评 5 中位数 中位数符合上述第1 3 4 5四个条件 不受极端值的影响 当分布数列中存在极端值或组距数列中存在开口组时 计算中位数比较好 中位数缺乏灵敏性 没有算术平均数可靠 且不易用代数方法计算 中位数适用于顺序数据和数值型数据 2020 4 8 94 四 几种平均数简评 三 众数 中位数和算术平均数的关系在数据分布呈完全对称的正态分布时 算术平均数 众数和中位数三者相等 在次数分布非对称时 算术平均数 众数和中位数三者不相等 但具有相对固定的关系 在尾巴拖在右边的正偏态 或右偏态 分布中 众数最小 中位数适中 算术平均数最大 2020 4 8 95 四 几种平均数简评 2020 4 8 96 四 几种平均数简评 三者的关系 2020 4 8 97 第三节离中趋势的测度 一 全距 Range 二 异众比率三 四分位差四 平均差 AverageDeviation 五 方差与标准差 2020 4 8 98 一 全距 Range 全距也称为极差 是指一组数据的最大值与最小值之差 用R表示 即 R 最大变量值 最小变量值 3 15 全距可以反映一组数据的差异范围 2020 4 8 99 一 全距 Range 没有开口组的组距分布数列计算全距 可以用最大组的上限值减去最小组的下限值 得到全距的近似值 例3 18 假设某班有3个学习小组 期中数学考试成绩如表3 15所示 2020 4 8 100 一 全距 Range 要求 计算三个小组考试成绩的全距 如果组距分布数列中有开口组 则不能计算全距 全距计算简单 易理解 易受极端值的影响 不能反映中间数据分散状况 不能准确描述数据的分散程度 2020 4 8 101 二 异众比率 2020 4 8 102 二 异众比率 异众比率主要用于衡量众数对一组数据的代表程度 异众比率越大 说明非众数组的频数占总频数的比重越大 众数的代表性就越差 异众比率越小 说明非众数组的频数占总频数的比重越小 众数的代表性越好 异众比率适合测度分类数据 测度顺序数据和数值型数据的离散程度 2020 4 8 103 二 异众比率 例3 19 根据例3 12表3 11中的数据计算学生对影片取向的异众比率 解 根据公式 3 16 得 2020 4 8 104 三 四分位差 四分位差就是上四分位数与下四分位数之差的简单算术平均数 以QD表示 其计算公式为 2020 4 8 105 三 四分位差 四分位差表示从下四分位数到中位数的距离以及从中位数到上四分位数的距离 数据分布对称 这两端距离相等 如果不是完全对称 四分位差可测定四分位数到中位数的平均距离 四分位差越小 表明中位数的代表性越好 数据分布的集中趋势越明显 四分位差越大 表明中位数的代表性越差 数据分布越分散 2020 4 8 106 三 四分位差 由公式 3 17 可以计算例3 18中三个小组考试成绩的四分位差为四分位差不易受极端值的影响 可以测量含有开口组的数据分布的差异程度 但不能反映所有变量值的差异程度 2020 4 8 107 四 平均差 AverageDeviation 平均差就是各个变量值与其算术平均数离差的绝对值的平均数 以AD表示 它综合反映了各变量值的变动程度 是各个离差的代表值 平均差越大 则表示变量值的离散程度越大 说明平均数的代表性越小 平均差越小 则表示变量值的离散程度越小 说明平均数的代表性越大 2020 4 8 108 四 平均差 AverageDeviation 在资料未分组的情况下 平均差的计算公式为 在资料已分组的情况下 平均差的计算公式为 2020 4 8 109 四 平均差 AverageDeviation 例3 20 试根据例3 18所给资料分别计算第一 二 三小组学生考试成绩的平均差 并比较其平均成绩的代表性 2020 4 8 110 四 平均差 AverageDeviation 例3 21 续例3 3 试根据表3 4中的资料计算50个学生统计学考试成绩的平均差 解 从例3 3可知 平均成绩为77分 根据公式 3 19 列表计算有关数据如表3 16所示 2020 4 8 111 四 平均差 AverageDeviation 将表3 16中的计算结果代入 3 19 式 即得平均差易理解 计算简便 可以说明数据分布的离中趋势 不适宜进行代数运算 其应用范围易受限制 2020 4 8 112 五 方差与标准差 方差是各个数据与其算术平均数的离差平方的平均数 通常以表示 标准差又称均方差 是方差的算术平方根 一般用表示 方差和标准差的计算也分为简单平均法和加权平均法 对于总体数据和样本数据 公式略有不同 2020 4 8 113 五 方差与标准差 方差和标准差是根据全部数据计算的 它反映了每个数据与其均值相比平均相差的数值 它能准确地反映出数据的离散程度 方差和标准差是应用最广泛的离散程度测度值 2020 4 8 114 五 方差与标准差 一 总体方差和标准差设总体方差为 对于未经分组整理的原始数据 方差的计算公式为 2020 4 8 115 五 方差与标准差 对于分组数据 方差的计算公式为 2020 4 8 116 五 方差与标准差 方差的平方根即为标准差 其相应的计算公式为 2020 4 8 117 五 方差与标准差 二 样本方差和标准差它们在计算上的区别是 总体方差是用数据个数或总频数去除离差平方和 而样本方差则是用样本数据个数或总频数减1去除离差平方和 其中样本数据个数减1即n 1称为自由度 样本方差用表示 2020 4 8 118 五 方差与标准差 2020 4 8 119 五 方差与标准差 2020 4 8 120 五 方差与标准差 例3 22 续例3 3 试根据表3 4中的资料计算50个学生统计学考试成绩的方差和标准差 解 从例3 3可知 平均成绩为77分 因在例3 3中没有说明是随机抽取的样本资料 故可将50个学生看作是总体 根据公式 3 21 列表计算有关数据如表3 17所示 2020 4 8 121 五 方差与标准差 2020 4 8 122 五 方差与标准差 将表3 17中的计算结果代入 3 21 和 3 23 式 即得50名学生统计学考试成绩方差和标准差分别为 2020 4 8 123 五 方差与标准差 标准差是反映数据分布离散程度的测度值之一 它可以说明平均数的代表性 它可以用来衡量产品的生产质量是否稳定 2020 4 8 124 五 方差与标准差 例3 23 考察一台机器的生产能力 利用抽样程序来检验其生产出来的产品质量是否稳定 根据行业标准 如果样本零件尺寸的标准差大于0 3公分 则表明该零件的质量不稳定 需要对该机器进行停工检修 假设搜集的数据如下表3 18所示 2020 4 8 125 五 方差与标准差 要求 试根据上述资料计算样本标准差以判断该机器是否需要停工检修 2020 4 8 126 五 方差与标准差 计算的样本标准差0 2126公分 小于0 3公分 表明该台机器不需要停工检修 2020 4 8 127 五 方差与标准差 方差和标准差的数学性质 若每一个变量值加上一个常数 方差和标准差不变 设a为任意常数 则有 若每一个变量值均扩大一个常数倍 方差和标准差也同比例变化 设a为任意常数 则有 分组条件下 总方差可以分解成组内方差的平均数和组间方差两部分 即 2020 4 8 128 五 方差与标准差 方差和标准差的数学性质 同一数列的标准差一般不小于平均差 即一般说来 标准差比平均差具有更高的灵敏度 2020 4 8 129 六 离散系数 离散系数 标准差系数或变异系数 通常是用标准差来计算的 它是一组数据的标准差与其相应的均值之比 是测度数据离散程度的相对指标 其计算公式为 式中 V 和Vs分别表示总体离散系数和样本离散系数 2020 4 8 130 六 离散系数 平均水平或计量单位不同的不同组别的变量值 不能直接用离散程度的测度值比较 平均水平或计量单位不同的不同组别进行比较 需计算离散系数 离散系数大的说明该组数据的离散程度也就大 离散系数小的说明该组数据的离散程度小 2020 4 8 131 六 离散系数 例3 24 从某高校2005级新生中随机抽取男女学生各10名 测得其身高资料如表3 19所示 要求 根据上表数据计算男女生的平均身高以及标准差系数 说明两组数据的离散程度及平均数的代表性 2020 4 8 132 六 离散系数 解 根据上表数据以及计算均值和样本标准差的公式计算得 2020 4 8 133 六 离散系数 从标准差系数可以看出 男生身高的离散程度小于女生身高的离散程度 说明男生的平均身高比女生的平均身高更具有代表性 2020 4 8 134 第四节偏态与峰态的测度 一 偏态及其测度二 峰度及其测度三 统计软件SPSS应用 2020 4 8 135 一 偏态及其测度 计算偏态系数的方法有皮尔逊测度法和中心矩法两种 1 皮尔逊测度法皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布偏斜程度的一种方法 计算公式为 2020 4 8 136 一 偏态及其测度 2020 4 8 137 一 偏态及其测度 2 中心矩法中心矩法是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法 该偏态系数为 SK 2020 4 8 138 一 偏态及其测度 矩 统计学把变量与权数对平均数的关系类比于 矩 用来描述数据分布的性质 2020 4 8 139 一 偏态及其测度 2020 4 8 140 一 偏态及其测度 当SK 0时 数据分布呈对称分布形态 SK 0 数据分布呈负 右 偏态 SK
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年曲靖货运从业资格考题
- 钢板弹簧培训课件
- 2025年海口危货车押运证模拟考试0题
- 影像培训课件
- 质量方面培训课件
- 饭店新店开业活动方案
- 写作基础题目大全及答案
- 小猪盖新房题目及答案
- 小学音高训练题目及答案
- 中式点心线上教学案例
- 人教版(2024)2025年春季学期七年级下册地理期末复习模拟试卷(原卷)
- 2025年全国普通高校招生全国统一考试数学试卷(新高考Ⅰ卷)含答案
- 生物●广东卷丨2024年广东省普通高中学业水平选择性考试生物试卷及答案
- 2025年河南省豫地科技集团有限公司社会招聘169人笔试参考题库附带答案详解析集合
- 2025年中国电风扇行业市场现状、进出口贸易、市场规模预测报告
- 智能建造技术概述
- 重庆市渝北区名校2025届生物七下期末复习检测模拟试题含解析
- 扬州印象城市介绍旅游宣传
- 历史明清时期的科技与文化课件-2024-2025学年统编版七年级历史下册
- 初三道法补考试卷及答案
- 2025年上海国企中铁十五局集团有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论