第04章管理统计学.pptx_第1页
第04章管理统计学.pptx_第2页
第04章管理统计学.pptx_第3页
第04章管理统计学.pptx_第4页
第04章管理统计学.pptx_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学Managementstatistics 第四章描述统计中的测度 管理统计学Managementstatistics 1 集中趋势 2 离散趋势 3 统计数据的来源 3 分布形状 目录 数据分布的特征 管理统计学Managementstatistics 管理统计学Managementstatistics 4 1数据分布的集中趋势测度 集中趋势 generaltendency 是指分布的定位 它是指一组数据向某一中心值靠拢的倾向 或是表明一组统计数据所具有的一般水平 位置平均数 中位数 管理统计学Managementstatistics 集中趋势 Centraltendency 一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势测度值适用于高层次的测量数据 反过来 高层次数据的集中趋势测度值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势 要根据所掌握的数据的类型来确定 管理统计学Managementstatistics 4 1 1数值平均数 数值平均数又称均值 mean 根据统计资料的数值计算而得到 在统计学中具有重要的作用和地位 是度量集中趋势的最主要的指标之一 平均的对象可理解为变量 平均数可记为 管理统计学Managementstatistics 1 算术平均数 1 简单算术平均数简单算术平均数是根据原始数据直接计算均值 一般地 设一组数据为 其简单算术平均数计算的一般公式可表达为 管理统计学Managementstatistics 简单均值 算例 原始数据 10591368 例 为了研究目前大学中班级学生人数的情况 从北京某大学抽样五个班级 其学生人数分别为 46 54 42 46 32 我们使用 分别表示该五个数据 计算其均值 可以写成 算术平均数 管理统计学Managementstatistics 2 加权算术平均数加权算术平均数计算的所依靠的数据是经过一定整理的 即是根据一定规则分组的 可分为 1 由数列计算加权算术平均数 2 根据组距计算加权算术平均数 算术平均数 管理统计学Managementstatistics 1 由数列计算加权算术平均数由单项变量数列计算加权算术平均数的基础是要先将数据进行分组 即将n个数据按变量值 xi 进行分组 并统计在各个变量取值出现的次数 或称为频数 fi 其加权算术平均数的计算公式如下 算术平均数 管理统计学Managementstatistics 设某班级10名同学的年龄分别为 18 19 17 18 17 18 19 18 18 19 则根据简单平均数的公式 我们可计算得到该班10名同学的平均年龄 算术平均数 管理统计学Managementstatistics 年龄 岁 人数 人数比重 算术平均数 2 根据组距计算加权算术平均数选择适当的组距来对数据进行分组 再求加权平均数往往就简单 容易许多 根据组距计算加权平均数的方法与上面所述的数列加权平均数方法基本相同 只需以各组的组中值来代替相应的x值即可 算术平均数 管理统计学Managementstatistics 加权均值 例4 7 根据第三章表3 5中的数据 计算50名工人日加工零件数的均值 管理统计学Managementstatistics 简单算术平均数适用于数据量较少的未分组数据 加权算术平均数则只适用于分组数据 且在进行数据分组时 可以根据每个变量的取值来分组 亦或根据一定的区间来分组 这应该根据所针对问题的具体数据来来选取 简单算术平均数其数值的大小只与变量值的大小有关 对最终加权平均数大小的影响因素有两个 一是各组变量值的影响 另一个是各组变量值的频数的影响 算术平均数 管理统计学Managementstatistics 加权算术平均数计算公式中频数的大小起着重要作用 当变量值比较大的次数多时 平均数就接近变量值大的一方 当变量值比较小的次数多时 平均数就接近于变量值小的一方 可见 次数对变量值在平均数中的影响起着某种权衡轻重的作用 因此被称为权数 在加权算术平均数计算中当各组变量的权重相等时 则权重的权衡轻重的作用也就消失了 此时加权算术平均数转化为简单算术平均数的计算形式 算术平均数 管理统计学Managementstatistics 调和平均数 harmonicmean 是均值的另一种重要表示形式 由于它是根据变量值倒数计算的 也叫倒数平均数 一般用字母表示Hm 根据所给资料情况的不同 调和平均数可分为 简单调和平均数和加权调和平均数两种 调和平均数 管理统计学Managementstatistics 1 简单调和平均数 事实上简单调和平均数是权数均相等条件下的加权调和平均数的特例 当权数相等时 就产生了通常所说的加权调和平均数 调和平均数 管理统计学Managementstatistics 2 加权调和平均数用公式表示为 由此可以看出 当权重mi相等时 则加权调和平均数则转换为简单调和平均数 调和平均数 管理统计学Managementstatistics 3 调和平均数是算术平均数的变形在一定的条件下 加权调和平均数和加权算术平均数只是计算形式不同 在经济内容上没有实质性的区别 调和平均数是算术平均数的变形 是在缺少总体单位的资料时才被迫使用的计算平均数的一种方法 即 调和平均数 管理统计学Managementstatistics 调和平均数 例4 8 某蔬菜批发市场三种蔬菜的日成交数据如表4 2 计算三种蔬菜该日的平均批发价格 管理统计学Managementstatistics 几何平均数 geometricmean 几何平均数是变量值连乘积的次方根 常用字母表示 它是平均指标的另一种计算形式 几何平均数是计算平均比率和平均速度最适用的一种方法 根据掌握的数据资料不同 几何平均数可分为简单几何平均数和加权几何平均数两种 几何平均数 管理统计学Managementstatistics 1 简单几何平均数假定有n个变量值x1 x2 xn 则简单几何平均数的基本计算公式为 几何平均数 管理统计学Managementstatistics 2 加权几何平均数当掌握的数据资料为分组资料 且各个变量值出现的次数不相同时 应用加权方法计算几何平均数 加权几何平均数的公式为 几何平均数 管理统计学Managementstatistics 几何平均数 例 一位投资者持有一种股票 1996年 1997年 1998年和1999年收益率分别为4 5 2 0 3 5 5 4 计算该投资者在这四年内的平均收益率 平均收益率 103 84 1 3 84 管理统计学Managementstatistics 数值平均数根据所提供资料的具体数值计算而得到 和我们通常观念中的平均含义比较接近 但结果受极端值的影响而不能真是地反应改组资料的整体集中趋势 在这种情况下 一般可以考虑用位置中位数取代算术中位数来对数据的集中趋势进行描述 常用的位置平均数有 平均数 众数 分位数 二 位置平均数 管理统计学Managementstatistics 中位数 median 度量数据集中趋势的另一重要测度 它是一组数据按数值的大小从小到大排序后 处于中点位置上的变量值 通常用表示Me 定义表明 中位数就是将某变量的全部数据均等地分为两半的那个变量值 其中 一半数值小于中位数 另一半数值大于中位数 中位数是一个位置代表值 它不受极端变量值影响 中位数 管理统计学Managementstatistics 1 根据未分组数据确定中位数对于未分组的数据 确定其中位数的具体步骤为 1 将变量按变量值大小从小到大进行排列 2 确定中位数的位置 即中点位置 一般的 设一组数据的个数为 则中点的位置为 n 1 2 3 确定中位数 中位数 管理统计学Managementstatistics 如果观测值的数目n为奇数 则 n 1 2为整数 该位置上所对应的变量即为所求的中位数 如果观测值的数目n为偶数 则 n 1 2为非整数 则取位于中间位置的两个变量值的算术平均数作为中位数 中位数 管理统计学Managementstatistics 2 根据单项数列确定中位数根据单项数列资料确定中位数与根据未分组资料确定中位数方法基本一致 具体步骤为 1 计算各组的累计次数 或频数 2 确定中位数的位置 k 3 确定中位数 中位数所在组的变量值即为中位数 中位数 管理统计学Managementstatistics 3 根据组距数列确定中位数如果我们掌握的资料是分组后得到的组距数列 则确定中位数的步骤为 1 确定中位数的位置 k 2 计算累计次数 据以找出中位数所在的组 3 利用以下公式 确定中位数的近似值 中位数 管理统计学Managementstatistics 中位数 定序数据的中位数 例 根据第三章表3 2中的数据 计算甲城市家庭对住房满意状况评价的中位数 解 中位数的位置为 300 2 150从累计频数看 中位数的在 一般 这一组别中 因此Me 一般 管理统计学Managementstatistics 数值型未分组数据的中位数 5个数据的算例 原始数据 2422212620排序 2021222426位置 12345 中位数 22 管理统计学Managementstatistics 数值型未分组数据的中位数 6个数据的算例 原始数据 10591268排序 56891012位置 123456 管理统计学Managementstatistics 根据位置公式确定中位数所在的组采用下列近似公式计算 4 该公式假定中位数组的频数在该组内均匀分布 数值型分组数据的中位数 要点及计算公式 管理统计学Managementstatistics 数值型分组数据的中位数 例 根据第三章表3 5中的数据 计算50名工人日加工零件数的中位数 管理统计学Managementstatistics 众数 mode 一组数据中出现次数最多的那个变量值 通常用MO表示 如果在一个总体当中 各变量值皆不相同 或各个变量值出现的次数皆相同 则没有众数 如果在一个总体中 有两个标志值出现的次数都最多 称为双众数 只有在总体单位比较多 变量值有明显集中趋势的条件下确定的众数 才能代表总体的一般水平 在总体单位较少 或虽多但无明显集中趋势的条件下 众数的确定是没有意义的 众数的确定方法要根据给定资料的具体情况而定 众数 管理统计学Managementstatistics 1 未分组资料或单项数列资料众数观察给定的数据 某个变量出现次数最多 则该变量即为所求众数 这样的方法确定比较容易 不需要计算 众数 管理统计学Managementstatistics 2 根据组距变量数量确定众数具体步骤为 众数 众数 概念要点 集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于定类数据 也可用于定序数据和数值型数据 管理统计学Managementstatistics 众数 众数的不唯一性 无众数原始数据 10591268 一个众数原始数据 659855 多于一个众数原始数据 252828364242 管理统计学Managementstatistics 定类数据的众数 算例 例 根据第三章表3 1中的数据 计算众数 解 这里的变量为 广告类型 这是个定类变量 不同类型的广告就是变量值 我们看到 在所调查的200人当中 关注商品广告的人数最多 为112人 占总被调查人数的56 因此众数为 商品广告 这一类别 即Mo 商品广告 管理统计学Managementstatistics 定序数据的众数 算例 例 根据第三章表3 2中的数据 计算众数 解 这里的数据为定序数据 变量为 回答类别 甲城市中对住房表示不满意的户数最多 为108户 因此众数为 不满意 这一类别 即Mo 不满意 管理统计学Managementstatistics 数值型分组数据的众数 1 众数的值与相邻两组频数的分布有关 4 该公式假定众数组的频数在众数组内均匀分布 2 相邻两组的频数相等时 众数组的组中值即为众数 3 相邻两组的频数不相等时 众数采用下列近似公式计算 管理统计学Managementstatistics 数值型分组数据的众数 算例 例 根据第三章表3 5中的数据 计算50名工人日加工零件数的众数 管理统计学Managementstatistics 中位数是从中间点将全部数据等分为两部分 与中位数类似的还有四分位数 八分位数 十分位数和百分位数等 它们分别是用3个点 7个点 9个点和99个点将数据四等分 八等分 十等分和100等分后各分位点上的值 这里只介绍四分位数的计算 其他分位数与之类似 分位数 管理统计学Managementstatistics 1 百分位数百分位数 percentile 是用99个点将排列好的数据100等分后各能给出从最小值到最大值区间内数据的信息分位点上的值 其中每个部分包含了1 的数据 百分位数的计算方法与中位数的类似 分位数 管理统计学Managementstatistics 百分位数计算步骤 1 将n个数据按一定的顺序 升序或降序 进行排列 2 确定所求百分位数的位置 假设求第p百分位数 则该第p百分位数位置为 i pn 100 3 确定百分位数 如果计算i的为整数 则直接在排列的数据列中找到第个变量即为所求 若i不为整数 则取位于两侧的变量的平均数作为所要求的百分位数 分位数 管理统计学Managementstatistics 2 四分位数一组数据排序后处于25 和75 位置上的值 称为四分位数 quartile 也称四分位点 四分位数是通过三个点将全部数据等分为四部分 其中每部分包含25 的数据 四分位数是指处在25 位置上的数值 下四分位数 和处在75 位置上的数值 上四分位数 分位数 管理统计学Managementstatistics 设下四分位数为Q1 中间的四分位数为Q2 上四分位数为Q3 这三个四位数所在位置 Q1的位置为 n 1 4Q2的位置为 n 1 2 即中位数点的位置 Q3的位置为3 n 1 4 分位数 管理统计学Managementstatistics 分位数 定序数据的四分位数 例 根据第三章表3 2中的数据 计算甲城市家庭对住房满意状况评价的四分位数 解 下四分位数 QL 的位置为 QL位置 300 4 75上四分位数 QL 的位置为 QU位置 3 300 4 225从累计频数看 QL在 不满意 这一组别中 QU在 一般 这一组别中 因此QL 不满意QU 一般 管理统计学Managementstatistics 数值型未分组数据的四分位数 7个数据的算例 原始数据 23213032282526排序 21232526283032位置 1234567 N 1 QL 23 QU 30 管理统计学Managementstatistics 数值型未分组数据的四分位数 6个数据的算例 原始数据 232130282526排序 212325262830位置 123456 QL 21 0 75 23 21 22 5 QU 28 0 25 30 28 28 5 管理统计学Managementstatistics 数值型分组数据的四分位数 计算公式 上四分位数 下四分位数 管理统计学Managementstatistics 数值型分组数据的四分位数 QL位置 50 4 12 5 QU位置 3 50 4 37 5 例4 6 根据第三章表3 5中的数据 计算50名工人日加工零件数的四分位数 管理统计学Managementstatistics 三 众数 中位数与均值的比较 一 正态分布时三者的关系正态分布是以算术平均数为对称轴 两边频数相等 其中频数最大的标志值就是数列居中位置的标志值 也就是权数最大 最具有代表性的那个变量值 因此 正态分布时 算术平均数 中位数和众数三者相等 即 管理统计学Managementstatistics 三 众数 中位数与均值的比较 二 偏态分布时三者的关系频数分布呈偏态时 算术平均数 中位数和众数的计算结果不同 当右偏时 算术平均数大于中位数 而中位数又大于众数 左偏时众数大于中位数 中位数大于算术平均数 在偏态分布情况下 算术平均数 中位数和众数的上述关系是容易理解的 由于算术平均数受极端值影响 在发生右偏出现较大极端值时 算术平均数将增加得更快 而中位数总是居于中间位置 左偏同样可作类似的解释 从而有 三 众数 中位数与均值的比较 管理统计学Managementstatistics 4 2数据分布的离散趋势测度 变量的变异程度的度量则是将变量值的差异揭示出来 反映总体各变量值对其平均数这个中心的离中趋势 变异指标与平均指标分别从不同的侧面反映总体的数量特征 管理统计学Managementstatistics 4 2数据分布的离散趋势测度 管理统计学Managementstatistics 极差 range 又称为全距 常用R表示 它是一组数据的最大值与最小值之差 即 极差表明数列中各变量值变动的范围 R越大 表明数列中变量值变动的范围越大 即数列中各变量值差异大 反之 R越小 表明数列中变量值的变动范围越小 即数列中各变量值差异越小 极差 管理统计学Managementstatistics 四分位距 quartiledeviation 是度量变异数的另一种方法 也称为内距或四分位差 是第一四分位数 下四分位数Q1 与第三四分位数 上四分位数Q3 的差 也就是75 百分位数与25 百分位数间的距离 它代表分布中间50 的距离 常用表示IQR 其计算公式为 四分位距 管理统计学Managementstatistics 四分位差 例 根据第三章表3 2中的数据 计算甲城市家庭对住房满意状况评价的四分位差 解 设非常不满意为1 不满意为2 一般为3 满意为4 非常满意为5已知QL 不满意 2 QU 一般 3四分位差 QD QU QL 3 2 1 管理统计学Managementstatistics 平均差 meandeviation 变量数列中各个变量值与算术平均数的绝对离差的平均数 常用MD表示 各变量值与平均数的离差的绝对值越大 平均差也越大 则说明变量值变动大 数列离散趋势越大 反之亦然 根据所给资料的形式不同 对平均差的计算可以划分为简单和加权式平均差两种形式 平均差 管理统计学Managementstatistics 一 简单平均差对未经分组的数据资料 采用简单平均差 公式如下 平均差 管理统计学Managementstatistics 二 加权式根据分组整理的数据计算平均差 应采用加权式 公式如下 平均差 管理统计学Managementstatistics 四 方差与标准差 方差 variance 方差是变量数列中各变量值与其算术平均数差的平方 标准差 standarddeviation 标准差是方差的平方根 故又称均方差或均方差根 其计量单位与平均数的计量单位相同 根据给定资料的不同 对方差和标准差的求解也可以分为两种形式 管理统计学Managementstatistics 对未经分组的数据资料 采用简单式 公式如下 方差的计算公式 标准差的计算公式 简单式 管理统计学Managementstatistics 根据分组整理的数据计算标准差 应采用加权式 公式如下 方差 标准差 加权式 管理统计学Managementstatistics 五 相对位置和相对离散程度的度量 一 标准分数标准分数 standardscore 也称标准化值或分数 它是变量值与其平均数的离差除以标准差后的值 是对每个数据在该组数据中相对位置的测量 常用字母z表示 有z分数是将原始数据进行了线性变换 它并没有改变一个数据在该数据组中的位置 也没有改变该组数据的分布形状 而只是将该组数据变为均值为0 标准差为1 管理统计学Managementstatistics 离散系数 coefficientofvariation 通常是就标准差来计算的 因此 也称为标准差系数 它反映数列离散趋势的相对程度 是一组数据的标准差与其对应的平均数之比 是测度数据离散程度的相对指标 其计算公式如下 离散系数的作用主要用于比较不同总体或样本数据的离散程度 离散系数大的说明数据的离散程度也就大 离散系数小的说明数据的离散程度也就小 离散系数 管理统计学Managementstatistics 4 3数据分布的形状测度 管理统计学Managementstatistics 偏态 skewness 是对分布偏斜方向和程度的测度 是次数分配的非对称程度 它与平均数和标准差一样 是反映次数分布特征的又一重要指标 偏态通常分为两种 右偏 或正偏 与左偏 或负偏 它们是与对称分布为标准相比较而言的 分布偏态测度 管理统计学Managementstatistics 统计分析中测定偏态系数的方法很多 一般采用动差概念计算 其计算公式为三阶中心动差与标准差的三次方之比 具体公式如下 分布偏态测度 管理统计学Managementstatistics 偏态 1 数据分布偏斜程度的测度2 偏态系数 0为对称分布3 偏态系数 0为右偏分布4 偏态系数 0为左偏分布5 计算公式为 管理统计学Managementstatistics 从上式可以看到 它是离差三次方的平均数再除以标准差的三次方 当分布对称时 离差三次方后正负离差可以相互抵消 因而的分子等于0 则 0 当分布不对称时 正负离差不能抵消 就形成了正与负的偏态系数 当为正值时 表示正偏离差值较大 可以判断为正偏或右偏 反之 为负值时 表示负偏离差值较大 可以判断为负偏或左偏 偏态系数的数值一般在0与 3之间 越接近0 分布的偏斜度越小 越接近 3 分布的偏斜度越大 分布偏态测度 管理统计学Managementstatistics 偏态 实例 例 已知1997年我国农村居民家庭按纯收入分组的有关数据如表4 9 试计算偏态系数 管理统计学Managementstatistics 农村居民家庭村收入数据的直方图 偏态与峰度 按纯收入分组 元 结论 1 为右偏分布2 峰度适中 管理统计学Managementstatistics 偏态系数 计算过程 管理统计学Managementstatistics 偏态系数 计算结果 根据上表数据计算得 将计算结果代入公式得 结论 偏态系数为正值 而且数值较大 说明农村居民家庭纯收入的分布为右偏分布 即收入较少的家庭占据多数 而收入较高的家庭则占少数 而且偏斜的程度较大 管理统计学Managementstatistics 峰度 kurtosis 是分布集中趋势高峰的形状 指次数分配曲线顶端的尖峭程度 在变量数列的分布特征中 常常将数分配曲线与正态曲线相比较 判断是尖顶还是平顶及其尖顶或平顶的程度 峰度通常分为三种 正态峰度 尖顶峰度与平顶峰度 当分配数列的次数比较集中于众数的位置 使次数分配曲线较正态分配曲线更为隆起的 属于尖顶峰度 当分配数列的次数 对众数来说比较分散 使次数分配曲线较正态分配曲线更为平滑的 属于平顶峰度 分布峰态测度 管理统计学Managementstatistics 测度峰度的方法一般运用统计动差法 即运用四阶中心动差与标准差的四次方对比 以此来判断各分布曲线峰度的尖平程度 公式如下 分布峰态测度 管理统计学Managementstatistics 峰度系数是统计中描述次数分布状态的又一个重要特征值 用以测定邻近数值周围变量值分布的集中或分散程度 它以四阶中心动差为测量标准 除以好是为了消除单位量纲的影响 而得到以无名数表示的相对数形式 以便在不同的分布曲线之间进行比较 由于正态分布的峰度系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论