商务与经济统计学.ppt_第1页
商务与经济统计学.ppt_第2页
商务与经济统计学.ppt_第3页
商务与经济统计学.ppt_第4页
商务与经济统计学.ppt_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3 讲 统计描述的数值方法 案例-SMALL FRY DESIGN公司 nSmall Fry Design公司成立于1997年,是一家设计和进口婴儿用品 的公司,主要经营玩具和附属用品。公司产品包括泰德熊、玩具汽 车、音乐玩具等,公司特长是设计强调颜色、材质和声音高质量的 柔软玩具。公司的产品在美国设计,而在中国生产。 n在这个公司的日常运营中,现金流量管理是最重要的经营活动之一 。现金流量管理的一个关键因素是对应收账款的分析和控制。通过 度量未付款发票的平均帐龄和价值,经理能够预测可用现金和监视 应收账款状态的变化。公司设置的目标是:未付款发票的平均帐龄 不应超过45天,超过60天的未付款发票的价值不应超过所有应收账 款价值的5%。 案例-SMALL FRY DESIGN公司 n在最近对应收账款的总结中,使用了下列描述性统计两来衡 量未付款发票的帐龄: n均值-40天 n中位数-35天 n众数-31天 n对这些统计量的解释表明,一张发票的平均帐龄是40天;而 中位数显示一半的发票已经超过35天没有付账;31天的众 数表示最高频率的发票帐龄,即一张未付款发票的最普通时 间长度是31天。统计汇总还显示出应收账款总价值中只有 3%超过了60天。基于这些统计信息,管理者可以感到满意 ,因为应收账款和收入现金流都处于控制之下。 未付款发票的平均帐龄不应超过45天,超过 60天的未付款发票的价值不应超过所有应收 账款价值的5%。 一 集中趋势的定量描述 二 离散程度的定量描述 三 偏态与峰度的测度 统计描述的数值方法 学习目标 1.集中趋势各测度值的计算方法 2.集中趋势不同测度值的特点和应用场合 3.离散程度各测度值的计算方法 4.离散程度不同测度值的特点和应用场合 5.偏态与峰度测度方法 6.用SPSS(或Excel)计算描述统计量并进行 分析 数据分布的特征 集中趋势 (位置) 离散趋势 (分散程度) 偏态和峰度 (形状) 数据分布的特征和测度 数据的特征和测度 分布的形状集中趋势离散程度 众 数 中位数 均 值 离散系数 方差和标准差 峰 度 四分位差 异众比率 偏 态 第1节 集中趋势的定量描述 一. 定类数据:众数 二. 定序数据:中位数和分位数 三. 定距和定比数据:均值 四. 众数、中位数和均值的比较 集中趋势(Central tendency) n一组数据向其中心值靠拢的倾向和程度 n测度集中趋势就是寻找数据一般水平的代表值或中心值 n不同类型的数据用不同的集中趋势测度值 n低层次数据的集中趋势测度值适用于高层次的测量数据 ,反过来,高层次数据的集中趋势测度值并不适用于低 层次的测量数据 n选用哪一个测度值来反映数据的集中趋势,要根据所掌 握的数据的类型来确定 众数(概念要点) 1.集中趋势的测度值之一 n出现次数最多的变量值 n不受极端值的影响 n可能没有众数或有几个众数 n主要用于定类数据,也可用于定序数据 和数值型数据 众数(Mode)(众数的不唯一性) 无众数无众数 原始数据: 10 5 9 12 6 8 一个众数 原始数据: 6 6 5 5 9 8 9 8 5 5 5 5 多于一个众数 原始数据: 25 : 25 28 28 2828 36 36 4242 4242 定类数据的众数(算例) 【例例3.13.1】根据第根据第2 2讲表讲表2-12-1中的数据,计算众数中的数据,计算众数 表3-1 某城市居民关注广告类类型的频频数分布 广告类类型人数(人)频频率 百分比 (%) 商品广告 服务务广告 金融广告 房地产产广告 招生招聘广告 其他广告 112 51 9 16 10 2 0.560 0.255 0.045 0.080 0.050 0.010 56.0 25.5 4.5 8.0 5.0 1.0 合计计2001100 解:解:这里的变量为“广告类型” ,这是个定类变量,不同类型 的广告就是变量值。我们看到 ,在所调查的200人当中,关 注商品广告的人数最多,为 112人,占总被调查人数的 56%,因此众数为“商品广告” 这一类别,即 MM o o 商品广告商品广告 定序数据的众数(算例) 【例例3.23.2】根据第2讲表2-2中的数据,计算众数 表3-2 甲城市用户对户对 冰箱使用状况评评价的频频数分布 回答类别类别 甲城市 用户户数 (人)百分比 (%) 非常不满满意 不满满意 一般 满满意 非常满满意 24 108 93 45 30 8 36 31 15 10 合计计300100.0 解:解:这里的数据为定 序数据。变量为“回 答类别”。甲城市中 对该冰箱表示不满意 的户数最多,为108 户,因此众数为“不 满意”这一类别,即 MM o o 不满意不满意 数值型分组数据的众数(要点及计算公式) 1. 众数的值与相邻两组频数的分布有关 MM o o MM o o L L MM o o f-1 f+1 2. 2. 相邻两组的频数相等时,众数组的组中 值即为众数 3. 3. 相邻两组的频数不相等时,众数采用下 列近似公式计算 4 4. 该公式假定众数组的频数在众数组内均匀分布 L: 频数最高所在组区间下限 f : 频数最高所在组的频数 i: 频数最高所在组的组距 f-1:前一组的频数; f+1:后一组的频数 数值型分组数据的众数(算例) 【例3.3】 根据第2 讲中的数 据,计算 50名工人 日加工零 件数的众 数 表3-3 某车间车间 50名工人日加工零件数 分组组表 按零件数分组组频频数(人)累积频积频 数 105109 110114 115119 120124 125129 130134 135139 3 5 8 14 10 6 4 3 8 16 30 40 46 50 合计计50 定序数据:中位数和分位数 中位数(Median) (概念要点) 1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值 MM e e 50%50%50%50% 3.3. 不受极端值的影响不受极端值的影响 4.4. 主要用于定序数据,也可用数值型数据,但不能用于定主要用于定序数据,也可用数值型数据,但不能用于定 类数据类数据 5.5. 各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即 中位数 分组数据:分组数据: 未分组数据:未分组数据: 定序数据的中位数(算例) 【例例3.43.4】根据第2讲表2-2中的数据,计算甲城 市用户对冰箱使用满意状况评价的中位数 表3-4 甲城市用户对户对 冰箱使用状况评评价的频频数分布 回答类别类别甲城市 用户户数 (人)累计频计频 数 非常不满满 意 不满满意 一般 满满意 非常满满意 24 108 93 45 30 24 132 225 270 300 合计计 300 解:解:中位数的位置为:中位数的位置为: 300/2300/2150150 从累计频数看,中位数从累计频数看,中位数 的在的在“ “一般一般” ”这一组别中。这一组别中。 因此因此 MM e e 一般一般 数值型未分组数据的中位数(5个 数据的算例) n原始数据: 24 22 21 26 20 n排 序: 20 21 22 24 26 n位 置: 1 2 3 4 5 中位数中位数 2222 数值型未分组数据的中位数(6个 数据的算例) n原始数据: 10 5 9 12 6 8 n排 序: 5 6 8 9 10 12 n位 置: 1 2 3 4 5 6 中位数中位数 8 + 98 + 9 2 2 8.58.5 数值型分组数据的中位数(要点 及计算公式) 根据位置公式确定中位数所在的组 采用下列近似公式计算: N: 数据总数 L: 中位数所在组区间下限 Sm-1: 中位数以前的累积频数 i: 中位数所在组的组距 fm: 中位数所在组的频数 该公式假定中位数组的频数在该组内均匀分布 数值型分组数据的中位数(算例 ) 【例例3.53.5】 根据第根据第2 2 讲表讲表2-52-5 中的数中的数 据,计据,计 算算50 50 名名 工人日工人日 加工零加工零 件数的件数的 中位数中位数 表3-3 某车间车间 50名工人日加工零件数分组组表 按零件数分组组频频数(人)累积频积频 数 105109 110114 115119 120124 125129 130134 135139 3 5 8 14 10 6 4 3 8 16 30 40 46 50 合计计50 N: 数据总数 L: 中位数所在组区间下限 Sm-1: 中位数以前的累积频数 i: 中位数所在组的组距 fm: 中位数所在组的频数 四分位数(概念要点) 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 QQ L L QQM M QQ U U 25%25%25%25%25%25%25%25% 3. 3. 不受极端值的影响不受极端值的影响 4. 4. 主要用于定序数据,也可用于数值型数据,主要用于定序数据,也可用于数值型数据, 但不能用于定类数据但不能用于定类数据 四分位数(位置的确定) 未分组数据:未分组数据: 分组数据:分组数据: 下四分位数下四分位数( (QQ L L ) )位置位置 = = N+N+1 1 4 4 上四分位数上四分位数( (QQ U U ) )位置位置 = = 3(3(N+N+1)1) 4 4 下四分位数下四分位数( (QQ L L ) )位置位置 = = N N 4 4 上四分位数上四分位数( (QQ U U ) )位置位置 = = 3N3N 4 4 定距和定比数据:均值 均值(Mean)(概念要点) n1.集中趋势的测度值之一 n2. 最常用的测度值 n3. 一组数据的均衡点所在 n4. 易受极端值的影响 n5. 用于数值型数据,不能用于定类 数据和定序数据 均值(计算公式) 设一组数据为:设一组数据为:X X1 1 , ,X X2 2 , , ,X XN N 简单均值简单均值的计算公式为的计算公式为 设分组后的数据为:设分组后的数据为:X X1 1 , ,X X2 2 , , ,X X K K 相应的频数为:相应的频数为: F F1 1 , , F F 2 2 , ,F F K K 加权均值加权均值的计算公式为的计算公式为 调和平均数(概念要点) n1. 集中趋势的测度值之一 n2. 均值的另一种表现形式 n3. 易受极端值的影响 n4. 用于定比数据 n5. 不能用于定类数据和定序数据 n6. 计算公式为 原来只是计算 时使用了不同 的数据! 调和平均数(算例) 【例3.9】某蔬菜批发市场三种蔬菜的日成交数据某蔬菜批发市场三种蔬菜的日成交数据 如表如表3-93-9,计算三种蔬菜该日的平均批发价格,计算三种蔬菜该日的平均批发价格 表3-9 某日三种蔬菜的批发发成交数据 蔬菜 名称 批发发价格(元) Xi 成交额额(元) XiFi 成交量(公斤) Fi(非原始数据 ) 甲 乙 丙 1.20 0.50 0.80 18000 12500 6400 15000 25000 8000 合计计3690048000 几何平均数(概念要点) 1. 集中趋势的测度值之一 2. N 个变量值乘积的 N 次方根 3. 适用于特殊的数据 4. 主要用于计算平均发展速度 5. 计算公式为 6. 6. 可看作是均值的一种变形可看作是均值的一种变形 几何平均数(算例) 【例3.10】一位投资者持有一种股票, 1996年、1997年、1998年和1999年收益率 分别为4.5%、2.0%、3.5%、5.4%。计算 该投资者在这四年内的平均收益率。 平均收益率平均收益率103.84%-1=3.84%103.84%-1=3.84% 众数、中位数和均值的比较 众数、中位数和均值的关系 对称分布对称分布 均值均值 = = 中位数中位数 = = 众数 众数 左偏分布左偏分布 均值均值 中位数中位数 众数众数 右偏分布右偏分布 众数众数 中位数中位数 均值均值 均值、中位数、众数哪个好? n均值: (1)使用目标是描述一组数据的中心位置,通常是人 们首选的统计量 (2)数据类型:数值型数据 (3)缺点是对异常观测值敏感 n中位数: (1)使用目标:描述一组数据的中心位置 (2)数据类型:定序数据 (3)不像均值那样对异常观测值敏感,有些情况下比 均值更好: 例:统计课考完后,你最想知道的信息有哪些? 比较 各班的成绩用均值和中位数哪个更好一些? n众数: 一般不用来描述数据组的中心位置 数据类型与集中趋势测度值 表3-10 数据类类型和所适用的集中趋势测趋势测 度值值 数据类类型定类类数据 定序数据定距数据定比数据 适 用 的 测测 度 值值 众数中位数均值值均值值 四分位数众数调调和平均数 众数中位数几何平均数 四分位数 中位数 四分位数 众数 第1节 集中趋势的定量描述 一. 定类数据:众数 二. 定序数据:中位数和分位数 三. 定距和定比数据:均值 四. 众数、中位数和均值的比较 第2节 离散程度(变异性)的 定量描述 一. 定类数据:异众比率 二. 定序数据:四分位差 三. 定距和定比数据:方差及标准差 四. 相对离散程度:离散系数 离中趋势 n数据分布的另一个重要特征 n离中趋势的各测度值是对数据离散程度所作的描 述 n反映各变量值远离其中心值的程度,因此也称为 离中趋势 n从另一个侧面说明了集中趋势测度值的代表程度 n不同类型的数据有不同的离散程度测度值 数据的特征和测度(本节位置) 数据的特征和测度 分布的形状离散程度集中趋势 众众 数数 中位数中位数 均均 值值 离散系数 方差和标准差 峰峰 度度 四分位差四分位差 异众比率 偏偏 态态 定序数据:四分位差 四分位差(概念要点) 1.离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU - QL 4. 反映了中间50%数据的离散程度 5. 不受极端值的影响 6. 用于衡量中位数的代表性 四分位差(定序数据的算例) 【例例3.123.12】根据第根据第2 2讲表讲表2-22-2中的数据,计算甲中的数据,计算甲 城市家庭对住房满意状况评价的四分位差城市家庭对住房满意状况评价的四分位差 表3-12 甲城市用户对该户对该 冰箱使用状况评评价的频频 数分布 回答类别类别甲城市 用户户数 (人)累计频计频 数 非常不满满意 不满满意 一般 满满意 非常满满意 24 108 93 45 30 24 132 225 270 300 合计计300 解:解:设非常不满意为设非常不满意为1, 1, 不满意为不满意为2, 2, 一般为一般为3, 3, 满满 意为意为 4, 4, 非常满意为非常满意为5 5 已知已知 Q QL L = = 不满意不满意 = = 2 2, Q QU U = = 一般一般 = = 3 3 四分位差:四分位差: Q Q D D = = Q QU U = = Q Q L L = = 3 2 3 2 = = 1 1 四分位差与箱线图(案例) n在国外许多快餐店开设汽车窗口,为司机和乘客提供便 利服务。为了研究测量这种服务的便利性,快餐店协会 组织了一项研究,对5个快餐店分别抽取驾车顾客组成 样本,并记录顾客花费的时间(秒),并利用箱线图作出 分析说明。 Smallest = 190 Q1 = 253.25 Median = 276.5 Q3 = 297.5 Largest = 355 IQR = 44.25 Outliers: 快餐店A 四分位差与箱线图(案例) Smallest = 95 Q1 = 133 Median = 143.5 Q3 = 155 Largest = 201 IQR = 22 Outliers: 201, 199, 190, 97, 95, Smallest = 121 Q1 = 136 Median = 153 Q3 = 177.5 Largest = 223 IQR = 41.5 Outliers: 快餐店B 快餐店C 四分位差与箱线图(案例) 快餐店D 如何解释? 快餐店B的看起来最短而且最稳定,D的服务时间更具有 变异性,A最慢,A和B 对称性较强,C和D 右偏 Smallest = 121 Q1 = 141.25 Median = 163 Q3 = 207.25 Largest = 338 IQR = 66 Outliers: 338, 四分位差与箱线图(案例) 快餐店D 快餐店B的看起来最短而且最稳定,D的服务时间更具有 变异性,A最慢,A和B 对称性较强,C和D 右偏 如何绘制箱线图 n1. 根据上下四分位数画一个方盒。 n2. 在方盒中中位数位置画一条线。 n3. 利用四分位间距设定上下界限,确定异常值。 n4. 在方盒的两边分别画虚线,直至上下界限内的 最大值和最小值。 n5. 标注出异常值。 根据以下数据画箱线图:5,15,18,10,8,12 ,16,10,6 定距和定比数据: 极差、方差和标准差 极差(全距 Range)(概念要点 及计算公式) 1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 7 7 8 8 9 9 10107 7 8 8 9 9 10 10 5. 5. 计算公式为计算公式为 未分组数据未分组数据 R R = = max(max(X X i i ) - ) - min(min(X X i i ) ) . . = = 组距分组数据组距分组数据 R R 最高组上限最高组上限 - - 最低组下限最低组下限 方差(Variance)和标准差(概念要点 ) n1. 离散程度的测度值之一 n2. 最常用的测度值 n3. 反映了数据的分布 n4.反映了各变量值与均值的平均差异 n5.根据总体数据计算的,称为总体方差或标 准差;根据样本数据计算的,称为样本方差 或标准差 4 6 8 10 124 6 8 10 12 X = X = 8.38.3 总体方差和标准差(计算公式) 未分组数据: 组距分组数据:组距分组数据: 未分组数据:未分组数据: 组距分组数据:组距分组数据: 方差方差标准差标准差 注意分组数据的计算注意分组数据的计算 总体标准差(Standard deviation) 计 算过程及结果 【例例3.143.14】根据下表数据,计算工人日加工零件数的标准差 表3-14 某车间车间 50名工人日加工零件标标准差计计算表 按零件数分组组组组中值值(Xi)频频数(Fi)(Xi- X )2(Xi- X )2Fi 105110 110115 115120 120125 125130 130135 135140 107.5 112.5 117.5 122.5 127.5 132.5 137.5 3 5 8 14 10 6 4 246.49 114.49 32.49 0.49 18.49 86.49 204.49 739.47 572.45 259.92 6.86 184.90 518.94 817.96 合计计503100.5 样本方差和标准差(计算公式) 未分组数据: 组距分组数据:组距分组数据: 未分组数据:未分组数据: 组距分组数据:组距分组数据: 方差的计算公式方差的计算公式 标准差的计算公式标准差的计算公式 注意:注意: 样本方差用自样本方差用自 由度由度n-1n-1去除去除! ! 样本方差(案例) u高尔夫装备制造商要研究 改进后球棒对提高高尔夫 球手的稳定性是否有作用 ? n稳定性的测量:击球距离 的标准差 n数据的收集:采用实验的 方法,让一位高尔夫选手 用改进前和改进后的球棒 个击球75次,记录击球 距离 改进前改进后 平均150.5467150.1467 中位数151150 标准差5.7921043.091808 众数150149 方差33.548479.559279 峰度0.12674-0.88542 偏度-0.429890.177338 最小值134144 最大值162156 观测数7575 相对离散程度:离散系数 离散系数(变异系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论