




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本章主要介绍以下三种综合统计指标:计量中心(集中)倾向的平均指标是离散度(变异性)指标是测量偏差程度的指标是测量两种数值变量关系的指标,第三章统计数据的记述计量,2,常用指标是算术平均、中值、大众数、四分位数、几何平均、五数摘要3.1测量集中倾向的指标,3,(1)基本式:1 .算术平均,4,(1)简单算术平均,(2)算术平均的计算,n-整体单位总数第Xi-I个单位的标志值。 (2)加权算术平均,Xi-第I组的代表值(组的中值或该组的变数值) fi-组I的频率。 5、用Excel函数求出加权算术平均,用Excel的“数学和三角函数”的SUMPRODUCT函数简单地计算分组数据的加权算术平均。 语法规则:格式: SUMPRODUCT (,)功能:返回两个或多个区域的相应元素乘积之和。 /利用啤酒公司各销售点集团的频数分布数据,求出各销售点的平均销售量。 6、2 .几何平均、统计数据是各时期发展速度等前后期的二对比环数据,要求各时期的平均发展速度时,需要使用几何平均。 几何平均是n个连积的n次方根。 (1)简单几何平均,(2)加权几何平均,fi各比率的出现频率,7,例如:某公司原料成本随时间增加的情况如下表所示,求出原料成本的平均年增长率。 当使用解一:解二:年平均增长率=1.0688-1=6.88%,8,(3)Excel确定几何平均时,可以使用excel统计函数的GEOMEAN函数返回几何平均。 语法规则:格式: GEOMEAN (,)功能:返回所有参数数据的几何平均。 另外,按照整体的各单位标记值从小到大的顺序排列,将处于中间位置的标记值称为中央值,记为Me。 中值是位置平均,不受极端数据的影响。 当统计数据包含异常或极端数据时,中值比算术平均更有代表性。 例如,有5件付款。 9元、10元、10元、11元、60元的支付平均为20元,这显然不是一个好的代表值,但中位数Me=10元表示每件支付的平均数。 3 .中值,10,(1)使用excel统计函数返回未分组数据的中值,并且使用excel统计函数的中值返回未分组数据的中值。 格式: MEDIAN (,)功能:返回所有参数数据的中值。 11、(2)确定组数据的中央值,关于组数据的统计数据,中央值用插值法估计。 (1)计算各组的累计度数(2)特定中央值的位置的组是累计度数首次包含中央值位次f/2的组。 其中,具有l-中央值的组的下限Sm-1具有中央值的组之前的组的累积度数FM-具有中央值的组的度数d-具有中央值的组的组间隔。12、例:计算下表的数据的中央值,解:f/2=27.5,在中央值为“15-25”的组中,13、4 .最多,是整体出现次数最多的标志值,记为M0。 大众人数明确反映了数据分布的集中倾向,也是不受极端数据影响的位置平均。 但是,并不是所有的数据集合都有公共数,有可能存在多种公共数。 在某些情况下,群众人数是更好的代表值。 例如,在服装行业,制造商、批发商、零售商在决定生产和库存时,对最普遍的尺寸而不是平均尺寸感兴趣。 另外,要知道大部分家庭的收入情况,也必须使用一般的数字。 (1)未分组数据的最大数目的确定可以使用Excel统计函数的MODE函数来返回最大数目。 格式: MODE (,)功能:返回所有参数的最大数据数。 15、(2)分组数据的最大数量的确定,关于分组数据的统计资料,也用插值法估计最大数量。(1)确定众数存在的组是等间隔组,众数组是频度最高的组(2)用下面的插值式计算: l-众数组的下限1-众数组和前组的频度之差2-众数组和后组的频度之差d-众数组例如:计算下表数据的群众数,解:群众数组为“15-25”组,17、算术平均值、中值与群众数的关系,2 .度数分布为右偏置时,小于中值,算术平均值大于中值。 另外,在度数分布是左偏置状态的情况下,最频值大于中值,算术平均值小于中值。 1、度数分布呈完全对称的单峰分布,算术平均值、中值和最频三者相同。18、引理、引理3 :某地区民营企业注册资金集团资料如下,求该地区民营企业注册资金的平均、中位数和人数。19、引理3的回答、f/2=143/2=71.5、有中央值的组为“100150”的组、所有数组为“100150”的组、20、5 .四分位数(概念点)、1 .集中倾向的测度值之一、2 .排序3 .不受极端值的影响4 .排序数据、数值型数据但是分类数据、21、未分类数据、组距离分组数据:四分位数的位置的确定、22、数值型未分类数据的四分位数(7个数据的计算例), 原始数据:23212282526重新排列:252838303538332位置:52535253525252525252535252525252525252525352525253525253咖啡壶数值类型在以下数据的计算示例中,原始数据:232182526是:212325262830的位置:123456,QL=21 0.75(23-21)=22.5,QU=28 0.25(30-28)=28.5, 24、数值型数据包化数据的四分位数上四分位:下四分位: 25、数值型分组数据的四分位置,QL位置=50/4=12.5,QU位置=350/4=37.5,【例】根据表中的数据,计算50名工人的日加工零件数的四分位置,26,使用Excel统计函数的QUARTILE函数,在数据量大的情况下格式: QUARTILE (数据集、nthquart百分比)功能:返回nthquart的不同百分比。27、6 .五数摘要和箱线图,五数摘要包含最小值、第一分位数、中值、第三分位数和最大值这五个数据,箱线图(也称为箱须图)提供基于五数摘要的几何图形,28、箱线图和四种不同类型的分布图的连接,29、 变异指标表示数据离散度的特征。 变异指标主要是极差、平均差、标准偏差和变异系数。 3.2测量离散度的指标,30,【案例】道格拉斯公司应该如何选择供应商,道森公司和克拉克公司是道格拉斯公司两个供应商。 两个供应商都要求约在10个工作日内交货订单。 下表显示了两个供应商订单交货期的历史数据。 今后道格拉斯公司应该选择哪个供应商?31,1 .极差、极差也被称为全距离,是一组数据的最大值和最小值的差,通常记为r。 显然,小组数据的差异越大,其极端差异也越大。 极端差异是最简单的变异指标,被广泛应用于控制产品质量管理中的质量差异,如果发现超出控制范围,就采取措施纠正,保证产品质量的稳定。 但是,极端的差有很大的界限,那是因为只考虑了两个极端的数据,没有利用该剩馀数据的信息,所以比较粗糙的变异指标。 32、2 .平均差、平均差是各数据及其平均方差的绝对值的算术平均,通常记为A.D。 平均差越大,反映数据间的差越大。 但是,因为使用了绝对值,数学性质差,所以不怎么被使用。33,3 .四分位差,1 .离散度的测度值之一。2 .也称为内距离或四分位间隔。3 .上四分位数和下四分位数的差QD=QU-QL4 .中间的50%数据的离散度用于不受到极端值的影响的中央值的代表性测量。34,4 .方差和标准偏差、方差和标准偏差标准偏差是方差的算术平方根,也称为平均方差或根方差。 总体方差、标准偏差和标本方差、标准偏差不同。 (1)总体的方差和总体的标准偏差总体的方差是各总体及其平均方差的平方的平均值,记为2,总体的标准偏差记为。 35、(2)样本方差和样本标准偏差,样本方差为S2,样本标准偏差为s,在估计统计中分别是总体方差和标准偏差好的估计。 其中,n是样品容量,Xi是样品观察值,样品平均。 36、未分组数据的方差和标准偏差的计算、方差和标准偏差的手动计算非常复杂,只掌握以下两种方法。 使用计算器的统计功能(SD和STAT功能)的Excel的统计函数使用VARP (,)功能:返回所有参数数据的总体方差。 STDEVP (,)功能:返回所有参数数据的整体标准偏差。 VAR (,)功能:返回所有参数数据的样本方差。 STDEV (,)功能:返回所有参数数据的样本标准偏差。 37,5 .变异系数在需要对不同总体的离散度进行比较的情况下,如果所使用的测量单位不同,或者它们在数量级上有很大不同,则用绝对值表示的方差和标准偏差缺乏比较性,在这种情况下,使用相对变异指标(变异系数)。 例如,汽车发动机的汽缸,0.05毫米的标准偏差很大,但建筑工程完全可以无视。 相对变异指标中最重要的是标准偏差系数,标准偏差和平均值之比,记为v。38、6.z值,极端的值是远离平均值的量。 z值有助于定义极端值。 z值越大,数据离开平均值的距离越大。 z值是数据和平均值的差除以标准偏差。 计算公式如下所示。 通常,如果z值小于-3.0或大于3.0,则数据可能包含极端值。 39、整体分布特征不仅与平均和变异指标有关,还与分布偏差程度有关,如对称分布、右偏分布、左偏分布。 这种分布形态上的数量特征,通常具有重要的社会经济意义。 偏置系数是测量时滞程度的指标,主要有以下两种计算方法: 1、以标准偏差为单位测量的偏置系数是SK,计算式是SK为无量纲量,取值通常在-3 3之间,其绝对值越大表示时滞程度越大。 在分布为右偏置状态的情况下,是SK0,所以也称为正偏置状态的分布为左偏置状态的情况下,是SK0,所以也称为负偏置状态。 3.3测量歪斜程度的指标,使用40、2、3次中心矩测量的偏置系数,该偏置系数是3次中心矩除以标准偏差的3次方来测量歪斜的程度,计算式称为3次中心矩。 偏度系数可以应用于任何数据。 因为和SK计算方法不同,所以从同一数据计算的结果也不同。 可以使用Excel统计函数的SKEW函数返回数据的偏度系数。 语法规则如下: SKEW (,)功能:返回所有参数数据的偏度系数。 41,1 .协方差:协方差测量了两个数值变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银企对账考试试题及答案
- 建筑安全监理培训试题及答案解析
- 2025年氢能重卡在新能源产业链中的应用前景与市场前景预测报告
- 安庆高考英语试卷及答案
- 2025年光伏电站智能运维系统与人工智能技术融合创新报告
- 2025黑龙江齐齐哈尔市建华区中华街道公益性岗位招聘1人模拟试卷及答案详解(夺冠)
- 2025-2030工业软件行业竞争格局与技术发展方向报告
- 2025年甘肃省天水天光半导体有限责任公司招聘18人考前自测高频考点模拟试题及答案详解(必刷)
- 2025-2030工业软件服务行业发展趋势分析与未来投资战略咨询研究报告
- 2025-2030工业软件云化转型趋势与制造业订阅模式接受度评估报告
- 中国密闭空间检测无人机行业市场前景预测及投资价值评估分析报告
- 2025面向机器学习的数据标注规范
- YY/T 0339-2024呼吸道用吸引导管
- 围手术期高血压专家管理共识
- 外科患者疼痛护理与管理
- 租金延迟缴纳申请书
- 学校体育学(唐炎-刘昕版)重点、知识点
- DL-T 2563-2022 分布式能源自动发电控制与自动电压控制系统测试技术规范
- 食堂工作人员培训内容
- 泛影葡胺在消化道造影中的应用
- 2022年11月四川省凉山州中级人民法院逐级遴选4名法官笔试题库含答案解析
评论
0/150
提交评论