2013-2014-1统计学第四章.ppt_第1页
2013-2014-1统计学第四章.ppt_第2页
2013-2014-1统计学第四章.ppt_第3页
2013-2014-1统计学第四章.ppt_第4页
2013-2014-1统计学第四章.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 数据的描述性分析,本章内容,第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度,集中趋势,集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。,算术平均数,算术平均数是总体中各个体的某个数量标志的总和与个体总数的比值,一般用符号 表示。,简单算术平均数 加权算术平均数 算术平均数的数学性质,案例1:甲班统计学考试情况如下表:,案例2:乙班统计学考试情况如下表:,案例3:丙班统计学考试情况如下表:,问题 1、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是

2、近似值,什么情况下会是真实值? 2、计算甲、乙、丙三个班的中位数、众数; 3、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么? 4、如要分别反映甲、乙、丙三个班的考试情况,你会选择用哪些指标来衡量? 5、如要比较甲、乙、丙三个班的考试情况的优劣,你又会选择什么样的指标来衡量?,6、甲乙丙三个班的考试成绩分别服从对称分布、左 偏分布、右偏分布中的哪种分布?为什么?,先计算各组的累计次数,再按公式 确定 中位数的位置,并对照累计次数确定中位数。,由组距数列确定中位数,下限公式:,为中位数组的下限; 为总次数; 为中位数组

3、前一组的向上累计次数; 为中位数组的次数; 为中位数组的组距。,众数,众数是一组数据中出现次数最多的那个变量值,通常用M0表示。,由未分组数据确定众数 由单项数列确定众数 由组距数列确定众数,组距式变量数列计算众数的公式:,对比,1. 众数、中位数和算术平均数的关系,2. 众数、中位数和算术平均数的特点与应用场合,15,2、几何平均数,各个比率或速度的连乘积等于总比率或总速度; 相乘的各个比率或速度不为零或负值。,使用几何平均数的条件:,用处:用于计算比率、发展速度的平均值。,16,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产

4、线产品的平均合格率。,分析:,设最初投产100A个单位 ,则 第一道工序的合格品为100A0.95; 第二道工序的合格品为(100A0.950.92) ; 第五道工序的合格品为 (100A0.950.920.900.850.80;,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900.850.80; 则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900.85

5、0.80; 则该流水线产品总的合格率为:,解:,加权几何平均数,当计算几何平均数的各种变量值出现的次数不等时,即数据经过了统计分组时,则应采用加权几何平均数。若以 表示第 组的变量值,以 表示第i 组的频数,以k 表示分组数,则加权几何平均数的计算公式为:,【例】某金融机构以复利计息。近12年来的年利率有4年为 3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第2年末的本利和为:, ,第12年末的本利和为:,分析:,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算

6、平均年本利率应采用几何平均法。,解:,数据标准化,标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数。设标准化数值为z,则有:,偏态,偏态是对分布偏斜方向和程度的测度。变量分组后,总体中各个体在不同的分组变量值下分布并不均匀对称,而呈现出偏斜的分布状况,统计上将其称为偏态分布。,偏态系数的数值一般在0与3之间,越接近0,分布的偏斜度越小;越接近3,分布的偏斜度越大。,峰度,峰度是分布集中趋势高峰的形状。在变量数列的分布特征中,常常以正态分布为标准,观察变量数列分布曲线顶峰的尖平程度,统计上称之为峰度。,正态分布的峰度系数为0,当0时为尖峰分布,当0时为平顶分布。,第四章

7、讨论题 1、任何平均数都受变量数列中的极端值的影响。 2、中位数把变量数列分成了两半,一半数值比他大,一半数值比他小。 3、任何变量数列都存在众数。 4、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征? 5、什么是众数?有什么特点?试举例说明其应用。 6、极差越小说明数据的代表性越好,数据越稳定;,7、四分位差、平均差和标准差衡量的是哪个平均指标的代表性?上述三个指标哪些优越? 8、如果某同学在英语竞赛中的标准得分为2,并且知道1%为一等奖,5%为二等奖,10%为三等奖,则 则他( )。 A.获一等奖 B获二等奖 C获三等奖 D无缘奖项 9、想知道某班同学统计学考试成绩的稳定性,需要用哪些指标比较好?相比较某班同学统计学考试成绩和大学英语考试成绩的稳定性,用哪些指标比较好?,10、在某地区抽取的120家企业按利润额进行分组, 结果如下表所示.,计算120家企业利润额的均值和标准差.,11、某管理局抽查了所属的8家企业,其产品销售数据如 下表所示,试比较产品销售额和销售利润的离散程度.,12、假定某班学生先后两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论