天津大学-刘金兰应用统计学.ppt_第1页
天津大学-刘金兰应用统计学.ppt_第2页
天津大学-刘金兰应用统计学.ppt_第3页
天津大学-刘金兰应用统计学.ppt_第4页
天津大学-刘金兰应用统计学.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

表示统计资料的特征数有哪些 几何平均数与调和平均数各适合于什么情况 计算样本方差与总体方差公式有何区别 3 1表示集中位置的特征数 3 1 1平均数 算术平均数 Arithmeticaverage 几何平均数 GeometricMean 调和平均数 定义 一组n个观测值x1 x2 xn的算术平均数 定义为 1 算术平均数 Arithmeticaverage 如果资料已经分组 组数为k 用x1 x2 xk表示各组中点 f1 f2 fk表示相应的频数 那么 1 算术平均数 Arithmeticaverage 表3 1某校125位大学一年级新生体重表 1 算术平均数 Arithmeticaverage 其平均体重 55 592 1 算术平均数 Arithmeticaverage 1 算术平均数 Arithmeticaverage 在数据为环比类型的问题中 算术平均数是不适用的 例如下表是天津市工业总产值在 十五 期间的逐年增长率 如求该期间平均增长率 算术平均数是不恰当的 几何平均数可以解决这个问题 2 几何平均数 GeometricMean 表3 2天津市工业总产值 天津市2005统计年鉴 2 几何平均数 GeometricMean 定义 一组n个数据的几何平均数定义为 2 几何平均数 GeometricMean 当数据是相对变化率 求平均数时 算术平均数也不恰当 例如 甲乙两地相距120公里 某人乘车往返甲乙两地之间 去时速度每小时20公里 回来时速度为每小时30公里 若求平均速度 这时用算术平均数是不对的 但调和平均数可解决此类问题 3 调和平均数 在上例中 公里 小时 定义 一组n个数据的调和平均数H 由下式定义 3 调和平均数 算术平均数表示了集中位置特征 它照顾到每一个值 但它不见得是出现次数最多的值 甚至也可能不是观测值中的一个 所以有必要研究表示集中位置的其它的特征数 3 1 2众数 Mode 定义 对于有频数分布的变量 它的众数指频数最大的变量的值 表3 3频数分布表 对于已分组且等组距的频数分布 根据最大频数 可求得众数所在组 根据众数定义 可知众数不唯一 3 1 2众数 Mode 算术平均数作为集中位置的特征还有一缺点 就是受观测值中极端值的影响很大 而一组观测值中的极端值常常没有代表性 中位数将避免这种影响 3 1 3中位数 Median 一组n个观测值按数值大小排列 处于中央位置的值称为中位数以表示 当n为奇数 当n为偶数 定义 即 3 1 3中位数 Median 第25百分位数又称第一个四分位数 FirstQuartile 用Q1表示 第50百分位数又称第二个四分位数 SecondQuartile 用Q2表示 第75百分位数又称第三个四分位数 ThirdQuartile 用Q3表示 中位数是第50百分位数 一组n个观测值按数值大小排列如x1 x2 x3 x4 处于p 位置的值称第p百分位数 定义 3 1 4百分位数 Percentile 如何计算百分位数 3 2表示变异 分散 程度的特征数 定义其中xmax和xmin分别为数据中的极大值和极小值 3 2 1极差 或称全距Range R 对于已分组的频数分布 组数为k 定义 平均差M D 是离差的绝对值的平均数 即 3 2 2平均差 MeanAbsoluteDeviation 方差 样本 对于已分组的频数分布 组数为k 总体 样本 总体 3 2 3方差 Variance 标准差 StandardDeviation 标准差 样本标准差 总体标准差 样本标准差 总体标准差 对于已分组的频数分布 组数为k 标准差的单位与X的单位相同 3 2 3方差 Variance 标准差 StandardDeviation 定义变异系数C 是一个无量纲的量 它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况 例如比较大学生身高与小学生身高 或比较130名大学生身高和体重哪个变化波动范围比较大时 都可用变异系数 3 2 4变异系数 CoefficientofVariation 定义变异系数C 是一个无量纲的量 它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况 例如比较大学生身高与小学生身高 或比较130名大学生身高和体重哪个变化波动范围比较大时 都可用变异系数 3 3表示偏倚情况或程度的特征数 3 3 1比较众数 中位数和算术平均数的相对位置 下图列举出了对称的 具有左偏态 负偏态 和右偏态 正偏态 的频数分布的例子 注意到它们的特点是 对称的分布的众数 中位数和算术平均数相同 具有偏倚性的分布 算术平均数突出在外 偏向分布的尾端 而中位数则介于众数与算术平均数之间 偏倚性是表示各观测值分布不对称情况或程度的 3 3表示偏倚情况或程度的特征数 图3 1 3 3 1比较众数 中位数和算术平均数的相对位置 Me Mo Me Mo Me Mo 可以看出 对于单峰的分布 对称态 左偏态 右偏态 3 3 1比较众数 中位数和算术平均数的相对位置 1 Pearson偏倚系数 Pearson 分布对称 则k 0 左偏态 则k 0 右偏态 则k 0 3 3 2定量地描述偏倚性 常用的两个公式 2 用标准化的三阶矩阵g表示 3 3 2定量地描述偏倚性 常用的两个公式 3 4五数概括法 首先将数据按递增顺序排列 然后很容易就能确定最小值 3个四分位数和最大值了 对12个月薪数据的样本 按照递增顺序排列如下 221022552350 238023802390 242024402450 255026302825Q1 2365Q2 2405Q3 2500上述起薪数据以五数概括为 2210 2365 2405 2500 2825 3 4五数概括法 盒形图实际上是以图形来概括数据 我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3 此外还将用到四分位数间距IQR Q3 Q1 盒形图的画法步骤如下 1 画一个方盒 其边界恰好是第1和第3四分位数 对于上述的起薪数据 Q1 2365 Q3 2500 这个方盒包含了中间的50 的数据 2 在方盒上中位数的位置画一条垂线 对起薪数据 中位数为2405 因此中位数将数据分为相等的两个部分 3 5盒形图 3 利用四分位数间距IQR Q3 Q1 来设定界限 盒形图的界限定于低于Q1以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论