




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
表示统计资料的特征数有哪些? 几何平均数与调和平均数各适合于什么情况? 计算样本方差与总体方差公式有何区别?,3.1 表示集中位置的特征数,3.1.1 平均数,算术平均数(Arithmetic average),几何平均数(Geometric Mean),调和平均数,定义: 一组n个观测值x1,x2 ,,xn的算术平均数,定义为,(1)算术平均数(Arithmetic average),如果资料已经分组,组数为k,用x1,x2 ,,xk 表示各组中点,f1,f2,fk 表示相应的频数,那么,(1)算术平均数(Arithmetic average),表3-1 某校125位大学一年级新生体重表,(1)算术平均数(Arithmetic average),其平均体重:,=, 55.592,(1)算术平均数(Arithmetic average),(1)算术平均数(Arithmetic average),在数据为环比类型的问题中,算术平均数是不适用的。例如下表是天津市工业总产值在“十五”期间的逐年增长率,如求该期间平均增长率,算术平均数是不恰当的。几何平均数可以解决这个问题。,(2)几何平均数(Geometric Mean),表3-2 天津市工业总产值,(天津市2005统计年鉴),(2)几何平均数(Geometric Mean),定义: 一组n个数据的几何平均数定义为,(2)几何平均数(Geometric Mean),当数据是相对变化率,求平均数时,算术平均数也不恰当。 例如:甲乙两地相距120公里,某人乘车往返甲乙两地之间,去时速度每小时20公里,回来时速度为每小时30公里,若求平均速度,这时用算术平均数是不对的,但调和平均数可解决此类问题。,(3)调和平均数,在上例中,,(公里/小时),定义:,一组n个数据的调和平均数H,由下式定义,(3)调和平均数,算术平均数表示了集中位置特征,它照顾到每一个值,但它不见得是出现次数最多的值(甚至也可能不是观测值中的一个)。所以有必要研究表示集中位置的其它的特征数。,3.1.2众数(Mode),定义:对于有频数分布的变量,它的众数指频数最大的变量的值,表3-3 频数分布表,对于已分组且等组距的频数分布,根据最大频数,可求得众数所在组。根据众数定义,可知众数不唯一。,3.1.2众数(Mode),算术平均数作为集中位置的特征还有一缺点,就是受观测值中极端值的影响很大,而一组观测值中的极端值常常没有代表性。中位数将避免这种影响。,3.1.3 中位数(Median),一组n个观测值按数值大小排列,处于中央位置的值称为中位数以 表示,,,当n为奇数,,当n为偶数,定义:,即,3.1.3 中位数(Median),第25百分位数又称第一个四分位数(First Quartile) ,用Q1 表示;第50百分位数又称第二个四分位数 (Second Quartile),用Q2表示;第75百分位数 又称第三个四分位数(Third Quartile),用Q3表示。,中位数是第50百分位数,一组n个观测值按数值大小排列如x1,x2,x3,x4 处于p%位置的值称第p百分位数。,定义:,3.1.4 百分位数( Percentile),如何计算百分位数,3.2 表示变异(分散)程度的特征数,定义 其中xmax和xmin分别为数据中的极大值和极小值。,3.2.1极差(或称全距 Range)R,对于已分组的频数分布(组数为k),定义,平均差M.D.是离差的绝对值的平均数,即,3.2.2 平均差(Mean Absolute Deviation),方差,样本,对于已分组的频数分布(组数为k),总体,样本,总体,3.2.3 方差(Variance),标准差(Standard Deviation),标准差,样本标准差,总体标准差,样本标准差,总体标准差,对于已分组的频数分布(组数为k),标准差的单位与X的单位相同。,3.2.3 方差(Variance),标准差(Standard Deviation),定义 变异系数C,是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。,3.2.4变异系数(Coefficient of Variation),定义 变异系数C,是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。,3.3 表示偏倚情况或程度的特征数,3.3.1比较众数、中位数和算术平均数的相对位置,下图列举出了对称的、具有左偏态(负偏态)和右偏态(正偏态)的频数分布的例子。注意到它们的特点是:,对称的分布的众数、中位数和算术平均数相同;,具有偏倚性的分布,算术平均数突出在外,偏向分布的尾端,而中位数则介于众数与算术平均数之间。,偏倚性是表示各观测值分布不对称情况或程度的。,3.3 表示偏倚情况或程度的特征数,图3-1,3.3.1比较众数、中位数和算术平均数的相对位置,MeMo,MeMo,=Me=Mo,可以看出,对于单峰的分布,,对称态:,左偏态:,右偏态:,3.3.1比较众数、中位数和算术平均数的相对位置,(1)Pearson偏倚系数,Pearson,分布对称,则k=0,左偏态,则k0,右偏态,则k0,3.3.2 定量地描述偏倚性,常用的两个公式,(2)用标准化的三阶矩阵g表示,3.3.2 定量地描述偏倚性,常用的两个公式,3.4 五数概括法,首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了。对12个月薪数据的样本,按照递增顺序排列如下: 2210 2255 2350 | 2380 2380 2390 | 2420 2440 2450 | 2550 2630 2825 Q12365 Q22405 Q32500 上述起薪数据以五数概括为:2210,2365,2405,2500,2825。,3.4 五数概括法,盒形图实际上是以图形来概括数据。我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3。此外还将用到四分位数间距IQRQ3Q1 。 盒形图的画法步骤如下: (1)画一个方盒,其边界恰好是第1和第3四分位数。对于上述的起薪数据, Q12365, Q32500。 这个方盒包含了中间的50的数据。 (2)在方盒上中位数的位置画一条垂线(对起薪数据,中位数为2405)。因此中位数将数据分为相等的两个部分。,3.5 盒形图,(3)利用四分位数间距IQR=Q3Q1,来设定界限。盒形图的界限定于低于Q1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 外资企业中国雇员培训与发展协议
- 高端游艇码头泊位使用及船舶代购服务合同
- 海外投资风险管理与审计合作协议
- 果园采摘机器人租赁与农资供应综合服务合同
- 国际商标注册及市场拓展代理合作协议
- 《美术教学之道》课件
- 《建筑工程合同管理与结算课件》
- 美容院卫生培训大纲
- 《光开关技术》课件
- 空乘礼仪握手课程规范
- 政务新媒体管理培训
- 2024年湖北省武汉市中考英语真题(含解析)
- 2024年国家公务员考试《行测》真题卷(副省级)答案及解析
- 家长写孩子在家学习情况的发言稿
- 北京市《配电室安全管理规范》(DB11T 527-2021)地方标准
- 《拟行路难(其四)》课件+2023-2024学年统编版高中语文选择性必修下册
- 2024年关于员工劳动合同参考模板(三篇)
- 2024年社区意识形态工作计划
- 麻醉科医师晋升副主任医师病例分析专题报告三篇
- HG∕T 3714-2014 耐油输送带 国标
- 北师大版八年级数学下册常考题专练专题09与旋转有关的最值问题(原卷版+解析)
评论
0/150
提交评论