




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,表示统计资料的特征数有哪些?几何平均数与调和平均数各适合于什么情况?计算样本方差与总体方差公式有何区别?,.,2,3.1表示集中位置的特征数,3.1.1平均数,算术平均数(Arithmeticaverage),几何平均数(GeometricMean),调和平均数,.,3,定义:一组n个观测值x1,x2,,xn的算术平均数,定义为,(1)算术平均数(Arithmeticaverage),.,4,如果资料已经分组,组数为k,用x1,x2,,xk表示各组中点,f1,f2,fk表示相应的频数,那么,(1)算术平均数(Arithmeticaverage),.,5,表3-1某校125位大学一年级新生体重表,(1)算术平均数(Arithmeticaverage),.,6,其平均体重:,=,55.592,(1)算术平均数(Arithmeticaverage),.,7,(1)算术平均数(Arithmeticaverage),.,8,在数据为环比类型的问题中,算术平均数是不适用的。例如下表是天津市工业总产值在“十五”期间的逐年增长率,如求该期间平均增长率,算术平均数是不恰当的。几何平均数可以解决这个问题。,(2)几何平均数(GeometricMean),.,9,表3-2天津市工业总产值,(天津市2005统计年鉴),(2)几何平均数(GeometricMean),.,10,定义:一组n个数据的几何平均数定义为,(2)几何平均数(GeometricMean),.,11,当数据是相对变化率,求平均数时,算术平均数也不恰当。例如:甲乙两地相距120公里,某人乘车往返甲乙两地之间,去时速度每小时20公里,回来时速度为每小时30公里,若求平均速度,这时用算术平均数是不对的,但调和平均数可解决此类问题。,(3)调和平均数,.,12,在上例中,,(公里/小时),定义:,一组n个数据的调和平均数H,由下式定义,(3)调和平均数,.,13,算术平均数表示了集中位置特征,它照顾到每一个值,但它不见得是出现次数最多的值(甚至也可能不是观测值中的一个)。所以有必要研究表示集中位置的其它的特征数。,3.1.2众数(Mode),.,14,定义:对于有频数分布的变量,它的众数指频数最大的变量的值,表3-3频数分布表,对于已分组且等组距的频数分布,根据最大频数,可求得众数所在组。根据众数定义,可知众数不唯一。,3.1.2众数(Mode),.,15,算术平均数作为集中位置的特征还有一缺点,就是受观测值中极端值的影响很大,而一组观测值中的极端值常常没有代表性。中位数将避免这种影响。,3.1.3中位数(Median),.,16,一组n个观测值按数值大小排列,处于中央位置的值称为中位数以表示,,,当n为奇数,,当n为偶数,定义:,即,3.1.3中位数(Median),.,17,第25百分位数又称第一个四分位数(FirstQuartile),用Q1表示;第50百分位数又称第二个四分位数(SecondQuartile),用Q2表示;第75百分位数又称第三个四分位数(ThirdQuartile),用Q3表示。,中位数是第50百分位数,一组n个观测值按数值大小排列如x1,x2,x3,x4处于p%位置的值称第p百分位数。,定义:,3.1.4百分位数(Percentile),.,18,如何计算百分位数,.,19,3.2表示变异(分散)程度的特征数,.,20,定义其中xmax和xmin分别为数据中的极大值和极小值。,3.2.1极差(或称全距Range)R,.,21,对于已分组的频数分布(组数为k),定义,平均差M.D.是离差的绝对值的平均数,即,3.2.2平均差(MeanAbsoluteDeviation),.,22,方差,样本,对于已分组的频数分布(组数为k),总体,样本,总体,3.2.3方差(Variance),标准差(StandardDeviation),.,23,标准差,样本标准差,总体标准差,样本标准差,总体标准差,对于已分组的频数分布(组数为k),标准差的单位与X的单位相同。,3.2.3方差(Variance),标准差(StandardDeviation),.,24,定义变异系数C,是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。,3.2.4变异系数(CoefficientofVariation),.,25,定义变异系数C,是一个无量纲的量。它适于用在比较有不同算术平均数或有不同量纲的两组数据的情况。例如比较大学生身高与小学生身高,或比较130名大学生身高和体重哪个变化波动范围比较大时,都可用变异系数。,3.3表示偏倚情况或程度的特征数,.,26,3.3.1比较众数、中位数和算术平均数的相对位置,下图列举出了对称的、具有左偏态(负偏态)和右偏态(正偏态)的频数分布的例子。注意到它们的特点是:,对称的分布的众数、中位数和算术平均数相同;,具有偏倚性的分布,算术平均数突出在外,偏向分布的尾端,而中位数则介于众数与算术平均数之间。,偏倚性是表示各观测值分布不对称情况或程度的。,3.3表示偏倚情况或程度的特征数,.,27,图3-1,3.3.1比较众数、中位数和算术平均数的相对位置,.,28,MeMo,MeMo,=Me=Mo,可以看出,对于单峰的分布,,对称态:,左偏态:,右偏态:,3.3.1比较众数、中位数和算术平均数的相对位置,.,29,(1)Pearson偏倚系数,Pearson,分布对称,则k=0,左偏态,则k0,3.3.2定量地描述偏倚性,常用的两个公式,.,30,(2)用标准化的三阶矩阵g表示,3.3.2定量地描述偏倚性,常用的两个公式,.,31,3.4五数概括法,.,32,首先将数据按递增顺序排列,然后很容易就能确定最小值、3个四分位数和最大值了。对12个月薪数据的样本,按照递增顺序排列如下:221022552350|238023802390|242024402450|255026302825Q12365Q22405Q32500上述起薪数据以五数概括为:2210,2365,2405,2500,2825。,3.4五数概括法,.,33,盒形图实际上是以图形来概括数据。我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3。此外还将用到四分位数间距IQRQ3Q1。盒形图的画法步骤如下:(1)画一个方盒,其边界恰好是第1和第3四分位数。对于上述的起薪数据,Q12365,Q32500。这个方盒包含了中间的50的数据。(2)在方盒上中位数的位置画一条垂线(对起薪数据,中位数为2405)。因此中位数将数据分为相等的两个部分。,3.5盒形图,.,34,(3)利用四分位数间距IQR=Q3Q1,来设定界限。盒形图的界限定于低
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南通通州三调数学试卷
- 2025-2030中国聚对苯二甲酸乙二醇酯(PET)行业运营动态与前景规划分析报告
- 医师聘用合同范本
- 房屋租赁行业合同范本
- 家庭采暖采购合同范本
- 韩国租房转租合同范本
- 你的语文和数学试卷
- 借款责任分担协议
- 全国初二数学试卷
- 葡萄大棚施工合同范本
- lpr利率管理办法
- 印刷装订车间管理办法
- 第三章 金融远期
- 课堂有效教学课件
- 规范诊疗培训课件
- 人教版七年级英语下册期末复习专练:短文填空(含答案解析)
- 2025年辅警面试考试试题库目(答案+解析)
- 湖南省长沙市岳麓实验中学2024-2025学年高一下学期6月月考数学试卷
- 初中教师师德培训课件
- 工业机器人讲课件
- 2025至2030中国燃料电池气体扩散层(GDL)行业发展趋势分析与未来投资战略咨询研究报告
评论
0/150
提交评论