




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3-1,分布数量特征的统计描述,第一节分布的平均水平、集中趋势和位置的度量第二节分布离散程度的度量第三节分布的偏度和峰度,3-2,统计资料经过加工整理形成分布数列后,我们对它的变化规律已有了一个直观的了解。然而,要作进一步的统计分析仅靠这些直观了解是远远不够的,我们还需要寻找一些能充分度量统计分布数量特征的统计指标,以便对不同的研究对象进行分析研究。对统计资料的度量包括:集中趋势的度量(平均指标);离中趋势的度量(变异指标)。,3-3,第一节统计平均数众数中位数,一、统计平均数的含义与作用(一)含义:也称平均指标,是用来表示社会经济现象总体各单位某一标志在一定时间、地点条件下所达到的一般水平(二)作用反映总体各单位变量分布的一般水平和集中趋势比较同类现象在不同单位的发展水平比较同类现象在不同时期的发展变化趋势或规律(三)分类,3-4,静态平均数同一时间不同单位的数据的平均反映现象总体在一定历史条件下的一般水平,动态平均数不同时间同一总体的数据的平均反映现象在发展阶段上的一般水平,3-5,5,3-6,二、算术平均数,1.算术平均数:总体单位的标志值总量除以总体单位数所得的结果。基本公式:例:平均工资=工资总额职工人数单位成本=总成本产量,3-7,2.计算方法,由于所掌握资料的数据不同,有(1)简单算术平均数。简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以总体单位数而得。计算公式:,3-8,简单算术平均数资料未分组时,6名学生的考试成绩分别为(分)79、82、87、60、95、91,他们的平均成绩是多少?(79+82+97+60+60+95+91)/6=84(分),3-9,(2)加权算术平均数适合于分组资料,1、单项式数列A.加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式:fi为各组标志值出现的次数。,3-10,3-11,不符合基本公式,总体单位总量不是5个工人,而是800个工人;工人人总产量(总体标志总量)不是60件,而是9710件,所以,应该这样计算:,可以这样计算吗?,不能!,3-12,3-13,B.权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=fn时:加权算术平均数就等于简单算术平均数。,3-14,2.是非标志的平均数,在总体中,具有某种性质的单位占总体的比率为p,不具有该种性质的单位占总体的比率为q,以1作为具有某种性质的单位的标志值,以0作为不具有该种性质的单位的标志值:p也称为总体中具有某种属性的单位成数,是非标志的平均数。,3-15,3、组距式数列计算算术平均数,x各组的组中值(代表组平均水平)假定条件:组内均匀分布或对称分布一般地,计算结果是近似值。,3-16,16,3-17,原来只是用组中值作为各组的代表值,3-18,4.算术平均数的数学性质,(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:,3-19,(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:,3-20,(3)各标志值与算术平均数离差的平方和为最小值。,3-21,三调和平均数,1.简单调和平均数:标志值的倒数的算术平均数的倒数。,3-22,2.加权调和平均数,计算公式:在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:,3-23,当各组标志总量相等,m1=m2=mn时,加权调和平均数可化简成为简单调和平均数形式。,3-24,3-25,某供销社分三批收购某种农副产品,其收购单价及各批收购额如下:,3-26,解:,3-27,某公司下属18个企业的计划完成情况(1),3-28,3-29,某公司下属18个企业的计划完成情况(2),3-30,18个企业的平均计划完成百分比:,3-31,四、几何平均数,1.几何平均数:是n项标志值连乘积的n次方根。2.分类:(1)简单几何平均数:是n个标志值xi连乘积的n次方根。计算公式为:G=式中G表示几何平均数,xi表示各项标志值。,3-32,(2)加权几何平均数,加权几何平均数是各标志值fi次方的连乘积的次方根,计算公式为:G=,3-33,例:某流水生产线有前后衔接的五道工序。某日各工序产品的不合格率分别为5%、3%、1%、5%、2%,整个流水线上产品的平均废品率?,平均废品率1平均合格率196.793.21,3-34,某金融机够以复利方式计息。近12年来的年利率有4年为3%、2年为5%、2年为8%、3年为10%、1年为15%。则12年的平均年利率?,平均年利率=106.82%-1=6.82,加权几何平均数,加权几何平均法,3-35,五、众数Mo,1.定义:众数是指社会现象总体中最普遍出现的标志值。集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数可以用于定类数据,也可用于定序数据和数值型数据,3-36,2.众数的确定,3-37,由品质数列(定类数据)确定众数,解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即Mo商品广告,3-38,由品质数列(定序数据)确定众数,频率最大的组是“高中”,占52,因此,M0高中,3-39,单项式数列确定众数,M0=12,3-40,4.组距式数列确定众数的公式,下限公式:上限公式:,3-41,(分),众数的近似公式,众数所在组的下限;众数所在组的次数与其前一组的次数之差;众数所在的次数与其后一组的次数之差;,众数组的组距。,3-42,3.众数的几何意义,3-43,六、中位数,1.定义:中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值,在总体中,标志值小于中位数的单位占一半;标志值大于中位数的单位也占一半。,3-44,2.中位数的确定,1)未分组资料确定中位数。将总体各单位的标志值按照大小顺序排列,当总体单位数n为奇数时:当总体单位数n为偶数时,:,3-45,例,原始数据:8482818680排序:8081828486位置:12345,中位数Me82,3-46,原始数据:848281868090排序:808182848690位置:123456,中位数Me83,中位数位置,n+1,3.5,2,2,6+1,3-47,2)单项式分组资料确定中位数,当为奇数时:,当为偶数时,3-48,3)组距式分组资料确定中位数,下限公式:上限公式:,3-49,某公司职工按月工资分组,3-50,(元),3-51,测度数据在特定位置上的水平,还可计算四分位数、十分位数和百分位数。与中位数计算原理相类似,它们是将数据由小到大排序后,分别位于全部数据1/4、1/10和1/100位置上的数值。实际上,中位数也就是第二个四分位数、第五个十分位数、第五十个百分位数。,P是想要得到的那个分位数,n是数据的项数,是多少分位数。,3.其他分位数,3-52,四分位数四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。很显然,第二个四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值(下四分位数Q1)和处在75%位置上的数值(上四分位数Q3)。与中位数的计算方法类似,根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置。,3-53,中位数、众数和算术平均数的关系:中位数、众数和算术平均数之间的数量关系决定于总体内次数分配的状况。对称钟形分布情形下:非对称左偏分布情形下:非对称右偏分布情形下:,3-54,众数、中位数和均值的关系图,3-55,英国著名的统计学家皮尔生(K.Pearson)提出了一个经验公式:在数据分布呈轻微偏态时,算术平均数和众数、中位数三者之间存在如下的近似关系:,3-56,第三节分布离散程度的度量,一、变异指标的含义与作用1.定义:变异指标反映总体内部的离中趋势或变异状况。变异指标值越大,表明总体各单位标志的变异程度越大。2.作用:(1)衡量平均指标的代表性。(2)反映社会经济活动的均衡性。(3)研究总体标志值分布偏离正态的情况。(4)资产风险的度量(5)进行抽样推断等统计分析的一个基本指标。,3-57,二、极差与四分位差,1、极差(Range):1)极差也称全距,它是统计总体中两个极端标志值之差,表明总体中标志值变动的范围。用R表示。2)计算公式:(未分组)(分组)式中:Umax代表最高组的上限;Lmin代表最低组的下限。3)特点:计算简便,直观易于理解;易受极端值的影响,3-58,2、四分位差(QuartileDeviation)1)计算公式:数列的3/4位次与1/4位次的标志值之差除以2。用QD表示。2)特点:四分位差避免了数列中极端值的影响,但去头弃尾,丢失大量的原始数据。,3-59,三、平均差(AverageDeviation),1、定义:平均绝对偏差,总体所有单位的标志值与其算术平均数的离差绝对值的算术平均数。用表示2、计算公式:3、特点:概括地反映了所有单位标志值的变异程度,但因取绝对值,数学性质不理想,实际中较少用。,3-60,某班学生考试成绩表平均差计算表,3-61,四、方差与标准差,(一)方差与标准差1、方差:总体各单位标志值与其算术平均数离差平方的算术平均数。方差的平方根称为标准差。未分组的资料:方差:标准差:,3-62,用分组资料计算加权平均法,方差:标准差,3-63,某班学生考试成绩表标准差计算表,3-64,(二)是非标志的方差与标准差,3-65,五、变异系数,一群牛的平均体重是180公斤,标准差是18公斤;一群羊的平均体重是15公斤,标准差是3公斤。能不能说羊的平均体重的代表性高些?为什么?,3-66,1、变异系数:变异系数也称离散系数,是各变异指标与其算术平均数的比值。极差系数:极差与其平均数的比值。标准差系数:标准差与其平均数的比值。2、作用:消除现象由于不同计量单位、不同平均水平所产生的影响。,3-67,六、箱线图在统计描述中的运用,箱线图,也称盒须图,由一个箱子(或盒子)和两条线段组成。中位数的位置表明了水平的高低箱体的大小说明了分布的集中状况箱线的长短说明了极大值与极小值的差异情况例3-21,3-68,第三节分布的偏度和峰度,一、统计动差1、统计动差:也称为距,反映分布偏斜或离散程度的指标。2、原点动差:变量x关于原点的k阶距,一般形式:(未分组)(分组)k=1时,即1阶的原点动差就是算术平均数。k=2时,即2阶的原点动差就是平方平均数。,3-69,3、中心动差:,变量x关于分布中心
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 晕血急救的护理措施
- 有创血压监测流程及护理
- 2025年Z世代消费偏好研究新消费品牌市场细分领域增长动力分析报告
- 人工智能赋能下的医疗器械诊断设备2025年技术创新与产业布局深度报告
- 工业互联网平台与AR交互技术在产品展示与营销中的应用报告
- 常用机床电气检修(第二版)课件:Z3040 型摇臂钻床电气检修
- 产业经济学(第3版)课件-经济全球化与产业组织变化
- 镇静催眠药中毒的急救护理
- 烟雾病术后患者的护理
- 膝关节的健康教育
- 《鼹鼠的月亮河》阅读测试题及答案
- 种植体修复前脱落率改进目标核心策略落实要点
- 医学生青年红色筑梦之旅项目计划书
- 金融学科研究新高度:黄达《金融学》2025课件解读
- 辽宁省沈阳市2025年高中三年级教学质量监测(一)地理试题(含答案)
- 2025年东莞市长安镇事业单位招考工作人员高频重点提升(共500题)附带答案详解
- 钢箱梁加工制作及安装方案
- 铁路货物运价规则
- 2024版园林景观工程建设项目招投标代理合同3篇
- 2024-2025学年上学期上海六年级英语期末复习卷3
- 十四五人才发展规划
评论
0/150
提交评论