已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章 统计数据分布特征的描述,分布集中趋势的测度平均指标分布离散程度的测度标志变异指标分布偏态与峰度的测度,教学目的与任务,1.掌握均值(算术平均数)的数学性质、计算方法与运用; 2.掌握标准差的概念、数学性质、计算方法及运用; 3.了解众数的特点、确定方法以及运用条件; 4.了解中位数的特点与确定方法; 5.正确理解平均指标的应用原则。,一、分布集中趋势的测度平均指标,(一)众数1.概念众数是指总体中出现次数最多的标志值(变量值),用符号Mo来表示。2.众数的确定未分组数据及单项式变量数列众数的确定根据未分组数据或单项式数列计算众数时,只需要找出出现次数最多的变量值即可。 如,某百货商店在女式旅游鞋销售中,23码的鞋销售量最多,则众数为23码。,【例4-1】 根据某班学生年龄分组资料(表4-1),求年龄众数。 表4-1 某班学生年龄分组表,经观察发现,20岁的学生人数最多,因此众数为20岁。,组距式变量数列众数的确定,式中,U表示众数组的上限;L表示众数组的下限;f0表示众数组的次数;f-1表示众数组前一组的次数;f+1表示众数组后一组的次数。,表42 某地区年人均纯收入资料,经观察,可知变量值600700元这一组出现的频数最多,为1070户,即众数组为变量数列的第三组。则利用上限公式得(用下限公式也可):,由计算结果可知,众数为645.63元。,3.众数的特点和应用场合众数属于位置平均数,不受极端值的影响; 当变量数列为均匀分布、U型分布、J型分布时,不存在众数; 众数缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。,(二)中位数1.概念将总体中各单位标志值按大小顺序排列,居中间的那个标志值(变量值)即为中位数,用Me来表示。 2.中位数的确定 未分组资料中位数的确定 在资料未分组的情况下,先将变量值按从小到大的顺序排列,然后根据研究数列项数的奇偶,用相应的公式来确定中位数。,当n为偶数时,当n为奇数时,【例4-3】 某工厂某班组11名工人生产产品零件数按大小顺序排列,见下表:,中位数的位置=(n+1)/2=(11+1)/2=6,则中位数为第6号位置的零件数,即Me=X6=22(件),若项数为偶数,现在上例加上12号工人,其生产零件为31件,则中位数应该为:,变量数列中位数的确定 对于单项式数列,确定中位数首先要将变量数列的频数或频率进行累计,然后用公式来计算中位数的项次,确定中位数组,找到中位数所在的位置,最后确定中位数。,【例4-4】某单位职工家庭按人口数多少分组资料如表4-4。表4-4 某单位职工家庭人口数分布表,计算累计频数 利用公式 确定出中位数的项次: 通过观察,找到中位数:从向上累计频数中可以看到,从第109户家庭到288户家庭都包含在了第三组,由此可判断出,第180户人家也应在第三组里,而第180户家庭对应的人口数为3人,故中位数Me=3(人),式中,U表示中位数组的上限;L 表示中位数组的下限;fm表示中位数组的频数;sm-1表示向上累计时中位数组前一组的累计频数;sm+1表示向下累计时中位数组后一组的累计频数。,【例4-5】 某市1993年城市住户抽样调查资料如表4-5所示。计算该城市住户家庭月收入的中位数。,计算累计频数 利用公式 确定出中位数的项次:通过观察,找到中位数组:从向上累计频数中可以看到,从第241户家庭到345户家庭都包含在了第四组,由此可判断出,第250户人家也应在第四组里。利用公式求得中位数近似值(以上限公式为例),3.中位数的特点及应用场合中位数属于位置平均数,不受极端值的影响。有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。缺乏敏感性。,(三)算术平均数1.概念也叫均值,是集中趋势测度中最重要的一种。 2.算术平均数的计算简单算术平均数根据未经分组整理的原始数据计算的均值。设一组数据为x1,x2,.xn,则简单算术平均数的计算公式如下:,【例4-6】据南方人才服务中心调查,从事IT行业的从业人员年薪在40 000-55 000元之间,表4-6的数据是IT从业人员年薪的一个样本:,计算IT从业人员的平均年薪。,根据公式计算如下:,加权算术平均数根据分组整理的数据计算的算术平均数。其计算公式为:,式中:f 代表各组变量值出现的频数。,【例4-7】 以表4-7为例,计算人均日产量。,平均日产量 =,返回,3.算术平均数的特点运算简单,而且运算方法与大量的社会经济过程相适应,因此是平均数中使用最为广泛的一种。容易受到极端值的影响,而且受极大值的影响大于受极小值的影响,因此当变量数列中出现极端值时,算术平均数的代表性就差。当根据组距式变量数列计算算术平均数时,由于组中值的使用,使算术平均数的代表性受到影响。,4.算术平均数的数学性质各变量值与其算术平均数的离差之和等于零,即,各变量值与其算术平均数的离差平方和为最小值,即,两个独立的同性质变量代数和的平均数等于各变量平均数的代数和。即,两个独立的同性质变量乘积的平均数等于各个变量平均数的乘积。即,(四)调和平均数1.概念调和平均数,又称倒数平均数。因为它是各个变量值倒数的算术平均数的倒数。用 来表示。2.调和平均数的计算简单调和平均数 资料未分组的条件下,各变量值倒数的简单算术平均数的倒数,其计算公式为:,【例4-9】 在市场上购买某种商品,甲级为每斤3元,乙级为每斤2元,丙级为每斤1元。现各买一斤时,该商品的平均价格为多少?现三个等级各买1元,则平均价格为多少?解:很显然,若各买1斤,则该商品的平均价格可由简单算术平均数公式来计算:,若三个等级各买1元,平均价格又是多少呢?此时作为计算平均指标基础的总体单位数不是3斤,而是1.83斤(即 ),要计算这1.83斤的平均价格,则应采用调和平均数形式来计算:,加权调和平均数在资料已分组的条件下,可用加权调和平均数公式,其计算公式为:,【例4-10】 现以某机械厂的有关资料,见表4-9,来说明加权调和平均数的应用。,3.调和平均数的特点实际中调和平均数直接运用的比较少,大多数是将其作为算术平均数的变形公式来使用;调和平均数也容易受到极端值的影响,与算术平均数不同的是调和平均数受极小值的影响大于受极大值的影响; 根据组距式变量数列计算调和平均数时,由于组中值的使用,使平均数带有较大的假定性。,(五)几何平均数1.概念n个变量值连乘积的n次方根,是计算平均比率和平均速度时比较适用的一种方法,通常用 来表示。2.几何平均数的计算 简单几何平均数设有n个变量值则简单几何平均数的计算公式为:,【例4-11】 某企业生产某种产品要经过三个连续作业车间才能完成。若某月份第一车间粗加工产品的合格率为95%,第二车间精加工产品的合格率为93%,第三车间最后装配的合格率为90%,则该产品的企业合格率(即三个车间的平均合格率)为多少?,加权几何平均数当各个变量值出现的次数不相同时,计算几何平均数就采用加权形式。加权几何平均数的公式为:,【例4-12】 投资银行某笔投资的年利率是按复利计算的,若将过去25年的年利率资料整理为如表410所示的变量数列,求25年的平均年利率。表410,解:计算平均年利率,必须先将各年的利率加上100%,换算为各年的本利率,然后在应用几何平均数的方法。平均年本利率为:,则25年的平均年利率为8.48%。,3.几何平均数的特点及应用场合 主要适用于计算平均比率或平均速度,应用范围比较窄; 同算术平均数、调和平均数相比受极端值的影响比较小; 当变量数列中的变量值为零或负数时,几何平均数无法计算或失去意义。,返回,(一)极差1.概念极差,又称全距。它是总体各单位标志的最大值与最小值之差。用R来表示。2.极差的计算未分组资料按照大小顺序排列起来,组成一个数据数列,则最大值与最小值分别处于数列的两极,两极之差便是全距。,二、分布离散程度的测度标志变异指标,【例4-14】求表4-11中机电设备公司某种物资各位月销售额的极差。,解:该机电公司某种物资该年年内各月销售额的极差是,单项式数列,则极差为最高组的变量值减去最低组的变量值。公式为:,组距式数列,则极差为最高组的组中值减去最低组的组中值。公式为:R=最高组的组中值-最低组的组中值,分组资料(变量数列),(二)方差和标准差1.概念方差是总体各单位变量值与其算术平均数的离差平方的算术平均数,用符号s 2表示。它反映数列中各单位标志值的平均差异程度。 标准差又称均方差,是总体各单位标志值与其平均数离差平方的算术平均数的平方根,一般用s表示。它反映各标志值对平均指标的平均离差。,2.方差和标准差的计算简单算式资料未分组的情况下,各标志值出现的次数相同 ,计算方差和标准差采用简单平均的方法。其计算公式分别为:,其中, 表示离差平方和;n表示总体单位数,【例4-16】现以甲乙两组工资资料为例,见表4-13,求方差及标准差。,解:,加权算式在资料已分组的情况下,其计算公式为:,对于组距式分组,可以用组中值来代表其变量值。例: 【例4-7】,(三)离散系数1.概念离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,其计算公式为:,2.作用离散系数用于对不同组别数据的离散程度进行比较,离散系数大,说明该组数据的离散程度大;离散系数小,说明该组数据的离散程度小。【例4-18】 某管理局抽查了所属的8家企业,其产品销售数据如下页表4-14所示。试比较产品销售额与销售利润的离散程度。,表4-14 某管理局所属8家企业产品销售数据,解:由于销售额与利润额的数据水平不同,不能直接用标准差进行比较,需要计算离散系数。由表中数据计算得:,计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度。,返回,(一)分布偏态的测度 偏态是对分布偏斜方向和程度的测度。统计分析中测定偏态系数的方法很多,一般采用动差概念计算,其计算公式为三阶中心动差与标准差的三次方之比。具体公式如下:偏态系数的数值,一般在-30、0-+3之间。偏态系数为0,表示对称分布;为负表示负(左)偏分布;为正,表示正(右)偏分布。偏态系数的绝对值,越接近0,分布的偏斜度越小;越接近3,偏斜度越大。,三、分布偏态与峰度的测度,【例4-19】 某管理局所属30个企业2004年8月份利润额统计资料如表4-15所示,要求计算该变量数列的偏斜状况。 表4-15 利润分布偏态与峰度系数计算表,计算结果表明该管理局所属企业利润额的分布状况呈轻微负偏分布。,(二)分布峰度的测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026国网内蒙古电力公司高校毕业生提前批招聘笔试参考题库浓缩500题附答案详解(b卷)
- 2026届国家管网集团高校毕业生招聘笔试模拟试题(浓缩500题)及一套完整答案详解
- 2026国网贵州省电力公司高校毕业生提前批招聘笔试模拟试题浓缩500题含答案详解(综合题)
- 2026国家管网集团高校毕业生招聘考试备考试题(浓缩500题)带答案详解(黄金题型)
- 2026国网海南省电力公司高校毕业生提前批招聘笔试参考题库浓缩500题含答案详解(精练)
- 2025国网贵州省电力公司高校毕业生提前批招聘笔试模拟试题浓缩500题含答案详解(a卷)
- 2025国网江西省电力公司高校毕业生提前批招聘笔试模拟试题浓缩500题含答案详解(预热题)
- 2026秋季国家管网集团福建公司高校毕业生招聘考试备考试题(浓缩500题)及参考答案详解(研优卷)
- 2026秋季国家管网集团西北公司高校毕业生招聘考试备考题库(浓缩500题)附参考答案详解(夺分金卷)
- 2026国网辽宁省电力公司高校毕业生提前批招聘(约450人)笔试备考题库浓缩500题附答案详解(黄金题型)
- 肺结核诊疗全解析
- 2025至2030乙烯丙烯酸共聚物(EAA)行业产业运行态势及投资规划深度研究报告
- 国务院部署实施“人工智能+”行动的意见解读
- 放射影像检查不良伪影课件
- GB/T 18495-2025电阻焊设备变压器与焊钳一体式的变压器
- 医院ICU质控管理标准操作手册
- 政府专职消防员文员参考试题(附答案)
- 2025至2030中国汽车工程服务外包(ESO)行业现状调查与前景趋势研究报告
- 全科医学转岗培训
- 初中数学课程标准7-9年级细则解读
- 脑血管病所致精神障碍的治疗及护理
评论
0/150
提交评论