版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章
数据分布特征的描述
国家统计局日前发布的报告称,与2012年的工资数据相比,2013年全国城镇单位在岗职工的年平均工资为52379元,比12年增加了4786元;日均工资200.69元,比12年增加了18.34元。
温家宝总理曾在一个记者招待会上说:“一个舰队决定它速度快慢的不是那个航行最快的船只,而是那个最慢的船只。”同样,决定全国城镇单位在岗职工工资整体发展速度的是广大低收入者的增长情况。
引入话题:别把平均指标看得过重!
目前,虽然中国居民工资性收入稳步增长,但收入差距的扩大,已成为工资分配中的突出问题。国家发改委官方网站公布行业最高与最低收入分配比重图:由96年1.76∶1扩大为11年4.48∶1。如果我们不注重行业间的收入差距过大问题,不采取措施弥补这种差距,而是任其扩大,一味追求平均指标的增长,那就无助于“整个社会的生活状况”的改善,因为一个舰队的速度,取决于那个最慢的船只。提问?以下是甲乙丙三家公司两周的普通股股票收盘价格作为投资者:甲乙丙三个公司哪个风险更小?
甲乙丙三家公司的平均股票价格是47元甲公司股票价格的标准差为2.61乙公司股票价格的标准差为3.97丙公司股票价格的标准差为6.32计算结果表明:甲种股票风险最小;丙种最大,乙种居中一、
变异指标的概念及作用二、
全距、分位差和平均差三、
标准差和标准差系数
【学习目标】掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。理解全距、四分位差和平均差的概念、计算公式和特点;了解偏度与峰度第三节变异指标1、离散趋势的涵义第六章变异指标一、变异指标的概念及作用指总体中各单位标志值偏离分布中心的规模或程度,用变异指标来反映。离散趋势反映总体内各变量值差异程度的指标称为变异指标变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大2、变异指标的作用衡量和比较平均数代表性的大小;帮助研究现象的稳定性和均衡性是进行质量控制的基础;是衡量风险程度的尺度。二、变异指标的种类以标志值之间相互比较说明变异情况
以平均数为比较标准来说明标志的变异情况
以正态分布为标准说明分配数列偏离情况的指标平均差标准差标准差系数方差峰度偏度全距四分位差指所研究的数据中,最大值与最小值之差,又称极差。一、全距最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限第六章变异指标【例】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则未分组数据第六章变异指标分组数据【例】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900缺点:①仅取决于两个极端值的水平,不能反映其间的变量分布情况;②受个别极端值的影响过于显著,不符合稳健性和耐抗性的要求。实际工作中,全距主要用于质量控制全距的特点及应用优点:计算方法简单、易懂;二、四分位差从变量数列中,剔除了一半极端值后计算的类似于全距的指标。上四分位数下四分位数三、平均差⑴简单平均差——适用于未分组资料是各个数据与其算术平均数的离差绝对值的算术平均数,用.表示。计算公式:总体算术平均数总体单位总数第个单位的变量值未分组资料【例】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。解:即该售货小组5个人销售额的平均差为93.6元。⑵加权平均差公式——适用于分组资料总体算术平均数第组变量值出现的次数第组的变量值或组中值三、平均差【例B】计算下表中某公司职工月工资的平均差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000解:即该公司职工月工资的平均差为138.95元。优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。平均差的特点⑴简单标准差——适用于未分组资料是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用来表示;标准差的平方又叫作方差,用来表示。4、标准差计算公式:总体单位总数第个单位的变量值总体算术平均数【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。解:⑵加权标准差——适用于分组资料总体算术平均数第组变量值出现的次数第组的变量值或组中值【例B】计算下表中某公司职工月工资的标准差。月工资(元)组中值(元)职工人数(人)300以下300~400400~500500~600600~700700~800800~900900以上2503504505506507508509502083143824563052377820合计—2000解:即该公司职工月工资的标准差为167.9元。第六章变异指标标准差的特点不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.是离散指标与相应的平均指标相比,是从相对数的角度来反应数据的离散程度5、离散系数主要的离散系数有标准差系数和四分位差系数等。可比离散系数指标身高的差异水平:cm体重的差异水平:kg用离散系数可以相互比较可比标准差系数用来对比不同水平的同类现象,或者是不同类现象总体平均数代表性的大小——标准差系数小的总体,其平均数的代表性大;反之,亦然。应用:【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。解:二班成绩的标准差系数为:因为,所以一班平均成绩的代表性比二班大。常用的几种标志变异指标概念 计算 特点 数列中最大值与最小值之差1.全距(R)R=最大值-最小值优点:容易理解,计算方便缺点:不能反映全部数据分布状况2.平均差(A.D)各标志值与均值离差绝对值的算术平均 简单:加权:优点:反映全部数据分布状况缺点:取绝对值,数字上不尽合理 概念 计算 特点 各标志值与均值离差平方的平均。方差的平方根(取正根)3.方差(σ2)和标准差(σ) 优点:反映全部数据分布状况,数字上合理。缺点:受计量单位和平均水平影响,不便于比较4.标准差系数(Vσ) 标准差与均值之商,是无量纲的系数 简单:加权:优点:适宜不同数据集的比较缺点:对数据结构变化反应不灵敏 第四节偏度与峰度数据分布除了集中程度和离散程度特征外,还有其他特征,如偏度与峰度。有时候不同水平的同类现象集中和离散趋势都相同,但是他们的分布却是不一样的。例如教材P87偏度
概念:是反映数据相对于正态分布的偏斜程度的指标左偏分布右偏分布1、算术平均数、众数和中位数比较法
2、计算偏度系数偏度的测量主要方法计算公式为偏度系数=0为对称分布偏度系数>0为右偏分布偏度系数<0为左偏分布偏度系数
(例题)农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi-X)3
Fi(Xi-X)4Fi5以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计—1001689.2572521.25(计算结果)根据上表数据计算得将计算结果代入公式得结论:偏度系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大峰度
概念:是反映频数分布曲线顶端尖峭或扁平程度的指标。扁平分布尖峰分布峰度的测度5.峰度系数计算公式为峰度系数=3扁平程度适中峰度系数<3为扁平分布峰度系数>3为尖峰分布峰度系数
(例题)农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi-X)3
Fi(Xi-X)4Fi5以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计—1001689.2572521.24峰度系数系数
(实例计算结果)代入公式得
【例】根据前表中的计算结果,计算农村居民家庭纯收入分布的峰度系数
结论:由于=3.3>3,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 芜湖市镜湖区2025-2026学年第二学期三年级语文第七单元测试卷(部编版含答案)
- 葫芦岛市连山区2025-2026学年第二学期五年级语文第七单元测试卷(部编版含答案)
- 首件三检内容
- 承德市双桥区2025-2026学年第二学期五年级语文第七单元测试卷(部编版含答案)
- 桂林市恭城瑶族自治县2025-2026学年第二学期三年级语文第七单元测试卷(部编版含答案)
- 沥青混合料拌和设备操作工操作规范水平考核试卷含答案
- 会展设计师安全意识水平考核试卷含答案
- 汽车整车装调工创新方法模拟考核试卷含答案
- 半导体继电器装调工安全生产知识水平考核试卷含答案
- 廊坊市文安县2025-2026学年第二学期五年级语文期末考试卷(部编版含答案)
- 产业引导资金实施方案
- 解读《特种设备使用管理规则》TSG 08-2026与2017版对比
- 2026年法律硕士(法学)考研复试高频面试题包含详细解答
- 湖北省武汉市2026届高中毕业生三月调研考试数学试题含答案
- 自动控制原理试题库(含答案)
- 深圳一模讲评课件
- 【答案】《数字电子技术基础》(华北电力大学)章节作业慕课答案
- 2026年私域流量运营美妆私域种草调研
- 滇西小哥粉丝数据分析报告
- 胆总管结石伴急性化脓性梗阻性胆管炎的护理查房
- 《财政学》第七章 财政收入总论
评论
0/150
提交评论