版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计数据第一节统计数据的收集——统计调查第二节统计数据的整理第三节统计数据的显示
——统计表和统计图第四节统计指标
第一节统计数据的收集——统计调查一、统计调查的意义
二、统计调查的方案三、统计调查的组织形式
一、统计数据搜集的意义
(一)定义有组织、有计划地搜集大量统计数据的过程。是统计工作的基础环节。(二)与一般社会调查的主要区别。主要着眼于数字资料的搜集;不是搜集个别单位的资料,而是搜集大量单位的资料并能够据以汇总计算形成说明总体的综合数据。(三)对统计调查的要求准确、及时、全面、系统。准确性(真实性、客观性)——如实反映客观实际。真实性是统计的生命。及时性——在规定时间内尽快提供统计资料。过时的信息有如“雨后送伞”。全面和系统——调查方案规定调查的单位要全、项目要全,不能遗漏。资料残缺不全,就不能正确、系统地反映现象总体的实质和规律性。
二、统计调查方案1.确定调查目的确定调查目的就是明确一项调查所要解决的问题。2.确定调查对象和调查单位调查对象是所要调查事物的全体,由许多个别单位构成,即统计总体。调查单位是所要调查的具体单位,是调查项目的具体承担者,即总体单位。调查单位要与调查的填报单位或报告单位相区别。填报单位是向上报告调查内容、提交统计数据的单位,它可能与调查单位一致,也可能不一致。如调查工业生产情况(目的),所有的工业企业是总体(对象),每一个工业企业是调查单位,同时每一个工业企业也是填报单位;而调查工业生产设备情况,所有的工业生产设备是调查对象,每一台设备是调查单位,每一个工业企业是填报单位。
3.确定调查项目和调查表
调查项目是具体的调查内容,是调查单位具有的特征,由一系列品质标志和数量标志构成。为了便于调查和汇总,应该把调查项目按一定顺序排列在表格中,这就是调查表。一个调查单位填写一份的调查表称为单一表,若干个调查单位填写一份的调查表称为一揽表。4.确定调查组织形式和方法全面调查和非全面调查。5.确定调查时间
确定调查时间一是指确定标准时间,即调查资料所属的时间,一是指确定调查工作的起止时间。对时期现象,标准时间是一段时间,如2003年第三产业营业收入调查,标准时间是2003年1月1日至2003年12月31日,调查工作时间是2004年1月1日至1月31日;对时点现象,标准时间是某一时刻,如第五次人口普查的标准时间是2000年11月1日零点,调查工作时间是2000年11月1日至10日。6.确定其它事项包括确定调查机构、培训计划、是否需要试点、经费预算、资料报送程序和方法、数据公布时间等。三、统计调查的组织形式
按范围不同划分全面调查优点:资料齐全、能够满足各级政府领导管理需要;不存在代表性误差。缺点:耗费大,易产生登记性误差。应用:搜集重要的、基础性数据。非全面调查优点:耗费小(人财物时间),不易产生登记性误差。缺点:存在代表性误差;不是所有层次政府领导都能够得到其管辖范围的数据。应用:广泛。(一)统计报表概念:按国家统一规定的表式、内容、报送程序、依据基层单位的原始记录,自下而上的提供统计资料的一种制度。特点全面性、稳定性、连续性、可比性曾经是我国数据收集的主要方式耗费大、数据质量差等全面调查(二)普查
概念:为了了解重要的国情国力资料而专门组织的一次性全面调查。作用:调查内容详细、提供重要国情国力资料;提供抽样框。特别注意:必须规定标准时间、统一进行、基本内容和指标解释统一并相对稳定。
非全面调查(三)重点调查重点调查是在所要调查的总体中选择一部分重点单位进行调查,用以反映总体基本情况的一种非全面调查。
重点单位—标志值在总体标志总量中占有较大比重的单位调查结果不宜用于推断总体了解总体的基本情况重点调查的适用场合客观存在重点单位下一个(四)抽样调查从总体中随机抽取部分单位(样本)进行调查目的是推断总体参数。可以计算和控制误差经济性、时效性、准确性应用最广泛的调查方式(五)典型调查典型调查是在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行的调查。典型调查的目的和作用描述和揭示事物的本质特征和规律了解生动具体情况调查结果一般不宜用于推断总体三种非全面调查的比较
调查单位的确定目的与总体的关系重点调查重点单位了解总体基本情况不宜推断总体典型
调查有意识选择了解生动具体资料“划类选典”时,典型单位可以推断总体,但不能计算和控制误差抽样调查按随机原则推断总体可计算和控制抽取部分单位误差我国统计调查方法体系改革的目标模式
建立以周期性普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析为补充,搜集、整理基本统计资料的统计调查方法体系。四、数据的收集方法
数据的收集方法询问调查观察实验询问调查邮寄调查电话调查电脑辅助座谈会个别深访观察法实验法一、统计整理的意义和步骤
二、统计分组
三、分布数列
第三节统计数据的整理
2.内容数据处理:分类、汇总、表现(制表)数据管理:输入、贮存、更新、输出3.步骤审核原始资料、数据的分类汇总数据的表现、数据保管和发布
一、统计整理的意义1.统计整理含义
统计整理是指根据统计研究的需要,将统计调查阶段所搜集到的大量个体资料进行科学的分类汇总、加工处理,或对已经经过加工的次级资料再加工,使之系统化、条理化,成为能够反映事物总体特征的综合资料的过程。统计整理主要任务资料审核、分组、汇总制表、制图等分组频数分布统计表统计图二、统计整理的基本方法----统计分组1.统计分组概念和作用概念---统计分组就是根据统计研究的需要,将总体中的所有单位按照一定的标志分为若干部分。
对总体——分;对个体——合。突出组与组之间的差异、抽象组内各单位差异2.原则科学性、完备性、互斥性统计分组的作用2.研究总体结构分组标志的选择与分组形式分组按分组标志性分数量标志分组品质标志分组按分组标志个数简单分组复合分组三、分布数列---统计分组整理的基本结果(一)分布数列的概念
1.将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组单位数在总体单位数中所占的比重,这样形成的数列称为分布数列,它表明总体单位在各组的分布状况。
2.构成要素
各组名称或变量值(按某个标志所分的组)次数(频数或频率)
(1)品质数列按品质标志分组形成的分布数列
3.分布数列的种类表2-1某公司职工文化程度状况文化程度工人数比重(%)小学4008初中150030高中260052大学50010合计5000100品质标志性别是品质标志性别人数(万人)比重(%)男6362950.98女6118149.02合计124810100.00(2)变量数列
变量数列单项式变量数列组距式变量数列等距数列异距数列单项式数列单项式数列—一个变量值为一个组;适合于:离散型变量且变动范围小
日产量(件)工人数(人)
107011100123801315014100合计800日产量是数量标志组距数列组距数列—以一定区间的变量值为一个组;适合于:离散型变量变动范围大、连续变量等距数列异距数列
(上下组限重叠)某车间50名工人日加工零件数分组表(上下组限间断)组距数列中的几个主要概念组限—组与组之间的界限上限—一组的最大值下限—一组的最小值开口组组距=上限-下限组距可以相等称为等距数列也可以不相等——称为异距数列组中值=(上限+下限)/2假定组内标志值均匀分布或者对称分布时组中值可以代表组内的一般水平等距分组和不等距分组1等距分组各组次数的多少不受组距大小的影响可直接根据次数(频数或者频率)来观察变量的分布特征2不等距分组各组次数的多少受组距大小不同的影响各组次数不能直接反应频数分布的实际情况用频数密度才能比较各组次数分布的实际情况频数密度+频数/组距使用开口组的若干理由保证分组的完备性避免有些区间的次数为0保密需要3.变量数列的编制
—组距数列步骤确定全距=最大值-最小值;(排序)先确定组数确定组距确定组限表现现象的度、规定的界限体现分布的集中趋势考虑到习惯、便于对比某月啤酒公司60个销售点的销量487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750
单位:桶
excel啤酒销售量的分布数列销售桶数销售点数频率(%)19以下11.720—2935.030—3958.340—491626.750—592033.360—69915.070—7946.780以上23.3
合计60100.04.累计次数成绩(分)学生人数向上累计向下累计60以下
2
25660-7015175470-8020373980-9015521990-100456
4合计56————
将全社会从业人员按收入水平分组,从低收入到高收入组汇总计算向上累计频率,得洛伦茨曲线。AB
20世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配均等程度的指标——基尼系数:累计人数(%)0累计收入(%)绝对平均曲线,绝对不均等曲线,实际分配曲线
基尼系数(洛伦茨系数)=A/(A+B)
95年96年97年98年99年0.280.2840.2920.30.295
表示收入(或财富)的不均等程度。在0~1之间。系数越大,表示收入分配越是趋向不均等,洛伦茨曲线的弧度越大联合国有关组织规定:高度平均比较平均差距相对合理差距偏大两极分化00.20.30.40.5次数分布图和主要类型(1)次数分布图直方图、折线图和曲线图。直方图折线图的绘制折线图——也称次数多边形图折线图的绘制方法在直方图的基础上,把各条形顶部的中点用线段连接起来以各组组中值为横坐标,以各组次数为纵坐标,描出各点,依次将各点连接起来注意折线图的两个终点要与横轴相交折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。曲线图(2)次数分布的主要类型
钟型分布——中间多、两头少(直方图、折线图、曲线图)对称分布——如正态分布左偏分布(负偏)右偏分布(正偏)
U型分布
J型分布U型分布正J型分布反J型分布对称分布右偏分布左偏分布第三节统计数据的显示一、统计表二、统计图(一)统计表
1.概念把经过调查整理汇总计算得到的统计数据按一定的结构和顺序,系统排列在一定的表格内,则形成统计表。表现经过整理的统计数据表格。
2.统计表的构成按形式:标题——总标题、横栏标题、纵列标题
横行、纵列数字按内容:主词(主栏)
宾词(宾栏)2006年城乡居民家庭人均收入及恩格尔系数家庭人均可支配收入恩格尔系数%绝对数(元)指数1978=100农村居民2366.4503.847.7城镇居民6859.6416.337.9总标题横行标题纵列标题数据主词栏宾词栏
4.交叉列联表将两个或以上的定类变量进行交叉分类,得到的频数分布表。列行12…c合计1…2…………………r…合计r×c
列联表某心理学者想了解人的社會参与度與生活满意度之关系。因此随机抽取1077位市民,结果如下表所示,请問此心理学者如何解释此结果?社会参与度与生活满意度有无显著关系。利用该数据你可以得到什么信息。利用你知道的检验方法进行检验。
社会参与
时常参加偶尔参加很少参加生活满意很满意35015048无意见12010288不满意3087102例:如何在excel中构造交叉列联表。性别和择偶首选两个变量间的交叉列联表。点击布局确定点击,改为计数点击5.统计表的设计规则(1)要合理安排统计表的结构(2)总标题内容应满足3H要求(whatwherewhen)(3)数据计量单位相同时,可放在表的右上角,不同时应放在每个指标后或单列出一列指标(4)表中的上下两条横线一般用粗线,其他线用细线(5)通常情况下,统计表的左右两边不封口(6)表中的数据一般右对齐,有小数点时应以小数点对其,而且小数点的位置应统一(7)第I语没有数字的表格单元,一般用“-”表示(8)必要时可在表的下方加注释6、定性数据的整理与显示要弄清楚所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的对数据主要是做分类和整理
适合低层次数据的整理和显示方法也适合高层次的数据;但是和高层次数据的整理和显示方法并不适合于低层次的数据。定类数据的整理列出各类别计算各类别的频数制作频数分布表用图形显示数据定类数据可计算的指标频数:落在各类别中的数据个数比重:某一类别数据占全部数据的比值比例:不同类别数值的比值定类数据整理—频数分布表
1.条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。
条形图有单式、复式等形式,在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率。绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,也称为柱形图。
2005-2006年我国直辖市地区生产总值
定类数据的表示2006年城镇居民消费计划结构3.饼图(圆形图)定序数据的整理累计频数:将各类别的频数逐级累加累计频率:将各类别频率(百分比)逐级累加定序定类数据的显示——环形图环形图中间有个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别原型图只能显示一个总体各部分所占的比例环形图可以同时显示绘制多个总体的数据系列每一个总体的数据系列为一个环环形图可以用于比较研究适用于定序和定类数据甲乙两个地区消费者对空调售后服务意见服务质量等级频率(%)甲地区乙地区好较好一般较差差10213619141119332215合计100100甲乙两地消费者对空调售后服务质量评价的环形图2.轮廓图(线图)2006年全国城乡居民家庭人均消费支出构成(单位:元)项目城镇居民农村居民食品3111.921216.99衣着901.78168.04家庭设备用品及服务498.48126.56医疗保健620.54191.51交通通信1147.12288.76教育文化娱乐服务1203.03305.13居住904.19468.96杂项商品与服务309.4963.075.雷达图2006年全国城乡居民家庭人均消费支出构成雷达图第四节统计指标一、总规模、总水平的描述——总量指标二、现象的对比分析——相对指标三、集中趋势的度量——平均指标四、离中趋势的度量——变异指标序统计指标分类统计指标的种类(一)根据指标数值的表现形式不同,分为:总量指标——也称为统计绝对数相对指标——也称为统计相对数平均指标——也称为统计平均数两种分类的关系数量指标——总量指标质量指标——相对指标、平均指标(补充)统计指标的种类
(二)根据指标所反映的内容不同,分为:数量指标(外延指标)反映客观现象总体规模和水平,说明总体的外延范围的大小或数量的多少,数量指标的数值大小必然会随总体范围变化而变动。
质量指标——(内涵指标)反映客观现象总体的一般水平或相对水平,说明总体的数量对比关系,其数值大小与总体范围大小的变动没有直接关系。统计指标的种类(续)(三)统计指标按性质不同,可分为:正指标指标数值越大越好如企业的利税总额、劳动生产率等逆指标指标数值越小越好如产品单位成本、废品率、犯罪率等适度指标在一定范围内波动才说明现象变化处于正常状态,过高或过低都不理想如基尼系数在0.3—0.4之间比较合理一、总量指标
(一)总量指标的意义总量指标——也称为统计绝对数表明现象总规模或绝对水平绝对数的形式表示是统计资料汇总的直接结果作用是认识社会经济现象的起点;是进行管理的重要依据;是计算相对指标、平均指标的基础。1、按反映总体的特征(内容)分为:总体总量即总体单位总数表示总体本身的规模大小
标志总量即总体各单位某一数量标志值总和。表示所研究现象的总水平。总体单位总量与标志总量的区分,不是固定不变的,而是随着研究目的和研究对象的不同而变化的。如:某地区工业企业职工总数是:总体总量——以该地区每个工业企业职工为总体单位时标志总量——以该地区每个工业企业为总体单位时(二)总量指标的分类2、按反映的时间状况分时期指标——也称为流量反映总体在一段时期内活动过程的总量,指标数值可以累计相加,数值大小和时间的长短有直接关系;时点指标——也称为存量是反映总体在某一时刻(瞬间)状况的总量数值不能累计相加,数值的大小和时间间隔的长短没有直接关系。试判断下列指标中哪些是时期指标?在校学生人数、招生人数、毕业生人数、出生人数、死亡人数、迁移人数、从业人数、失业人数(二)总量指标的分类(续)(二)总量指标的分类(续)3、按计量单位不同分为:实物(量)指标计量单位为实物单位——指以事物的自然属性和特点进行计量的单位,包括:自然单位:如人、只、台、件…,是长期习惯使用形成,用于离散型数据。
度量衡单位:
kg、cm、…,用于连续型数据。标准实物单位:按某一标准(含量、规格等)折算后的实物单位,用于将用途相同、但规格或含量不同的物品数量汇总。如粮食、能源(标准吨)等;复合单位:吨公里、人公里、人次数、工日…
特点——使用价值明确;综合性能差,不同使用价值的实物量不能直接汇总。用途——反映主要物资的生产和消耗、主要产品的供需平衡、特别是无法估价的土地面积和自然资源数量等。(二)总量指标的分类(续)价值量指标是用货币单位(如人民币元,对外贸易中使用英镑、美元、欧元等)计量。特点:具有较强的综合性和概括能力,内容抽象,而且要受价格波动的影响。用途:表明经济活动的总成果、总规模,广泛用于经济效益的考核和评价等。
劳动量指标是用劳动时间单位来计量的,如工时、工日、人年等。劳动量指标可作为确定劳动定额、评价劳动时间利用程度、计算劳动生产率的依据。但一般限于同一企业内部使用。二相对指标(一)相对指标的意义
1、概念两个有联系的指标对比的比率2、作用最常用的对比分析方法使一些不能直接对比的现象有了共同对比的基础是经济管理和考核被评价企业经济的重要指标例如:有两个企业的利润总额为:甲:50万元乙:5000万元与资金投入对比——资金利润率与上期数对比——发展速度与计划数对比——计划完成程度相对指标的表现形式无名数:百分数、千分数、成数、倍(系)数有名数:——复名数
(二)相对指标的种类根据研究目的不同,对比的基础不同,分为:计划完成相对数——检查计划完成程度结构相对数——反映现象的结构和分布比例相对数——反映现象的内部比例关系比较相对数——评价不同单位的实力、优劣强度相对数——反映现象强度、密度和普遍程度动态相对数——反映现象发展变化的状况
1、计划完成相对数(计划完成百分比)反映计划任务的完成程度。
例1、某地上年国内生产总值为500亿元,计划计划当年比上年增加50亿元,实际增加了60亿元,该地计划完成程度如何?
101.8%的经济意义,超额完成计划1.8%计划完成百分比=560/550*100%=101.8%例2、某地上年国内生产总值为500亿元,今年计划国内生产总值比上年增长10%,实际增长12%。注意:百分比与百分点的区别。
这里的超额完成1.8%,也可以说超额完成2个百分点。计划完成百分比=
同理,若表示为:计划当年比上年增加50亿元,实际增加了60亿元。
计划完成%=(500+60)/(500+50)*100%=101.8%例3。某地计划生产总值比上年增长10%,实际增长了12%。该地计划完成程度如何?
例4、某企业计划把单位成本降低3%,实际降低2%。该企业是否完成了单位成本降低计划?
计划完成百分比
超额完成计划百分比?在分析计划完成情况时,要注意计划任务数的性质差异。若计划数是以下限规定的(越大越好的指标——正指标),其计划完成相对数大于100%为超额完成计划,如产值、利润等;若计划数是以上限规定的(越小越好的指标——逆指标),其计划完成相对数小于100%为超额完成计划,如产品成本、原材料消耗量等。
注意:百分比与百分点的区别百分比——将对比基数抽象为100时,表示两个数相除的结果百分点——表示两个百分比相减的结果上例3中,表示超额完成计划的情况,用百分比表示为,超额完成1.8%用百分点表示为:超额完成两个百分点注意:不能是超额完成1.8个百分点,应该是超额完成2%(12%-10%)对比标准不同,相对指标所说明问题也就不同。
2.结构相对数(又称比重)反映社会经济现象的内部结构以及分布状况特点:必须以分组为基础各组结构相对数之和等于1或者100%2013年全国各地区恩格尔系数国内生产总值构成与从业人员构成年份国内生产总值(亿元)国内生产总值构成(%)年底从业人员(万人)从业人员构成(%)第一产业第二产业第三产业第一产业第二产业第三产业199558478.120.548.830.76794752.523.024.8199667884.620.449.530.16885050.523.526.0199774462.619.150.030.96960049.923.726.4199878345.218.649.332.16995749.823.526.7199982067.517.649.433.07058650.123.026.9200089468.116.450.233.47115050.022.527.5200197314.815.251.133.67302550.021.228.82002104790.615.451.533.57374050.021.428.62003114326.514.552.732.87443249.921.629.33.比例相对数——比例(结构性的比例)反映总体内部的比例关系,揭示总体不同部分之间的发展变化的协调平衡状况。
如:某地区农轻重比例:20%:50%:30%
消费与积累的比例两种商品价格之比——比价分子分母可互换08年中国人口结构我国城乡居民收入差距逐步扩大年度1990年1995年2000年2001年农村/城市1:2.21:2.711:2.791:2.94、比较相对数中美比较(《中国统计年鉴》1999年)
平均预期寿命(岁)谷物产量(万吨)公共教育经费占GNP比(%)美国76349705.4中国71456252.5美国与中国之比(倍或%)1.07(倍)(107%)0.766(倍)(76.6%)2.16(倍)(216%)相同时间不同空间同类现象数值的对比,说明不同空间的经济势力强弱和工作优劣等。分子分母可互换5、强度相对数
反映现象的强度,如:人均GDP、人均粮食产量…反映现象的密度和普遍程度。如:人口密度、每万人拥有医院病床数(医生数)、人均绿地面积等反映经济效益,如资金利润率。其它如:外贸依存度=对外贸易总额/GDP
保险密度=保费/人口数金融相关度(率)=金融资产总量/GNP11-5我国城市公用事业基本情况特点:强度相对数是惟一有单位(且为复名数)的相对数(有的也用无名数形式);分子分母一般可以互换,故有正指标与逆指标之分。(是不是所有的强度相对数指标都可以互换呢?人均GDP)(很多人均指标一般都不能颠倒)强度相对数常带有“均”字样,但不是平均数(含义不同)。(人均拥有床位数)6、动态相对数反映现象发展变化的相对程度(即发展速度)。上一年=100年份国内生产总值人均国内生产总值第一产业第二产业第三产业1995110.5105.0113.9108.4109.31996109.6105.1112.1107.9108.41997108.8103.5110.5109.1107.71998107.8103.5108.9108.3106.81999107.1102.8108.1107.7106.22000108.0102.4109.4108.1107.12001107.3102.8108.7107.4106.72002108.0102.9109.8107.5107.22003109.1102.5112.5106.7110.3六种相对数指标的比较不同时期比较同一时期不同现象比较同类现象比较动态相对数强度相对数不同总体比较同一总体比较相对数部分与部分比较部分与总体比较实际与计划比较比例相对数结构相对数计划完成相对数相对指标的种类小结根据研究的目的不同、对比的基础不同,分为:
结构相对数——反映现象的结构和分布比例相对数——反映现象内部比例关系比较相对数——评价不同单位的实力、优劣强度相对数——反映现象强度、密度和普遍程度动态相对数——反映现象发展变化的状态
计划完成相对数——检查计划完成程度
(三)计算和应用相对指标应注意的问题
1正确选择基础
2确保可比性
3相对数与绝对数结合运用
4多种相对数综合运用例题某地区报告年生产总值为1080亿元,超额10%完成计划,报告年计划生产总值比上年增长8%,则报告年实际生产总值比上年增长百分之多少?三、平均指标(平均数)平均指标又称平均数,是反应总体各单位数据在一定时间、地点、条件下一般水平的综合指标。同质总体代表一般水平在一定时间、地点、条件下数据集中区变量x集中趋势一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻求数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度概念要点最常用的集中趋势测量值一组数据的均衡点所在易受极端值的影响三、平均指标(一)平均指标的作用平均指标——也称为统计平均数反映某一现象的一般水平反映现象分布的集中趋势(代表数据分布中心)统计推断的基础指标按平均数据的时间状况不同,分为静态平均数同一时间不同单位的数据的平均反映现象总体在一定历史条件下的一般水平动态平均数不同时间同一总体的数据的平均反映现象在发展阶段上的一般水平平均数的计算方法静态平均数数值平均数位置平均数算术平均数几何平均数中位数众数(二)平均指标的计算算术平均数(1)基本公式
例:平均工资=工资总额/职工人数平均成本=总成本/产量(2)简单算术平均数——未分组时
5名学生的考试成绩分别为(分):
70、80、80、85、85,他们的平均成绩是多少?(70+80+80+85+85)/5=80(分)(3)加权算术平均数
——当数据已分组,形成了变量数列:成绩人数
x
f708085122合计5平均成绩=(70+80+85)/3?平均成绩=所有人的成绩总和/总人数
=(70+80*2+85*2)/5=80
工人日产量(件)工人人数(人)工人人数比重(%)
1011121314
70150380150100
8.7512.5047.5018.72512.50合计800100.00不符合基本公式,不是5个工人,而是800个工人;工人人总产量不是60件,而是9710件
所以,应该这样计算:
错误的计算:加权平均数(件)加权指变量数列中,各个统计数据出现的次数不一样,次数出现多的统计数据对平均数的影响重要一些,次数出现少的统计数据对平均数的影响小一些,因此对各个数据不能同等看待。计算平均数时,必须以统计数据乘以其出现的次数,以权衡其轻重,这就是“加权”权数(权重)
——是分布数列中的频数或频率,对平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。权数的两种形式——绝对数(次数)f;
——相对数(比重)权数的确定方法:主观赋权,客观赋权按成绩分组(分)学生人数(人)60以下60—7070—8080—9090—100
21519154合计55如何计算平均值?根据组距数列计算总平均数的方法
——加权算术平均(分)X——各组的组中值(代表组平均水平)假定条件:组内均匀分布或对称分布一般地,计算结果是近似值。按成绩分组(分)学生人数(人)60以下60—7070—8080—9090—100
21519154合计55分平均数=13.7平均数=13.6商店销售额数据
(3)算数平均数的数学性质:
变量值与算术平均数的离差和为零。
变量值与算术平均数的离差平方和最小证明:设
某供销社分三批收购某种农副产品,其收购单价及各批收购额如下批次单价(元)收购额12.40600022.251200032.152150合计——20150如何计算平均数?2、调和平均数(倒数平均数)
常作为加权算术平均数的变形公式使用。仍是总体的标志总量与总体单位总量的对比,仅仅是因为资料的不同,需要将算术平均数变形。
当缺乏分子数据时,采用算术平均数;
当缺乏分母数据时,采用调和平均数。工人日产量(件)x工人日总产量(件)xf1011121314
7001100456019501400合计9710(件)(1)选择加权算术平均法还是调和平均法,应该根据基本公式确定。(2)相对数的算术平均数
某公司下属18个企业,计划完成相对数如下:产值计划完成程度(%)组中值(%)企业数(个)实际产值计划产值80-9085
268080090-10095
323752500100-110105101806017200110-120115
350604400合计——182617524900平均计划完成百分比:3、几何平均数
例某企业生产某种产品要经过三道工序,各工序的合格品率分别为95%、96%和98%。该产品三道工序的平均合格品率为多少?三道工序的平均合格品率为96.32%.思考:三道工序的平均废品率为多少?平均废品率=1-平均合格率
几何平均数通常用在总量等于各分量乘积的情形。比如,求某些平均比率,平均发展速度等。
例1
某流水生产线有前后衔接的五道工序。某日各工序产品的不合格率分别为5%、8%、10%、15%、20%,整个流水线产品合格率?
例2
某金融机够以复利方式计息。近12年来的年利率有4年为3%、2年为5%、2年为8%、3年为10%、1年为15%。则12年的平均年利率?平均年利率=106.82%-100%=6.82%2008年成都市劳动力市场工资指导价位(元/人年)职业类别工资价位国有企业其它经济类型高级管理人员低位数1914413244
中位数5640538744
高位数186916146254专业技术人员低位数1264510088
中位数3222023560
高位数9471672387办事人员低位数113138219
中位数2142916800
高位数7681748733商业服务人员低位数92347368
中位数1751513598
高位数6792944163生产人员低位数92657656
中位数2152115000
高位数7373937293工资价位博士及以上硕士本科大专高中中专技校初中及以下1.低位数27913192051227510307838473962.中位数6019250160365882548818000143983.高位数2685912620381325008914157004426022008年成都市劳动力市场工资指导价位(按学历分组元/人年)1.众数(Mode)
众数是指总体中出现次数最多或频率最大的变量值(数据),用Mo表示。众数也是一种位置平均数,且也不受极端值的影响。位置平均数工人日产量(件)x工人日总产量(件)xf1011121314
7001100456019501400合计9710集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数众数(众数的不唯一性)无众数
原始数据:10591268一个众数
原始数据:65
9855多于一个众数
原始数据:25
2828
36
4242条件——总体单位多;分布有集中趋势由品质数列确定众数第一二三产业按照就业人数确定众数人口普查按照文化程度确定众数组距分组数据,如何计算众数?2.中位数(Median)
中位数是根据变量值的位置来确定的平均数。将变量值按大小顺序排序,处于中间位置的变量值(或数据)即中位数,用me表示。由于中位数是位置代表值,所以不会受极端值的影响,具有较高的稳健性。Me50%50%中位数位置的确定未分组数据:组距数列数据:中位数位置
n2中位数位置=未分组数据的中位数原始数据:
2422212620排序: 2021222426位置: 123 45中位数
22
原始数据:
105 91268排序: 56891012位置: 123
4
56
(三)众数、中位数和算术平均数的比较1.算术平均数综合反映了全部数据的信息,众数和中位数由数据分布的特定位置所确定。2.算术平均数和中位数在任何一组数据中都存在而且具有惟一性,但计算和应用众数有两个前提条件3.算术平均数只能用于定量(数值型)数据,中位数适用于定序数据和定量数据,众数适用于所有形式(类型、计量层次)的数据4.算术平均数要受数据中极端值的影响。而众数和中位数都不受极端值的影响。为了排除极端值的干扰,可计算切尾均值,即去掉数据中最大和最小的若干项数值后计算的均值.切尾均值是将均值与中位数取长补短的结果。5.算术平均数可以推算总体的有关总量指标,而中位数和众数则不宜用作此类推算。中位数、众数和平均数的关系:
中位数、众数和平均数之间的数量关系决定于总体内次数分配的状况。对称钟形分布情形下:非对称左偏分布情形下:非对称右偏分布情形下:众数、中位数和均值的关系对称种型分布
均值=中位数=
众数左偏分布均值
中位数
众数右偏分布众数
中位数
均值不论英国著名统计学家皮尔生提出了一个经验公式:在偏斜适度(微偏)的情况下,则有如下的经验公式:3(平均数-中位数)=(平均数-众数)四、变异指标变异指标的概念
变异指标的种类变异系数
(一)变异指标的概念某车间有两个生产小组,某周5天的产量如下:甲:171,172,172,172,173(件)乙:220,190,170,150,130(件)两组的平均日产量均为172件。平均日产量172件的代表性甲组比乙组好。
变异指标反映总体单位变量值的离中趋势(或差异程度,均衡性、稳定性)衡量平均数的代表性。
变异指标越大,平均数代表性越小;变异指标越小,平均数代表性越大。集中趋势(Centraltendency)——平均指标一组数据向其中心值靠拢的倾向和程度,测度集中趋势就是寻找数据一般水平的代表值或中心值,不同类型的数据用不同的集中趋势测度值。选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定离中趋势(差异程度)——变异指标
1、全距(极差Range):
R=最大值—最小值
2、平均差(AverageDeviation)变量值与平均数的离差绝对值的平均数(二)变异指标的种类3、方差Variance和标准差S.D
测度标志变异最重要,最常用的指标。标准差=方差的平方根。方差——变量值与平均数的离差平方的平均数。成绩(分)学生人数552-20.37829.87386515-10.371613.05357519-0.372.601185159.631391.053585319.631156.0107合计54——4992.5926(分)(分)
4、方差和标准差具有以下数学性质
(1)若每一个变量值加上一个常数,方差和标准差不变。设a为任意常数,
则有:
,
(2)若每一个变量值均扩大一个常数倍,方差是常数项的平方倍,标准差同比例变化。设a为任意常数,
(3)分组条件下,总方差可以分解成组内方差的平均数和组间方差两部分,即:
其中
某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。计算总方差、组内方差和组间方差。早班中班晚班34493937474035514233483933504135514
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业管理-报表管理制度
- 江苏省高邮市重点名校2025-2026学年初三第一次阶段考试数学试题含解析
- 湖南省汨罗市弼时片区市级名校2026年初三下学期期末考试(二模)数学试题含解析
- 江西南昌市心远中学度2025-2026学年初三5月月考(数学试题文)试题含解析
- 扬州地区部分县2026届初三暑假末结业考试数学试题含解析
- 江西省赣州市南康区唐西片区2026届初三下学期第二次大联考物理试题含解析
- 娄底市重点中学2026届初三下学期第一次诊断性考试物理试题试卷含解析
- 2026年朔州市重点中学初三七校联合体考前冲刺交流考试物理试题含解析
- 艾灸护理安全注意事项
- 老年患者压疮护理的伦理问题
- 2026广东深圳医学科学院科研职能岗位招聘笔试备考试题及答案解析
- 山东大众报业集团有限公司招聘笔试题库2026
- 2026年国网江苏省电力有限公司高校毕业生招聘约825人(第二批)笔试模拟试题及答案解析
- 2026上半年新疆维吾尔自治区招聘事业单位工作人员分类考试4474人笔试备考题库及答案解析
- GB/T 20151-2026光度学CIE物理光度系统
- GB/T 18570.9-2025涂覆涂料前钢材表面处理表面清洁度的评定试验第9部分:水溶性盐的现场电导率测定法
- 高中实验室安全教育课件
- 水轮发电机组检修作业指导书资料
- 定压补水装置说明书
- 一汽大众汽车公司介绍
- 4.2《产生气体的变化》课件
评论
0/150
提交评论