统计学第四章统计数据的概括性度量ppt课件_第1页
统计学第四章统计数据的概括性度量ppt课件_第2页
统计学第四章统计数据的概括性度量ppt课件_第3页
统计学第四章统计数据的概括性度量ppt课件_第4页
统计学第四章统计数据的概括性度量ppt课件_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计数据的概括性度量,第四章统计数据的概括性度量,第一节统计数据的概括性度量理论第二节集中趋势的度量第三节离散程度的度量第四节偏态与峰态的度量,第一节统计数据的概括性度量理论,一、统计数据的概括性度量方法统计指标二、总量指标三、相对指标四、数据分布的特征及度量(集中趋势、离中趋势、分布形状的测度),一、统计数据的概括性度量方法统计指标,1、概念:统计指标是反映现象总体综合数量特征的基本概念及其具体数值的总称2、特点:同质事物的可量性和量的综合性3、作用:(1)是记录社会经济现象发展变化情况的工具,也是反映社会经济现象数量规律的手段(2)是进行社会经济管理和科学研究的基本依据4、种类:(1)按作用和表现形式的不同分为:总量指标、相对指标、平均指标、离散指标和形状指标(2)按其所反映的内容和数量性质不同分为:数量指标和质量指标(3)按其反映现象的时间状况不同分为:静态指标和动态指标(4)按其计算范围不同分为:总体指标和样本指标(5)按其计量单位不同可分为:实物指标、价值指标和劳动量指标,二、总量指标,1、概念:反映社会经济现象在一定时间、空间条件下的总规模或总水平的最基本的综合指标、用绝对数表示2、作用:(1)是认识现象的起点(2)能够反映社会经济发展规模,是进行宏观经济调控、制定经济发展政策的重要依据之一(3)是计算相对指标和平均指标等其他形式统计指标的基础3、计量单位:实物单位(自然单位“件”、“辆”、“台”等;物理单位“千瓦”、“大卡”等;度量衡单位“吨”、“平方米”等)价值单位(货币单位“元”等)劳动单位(“工日”、“工时”等)4、计算原则:(1)科学地确定总量指标的含义、计算范围,保证总量指标计算的准确性(2)计算总量指标必须注意其计算口径、计算方法和计量单位的统一,才能进行汇总,二、总量指标,5、种类:(1)按反映的内容不同分为:总体单位总量和总体标志总量(2)按反映的时间状况不同分为:时期指标和时点指标时期指标是反映总体在某一段时期内累计规模的总量指标时点指标是反映总体在某一时刻状况上规模的总量指标时期指标与时点指标的区别在于:#时期指标数值的大小与时期长短有直接关系;而时点指标数值的大小与时点间的间隔长短无直接关系#时期指标的各期数值可以相加,表明现象在更长时期内发生的总量;而时点指标的数值不能相加,因为相加的数值没有实际意义,三、相对指标,1、概念:应用对比的方法,将两个相互联系的指标数值加以对比计算的一种比值。反映社会经济现象中某些相关事物间数量对比关系的综合指标,其表现形式为相对数2、计量形式:(1)有名数(复名数),以分子分母的复合单位计量。如人口密度“人/平方公里”(2)无名数,通常以系数、倍数、成数、百分数、千分数等表示例如:60岁以上老年人口占人口总数10%及65岁以上老年人口占人口总数7%是衡量老龄化社会的指标3、作用:第一,反映现象之间的相互联系程度,说明现象的质量、效益和经济实力的情况第二,使原来不能直接对比的数量关系变为可比,有利于对所研究的事物进行比较和分析第三,表明事物的发展程度、内部结构及比例关系,为人们深刻认识事物提供依据4、计算原则:(1)正确选择对比的基数(2)保持对比指标的可比性,三、相对指标5、种类与计算方法,(1)计划完成程度相对数:是同一时期的实际数与计划数进行对比,反映计划执行情况,评价工作成绩提供依据。计算结果一般用百分数表示公式为:计划完成程度相对指标=(实际完成数计划任务数)100%注意:分子分母在指标的概念、计算口径(时间、空间范围)、计算方法、计量单位等方面完全一致,且分子分母不可互换对于以实际提高或降低的百分数与计划提高或降低的百分数不能直接对比,而应考虑原有基数(2)结构相对数:先将总体区分成不同性质的若干部分,以部分数值与总体数值对比求得比重反映总体的内部结构特征,说明研究现象总体的工作质量、人力、物力、财力的利用情况等。常用百分数(或成数)等表示公式为:结构相对指标=(总体部分数据总体全部数据)100%注意:分子分母不可互换,分子分母指标必须是根据同一总体资料计算;总体中各个部分比重之和必然等于1或100%,三、相对指标5、种类与计算方法,(3)比例相对数:是总体内部分与部分的数据对比,反映事物各组成部分之间的数量联系程度,常用系数或倍数,以及n:1或n:100或1:m:n的连比等形式表示公式为:比例相对指标=(总体中某一部分数值总体中另一部分数值)100%注意:分子分母指标可以互换、对比数值可以大于1或小于1,这一特点与结构相对数不同。该指标有助于认识客观现象是否按比例协调发展(4)比较相对数:是同类现象在不同国家、地区、部门、单位之间的数值对比,用以表现同类现象在不同空间条件下的数量对比关系。常用百分数、系数、倍数等表示。公式为:比较相对指标=某条件下的某类指标数值另一条件下同类指标数值注意:分子分母可以互换,根据研究需要决定,三、相对指标5、种类与计算方法,(5)动态相对数:是同类现象在不同时间的数值对比,用以说明现象发展变化的方向与快慢程度(速度),并据以推测现象变化的趋势,常用百分数、成数、倍数等表示公式为:动态相对指标=(报告期某指标数值基期同一指标数值)100%其中:基期是作为比较基准时期,可以是前一期、或历史上某一时期等报告期是与基期对比的时期,即研究变化的时期该指标应用广泛,在时间序列分析一章中详细介绍(6)强度相对数:是两个性质不同、但有一定联系的数值之比,用以说明现象发展的强度、密度和普遍程度,常用系数、倍数、百分数等无名数或用有名数即复名数表示公式为:强度相对指标=某一总体指标另一有联系而性质不同的总体指标注意:强度相对数与平均数很相似,但两者有本质区别强度相对指标有时对比的分子分母指标可以互换,有正指标和逆指标之分。如商业网密度但有些强度相对指标只有一种方式计算,例如:人口密度(人/平方公里),四、数据分布的特征及度量,数据分布特征和描述统计量,第二节集中趋势的度量,一.分类数据:众数二.顺序数据:中位数和分位数数值型数据:平均数(算术平均数均值、调和平均数、几何平均数)四.众数、中位数和算术平均数(均值)的比较,集中趋势(Centraltendency),一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定,一、分类数据:众数(众数也适用于顺序数据和数值型数据的集中趋势测度),众数(概念要点P86),集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据,众数(众数的不唯一性P87),无众数原始数据:10591268,一个众数原始数据:4659855,多于一个众数原始数据:252828364242,分类数据的众数(算例),【例4.1】根据第三章表3-1中的数据,计算众数,解:这里的变量为“广告类型”,这是个分类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即Mo商品广告,顺序数据的众数(算例),【例4.2】根据第三章表3-2中的数据,计算众数,解:这里的数据为顺序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo不满意,数值型分组数据的众数(要点及计算公式),1.众数的值与相邻两组频数的分布有关,4.该公式假定众数组的频数在众数组内均匀分布,2.相邻两组的频数相等时,众数组的组中值即为众数,3.相邻两组的频数不相等时,众数采用下列近似公式计算,数值型分组数据的众数(算例),【例4.3】根据第三章表3-5中的数据,计算50名工人日加工零件数的众数,二、顺序数据:中位数和分位数(中位数和分位数也适用于数值型数据),中位数(概念要点P88),1.集中趋势的测度值之一2.排序后处于中间位置上的值,不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即,中位数(位置的确定P88),未分组数据:,分组数据:,未分组数据的中位数(计算公式P88),数值型数据的中位数(9个数据的算例),【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,中位数(Me)1080,数值型数据的中位数(10个数据的算例),【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910,顺序数据的中位数P88-89(算例),【例4.4】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的中位数,解:中位数的位置为:300/2150从累计频数看,中位数的位置在“一般”这一组别中。因此Me一般,根据位置公式确定中位数所在的组采用下列近似公式计算:,3.该公式假定中位数组的频数在该组内均匀分布,数值型分组数据的中位数(要点及计算公式),数值型分组数据的中位数(算例),【例4.5】根据第三章表3-5中的数据,计算50名工人日加工零件数的中位数,四分位数P89-91(quartile),排序后处于25%和75%位置上的值,不受极端值的影响计算公式,顺序数据的四分位数(算例),【例4.6】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数,解:下四分位数(QL)的位置为:QL位置(300)/475上四分位数(QU)的位置为:QU位置(3300)/4225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此QL不满意QU一般,数值型数据的四分位数(9个数据的算例),【例4.7】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,四分位数的位置有4种计算方法,见教材P90,数值型分组数据的四分位数(计算公式),上四分位数:,下四分位数:,数值型分组数据的四分位数(计算示例),QL位置50/412.5,QU位置350/437.5,【例4.8】根据第三章表3-5中的数据,计算50名工人日加工零件数的四分位数,三、数值型数据:平均数(算术平均数均值、调和平均数、几何平均数),平均数P91-93(mean),1.也称为均值2.集中趋势的最常用测度值3.一组数据的均衡点所在4.体现了数据的必然性特征5.易受极端值的影响6.有简单平均数和加权平均数之分7.根据总体数据计算的,称为平均数,记为;根据样本数据计算的,称为样本平均数,记为x,简单平均数P91-92(Simplemean),设一组数据为:x1,x2,xn(总体数据xN),样本平均数,总体平均数,算术平均数均值(数学性质),1.各变量值与均值的离差之和等于零,2.各变量值与均值的离差平方和最小,加权平均数P91-93(Weightedmean),单变量值分组:设各组的变量值为:x1,x2,xk相应的频数为:f1,f2,fk,样本加权平均,总体加权平均,加权平均数P91-92(Weightedmean),组距分组:设各组的组中值为:M1,M2,Mk相应的频数为:f1,f2,fk,样本加权平均,总体加权平均,加权平均数(例题分析P92),调和平均数(概念要点),1.集中趋势的测度值之一2.均值的另一种表现形式3.易受极端值的影响4.不能用于分类数据和顺序数据5.计算公式为,原来只是计算时使用了不同的数据!,调和平均数(算例),【例4.9】某蔬菜在三个批发市场的日成交数据如表4-2,计算该蔬菜该日的平均批发价格,调和平均数(算例),【例4.9】某蔬菜在三个批发市场的日成交数据如表4-2,计算该蔬菜该日的平均批发价格,几何平均数(geometricmean),n个变量值乘积的n次方根适用于对比率数据的平均主要用于计算平均发展速度、平均增长率计算公式为,5.可看作是平均数的一种变形,几何平均数(例题分析),【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率,几何平均:,四、众数、中位数和均值的比较P94-96,众数、中位数和均值的关系P95,众数、中位数、平均数的特点和应用P95-96,众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,数据类型与集中趋势测度值,第三节离散程度的度量,一.分类数据:异众比率二.顺序数据:四分位差数值型数据:极差(全距)、平均差、方差、标准差四.相对离散程度:离散系数,离中趋势(离散程度P96),数据分布的另一个重要特征离中趋势的各测度值是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值,一、分类数据的离中程度:异众比率,异众比率(variationratio)(概念要点P96),1.离散程度的测度值之一2.非众数组的频数占总频数的比率3.计算公式为,4.用于衡量众数的代表性异众比率越大,说明众数的代表性就越差。主要适用于分类数据的离散程度的度量,也可适用于顺序数据和数值型数据的离散程度的度量,异众比率P96(算例),【例4.11】根据第三章表3-1中的数据,计算异众比率,二、顺序数据的离中程度:四分位差,四分位差(概念要点P96-97),1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差Qd=QUQL4.反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性,四分位差的数值越小,说明中间的数据越集中,中位数的代表性越强四分位差主要适用于顺序数据的离散程度的度量,也可适用于数值型数据的离散程度的度量,数值型未分组数据的四分位差(7个数据的算例),原始数据:23213032282526排序:21232526283032位置:1234567,n+1,QL=23,QU=30,Qd=30-23=7(件),三、数值型数据的离中程度:极差(全距)、平均差、方差、标准差,极差(range)(又称为全距R)(概念要点及计算公式P97),1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑全部数据的分布状况,未分组数据R=max(Xi)-min(Xi),5.计算公式为,平均差(meandeviation)(概念要点及计算公式P97-98),1.离散程度的测度值之一2.各变量值与其均值离差绝对值的平均数,数值越大,说明数据的离散程度也越大3.能全面反映一组数据的离散程度4.数学性质较差,实际中应用较少,5.计算公式为,未分组数据,组距分组数据,平均差(计算过程及结果P98),【例4.12】根据第三章表3-5中的数据,计算工人日加工零件数的平均差,方差和标准差(varianceandstandarddeviation)(概念要点P98-99),1.离散程度的最常用的测度值2.反映了数据的分布状况3.反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差,记为2();根据样本数据计算的,称为样本方差或标准差,记为s2(s)5.与方差不同的是,标准差与变量值的计量单位相同,其实际意义要比方差清楚,总体方差和标准差(PopulationvarianceandStandarddeviation),未分组数据,组距分组数据,未分组数据,组距分组数据,方差的计算公式,标准差的计算公式,样本方差和标准差P99-100(samplevarianceandstandarddeviation),未分组数据,组距分组数据,未分组数据,组距分组数据,方差的计算公式,标准差的计算公式,自由度P99(degreeoffreedom),自由度是指数据个数与附加给独立的观测值的约束或限制的个数之差从字面涵义来看,自由度是指一组数据中可以自由取值的个数当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k,自由度P99(degreeoffreedom),样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差的自由度为什么是n-1呢?因为在计算离差平方和时,必须先求出样本均值x,而x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差2时,它是2的无偏估计量,样本方差和样本标准差(算例),原始数据:10591368样本方差样本标准差,样本标准差(例题4-13P100),样本标准差(例题P100),含义:每一天的销售量与平均数相比,平均相差21.58台,相对位置的度量:标准分数,标准分数P100-101(standardscore),1.也称标准化值2.对某一个值在一组数据中相对位置的度量3.可用于判断一组数据是否有离群点(outlier)4.用于对变量的标准化处理5.计算公式为,标准分数(性质),z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是使该组数据均值为0,标准差为1,标准分数(例题4-14P101),经验法则P101-102,经验法则表明:当一组数据呈对称的钟型分布时约有68%的数据在平均数1个标准差的范围之内约有95%的数据在平均数2个标准差的范围之内约有99%的数据在平均数3个标准差的范围之内,切比雪夫不等式P102(Chebyshevsinequality),如果一组数据不是对称分布,经验法则就不再适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”对于任意分布形态的数据,根据切比雪夫不等式,至少有(1-1/k2)的数据落在平均数加减k个标准差之内。其中k是大于1的任意值,但不一定是整数对于k=2,3,4,该不等式的含义是(1)至少有75%的数据落在平均数2个标准差的范围之内(2)至少有89%的数据落在平均数3个标准差的范围之内(3)至少有94%的数据落在平均数4个标准差的范围之内,四、相对离散程度:离散系数,离散系数(变异系数)P102-104(标准差系数概念要点和计算公式),1.标准差与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同组别数据离散程度的比较5.计算公式为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论