第三章 集中趋势和离散程度的测定ppt课件_第1页
第三章 集中趋势和离散程度的测定ppt课件_第2页
第三章 集中趋势和离散程度的测定ppt课件_第3页
第三章 集中趋势和离散程度的测定ppt课件_第4页
第三章 集中趋势和离散程度的测定ppt课件_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,第三章集中趋势和离散程度的测度,一、众数二、平均数三、中位数四、众数、中位数和平均数的比较,第一节集中趋势的测定,.,一、众数(mode),众数是指总体中最常见的标志值,也即重复出现次数最多的标志值。众数的计算方法:单项数列:出现次数最多的标志值就是众数。,.,对于分组数据,众数通常采用下面的近似公式计算(下限公式:),MO:表示众数L:表示众数组的下组限表示众数组次数与前一组次数之差表示众数组次数与后一组次数之差i表示众数组的组距,.,对于分组数据,众数通常采用下面的近似公式计算(上限公式:),MO:表示众数U:表示众数组的上组限表示众数组次数与前一组次数之差表示众数组次数与后一组次数之差i表示众数组的组距,.,一、众数的特点,一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数在组距数列中,当变量数列不等距分组时,众数的位置不好确定。,.,M0,M0,M0,M0,M0,若有两个次数相等的众数,则称复众数。,只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。,.,下三图无众数:,在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。,.,众数(不惟一性),无众数原始数据:10591268,一个众数原始数据:659855,多于一个众数原始数据:252828364242,.,1.算术平均数的基本公式,二、算术平均数,.,式中:算术平均数X各单位的标志值n总体单位数总和符号,2.简单算术平均数,.,式中:算术平均数X各组数值f各组数值出现的次数(即权数),3.加权算术平均数,.,设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。,.,在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:,.,.,加权算术平均数受两因素的影响:变量值大小的影响。次数多少的影响。,而简单算术平均数只反映变量值大小这一因素的影响。,加权算术平均数与简单算术平均数不同在于:,.,各个变量值与算术平均数离差之和等于零,4.算术平均数的数学性质,.,各个变量值与算术平均数离差平方之和等于最小值,.,算术平均数的特点,算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确定,使的代表性也不很可靠。,.,调和平均数是各个变量值倒数的算术平均数的倒数。,三、调和平均数(又称“倒数平均数”),.,其计算方法如下:,.,在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:,m是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。,.,已知某商品在三个集市贸易市场上的平均价格及销售额资料如下:,1.由平均数计算平均数时调和平均数的应用:,.,某公司有四个工厂,已知其计划完成程度(%)及实际产值资料如下:,2.由相对数计算平均数时调和平均数的应用:,.,从以上计算平均数的例子来看,当掌握的资料是变量值X和总体的标志总量M时,则权数就是标志总量,这时就采用加权调和平均数公式计算平均数。反之,如果已掌握变量值X及其相应的总体单位数f,则权数就是总体单位数,就可以直接采用加权算术平均数法计算平均数。,.,调和平均数的特点,如果数列中有一标志值等于零,则无法计算;,它作为一种数值平均数,受所有标志值的影响,它受极小值的影响大于受极大值的影响,但较之算术平均数,受极端值的影响要小。,.,1.简单几何平均数,四、几何平均数(又称“对数平均数”),计算时要进行对数变换,即:,几何平均数就是n个变量值Xi连乘积的n次方根。计算公式为:,.,某机械厂有铸造车间、加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为95%、92%、90%,求平均车间产品合格率。,解:,这说明该厂车间产品平均合格率为92.31%,.,2.加权几何平均数,.,几何平均数的特点,如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较和小,故比较稳健;几何平均数的适用范围较小,主要适用于比率平均和速度平均,即计算平均发展速度,进行时间数列分析等。,.,排序后处于中间位置上的值,将总体单位的某一数量标志的各个数值按其大小顺序排列,处于中间位置的标志值就是中位数。中位数是根据标志值所处的中点位次来确定,不受极大或极小数值的影响,所以可以用来代替变量值的一般水平。,六、中位数Me,.,由未分组资料确定中位数,2.中位数的计算方法,.,n为奇数时,则居于中间位置的那个标志值就是中位数。,.,n为偶数时,则中间位置的两个标志值的算术平均数为中位数。,.,由单项数列确定中位数,某企业按日产零件分组如下:,.,由组距数列确定中位数,.,下限公式(较小制累计时用):,.,上限公式(较大制累计时用):,.,中位数不受极端值及开口组的影响,具有稳健性。,各单位标志值与中位数离差的绝对值之和是个最小值。,对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。,3.中位数的特点,.,众数、中位数和均值的比较,众数、中位数和算术平均数之间有着一定的关系,这种关系决定于总体次数分布的状况。当次数分布呈对称的钟形分布时,算术平均数位于次数分布曲线的对称点上,而该点又是曲线的最高点和中心点,因此众数、中位数和算术平均数三者相等。当次数分布呈非对称的钟形分布时,由于这三种平均数受极端值影响程度的不同,因而它们的数值就存在一定的差别,但三者之间任然有一定的关系。如下图所示:,.,众数、中位数和均值的关系,.,众数、中位数、均值的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,.,表示为:,七、各种平均数之间的相互关系,.,1.当总体分布呈对称状态时,三者合而为一,.,2.当总体分布呈非对称状态时,.,如图:,f,X,.,所以,.,1、标志变动度是评价平均数代表性的依据。,第二节标志变动度,2.作用:,1.概念:标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度。,一、标志变动度的意义、作用和种类,.,甲、乙两学生某次考试成绩列表,甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。,.,2、标志变动度可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。,.,3、标志变动度可以揭示总体变量分布的离中趋势,是研究总体分布的重要特征值。平均指标揭示了总体变量分布的集中趋势,成为研究总体分布的重要特征值。而标志变动度则从另一个侧面揭示了以平均数为中心,各标志值偏离中心的程度。,4、标志变动指标可以确定推断总体的准确程度。例如,在抽样调查中,根据样本指标来推断总体指标,只有计算标志变动指标,才能确定推断的准确程度及误差大小。,.,3.种类即测定标志变动度的方法,主要有:全距、四分位差、平均差、标准差、离散系数等。,全距R四分位差Q.D.平均差A.D.标准差S.D.()离散系数V,.,优点:计算方便,易于理解。,缺点:全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略方法,不能全面反映总体各单位标志的变异程度。,1.全距是总体各单位标志值最大值和最小值之差,2.全距的特点,二、全距R,.,1.概念:将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Ql、Qe、Qu),这三个分割点称为四分位数,(其中第二个四分位数Qe就是数列的中位数Me)。四分位差Q.D.=Qu-Ql,三、四分位差Q.D.,.,根据未分组资料求Q.D.,2.计算:,Ql位置=n/4,Qu位置=3n/4,如果位置是整数,四分位数就是该位置对应的值;如果是在整数加0.5的位置上,则取该位置两侧值的平均数;如果是在整数加0.25或0.75的位置上,则四分位数等于该位置前面的值加上按比例分摊位置两侧数值的差值。,.,例如:在一个企业中随机抽取9名员工,得到每名员工的月工资收入数据如下:15007507801080850960200012501630,先对数据进行排序,然后计算出四分位数的位置,再计算出四分位数的值。,Ql位置=n/4=2.25,即Ql在第2个数值(780)和第3个数值(850)之间0.25的位置上,因此Ql=780+(850-780)*0.25=797.5(元),.,Qu位置=3n/4=6.75,即Qu在第6个数值(1250)和第7个数值(1500)之间0.75的位置上,因此Qu=1250+(1500-1250)*0.75=1437.5(元),四分位数的结果表明,至少有25%的数据小于或等于Ql;至少有75%的数据小于或等于Qu,而至少有25%的数据大于或等于Qu。由于Ql和Qu之间包含了50%的数据,就上面的例子而言,可以说大约有一半的员工工资收入在797.5-1437.5元之间。,.,根据分组资料求Q.D.,2)若单项数列,则Ql与Q3所在组的标志值就是Q1与Q3的数值;,若组距数列,确定了Q1与Q3所在组后,还要用以下公式求近似值:,.,根据某车间工人日产零件分组资料,求Q.D.,.,这表明有一半工人的日产量分布在11.41件至17.36件之间,且相差5.95件。,.,四分位差不受两端各25%数值的影响,能对开口组数列的差异程度进行测定;,用四分位差可以衡量中位数的代表性高低;,四分位差不反映所有标志值的差异程度,它所描述的只是次数分配中一半的离差,所以也是一个比较粗略的指标。,3.四分位差的特点,.,平均差是数列中各单位标志值与平均数之间绝对离差的平均数。,1.概念和计算:,四、平均差A.D.,.,以某车间100个工人按日产量编成变量数列的资料:,.,1、均差是根据全部标志值与平均数离差而计算出的变异指标,能全面反映标志值的差异程度;,2、平均差计算有绝对值符号,不适合代数方法的演算使其应用受到限制。,2.平均差的特点,3、利用平均差来判断哪一个更有代表性,在平均数相同的情况下,平均差越大,代表性则越小;平均差越小,说明代表性越强。,.,标准差是离差平方平均数的平方根,故又称“均方差”。其意义与平均差基本相同。,1.概念和计算:,五、标准差S.D.(),.,.,.,2.交替标志的标准差,在社会经济统计中,有时把社会经济现象的总体单位,分为具有某种标志的单位和不具有这种标志的单位两组。统计中,用“是”、“否”或“有”、“无”来表示的标志,称为交替标志,也称是非标志。,.,成数:交替标志只有两种标志表现,我们把总体中具有某种表现或不具有某种表现的单位数占总体单位数的比重称为成数。,例如检测一批产品,合格品占95%,不合格品占5%,这里的95%和5%都是成数。在同一总体中,对于某一交替标志,具有两种成数且其和为1,.,交替标志的平均数和标准差,交替标志是一种品质标志,其表现为文字。因此,在计算其平均数时,首先要将文字进行数量化处理,用1表示具有某种标志表现,用0表示不具有某种标志表现。然后以1和0作为变量值,计算加权算术平均数和标准差。,.,.,由此可得出:交替标志的平均数即为被研究标志(交替标志)某种表现的成数。交替标志的标准差为被研究标志的成数p与(1-p)乘积的平方根。,.,标准差的特点:,标准差也是根据全部变量值计算出来的,所以对整个变量值的离散趋势有充分的代表性。用标准差来判断时,该方法是在平均数相同的情况下,标准差越大,代表性越小;标准差越小,代表性越强。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论