数据分布的特征和度量.ppt_第1页
数据分布的特征和度量.ppt_第2页
数据分布的特征和度量.ppt_第3页
数据分布的特征和度量.ppt_第4页
数据分布的特征和度量.ppt_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章数据分布的特征和度量,第一节分布的集中趋势数值平均数,主要内容,算术平均数,中位数,众数,几何平均数和调和平均数,下面是一个小故事:一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?,挠头的数值,公司员工的月薪如下:,我们有三种方法选择集中趋势:(1)根据频数:哪个变量值出现次数越多,就选择哪个变量值,比如民主决策的表决机制。(2)根据居中:比如一个城镇居民的生活水平,居中的是小康家庭,那么就用小康家庭来代表该城镇的生活水平。(3)根据平均:用平均数来代表变量的平均水平。,关于集中趋势的一个故事,吉斯莫先生有一个小工厂,生产超级小玩意儿。管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。现在吉斯莫先生正在接见萨姆,谈工作问题。,吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。,吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。,萨姆:每周100元又是怎么回事呢?吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。萨姆:好,现在我可懂了。我我辞职!,一、统计平均数的含义与作用,(一)、统计平均数的含义表示社会经济现象总体各单位某一标志在一定时间、地点条件下所达到的一般水平,亦即总体各单位标志值的差异抽象化,反映在具体条件下各单位标志值达到的一般水平。(二)、统计平均数的特点将数量差异抽象化只能用于同类现象的计算能反映总体变量的集中趋势集中趋势:总体各单位的次数分布从两边向中间集中的趋势,也叫趋中性。,(三)、平均指标的作用,反映总体各单位变量分布的集中趋势和一般水平比较同类现象在不同单位的发展水平比较同类现象在不同时期的发展变化趋势和规律可用于分析现象之间的依存关系和进行数量的估算(四)、平均指标的两大类别数值平均数(常用的有算术平均数、调和平均数、几何平均数和幂平均数)位置平均数(常用的有中位数和众数),二、算数平均数,算术平均数的统计定义公式计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。实际上由于所掌握的统计资料不同,计算平均数有简单算术平均数和加权算术平均数两种。,(一).简单算术平均数(用于未分组资料或变量分配数列中,各组次数都相等的情况)注意:对求和符号,此时流动脚标的变动范围是1,2,3,N,如果为未分组资料,N为总体单位总数,如为次数相等的分组数列,N为组数。例求74、85、69、9l、87、74、69这些数字的算术平均数。解,(二).加权算术平均数(用于分组资料中,各分组次数不同的情况)注意:对求和符号,此时流动脚标的变动范围是1,2,3,n,n是组数,而不是总体单位数。很显然,算术平均数不仅受各变量值(X)大小的影响,而且受各组单位数(频数)的影响。由于对于总体的影响要由频数(f)大小所决定,所以f也被称为权数。值得注意的是,在统计计算中,权数不仅用来衡量总体中各标志值在总体中作用,同时反映了指标的结构,所以它有两种表现形式:绝对数(频数)和相对数(频率)。这样一来,在统计学中,凡对应于分组资料的计算式,都被称为加权式。,(1)、权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=fn时:加权算术平均数就等于简单算术平均数。(2)、权数的选择一般来说,次数就是权数,但也有不合适的情况,对于组距数列,要用每一组的组中值权充该组统一的变量值。例求下表所示数据的的算术平均数,(三)、是非标志的平均数(成数),在总体中,具有某种性质的单位占总体的比率为p,P也称为总体中具有某种属性的单位成数,是是非标志的平均数。不具有该种性质的单位占总体的比率为q。在总体中,将总体分为两大类,一类为具有某种性质的单位,它的单位数用表示,另一类为不具有某种性质的单位,它的单位数用表示,他们的和为总体单位总数N,即,那么P的计算公式如下:是非标志的平均数主要是针对于品质数据而言,把品质标志性质上的差异过度到数量上的变异。,(四)、算术平均数的数学性质,(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:,(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:(3)各标志值与算术平均数离差的平方和为最小值。,三、调和平均数(不能有标志值为0),1.简单调和平均数:标志值的倒数的算术平均数的倒数。适用场合:各标志值对应的标志总量为一个单位或是相等的情况。n指标志值的项数,2.加权调和平均数,计算公式:在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:,当各组标志总量相等,m1=m2=mn时,加权调和平均数可化简成为简单调和平均数形式。,3.平均数计算方法的选择,设:则:,例:某商品在三个市场上的销售情况,四、几何平均数G(geometricmean),N个变量值连乘积的N次方根。(不能有变量值为0)。适用于:(1)计算某种比率的平均数;(2)计算大致具有几何级数关系的一组数字的平均数,如经济指标的平均发展速度。1、简单几何平均数(适用于为分组资料)对数式:,(2)加权几何平均数(适用于分组资料)对数式:应该指出,用以计算几何平均数的各项数值必须大于0,否则就不能计算几何平均数或计算结果无实际意义。,例一:某水泥生产企业1995的水泥为100万吨,1996年与1995年相比增长9%,1997年比1996年增长16%、1998年比1997增长20%,求各年的平均增长率。例二:某投资银行某笔投资的年利率按复利计算,25年的年利率如下:年利率发展速度年数103%1105%4108%8110%10115%2,五、幂平均数,设有一组变量求各变量k次方的和:根据算术平均数的数学性质1,以幂平均代替各具体变量xi,其数值总和不变,则称为k阶幂平均数,当k取不同的整数值时,幂平均数就给出不同的数值平均数计算公式。,当k=1时,幂平均数,为算术平均数计算公式。当k=-1时,幂平均数,为调和平均数计算公式。当K趋近于0时,为几何平均数计算公式。,幂平均数的是关于k阶的递增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论