统计学第四章数据的概括性度量_第1页
统计学第四章数据的概括性度量_第2页
统计学第四章数据的概括性度量_第3页
统计学第四章数据的概括性度量_第4页
统计学第四章数据的概括性度量_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计描述,第一节统计表与统计图,第一节统计表与统计图,一、统计表(一)统计表的定义和结构定义有广义和狭义之分。书P36结构(P37):1、从格式上看,包括总标题、横行标题、纵栏标题(列标题)和指标数值四部分。2、从内容上看,由主词栏和宾词栏两部分组成。必要时在统计表下方加上“表外附加”:资料来源、指标注释、填表说明、填表单位、填表人等,第一节统计表与统计图,(二)统计表的分类1、按主词的结构分类:简单表、分组表和复合表2、按宾词设计分类:简单排列、分组平行排列和分组层叠排列注意:主词分组与宾词分组的区别P39,第一节统计表与统计图,(三)统计表的设计P39总要求:简练、明确、实用、美观,便于比较。特别提醒:表格左右两端不划线开口式;当数字小到可以忽略不计时,可填“0”,当缺某项数字资料时,用“”表示,不应该有数字时用“”表示。,第一节统计表与统计图,二、统计图(一)条形图与直方图(二)折线图(三)曲线图(四)累计(累积)曲线图(五)饼图与环形图三、频数分布图的类型P44,第一节统计表与统计图,(一)条形图与直方图条形图用宽度相同的条形的高度或长短来表示数据多少的图形;直方图用矩形的宽度和高度(即面积)来表示频数分布的图形。,第一节统计表与统计图,条形图与直方图的区别:、条形图主要用于展示分类数据,而直方图主要用于展示数值型数据;、条形图是分开排列的,而直方图是连续排列的;、条形图是用条形的长度表示各类别频数的多少,其宽度是固定的,宽度对于频数分布没有任何意义;而直方图是用矩形的面积来表示各组的频数分布,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,高度和宽度均有意义。,第一节统计表与统计图,在直方图中,频数随着组距的扩大而增加,随着组距的缩小而减少。要消除异距分组所造成的这种影响,需要引入频数密度/频率密度的概念,计算公式:P31频数密度=频数/组距频率密度=频率/组距规律:各组频数密度与各组组距的乘积之和等于总体个数或样本个数;各组频率密度与各组组距乘积之和等于1。,第一节统计表与统计图,频数累积的方法有两种:向上累积和向下累积P32向上累积对于顺序数据,是从低级别的频数向高级别的频数逐个累加,每个数值表示在某一级别及其以下的频数之和;对于数值型数据则是从变量值小的一方向变量值大的一方累加频数,每个数值表示在某组上限以下的频数之和。向下累积对于顺序数据,是从高级别的频数向低级别的频数逐个累加,每个数值表示在某一级别及其以上的频数之和;数值型数据则是从变量值大的一方向变量值小的一方累加频数,每个数值表示在某组下限以上的频数之和。累积频率与上类似。,第一节统计表与统计图,(五)饼图与环形图饼图用圆形及圆内扇形的角度来表示总体中各组成部分所占比例的图形。环形图用两个或两个以上的圆环分别表示各组数据频率大小的图形。,第一节统计表与统计图,饼图与环形图的区别:1、饼图是实心的,而环形图是空心的;2、饼图用扇形的角度或扇形面积来表示频率,而环形图用环中的一段表示频率。3、饼图只能显示一个总体或一个样本各部分所占的比例,而环形图则可以同时绘制多个环来显示多个总体或多个样本的各部分比例。,第四章统计描述,第二节分布的集中趋势,第二节分布的集中趋势,反映数据分布集中趋势的主要指标有:众数(mode)中位数(median)平均数(average),第二节分布的集中趋势,一、众数(mode)P53定义:一组数据中出现的频数最多、频率最高的标志值,用表示。众数主要测度分类数据的集中趋势,也适用于顺序数据和数值型数据。例4.1:对50位购买饮料的消费者进行调查,其中购买鲜橙多的有6人,买统一绿茶的有11人,买可口可乐的有15人,买百事可乐和脉动的分别有9人,求众数。=可口可乐,第二节分布的集中趋势,例4.2:随机抽取9个家庭,调查每个家庭的人均月收入,数据如下:108075010808509601080200012501630=1080众数是一个位置代表值,其特点是不受数据中极端值的影响。可能还有两种情况:1、没有众数2、有两个众数,第二节分布的集中趋势,二、中位数(median)P56定义:一组数据排序后处于中间位置上的标志值,用表示。中位数主要测度顺序数据的集中趋势,也适用于测度数值型数据,但不适用于分类数据。对于未分组数据,计算中位数的步骤:1、对数据排序2、确定中位数的位置中位数位置=3、确定中位数的具体数值,第二节分布的集中趋势,例4.3:随机抽取9个家庭,调查每个家庭的人均月收入:15007507801080850960200012501630解:先排序:75078085096010801250150016302000中位数位置=(9+1)/2=5中位数Me=1080例4.4:随机抽取10个家庭,排序后为:66075078085096010801250150016302000中位数位置=(10+1)/2=5.5中位数Me=(960+1080)/2=1020特点:中位数是一个位置代表值,不受极端值的影响。,第二节分布的集中趋势,三、平均数(average)P46(一)算术平均数平均数要求标志值和单位之间存在一一对应关系。如:全国人均能源消费量(平均指标)注意平均指标与强度相对指标的区别:强度相对指标=某一指标数值/另一有联系的指标数值如人均能源生产量、人均钢产量、人均粮食产量,第二节分布的集中趋势,1、算术平均数的计算(1)简单算术平均数未分组数据总体:样本:总体平均数N总体单位数各单位标志值样本平均数n样本单位数例P46P30,第二节分布的集中趋势,(2)加权算术平均数已分组数据总体:样本:各组标志值或组中值N总体组数各组标志值出现的频数n样本组数频率,第二节分布的集中趋势,假设:将数据分成3个组,各组的组中值分别为,频数分别为,设则:,第二节分布的集中趋势,2、权数的作用与选择(1)权数的作用简单算术平均数:加权算术平均数:“权衡轻重”的作用权数:绝对数形式(频数)和相对数形式(频率),第二节分布的集中趋势,2、权数的作用与选择(2)权数不起作用的场合简单算术平均数实际上是加权算术平均数的特例。(3)权数的选择例P48,当f1=f2=fn时:,第二节分布的集中趋势,3、是非标志的平均数对于品质标志的具体表现只有两种的,用“是”与“非”来区分,称为“是非标志”。样本总体又例P49,第二节分布的集中趋势,4、算术平均数的数学性质P50算术平均数与标志值个数的乘积等于各标志值的总和;各个标志值与算术平均数离差之和等于零;各标志值与算术平均数离差的平方和为最小值。,第二节分布的集中趋势,(二)调和平均数(harmonicmean)1、简单调和平均数定义:各个标志值的倒数的简单算术平均数的倒数。应用场合:各标志值对应的标志总量为1个单位(或相等)。,第二节分布的集中趋势,2、加权调和平均数表示各组标志值对应的标志总量例P51注意:当标志值有一个为“0”时,不宜计算调和平均数,第二节分布的集中趋势,加权调和平均数是加权算术平均数的变形:调和平均数与算术平均数的区别在于已知和未知的不同。调和平均数:已知各组标志值和对应的标志总量,未知单位数(各组单位数=各组标志总量/对应的标志值)算术平均数:已知各组标志值和对应的频数(频数总和=单位数),未知标志总量(各组标志总量=各组标志值对应的频数),第二节分布的集中趋势,当各组标志总量相等,即时,加权调和平均数可化为简单调和平均数:简单调和平均数是加权调和平均数的特例。,第二节分布的集中趋势,(三)几何平均数(geometricmean)定义:n个标志值连乘积的n次方根,用G表示。一般用来计算时间上相互衔接的比率的平均数。例P52例4.5:一家水泥厂2000年的水泥产量为100万吨,2001年与2000年相比增长率为9%,2002年比2001年增长了16%,2003年比2002年又增长了20%,求年平均增长率。,第二节分布的集中趋势,如果采用算术平均数计算,则年平均增长率为:(9%+16%+20%)/3=15%要检验这一结果的正确性,需要用这个平均增长率计算的2003年水泥产量与2003年的实际产量相比较。按照以上年平均增长率来计算的2003年水泥产量为:100(1+15%)(1+15%)(1+15%)=152.0875万吨2001年的实际产量为:100(1+9%)=100109%=109万吨2002年的实际产量为:109(1+16%)=100(1+9%)(1+16%)=126.44万吨2003年的实际产量为:126.44(1+20%)=100(1+9%)(1+16%)(1+20%)=151.728万吨,第二节分布的集中趋势,如何正确计算年平均增长率?设开始的数值为,逐年增长率为第n年的数值为:从到用n年,每年的增长率都相同,则这些增长率可视为年平均增长率G,只要使就能求出年平均增长率G。,第二节分布的集中趋势,则:在本题中,年平均增长率为:=114.9093%1=14.9093%,第二节分布的集中趋势,四、众数、中位数和算术平均数的关系(一)区别1、众数是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的代表值;而算术平均数是由所有数据计算得到的。2、算术平均数易受极端值的影响,而众数和中位数不受极端值的影响。3、众数主要适合于测度分类数据的集中趋势,中位数主要适合于测度顺序数据,而算术平均数只用来测度数值型数据。,第二节分布的集中趋势,四、众数、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论