分配数列统计表统计图_第1页
分配数列统计表统计图_第2页
分配数列统计表统计图_第3页
分配数列统计表统计图_第4页
分配数列统计表统计图_第5页
已阅读5页,还剩81页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学第第2 2章章 统计整理统计整理 菏泽学院经济系菏泽学院经济系第第5 5节节 分配数列分配数列/8:41 AM课程回顾课程回顾一、统计分组的概念一、统计分组的概念二、统计分组的目的二、统计分组的目的三、统计分组的作用三、统计分组的作用四、统计分组标志选择的原则四、统计分组标志选择的原则五、统计分组的分类五、统计分组的分类/8:41 AM一、分配数列的概念和种类一、分配数列的概念和种类(一)分配数列的概念(一)分配数列的概念 是在分组的基础上,把总体的所有单位按组是在分组的基础上,把总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各归类整理,并按一定的顺序排列,形成总体中各个单位

2、在各组间的分布,又称次数分配。个单位在各组间的分布,又称次数分配。次数:分布在各组的个体单位数,又称为频数;总次数:全部总体单位数;比率:各组次数与总次数之比,又称为频率。/8:41 AM(二)/8:41 AM例例月工资分组月工资分组(元元)工人数工人数(人人)占占总数比重总数比重(%)2000 以下以下210 39.62000-2500187 35.32500 以上以上133 25.1合合 计计530100.0 组别(变量) 频数(次数) 频率(比率)/8:41 AM思考:思考: 分配数列与分组的区别?分配数列与分组的区别? 分配数列是在分组的基础上加分配数列是在分组的基础上加上次数(频数)

3、的分布。上次数(频数)的分布。/8:41 AM1.品质分配数列品质分配数列 指按品质标志对总体分组形成的数列,简称为品质数列。2.变量分配数列变量分配数列 指按数量标志对总体分组形成的数列,简称为变量数列。按照标志的性质不同按照标志的性质不同/8:41 AM变量数列变量数列离散型变量数列离散型变量数列连续型变量数列连续型变量数列变量数列变量数列单项数列单项数列组距数列组距数列/8:41 AM(一)(一) 品质数列品质数列二、分配数列的编制二、分配数列的编制 编制品质数列,只要根据统计研究目的,正确编制品质数列,只要根据统计研究目的,正确选择分组标志,确定分组标准,则事物性质的差选择分组标志,确

4、定分组标准,则事物性质的差异可以明确地表现出采,也就容易划分总体中各异可以明确地表现出采,也就容易划分总体中各组的性质界限。因此,在通常情况下,品质数列组的性质界限。因此,在通常情况下,品质数列能够较准确地反映总体各单位的分布状态和特征能够较准确地反映总体各单位的分布状态和特征。 /8:41 AM 某班学生的性别构成情况 例例按按性别分组性别分组绝对数人数绝对数人数比重比重(%)男男30 75女女10 25合计合计40100 组别组别 次数次数 频率频率/8:41 AM(二)变量数列(二)变量数列 按数量标志分组,就是将变量值即数量标按数量标志分组,就是将变量值即数量标志值划分为不同的区段,通

5、过各组的数量差别志值划分为不同的区段,通过各组的数量差别和变化来区分现象的不同性质,反映总体各单和变化来区分现象的不同性质,反映总体各单位在各组间的分布状态和特征。位在各组间的分布状态和特征。 /8:41 AM指每个组值只用一个具体的变量值表现的数列指每个组值只用一个具体的变量值表现的数列(1)(1)概念概念(3)(3)编制步骤编制步骤a.将原始资料按照变量值大小顺序排列。将原始资料按照变量值大小顺序排列。b.按变量值分为若干组。按变量值分为若干组。c.设计综合表(整理表),整理出变量值出现的次数设计综合表(整理表),整理出变量值出现的次数。/8:41 AM 己知某车间有己知某车间有24名工人

6、,他们的日产量名工人,他们的日产量(件)分别是:(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资要求根据以上资料编制变量数列。料编制变量数列。20,20,20, 21,21,21,21,21, 22,22,22,22,22,22,23,23,23,23, 24,24,24, 25,25, 26,排序后/8:41 AM/8:41 AM指每个组的变量值用一个区间来表现的变量数列指每个组的变量值用一个区间来表现的变量数列(1)概念概念/8:41 AM(3)组距数列编制的步骤组距

7、数列编制的步骤:a.排序,计算全距。排序,计算全距。b.确定组数、组距。确定组数、组距。c.确定组限及其表示法。确定组限及其表示法。d.计算频数、频率。计算频数、频率。e.制作组距数列统计表。制作组距数列统计表。/8:41 AM指每指每组组两端表示各组界限的变量值,各组的最小两端表示各组界限的变量值,各组的最小值为值为下限下限,最大值为,最大值为上限。上限。每组每组变量值变动区间的长度,为上下限之差变量值变动区间的长度,为上下限之差每组每组变量取值范围的中点数值变量取值范围的中点数值 2下限上限组中值/8:41 AM先先计算开口组的假定上、下限:计算开口组的假定上、下限:22相邻组组距上限首组

8、首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限/8:41 AM销售额(万销售额(万元)元)商店数商店数(个)(个)每百元每百元商品销售商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5组中值组中值=U-d/2=50-25=25组中值=L+d/2=300+100/2 =350/8:42 AMminmaxXXRq要能要能区分各组的性质差异区分各组的性质差异q要能反映总体资料的分布特征要能反映总体资料的分布特征q为方便计算,尽可能为为方便计算,尽可能为5 5,1010

9、,5050,100100,500500的的整数倍整数倍R组距组距(d) 组数(组数(k)/8:42 AM等距数列与异距数列等距数列与异距数列等距数列等距数列 各组组距均相等,一般适用于变量值比较均匀的情况。各组组距均相等,一般适用于变量值比较均匀的情况。异距数列异距数列 各组组距不全相等,不常用。各组组距不全相等,不常用。 /8:42 AM异距数列适用于异距数列适用于 1.1.标志值分布很不均匀的场合,在分布比较密标志值分布很不均匀的场合,在分布比较密集的区间内使用较短的组距,在分布比较稀少的部集的区间内使用较短的组距,在分布比较稀少的部分使用较长的组距。分使用较长的组距。2.等量的标志值具有

10、不同意义的场合等量的标志值具有不同意义的场合例:进行人口疾病研究的年龄分组,应采用异例:进行人口疾病研究的年龄分组,应采用异距分组,即:距分组,即:1岁以下按月分组,岁以下按月分组,1-10岁按照年岁按照年龄分组,龄分组,11-20按照按照5年分组,年分组,21岁以上按照岁以上按照10年年分组等。分组等。/8:42 AM异距数列适用于异距数列适用于3.3.标志值按一定比例发展变化的场合标志值按一定比例发展变化的场合例:例: 大城市百货商店营业额差别很大的,比如营大城市百货商店营业额差别很大的,比如营业额从业额从5万到万到5千万元,可采取公比为千万元,可采取公比为10的不等距的不等距分组,即:分

11、组,即:5-50万元,万元,50-500万元,万元,500-5000万万元,如果采用等距分组,即便组距为元,如果采用等距分组,即便组距为100万元,万元,也得分也得分50组,显然是不合适的。组,显然是不合适的。/8:42 AM1dRkdRkdRdR/8:42 AM组数的经验公式组数的经验公式 如果现象近似于正态分布,则可如果现象近似于正态分布,则可参考美国统计学家参考美国统计学家 斯特杰斯提出的斯特杰斯提出的分组数的经验公式:分组数的经验公式:组数(组数(K)=1+3.322lgN其中,其中,N为总体单位数。为总体单位数。/8:42 AMq对于离散变量,相邻组组限可以对于离散变量,相邻组组限可

12、以间断间断,也,也可可重叠重叠;q对于连续变量,相邻组组限对于连续变量,相邻组组限必须重叠必须重叠;q符合符合“上组限不计入上组限不计入”原则;原则;q首末两组可使用首末两组可使用“以下以下”及及“以以上上”的开口组。的开口组。/8:42 AM例例 工业企业按照职工人数分组可以表示为:工业企业按照职工人数分组可以表示为:499人以下,人以下,500-999人,人,1000-1999人,人,2000人以上等。人以上等。 工业企业按照职工人数分组可以表示为:工业企业按照职工人数分组可以表示为:500人以下,人以下,500-1000人,人,1000-2000人,人,2000人以上等人以上等./8:4

13、2 AM/8:42 AM/8:42 AM百万元)(27229minmaxXXRR组距组距(d) 组数(组数(k)组)(615271dRk/8:42 AM适用于总体单位的标志值变适用于总体单位的标志值变动比较均匀的情况动比较均匀的情况/8:42 AM 销售额销售额(百万元)(百万元)商店数商店数5以下以下51010151520202525以上以上合计合计50f410161343/8:42 AM 销售额销售额(百万元)(百万元)商店数商店数频率频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100fff各组各组单位数占总体单位总数的比重单

14、位数占总体单位总数的比重11/0ffff/8:42 AM/8:42 AM 休息是为了走更长的路,累了,迷茫时,就坐下来,静静地,想想未来路的方向/8:42 AM 从变量值低的组开始,将各组次数和比率逐次从变量值低的组开始,将各组次数和比率逐次向变量值高的组累计。向变量值高的组累计。 组距数列中的向上累计,表明各组上限以下总组距数列中的向上累计,表明各组上限以下总共所包含的总体次数和比率有多少。共所包含的总体次数和比率有多少。(一)向上累计(以下累计、或较小制累计)(一)向上累计(以下累计、或较小制累计)/8:42 AM 从变量值高的组开始,将各组次数从变量值高的组开始,将各组次数和比率逐次向变

15、量值低的组累计。和比率逐次向变量值低的组累计。 组距数列中的向下累计,表明各组组距数列中的向下累计,表明各组下限以上总共所包含的总体次数和比率下限以上总共所包含的总体次数和比率由多少。由多少。(二)向下累计(二)向下累计/8:42 AM 销售额销售额(百万元)(百万元)商店商店数数频率频率()累计次数累计次数累计频率累计频率()5以下以下51010151520202525以上以上410161343820322686合计合计50100fff/8:42 AM 销售额销售额(百万元)(百万元)商店数商店数频率频率()累计次数累计次数累计频率(累计频率()向下向下累计累计向下向下累计累计5以下以下51

16、010151520202525以上以上41016134382032268641430434750828608694100合计合计50100fff/8:42 AM 销售额销售额(百万元)(百万元)商店数商店数频率频率()累计次数累计次数累计频率(累计频率()向下向下累计累计向上向上累计累计向下向下累计累计向上向上累计累计5以下以下51010151520202525以上以上410161343820322686414304347505046362073828608694100100927240146合计合计50100fff/8:42 AM按按完成定额分完成定额分组组工人人工人人数数频率频率()累计次

17、数累计次数累计频率(累计频率()100以下以下100 11011012012013013014014015015016051011832112.52527.5207.552.5合计合计40100/8:42 AM按按完成定额分完成定额分组组工人人工人人数数频率频率()累计次数累计次数累计频率(累计频率()向下向下累计累计向上累向上累计计向下累向下累计计向上向上累计累计100以下以下100 11011012012013013014014015015016051011832112.52527.5207.552.551526343739404035251463112.537.5658592.597.5

18、10010087.562.535157.52.5合计合计40100/8:42 AM 当我们所关心的是标志值较小的现象当我们所关心的是标志值较小的现象的次数分布情况时,通常用向上累计;的次数分布情况时,通常用向上累计; 当我们所关心的是标志值较大的现象当我们所关心的是标志值较大的现象的次数分布情况时,通常用向下累计;的次数分布情况时,通常用向下累计;/8:42 AM四、图示法四、图示法 即用统计图来表示次数分配即用统计图来表示次数分配直方图直方图多边形图多边形图/8:42 AM(一)一)直方图直方图 用用矩形的宽度和高度矩形的宽度和高度来表示次数分配的图形。来表示次数分配的图形。它是最常用的次数

19、分配的图示法。绘制直方图时,它是最常用的次数分配的图示法。绘制直方图时,横轴表示各组组限,纵轴表示频数(一般标在图横轴表示各组组限,纵轴表示频数(一般标在图的左方)和频率(一般标在图的右方),如没有的左方)和频率(一般标在图的右方),如没有频率则只保留左侧频数。频率则只保留左侧频数。 按分布在各组的频数及频率确定各组在纵轴按分布在各组的频数及频率确定各组在纵轴上的坐标,并依据各组组距的宽度与频数的高度上的坐标,并依据各组组距的宽度与频数的高度绘成矩形。绘成矩形。/8:42 AMVAR00001174.0170.0166.0162.0158.0154.0403020100Std. Dev = 4

20、.86 Mean = 163.3N = 83.00用矩形的宽度和高度来表示频数分布的图形/8:42 AM(一)一)直方图直方图仍以某班应用统计学考试成绩数据,画成如下直方图仍以某班应用统计学考试成绩数据,画成如下直方图: 405060708090100 110/8:42 AM若若组距不等的话,用标准组距人数,然后据此画直方图:组距不等的话,用标准组距人数,然后据此画直方图:按按工人年龄分组工人年龄分组(岁)(岁)组距组距人数人数(人)(人)标准组距人数标准组距人数( 人人)频数频数密度密度=频数频数/组距组距15-20 5 1717 3.420-25 5 2828 5.625-30 5 404

21、0 8.030-35 5 707014.035-4510 65 32.5 6.545-50 5 1010 2.0合合 计计 -230- -/8:42 AM直方图直方图例例010203040506070年龄人数02468101214频数密度1015 2025 3035 4045 5055/8:42 AM(二)次数多边形(二)次数多边形图图在直方图的基础上连接各条形顶边的中点成折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配如下图红笔围成的,即为次数分配多边形多边形图图 (次数折线(次数折线图):图): 04812考分次数0102030比率(%)405060708

22、090100110/8:42 AM/8:42 AM/8:42 AM/8:42 AM饼图饼图 Pie/8:42 AM/8:42 AM/8:42 AM/8:42 AM/8:42 AM 各种不同性质的社会经济现象都有着特殊各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有下列四种类的次数分布。概括起来,主要有下列四种类型:型:钟形分布钟形分布水平分布水平分布U形分布形分布J形分布形分布 五、次数分布的主要类型五、次数分布的主要类型/8:42 AM 钟形分布的符征是钟形分布的符征是“两头小、中间两头小、中间大大”,即靠近中间的变量值分布的次数多,即靠近中间的变量值分布的次数多,靠近两端的

23、变量值分布的次数少。绘成曲靠近两端的变量值分布的次数少。绘成曲线图,宛如一口古钟。线图,宛如一口古钟。 (一)(一) 钟形分布钟形分布/8:42 AM 钟形分布具体可分为对称分布和非对称分布。钟形分布具体可分为对称分布和非对称分布。 对称分布的特征是中间变量值分布的次数最多,对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称增大而渐次减少,并且围绕中心变量值两侧呈对称分布。分布。 /8:42 AM 对称分布中的正态分布最为重要,许对称分布中的正态分布最为重要,许多社会经济

24、现象统计总体的分布都趋近于多社会经济现象统计总体的分布都趋近于正态分布。正态分布。 例如,农业平均亩产量的分布、零件例如,农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等。公差的分布、商品市场价格的分布等。 正态分布在社会经济统计学中具有重正态分布在社会经济统计学中具有重要意义。要意义。 /8:42 AM 在非对称的分布中,有不同方向的偏态,在非对称的分布中,有不同方向的偏态,如图如图:/8:42 AM 水平分布的特征是总体内各个变量值分布的水平分布的特征是总体内各个变量值分布的次数大体相等,绘成图形,表现为一条平行于横次数大体相等,绘成图形,表现为一条平行于横铀的水平线,如图铀的水

25、平线,如图: : (二)(二)水平分布水平分布/8:42 AM 例如,某些必需而用途又比较狭窄例如,某些必需而用途又比较狭窄的商品的商品( (如丧葬用品如丧葬用品) )的价格,需求弹性的价格,需求弹性小,不论价格如何变化,而需求量变动小,不论价格如何变化,而需求量变动不大。需求量按价格水平分组便呈现水不大。需求量按价格水平分组便呈现水平分布。平分布。 现实生活中严格的水平分布是比较现实生活中严格的水平分布是比较少见的,但对这种分布的研究,在统计少见的,但对这种分布的研究,在统计理论上有着特殊的意义。理论上有着特殊的意义。/8:42 AM U U形分布的待征与钟形分布恰恰相反,靠近两端的形分布的

26、待征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数变量值分布的次数多,靠近中间的变量值分布的次数少,形成少,形成“两头高、中间低两头高、中间低”的分布持征。绘成曲线的分布持征。绘成曲线图,象英文字母图,象英文字母“U”U”字。图形如字。图形如: :。 (三)(三)U形分布形分布/8:42 AM 有些社会经济现象的分有些社会经济现象的分布表现为布表现为U U形分布,例如人口形分布,例如人口死亡率分布。由于人口总体死亡率分布。由于人口总体中幼儿死亡人数和老年死亡中幼儿死亡人数和老年死亡人数均较高,而中年死亡人人数均较高,而中年死亡人数最低,因而按年龄分组的数最低,因而

27、按年龄分组的人口死亡率便表现为人口死亡率便表现为U U形分布。形分布。 /8:42 AM J J形分布有两种类型。正形分布有两种类型。正J J形分布是次数随着形分布是次数随着变量值的增大而增多,绘成曲线图变量值的增大而增多,绘成曲线图, ,犹如英文字母犹如英文字母“J J”字。字。 反反J J形分布是次数随着变量值的增大而减少,形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母绘成曲线图,犹如反写的英文字母“J”J”字,图形字,图形如下:如下:(四)(四) J J形分布形分布 /8:42 AM 在社会经济现象中,有一些统计总体在社会经济现象中,有一些统计总体呈呈J J形分布。形

28、分布。 例如,资本主义社会中,投资额按利例如,资本主义社会中,投资额按利润率大小分布,一般均呈正润率大小分布,一般均呈正J J形分布;而人形分布;而人口总体按年龄大小分布,则一般均呈反口总体按年龄大小分布,则一般均呈反J J分分布。布。/8:42 AM第五节第五节 统计表统计表一、统计表的概念与作用一、统计表的概念与作用二、统计表的结构二、统计表的结构三、统计表的分类三、统计表的分类四、宾词指标的设计四、宾词指标的设计五、编制统计表应注意的问题五、编制统计表应注意的问题/8:42 AM一、统计表的概念与作用一、统计表的概念与作用(一)统计表的概念(一)统计表的概念 把统计调查得来的数字资料,经

29、过汇总整把统计调查得来的数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统定顺序填列在一定的表格内,这个表格就是统计表。计表。 以纵横交叉的线条所形成的表格来表现统以纵横交叉的线条所形成的表格来表现统计资料的形式。计资料的形式。/8:42 AM(二)统计表的作用(二)统计表的作用 1. 代替冗长的文字叙述,简明、有条理地罗列数代替冗长的文字叙述,简明、有条理地罗列数据与统计量,方便阅读、比较与计算;据与统计量,方便阅读、比较与计算; 2. 展示数据的结构、分布和主要特征,便于在进展示数据的结构、分布和主要

30、特征,便于在进一步分析中选择与计算统计量。一步分析中选择与计算统计量。/8:42 AM二、统计表的结构二、统计表的结构(一)从内容上,统计表由主词和宾词两部分组成(一)从内容上,统计表由主词和宾词两部分组成1.主词:主词: 统计表所要说明的总体及其分组。统计表所要说明的总体及其分组。2.宾词:宾词: 统计表所要说明的总体的统计指标。统计表所要说明的总体的统计指标。/8:42 AM(二)从构成要素上,统计表包括三部分(二)从构成要素上,统计表包括三部分1.总标题总标题2.分标题(标目)分标题(标目)横行标题横行标题纵栏标题纵栏标题3.纵、横栏组成的本身及表中的数字纵、横栏组成的本身及表中的数字必要的附注和注明资料的来源必要的附注和注明资料的来源/8:42 AM按按销售额分组销售额分组(万元)(万元)商店数商店数(个)(个)每百元每百元商品销售额中支商品销售额中支付的流通费(元)付的流通费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5宾词主词纵行标题横行标题指标数值总标题/8:42 AM三、统计表的种类三、统计表的种类(一)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论