版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Ch3 统计的整理与描述统计的整理与描述n3.1 统计数据的预处理(new)n3.2 品质数据的整理与描述(new)n3.3 数字数据的整理与描述(new)n3.4 统计分组(类)n3.5 统计整理的应用(new) 介绍如何整理数据,以及利用何种技术描述整理的结果。 统计整理的目的目的,就是要把无规无规的数据变成有规有规的数据。 数据整理整理,通常包括:数据的预处理、分类或者分组、汇总等内容,它是统计分析的必要步骤。其中,统计分组,是统计整理的核心。 有规的数据的描述描述,通常是用统计图和统计表来完成。 Ch3 主要内容主要内容 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理
2、统计数据的预处理(new)3.2 品质数据的整理与描述品质数据的整理与描述(new)3.3 数字数据的整理与描述数字数据的整理与描述(new)3.4 统计分组(类)统计分组(类)3.5 统计整理的应用统计整理的应用(new)Ch3 学习要求学习要求1,掌握统计整理的程序2,掌握统计分组(类)技术3,掌握统计图(表)技术 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)3.2 品质数据的整理与描述品质数据的整理与描述(new)3.3 数字数据的整理与描述数字数据的整理与描述(new)3.4 统计分组(类)统计分组(类)3.5 统计整理的应用统计整理的应用
3、(new)Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理(new)3.2 品质数据的整理与描述(new)3.3 数字数据的整理与描述(new)3.4 统计分组(类)3.5 统计整理的应用(new)3.1 统计数据的预统计数据的预处理处理3.1.1 数据的审核与筛选3.1.2 统计数据的排序3.1.3 数据的排序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)3.2 品质数据的整理与描述品质数据的整理与描述(new)3.3 数字数据的整理与描述数字数据的整理与描述(new)3.4 统计分组(类)统计分组(类)3.5 统计整理的应用
4、统计整理的应用(new)返回一,统计整理综述 统计整理的目的目的: 无规无规的数据变成有规有规的数据。 数据整理整理: 数据的预处理分类或分组分类或分组汇总编制统计图表。它是统计分析的必要步骤。其中,统计分组,是统计整理的核心。 数据的审核和筛选,是统计整理的基础。 有规的数据的描述描述,通常是用统计图(表)来完成。3.1.1 数据的审核与筛选数据的审核与筛选 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)二,审核与筛选目的目的 以保证数据的质量,为下一步的整理分析打好基础。 从不同的渠道取得的统计数据,其审核的内容和方法有所不同; 不同类型的统计数
5、据,在审核内容和方法上有所差异。 数据的审核与筛选,包括原始数据和第二手数据的审核与筛选。3.1.1 数据的审核与筛选数据的审核与筛选 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)三,原始数据审核审核内容:完整性和准确性。完整性审核,主要是检查应调查的单位是否有遗漏,所有的调查项目或指标是否填写齐全等。准确性审核,主要包括两个方面:一是检查数据资料,是否真实地反映了客观实际情况,内容是否符号实际;二是检查数据是否有错误,计算是否正确等。审核数据准确性的方法方法,主要有逻辑检查和计算检查。逻辑检查,主要是从定性角度审核数据是否符合逻辑,内容是否合理,
6、各项目或数字之间有无矛盾。逻辑检查,主要用于品质数据的审核。计算检查,是检查调查表中的各项数据在计算方法上有无错误。计算检查,主要用于数值数据的审核。 3.1.1 数据的审核与筛选数据的审核与筛选 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)四,第二手数据审核内容:完整性和准确性,适用性和时效性。首先要弄清数据的来源、数据的口径以及有关的背景材料,以确定这些数据,是否符合分析研究的需要,是否需要重新加工整理等,不能盲目生搬硬套。对数据的时效性进行审核,有些时效性很强的问题,如果所取得的数据过于滞后,就失去了研究的意义。一般来说,应尽可能使用最新的数
7、据。数据经过审核后,确认适合实际需要,才能进行进一步的加工整理。 3.1.1 数据的审核与筛选数据的审核与筛选 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)五,数据筛选筛选对审核过程中发现的错误应及时纠正。当数据中发现的错误不能纠正,或者有些数据不符合调查的要求而又无法弥补时,就需要对数据进行筛选。数据筛选,包括两方面内容:一是将某些不符合要求的数据或者有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。数据的筛选,在市场调查中有特殊的意义。 3.1.1 数据的审核与筛选数据的审核与筛选 Ch3 统计的整
8、理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)返回一,数据的排序排序数据的排序,就是按一定的顺序将数据进行排列。简言之,就是对于一个给定的序i和给定序列 xi : i=1,2,n. (3.1.1) 如何确定一组具体的数据 Y1 ,Y2 ,Y3 , ,Ym-1 ,Ym ;, n m. 的某一个数值,在这个xi序列中的位置。一般地,值相同数据占据相同的位置,值不同数据则有不同的序。 3.1.2 统计统计数据的排序数据的排序 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)二,排序的目的目的 通过排序,发现发现数据的一些明显特征和
9、趋势,找到解决问题的线索。除此外,排序还有助于对数据检查纠错纠错,为重新归类或者分组提供依据。 在某些场合,排序本身就是分析的目的之一。例如,了解谁是中国家电生产的三巨头,对于家电生产商而言是非常重要的信息。美国财富杂志每年都要排出世界500强企业,通过这一信息,经营者不仅可以了解自己所处的地位,清楚自己的差距,还可以了解竞争对手的状况,从而有效地制定企业发展的规划和战略目标。 3.1.2 统计统计数据的排序数据的排序 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)三,数据的排序方式 数据序列,一般有三种排列,即递增序列、递减序列和随机序列。 递增序
10、列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.2) 递减序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.3) 随机序列,即序列xi一般有 x1 x2 x3 x4 x5 xn-1 xn ; (3.1.4) 即各个xi的i只表示它们是不同的数值,共有n个数据,除此以外,别无其他的意思。 3.1.2 统计统计数据的排序数据的排序 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)四,数据的一般排序方式 一般序列,主要是递增序列或随机序列。 排序后的标志变量,通称为标志变量序列。 标志变量序
11、列一般是指递增序列。它一般表示是 xi : i=1,2,n. (3.1.5) 其中:i代表序号,通常为升序自然数排列。 对于标志变量序列,当然有, x1 x2 x3 x4 x5 xn-1 xn ; 。3.1.2 统计统计数据的排数据的排序序 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)返回一,排序的方法数据的排序,首先要确定排序的标志排序的标志,然后根据标志的特点标志的特点,确定排序的方法。原则是:根据标志值的大小,来确定数据序的方向序的方向,然后根据序的方向,确定某一个数据在这个序中的位置序中的位置。简言之,就是 先确定标志序, 然后确定数据序。
12、不同类型的数据,其排序方法是不同的。无论是定性数据还是数字型数据,排序均可借助于计算机完成。 3.1.3 数据的排序方法数据的排序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)二,定类数据的排序(1)由于定类数据值本身,并不是一个数值,而是一个文字数据,定类数据的值之间,也不存在绝对的大小序关系,而只是一个属于或者不属于的归属关系归属关系,因此,定类数据的排序,不能完全按值的大小确定排序的方向。通常的做法是,按字母做升序或者降序升序或者降序排列,或者按笔画或者其他什么约定,做升序或者降序排列。总而言之,定类数据的排序,相对比较自由自由。 3.1
13、.3 数据的排序方法数据的排序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)【例3-1】为了研究广告市场的状况,某公司在某城市随机调查了200个市民,其中的一个问题是:“您比较关心下列哪一类广告?” 商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告。试对其进行排序。解:这里数据为200个居民的回答数据,共200个。这200个数据的排序,应先选择排序标志排序标志。由于这200个数据均从属于“广告类型”变量集,即 商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告显然,i=1,2,3,4,5,6。因此,可以选择“广告类
14、型”变量为排序标志, “广告类型”为定类变量,不同类型的广告就是变量值。由于广告变量值并不是一个数字,而是一个文字数据,广告变量值之间,也不存在绝对的大小序关系,而只是一个属于或者不属于的归属关系,因此,可以指定 x1= “商品广告”,x2=“服务广告”,x3=“金融广告”, x4=“房地产广告”,x5=“招生招聘广告”,x6=“其他广告”。根据标志序列xi,进一步确定200个回答数据的归属,就就可以确立每一个回答数据在xi中的位置 。3.1.3 数据的排序方法数据的排序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)三,定序数据的排序(1)定序
15、数据依然是文字数据,虽然定序数据的值之间,不存在绝对的大小关系,但存在一个类似大小的优于关系。优于关系优于关系可以用“”表示,它基本与“”等价。即定序数据序列xi,都存在如下序关系 x1 x2 x3 x4 x5 xn-1 xn ;且这种序关系常常与人们的价值观价值观一致。因此,可以根据人们的价值观,确定定序数据的序位置。3.1.3 数据的排序方法数据的排序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)【例3-2】在一项有关住房问题的研究中,研究人员在某城市随机调查了300户居民,其中的一个问题是“您对您目前的住房状况是否满意?” 非常不满意,不
16、满意,一般,满意,非常满意。试对其进行排序。解:这里数据为居民的回答数据,共300个。这300个数据的排序,应先选择排序标志。由于这300个数据,均从属于“满意程度类型”变量集,即 非常不满意,不满意,一般,满意,非常满意显然,i=1,2,3,4,5。因此,可以选择“满意程度”为排序标志, “满意程度”为定序变量,不同类型的满意值就是变量值。但是这个定序变量,显然有 非常不满意 不满意 一般 满意 非常满意于是,可令 x1=“非常不满意”,x2=“不满意”,x3=“一般”, x4=“满意”,x5=“非常满意”。再确定这300个数据的归属,就可完成它们的排序。 3.1.3 数据的排序方法数据的排
17、序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)四,定距数据和定比数据的排序定距数据和定比数据,都是数字数据。数字数据的数据值之间,一般存在大小的序关系序关系。因此,定距数据和定比数据的排序,可以根据标志值标志值的大小,来确定数据序的方向序的方向,然后根据序的方向,确定某一个数据在这个序中的位置位置。 定距数据和定比数据的排序,一般按递增递增方法排序。 按递增要求排序后的数据,也称为顺序统计量。3.1.3 数据的排序方法数据的排序方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)【例3-3】某班学生
18、共55人,每个人的兴趣、爱好各异,初步判断与他们的性别和年龄有关。从年龄这个角度分组,发现这55人的年龄,主要集中在 “18,19,20,21,22。”岁之间。试对其进行排序。解:这里数据为55个学生的兴趣、爱好数据,共55个。由于这55个数据的结果与年龄有关。因此,数据的排序标志为“年龄”, “年龄变量”为排序标志变量,不同的年龄值就是变量值。即 18,19,20,21,22 显然有 18 19 20 21 22 。于是,可令 x1=18,x2=19,x3=20,x4=21,x5=22。再确定这55个数据的归属,就可完成它们的排序。 3.1.3 数据的排序方法数据的排序方法 Ch3 统计的整
19、理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)返回3.2 品质数据的整品质数据的整理与描述理与描述3.2.1 定类数据的整理与描述3.2.2 定序数据的整理与描述 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)3.2 品质数据的整理与描述品质数据的整理与描述(new)3.3 数字数据的整理与描述数字数据的整理与描述(new)3.4 统计分组(类)统计分组(类)3.5 统计整理的应用统计整理的应用(new)返回3.2.1 定类数据的整理与描述定类数据的整理与描述一、分组与分类数据经过预处理后,可进一步做分类或者分组整理。所谓
20、分类(组)分类(组),就是值相同的数据归为同一个组,值不同的数据则归为不同的类。 在对数据进行整理时,应首先弄清数据的类型,因为不同类型的数据所采取的整理方法是不同的。对品质数据主要做分类处理,对数值型数据则主要做分组处理。 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1 定类数据的整理与描述定类数据的整理与描述二、定类数据整理的程序定类数据本身就是对事物的一种分类。所以,在整理时,除了要列出所分的类别外,还要计算每一类别的频数、频率、比例、比率指标,同时选择适当的图形进行描述,以便对数据的特征有一个初步了解。 Ch3 统计的整理与
21、描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1 定类数据的整理与描述定类数据的整理与描述三、频数频数与频率分布频率分布频数也称次数,就是落在各类别中的数据个数。将各个类别及其频数对应地排列起来,就构成了频数分布或者次数分布。频数分布有两个基本构成要素:一是分组标志序列xi,二是组的频数序列f i,或称次数序列。一般表示为标志序列xi : x1,x2,x3,x4,x5,xn-1, xn ; (3.2.1)频数序列f i : f1,f2,f3,f4,f5,fn-1, fn ; (3.2.2)其中,标志序列xi多为递增序列,而频数序列f i,则是根据分组的位
22、置归类计算的结果,是一个指标变量随机序列。 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1 定类数据的整理与描述定类数据的整理与描述三、频数与频率分布将频数分布用表格的形式表现出来,就是频数分布表。将频数分布用图形的形式表现出来,就是频数分布图频数分布图。频数分布图也叫统计分布图。 组数i 标志变量xi 频数fi 向上累计频数Si=f1+f2+fi. 频率 1x1 f1 S1 =f1. 2x2 f2 S2 =f1+f2. 3x3 f3 S3 =f1+f2+f3. n-1 xn-1 f n-1 S n-1 =f1+f2+fn-1. n
23、 Xnf n S n=f1+f2+fn. -合计 f - 表表34某某标志分组表标志分组表 Xi ; f i;分组表统计图 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1 定类数据的整理与描述定类数据的整理与描述三、频数与频率分布【例3-4】为了研究广告市场的状况,某广告公司在某城市随机调查了200个市民,其中的一个问题是:“您比较关心下列哪一类广告?” 商品广告,服务广告,金融广告,房地产广告,招生招聘广告,其他广告。根据广告标志整理后,得到市民关注的广告类型频数分布。组数i广告类型分组xi人数fi人数比fi/200 1商品广告
24、1120.5602服务广告 510.2553金融广告 90.0454房地产广告 160.0805招生招聘广告 100.0506其他广告 20.010-合计 2001.000市民关注的广告类型频数分布 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1 定类数据的整理与描述定类数据的整理与描述三、频数与频率分布解:这里的标志变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。即x1=“商品广告”,x2=“服务广告”,x3=“金融广告”, x4=“房地产广告”,x5=“招生招聘广告”,x6=“其他广告”。归类计算了200个市民的关
25、心广告数据,求得了人数变量序列fi,即f1=112,f2=51,f3=9,f4=16,f5=10,f6=2。通过数据的整理,我们可以知道,某市居民对广告关注的重心归属于哪一类,以及它的分布结构。 市民关注的广告类型频数分布图图31 居民关注广告的分布居民关注广告的分布9商品广告商品广告服务广告服务广告金融广告金融广告房地产广告房地产广告10162招生招聘广告招生招聘广告51112其他广告其他广告 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1 定类数据的整理与描述定类数据的整理与描述四、统计条形图和统计柱形图用图形显示频数分布,比用
26、频数分布表更加形象和直观。一张好的统计图,往往胜过冗长的文字表述。统计图的类型很多。多数可以用计算机完成。图31是统计图的一种。图31也叫统计条形统计条形图图。统计条形图,就是用宽度相同的条形高度或者长度来表示数据的变动。其横轴表示各类别数据的频数或者频率,通常条形的高度或长度表示频数或者频率的大小;而纵轴则表示各个类别。统计条形图可以横置,也可以纵置。横置时称为条形图,纵置时称为柱柱形图形图。绘制条形图时,各类别可放在横轴,也可以放在纵轴。放在横轴时称为条形图,放在纵轴时称为柱形图。 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.1
27、 定类数据的整理与描述定类数据的整理与描述四、统计条形图和统计柱形图【例3-5】某个学生班级55人,按性别标志归类统计后,得如下统计表。试编制其柱形图。解:以性别为横坐标,人数或者人数比重为纵坐标,在绘制纵横坐标的刻度后,标出各组别的数值,得某班学生性别分布柱形图3-2。 某班学生性别分组表组数i性别xi人数fi人数比fi/200 1男300.545452女250.45455-合计 551.00000频率频率%频数(人)频数(人)图图32 某班学生性别分布柱形图某班学生性别分布柱形图女女性别510152025男男45.4518.1827.2736.3654.549.09300 Ch3 统计的整
28、理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)返回3.2.2 定序数据的整理与描述定序数据的整理与描述一、累计频数和累计频率 前面介绍的定类数据的整理与描述方法,也都适用于定序数据。但有些方法,只适用于定序数据,而不适用于定类数据。 累计频数,就是将各类别的频数逐次累加起来。累计频数有向上累计和向下累计之分。向上累计频数 Si=f1+f2+fi. (3.2.4) 向下累计频数 Sn+1-i=fn+fn-1+fn+1-i. (3.2.5) 通过累计频数,可以很容易地看出某一类别以下或者以上的频数之和。 用同样的方法,可以推广出累计频率的概念。累计频率也存在着向
29、上累计和向下累计之分。 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.2 定序数据的整理与描述定序数据的整理与描述一、累计频数和累计频率 【例3-6】在一项有关住房问题的研究中,研究人员在某城市随机调查了300户居民,其中的一个问题是“您对您目前的住房状况是否满意?” 非常不满意,不满意,一般,满意,非常满意。根据满意程度标志,整理后得到了市民对住房状况评价的频数分布。 市民对住房状况的评价频数分布组数i回答类型分组xi户数fi向上累计户数Si=f1+f2+fi. 1非常不满意 2424=242不满意 108132=24+108 3一
30、般93225=24+108+93 4满意 45270=24+108+93+45 5非常满意 30300=24+108+93+45+30 -合计 300- Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.2 定序数据的整理与描述定序数据的整理与描述一、累计频数和累计频率解:这里的标志变量为“满意程度”, “满意程度”是个定序变量,不同“满意程度”值就是标志变量值。即x1= “非常不满意”,x2=“不满意”,x3=“一般”, x4=“满意”,x5=“非常满意”。归类计算了300户市民的满意值数据,求得了人数变量序列fi,即f1=24,f2=
31、108,f3=93,f4=45,f5=30。同时按Si=f1+f2+fi.计算向上累计户数序列。通过观察统计表和统计图的表现,我们亦可以知道,某市居民对住房关注的重心在何处。 图图33 居民对住房评价的分布居民对住房评价的分布不满意不满意一般一般满意满意非常不满意非常不满意非常满意非常满意30459324108 Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)3.2.2 定序数据的整理与描述定序数据的整理与描述二、累计频数分布图或者累计频率分布图 根据累计频数或者累计频率,可以编制累计频数分布图或者累计频率分布图。 图图34 居民对住房评价的累
32、计分布居民对住房评价的累计分布不满意不满意一般一般满意满意非常不满意非常不满意非常满意非常满意300100200SS Ch3 统计的整理与描述统计的整理与描述3.2 品质数据的整理与描述品质数据的整理与描述(new)返回3.3 数字数据的整数字数据的整理与描述理与描述3.3.1 数据的分组3.3.2 统计直方图与统计折线图3.3.3 频率分布的类型 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)3.2 品质数据的整理与描述品质数据的整理与描述(new)3.3 数字数据的整理与描述数字数据的整理与描述(new)3.4 统计分组(类)统计分组(类)3.5
33、 统计整理的应用统计整理的应用(new)返回3.3.1 数据的分组数据的分组一、数据的分组 品质数据的整理与描述方法,可用于数值型数据的整理与描述。但数值型数据还有一些特定的方法,并不适用于品质数据。 数据的分组,也叫统计分组。是指根据统计研究目的,将数据按某种标准划分为不同的组别。 分组后,再计算出各组中出现的次数或频数,就形成了一个频数分布表。 分组的方法有单变量分组和组距变量分组。 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组二、单变量分组(1)就是把数值相等的数据归为一个组,每组赋予一个变量值,然后再
34、计算出各组中的数据个数。这种分组方法,只适用于离散型变量且变量值比较少的场合 , 如 表 34所示。 组数i 标志变量xi 频数fi 向上累计频数Si=f1+f2+fi. 频率 1x1 f1 S1 =f1. 2x2 f2 S2 =f1+f2. 3x3 f3 S3 =f1+f2+f3. n-1 xn-1 f n-1 S n-1 =f1+f2+fn-1. n Xnf n S n=f1+f2+fn. -合计 f - 表表34某某标志单变量分组表标志单变量分组表 下面结合具体的例子,说明单变量分组的过程和频数分布的编制过程。 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据
35、的整理与描述(new)3.3.1 数据的分组数据的分组二、单变量分组(2)【例3-7】某公司50名员工的月工资资料如下。共50个数据,试对其进行单变量分组,并编制其频数分布。(p54)1200, 2500, 1000, 1200, 800, 1000, 1200, 1500, 1000, 1000, 1500, 800, 1000, 2000, 2500, 1200, 2000, 1200,1200, 1500,1000, 1200, 1000,800, 1200, 1000, 1200, 1200, 1500, 1200, 1200, 800, 1200, 1200, 800, 1200,
36、1000, 1200, 1000, 1500, 1200, 1500, 2000, 1200, 2000, 1200 ,2000, 2500, 1500, 1200。 解:先对上面的数据进行排序,结果为800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1500 1500 1500 1500 1500 1500
37、 1500 2000 2000 2000 2000 2000 2500 2500 2500。 显然,排序后的结果,构成了一个标志变量序列Xi :i=1,2,50. Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组二、单变量分组(3) 然后对Xi分组归类,值相同的归为同一个组,值不同的则归为不同的类,并计数计算各组xi的频数f i,得频数序列f i:i=1,2,6.,如下表3-5。组数i工资变量xi工资序列Xi归并计数人数fi1x1 =800 800,800,800,800,800 f1 =5 2x2 =1000
38、1000,1000,1000,1000,1000 f2 =10 3x3 =1200 1200,1200,1200,1200,1200 f3 =20 4x4 =1500 1500,1500,1500,1500,1500 f4 =7 5x5 =2000 2000,2000,2000,2000,2000 f5 =5 6x6 =2500 2500,2500,2500 f 6 =3 -合计 -f=50 表表35某公司员工工资变量分组表某公司员工工资变量分组表 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组二、单变量分组(
39、4)在此基础上,还可以计算频率、累计频数等等。观察表3-5,我们可以得到该公司员工的月工资分布特征认识。但从表3-5也可以看出,在数据较多的情况下,单变量分组由于组数较多,不便于观察数据分布的特征和规律,而且对于连续变量无法采取这种分组方法。同样的问题,也可以在观察图3-5的特征过程中得出。图3-5是根据某公司员工工资变量分布表做出来的。图3-5的特征并不非常明显。图3-5也叫统计分布竖线图。 图图35 某公司员工工资分布竖线图某公司员工工资分布竖线图20000频数(人)频数(人)工资5101501000300020 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据
40、的整理与描述(new)3.3.1 数据的分组数据的分组二、单变量分组 【例3-8】表36是某班学生按年龄分组表。共55人,试按年龄标志,对其进行单变量分组,并编制其频数分布图。解:以年龄为横坐标,人数或者人数比重为纵坐标,在绘制纵横指标的刻度后,标出各组别的数值,得某班学生年龄分布竖线图3-6。 组数i 年龄变量xi(岁 )人数(人)fi 人数比重(%) 118814.55 2191221.81 3201629.09 4211120.00 522814.55 合计 55100.00 表表36 某班学生按年龄分组表某班学生按年龄分组表图图36 某班学生年龄分布竖线图某班学生年龄分布竖线图206频
41、数(人)频数(人)频率频率%年龄8101214161718 1921 22 232418.1821.8225.4529.0914.551832.72 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组组距式分组,就是将数据的变化范围,依次划分为若干个半开半闭区间,并将每一区间内的数据归为一个组。区间的最小值称为组下限,区间的最大值称为组上限,区间的宽度称为组距。区间的中心值称为组中值。组中值是该组数据变量的代表值。 设某组的区间为Li,Ui),它等价于 Li xiUi. i=1,2,n. (3.3.
42、1)且 Li+1=Ui. i=1,2,n-1. (3.3.2)则组距 di=Ui-Li. i=1,2,n. (3.3.3)如果各组的组距均相等,则分组为等距分组;如果其中有一组的组距与其他组不相等,则分组为异距分组。 记各组的组中值为 ,则 (3.3.4)不论是等距分组还是异距分组,组距分组的结果,一般表示为 ix.,.,2 , 1;2niULxiii Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组组数i 分组标志变量xi 组中值 频数fi 频率 1 L1U1 f1. 2 L2U2 f2. 3
43、L3U3 f3. n-1 Ln-1Un-1 fn-1. n LnUn fn. - 合计 f 表表37某某标志组距变量分组表标志组距变量分组表 ix1xnx1nx3x2x Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组半开半闭区间Li,Ui)所对应的组,通常叫做闭口组。闭口组的组中值计算按式(3.3.4)计算。如果是无限区间(-,Ui)或者(Li,-),则其所对应的组为开口组。开口组通常存在于第1组(-,U1)和第n组(Ln,-)。开口组(-,U1)和(Ln,-)的组中值计算,则应修正为组数i 分
44、组标志变量xi 组中值 频数fi 频率 1 L1U1 f1. 2 L2U2 f2. 3 L3U3 f3. n-1 Ln-1Un-1 fn-1. n LnUn fn. - 合计 f 表表37某某标志组距变量分组表标志组距变量分组表 下面结合具体的例子,说明单变量分组的过程和频数分布的编制过程。 ix1xnx1nx3x2x.21.21. 11211nnndLxnidUxi Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组【例3-9】某班级80名学生的英语成绩资料如下。试按成绩标志进行组距变量分组,并编
45、制其频数分布。 表表38某年级某班名同学英语成绩表某年级某班名同学英语成绩表65,73, 66, 89, 75, 66, 69, 85, 59, 78, 96, 78, 80, 80, 85, 65, 86, 75, 88, 78, 55, 70, 79, 76, 73, 47, 74, 58, 76, 77, 79, 81, 66, 66, 94, 68, 60, 78, 92, 60, 78, 65, 87, 79, 86, 65, 79, 56,90,64, 67, 74, 49, 85, 74, 69, 62, 93, 79, 83, 87, 88, 84, 64, 77, 68, 7
46、8, 82, 89, 95, 87, 58, 85, 77, 77, 97, 69,69, 61, 99。解:先对上面的数据进行排序,结果为47 49 55 56 58 58 59 60 60 61 62 64 64 65 65 65 65 66 66 66 66 67 68 68 69 69 69 69 70 73 73 74 74 74 75 75 76 76 77 77 77 77 78 78 78 78 78 78 79 79 79 79 79 80 80 81 82 83 84 85 85 85 85 86 86 87 87 87 88 88 89 89 90 92 93 94 95
47、 96 97 99 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组 按不及格、及格、中等、良好、优秀5个等级分组,并对每一个等级的人数进行统计,求得该班级英语成绩分组表。 组数i成绩等级 成绩变量xi 成绩计数 人数fi比重(%) 组中值 1 不及格 60 47,49,55,56,58,58,59 f1 =7 8.8 55 2 及格 6070 60,60,61,69,69 f2 =21 26.2 65 3 中等 7080 70,73,73,79,79 f3 =25 31.2 75 4 良好 80
48、90 80,80,81,89,89 f4 =19 23.8 85 5 优秀 90100 90,92,93,94,99 f5 =8 10.0 95 - - 合计 - f=80 100. -表表39 某年级某班名同学英语成绩分布表某年级某班名同学英语成绩分布表 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组根据英语成绩分组表编制其统计分布图。其统计分布图的图形表现如图3-7。 图图37 某班学生成绩分布直方图某班学生成绩分布直方图700频数(人)频数(人)频率频率%成绩510152025405060
49、8090100 11012.518.7525.031.256.25 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组【例3-10】抽样得某地50户居民的月消费支出数据如下。试按支出等级标志进行组距变量分组,并编制其频数分布。(p37) 表表310某地某地5户居民月消费支出表户居民月消费支出表830,880,1230,1100,1180,1580,1210,1460,1170,1080,1050,1100,1070,1370,1200,1630,1250,1360,1270,1420,1180,10
50、30,870,1150,1410,1170,1230,1260,1380,1510,1010,860,810,1130,1140,1190,1260,1350,930,1420,1080,1010,1050,1250,1160,1320,1380,1310,1270,1250,解:先对上面的数据进行排序,结果为810 830 860 870 880 930 1010 1010 1030 1050 1050 1070 1080 1080 1100 1100 1130 1140 1150 1160 1170 1170 1180 1180 1190 1200 1210 1230 1230 1250
51、1250 1250 1260 1260 1270 1270 1310 1320 1350 1360 1370 1380 1380 1410 1420 1420 1460 1510 1580 1630 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.1 数据的分组数据的分组三、组距变量分组按支出水平的高低分为8个消费等级,并对每一个等级的标准进行确定,对每一等级的户数进行统计,求得该地消费品支出水平分组表。组数i消费等级 支出变量xi 消费水平计数 户数fi比重(%) 组中值 1低偏下 800900 810,830,860,870,880
52、 f1 =5 10 850 2低偏中 9001000 930 f2 =1 2 950 3低偏上 10001100 1010,1010,1030,1080 f3 =8 16 1050 4中偏下 11001200 1100,1100,1130,1190 f4 =11 22 1150 5中等 12001300 1200,1210,1230,1270 f5=11 22 1250 6中偏上 13001400 1310,1320,1350,1380 f6 =7 14 1350 7高偏下 14001500 1410,1420,1420,1460 f7 =4 8 1450 8高偏上 15001510,1580
53、,1630 f8 =3 6 1550 - - 合计 - f=50 100. -表表311 某地某地5户居民消费支出水平分布表户居民消费支出水平分布表 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)返回3.3.2 统计直方图与统计折线图统计直方图与统计折线图一、统计直方图统计直方图,是用矩形的宽度和高度来表示频率或频数分布的图形。在平面直角坐标系中,纵轴表示数据分组,横轴表示频率或频数,以矩形的宽度表示各组的组距,以矩形的高度表示对应组的频率或频数,这样,各组与其相应的频率或频数,就形成一个矩形列,该矩形列即为直方图。比如,图3-7就是根据表3
54、-9绘制而成的直方图。从统计直方图上,可以非常方便地看出该班学生成绩分布的基本状况。即该班学生的英语成绩以“中等”为中心,大体对称分布。显然,用图形来表示一个具体的分布的好处是,非常简明且直观。 图图37 某班学生成绩分布直方图某班学生成绩分布直方图700频数(人)频数(人)频率频率%成绩5101520254050608090100 11012.518.7525.031.256.25 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.2 统计直方图与统计折线图统计直方图与统计折线图二、统计折线图 统计折线图,也叫统计频率或频数的多边形图。
55、它是在直方图的基础上,把直方图顶部的中点(即与组中值对应的频数值)用直线连接起来,并向两端与横轴封闭,使多边形面积与直方图面积相等,再把原来的直方图抹掉,就是折线图。图3-8就是在图3-7基础上绘制而成的折线图。 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)图图38 某班学生成绩分布折线图某班学生成绩分布折线图700频数(人)频数(人)频率频率%成绩5101520254050608090100 11012.518.7525.031.256.253.3.2 统计直方图与统计折线图统计直方图与统计折线图三、统计直方图和统计折线图的作用当对数据所
56、分的组很多时,组距会越来越小,这时所绘制的折线图就会越来越光滑,逐渐形成一条平滑的曲线,这就是频率或频数分布曲线。频率或频数分布曲线,在统计学中有广泛应用,它是描述各种统计量和分布规律的重要方法。 图图38 某班学生成绩分布折线图某班学生成绩分布折线图700频数(人)频数(人)频率频率%成绩5101520254050608090100 11012.518.7525.031.256.25 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)返回3.3.3 频数和频率分布的类型频数和频率分布的类型一、频数和频率分布的类型 频率、频数分布的曲线类型,概括
57、起来主要有三种类型:钟型分布、型分布和型分布。 一般而言,一种分布类型对应着一种现象,并且在相当长的时间内,这种对应关系不会有大的改变。如果数据的整理结果,与此有比较大的差异,那么,要么是现象的发展出现了新的变化,要么是数据的搜集和整理出现了什么问题。比如,数据的质量不是很可靠,或者分组的方法不恰当,等等。 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.3 频数和频率分布的类型频数和频率分布的类型钟型分布 钟型分布的曲线图,呈现“两头小、中间大”的形式,类似于一口古钟而得名。大量社会经济现象,如人口总体身高的分布、体重的分布、产品零件
58、误差的分布、某种商品价格的分布等,均属于钟型分布,数理统计学中的正态分布,也属于钟型分布的一种特殊情形。钟型分布,具体包括对称分布、正偏分布、负偏分布三种形式。如图39所示:上图中,正偏分布又称右偏分布,负偏分布亦称左偏分布。 对称分布对称分布图图39 钟型分布示意图钟型分布示意图正偏分布正偏分布负偏分布负偏分布 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.3 频数和频率分布的类型频数和频率分布的类型型分布 U型分布的图形与钟型分布相反,形状如英文字母的U字,这种分布的特性,是两端变量值分布次数多,中间变量分布次数少。有些社会经济现
59、象属于U型分布,如对一个较长时期内正常死亡人口总体,按其死亡时的年龄分组所形成的次数分布,为U型分布。如图310所示: 图图310 U U型分布示意图型分布示意图400死亡率(死亡率(%)年龄10203040501020305060708060 Ch3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)3.3.3 频数和频率分布的类型频数和频率分布的类型型分布 型分布有正型分布和反型两种形式。如投资额按利润率大小的分布,呈正型分布,投资额按风险大小的分布,呈反型分布。如图311所示: 图图311 J型分布示意图型分布示意图正正J分布分布反反J分布分布 C
60、h3 统计的整理与描述统计的整理与描述3.3 数字数据的整理与描述数字数据的整理与描述(new)返回3.4 统计分组(类)统计分组(类)3.4.1 统计分组概述3.4.2 统计分组的方法 Ch3 统计的整理与描述统计的整理与描述3.1 统计数据的预处理统计数据的预处理(new)3.2 品质数据的整理与描述品质数据的整理与描述(new)3.3 数字数据的整理与描述数字数据的整理与描述(new)3.4 统计分组(类)统计分组(类)3.5 统计整理的应用统计整理的应用(new)返回3.4.1 统计分组概述统计分组概述一、统计分组(类)的概念统计整理的目的,是把无规的数据变成有规的数据。有规的数据,通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家长疫情培训课件
- 家长会安全课件
- 2026年离婚协议子女探视权合同
- 2026年水电维修服务合同协议
- 2026年高新技术企业投资合同协议
- 2026年医疗健康行业加盟合同
- 影视发行合同2026年内容交付协议
- 人寿保险合同2026年续签协议
- 2026届新高考英语冲刺复习非谓动作状语
- 天津餐饮安全教育培训课件
- 儿童肥胖的长期管理
- 2025早发性卵巢功能不全中西医结合诊疗指南
- 国开2025年《行政领导学》形考作业1-4答案
- 2025年G3锅炉水处理实操考试题库含答案
- 铁路专业基础知识考试题及答案
- 精神科护理文书书写规范
- 美术包过本科线协议书3篇
- DB61-T 1823-2024 樱桃贮运技术规范
- 高中英语分层教学课件
- 人工智能在医学教育中的应用现状与未来发展
- (正式版)DB15∕T 2083-2021 《人工荒漠藻土壤结皮治沙技术规程》
评论
0/150
提交评论