《统计学》课件 3统计数据与显示_第1页
《统计学》课件 3统计数据与显示_第2页
《统计学》课件 3统计数据与显示_第3页
《统计学》课件 3统计数据与显示_第4页
《统计学》课件 3统计数据与显示_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课前复习思考题

11.调查方案的基本要素有哪些?2.问卷的结构设计由哪几个部分构成?3.问卷设计中关于“提问项目设计”的类型有哪些?4.”回答项目设计“的类型有哪些?5.问卷设计应遵循的原则是什么?

2调查方案设计确定调查目的主要的调查内容确定调查对象和单位调查方式和方法调查时间和人员调查项目经费预算课前复习思考题31.调查方案的基本要素有哪些?2.问卷的结构设计由哪几个部分构成?3.问卷设计中关于“提问项目设计”的类型有哪些?4.“回答项目设计”的类型有哪些?5.问卷设计应遵循的原则是什么?

问卷的结构设计※4问卷的基本结构开头部分甄别部分主体部分背景部分问候语填写说明问卷编号课前复习思考题

51.调查方案的基本要素有哪些?2.问卷的结构设计由哪几个部分构成?3.问卷设计中关于“提问项目设计”的类型有哪些?4.根据提问项目或内容的不同,封闭性问题的回答方法有哪几种?5.问卷设计应遵循的原则是什么?回答的类型与方法

回答的类型与方法6回答的类型与方法开放性问题(自由回答型)封闭性问题(选择回答型)两项选择法多项选择法顺序选择法评定尺度法双向列联法限制选择型多项选择型单项选择型课前复习思考题

71.调查方案的基本要素有哪些?2.问卷的结构设计由哪几个部分构成?3.问卷设计中关于“提问项目设计”的类型有哪些?4.“回答项目设计”的类型有哪些?5.问卷设计应遵循的原则是什么?问卷设计的要则

8问题中的某些概念或用词要清楚、明确;2.避免双重问题;

尽量把抽象的问题转化成具体的问题;

问题越短越好,尽量简洁;避免诱导性的问题和词语;6.间接询问敏感问题。《统计学》课程体系

9统计学(方法论)描述统计学(数据为总体)推断统计学(数据为样本)数据收集数据整理抽样与参数估计假设检验方差分析与试验相关与回归分析时间序列分析指数集中趋势离散程度偏态与峰态12345678910数据描述数据解释第3章统计数据的整理与显示统计学统计数据的整理与显示

11统计数据的整理与显示12统计数据的整理与显示12前言13

统计数据收集后是分散的、零星的,不能说明任何问题,而统计的目的就是要分析事物总体的数量特征及其发展规律。

本章主要介绍运用科学的方法整理数据,合理使用统计图表描述统计结果,这是应用统计的基本技能之一。

为此需要我们思考:统计数据整理与展示有哪些科学方法?如何应用?如何展示数据的特征呢?如何描述分析总体的规律呢?学习目标与重难点提示14了解数据预处理的内容和目的2.掌握分类和顺序数据(品质数据)的整理

与显示方法※3.掌握数值型数据的整理与显示方法※4.用Excel作频数分布表和图形※5.理解如何合理使用统计图表目的:为统计数据的描述分析打基础。目

录CONTENTS3.1统计数据的预处理3.2品质数据的整理与图示※3.3数值型数据的整理与图示※3.4统计表设计3.5应用Excel作统计图表开篇案例P49

16科尔盖特-帕尔莫利夫公司质量管理开篇案例

案例背景171806年,科尔盖特-帕尔莫利夫公司建于纽约市,除了驰名的传统条形皂、洗衣粉、牙膏外,该公司还经营Mennen、软形皂、希尔宠物食品等。而今科尔盖特公司在70个国家拥有自己的分公司,每年的销售额超过70亿美元。科尔盖特-帕尔莫利夫公司质量管理开篇案例

案例18这家公司在家用洗衣粉的质量保证方面运用了统计学,其中一项就是顾客对每盒洗衣粉数量的满意程度。在同一类型的每一个盒子里装上相同重量的洗衣粉,可是洗衣粉的数量受洗衣粉密度的影响。例如,如果洗衣粉的密度很大,则较少量的洗衣粉就可以达到一盒指定的重量。这样顾客打开盒子的时候会发现洗衣粉似乎没有装满。科尔盖特-帕尔莫利夫公司质量管理开篇案例

案例19

为了控制高密度的粉质问题,该公司在粉质密度上进行了一些可行性的限制。因此,需要定期抽取统计样品来进行密度测试。然后将这些概括数据提供给一线生产人员,以便必要时采取校正措施,把粉质密度控制在特定的理想范围内。在一周时间内抽取的150份样品的密度频数分布表和直方图如下表与下图所示。如果密度超过0.40便被认为是不正常。如果密度的频数分布表和直方图显示密度小于或等于0.40,则产品就满足质量要求。经理们看到这些统计概括数据,就会对洗衣粉生产过程的质量表示满意。科尔盖特-帕尔莫利夫公司质量管理开篇案例

案例200.29-0.30

30

0.31-0.32

75

0.33-0.34

32

0.35-0.36

9

0.37-0.38

3

0.39-0.40

1

粉质密度频数分布表

粉质密度分布直方图密度频数样本数1500.30

0.32

0.34

0.36

0.38

0.40

255075不到1%的样品靠近0.40的不满意水平科尔盖特-帕尔莫利夫公司质量管理开篇案例

案例讨论211.科尔盖特公司对产品质量进行监控时,应用了统计数据调查的什么方式?2.得到的统计结果是参数还是统计量?数据的预处理|3.1.1数据审核|3.1.2数据筛选|3.1.3统计数据的排序|3.1.4数据透视表|3.1数据的预处理

23数据预处理是在统计分组之前对数据所做的必要处理,包括:数据的审核数据的筛选数据的排序3.1数据的预处理

24数据审核检查数据中的错误数据筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征数据透视表按需要汇总3.1.1数据审核

统计数据的审核——原始数据(rawdata)25完整性审核审核的内容准确性审核1.单位或个体是否有遗漏2.项目或指标是否填写齐全1.检查数据是否真实无误2.检查数据计算是否正确3.1.1数据审核

数据的审核——原始数据(rawdata)26逻辑检查审核的方法计算检查1.从定性角度2.主要用于对分类和顺序数据的审核1.从定量角度检查计算结果和计算方法有无错误2.主要用于数值型数据的审核3.1.1数据审核

数据的审核——二手数据(secondhanddata)27弄清楚数据的来源、口径、背景材数据是否符合自己分析研究的需要适用性时效性尽可能使用最新的数据3.1数据的预处理

3.1.2数据筛选※28将符合统计整理特定条件的数据保留,而将不符合身体条件的数据剔除。3.1.2数据筛选

数据筛选(datafilter)29当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选。数据筛选的内容包括两个方面:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除3.1.2数据筛选

应用实例3-1

30下表是8名学生4门课程的考试成绩,利用Excel筛选出统计学成绩等于75分的学生,英语成绩最高的前3名,4门课程考试成绩均大于70分的学生。8名学生的考试成绩数据

3.1.2数据筛选

数据筛选(datafilter)31

用Excel进行数据筛选

姓名统计学成绩数学成绩英语成绩经济学成绩赵颖75968183袁方75587690“自动筛选”与”高级筛选”姓名统计学成绩数学成绩英语成绩经济学成绩王翔91759594李华81608664陈风87769277姓名统计学成绩数学成绩英语成绩经济学成绩王翔91759594赵颖75968183陈风87769277统计学成绩为75分英语成绩前3名4门课程均在70分以上3.1数据的预处理

3.1.3统计数据的排序※32按一定的规律把一列或多列无序的数据进行整合排列,使之变成有序数据的过程。3.1.3统计数据的排序

数据排序(datarank)33按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索。排序有助于对数据检查纠错,以及为重新归类或分组等提供依据。在某些场合,排序本身就是分析的目的之一。排序可借助于计算机完成。用Excel进行数据“排序”3.1.3统计数据的排序

数据排序(datarank)343.1.3统计数据的排序

数据排序(datarank)343.1.3统计数据的排序

数据排序(方法)35分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)<x(2)<…<x(n)递减排序:可表示为:x(1)>x(2)>…>x(n)3.1.3统计数据的排序

363.1.4数据透视表

数据透视表37可以从复杂的数据中提取有用的信息可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图形成一个符合需要的交叉表(列联表)在利用数据透视表时,数据源表中的首行必须有列标题3.1.4数据透视表

数据透视表(用Excel创建数据透视表)38第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置,然后选择【布局】第5步:在【向导—布局】对话框中,依次将“分类变量”拖至左边的“行”区域,上边的“列”区域,将需要汇总的

“变量”拖至“数据区域”第6步:然后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表

用Excel创建数据透视表3.1.4数据透视表P46应用实例3-1

39从某大学抽取30名学生,调查他们的性别、家庭所在地区、平均月生活费支出、平均每月购买生活用品支出和首选因素,在列变量中给出学生的家庭所在地区,对不同性别的学生的平均月生活费支出、平均每月购买生活用品支出进行交叉汇总。品质数据的整理与显示|3.2.1分类数据的整理与显示|3.2.2顺序数据的整理与显示|3.2品质数据的整理与显示

数据的整理与显示(基本问题)41要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的;对分类数据和顺序数据主要是做分类整理;※对数值型数据则主要是做分组整理;※适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。3.2.1分类数据的整理与图示

(1)分类数据的图示49用宽度相同的条形的高度或长短来表示各类别数据。条形图通常用来比较变量,其长度对应数值,纵轴表示分组;柱形图用来呈现变量的分布或趋势变化,其高度对应数值,横轴表示分组或分类。3.2.1分类数据的整理与图示

(2)分类数据的图示48用图形来显示频数分布,会更加形象和直观。3.2.1分类数据的整理与图示

440.29-0.30

30

0.31-0.32

75

0.33-0.34

32

0.35-0.36

9

0.37-0.38

3

0.39-0.40

1

粉质密度分布直方图密度频数样本数1500.30

0.32

0.34

0.36

0.38

0.40

255075不到1%的样品靠近0.40的不满意水平例:频数(frequency)

:落在各类别中的数据个数3.2.1分类数据的整理与图示

应用实例3-3

46【应用实例】为研究不同类型的软饮料的市场销售情况,一家市场调查公司对随机抽取的一家超市进行调查。右表是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录。生成频数分布表,观察饮料类型和消费者性别的分布状况,并进行描述性分析。制作频数分布表绿色健康饮品Excel3.2.1分类数据的整理与图示

不同类型饮料和顾客性别的频数分布(P50-51)47饮料品牌频数比例百分比(%)可口可乐150.3030旭日升冰茶110.2222百事可乐90.1818汇源果汁60.1212露露90.1818合计5011003.2.1分类数据的整理与图示

对比条形图50分类变量在不同时间或不同空间上有多个取值对比分类变量的取值在不同时间或不同空间上的差异或变化趋势电脑品牌一季度二季度联想256468IBM285397康柏247328戴尔5636883.2.1分类数据的整理与图示

对比条形图(例图)513.2.2顺序数据的整理与图示

(一)顺序数据的整理(可计算的指标)74累积频数(cumulativefrequencies):

各类别频数的逐级累加累积频率(cumulativepercentages):

各类别频率(百分比)的逐级累加

3.2.2顺序数据的整理与图示

累积频数与累积频率两种类型75例:全班35名学生某课程考试成绩如下:

成绩成绩学生数向上累积向下累积

(顺序)

xf(f/f)ff/ff

f/f

不及格60以下1(2.9)12.935100及格60-705(14.3)617.23497.1中等70-8010(28.6)1645.82982.8

良好80-9015(42.8)3188.61954.2

优秀90以上4(11.4)35100411.4—35(100)—向上累积频数与频率:频数(频率)由低组向高组进行累计;表示上限以下的累计频数和频率。(2)向下累积频数与频率:

频数(频率)由高组向低组进行累计;

表示下限以上的累计频数和频率。

3.2.2顺序数据的整理与图示

应用实例3-476【应用实例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————3.2.2顺序数据的整理与图示

顺序数据的频数分布表(例题分析)77乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意21997864387.033.026.021.312.7合计300100.0————3.2.2顺序数据的整理与图示

78乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093603412.7合计300100.0————3.2.2顺序数据的整理与图示

(二)顺序数据的图示——累积频数分布图(例题分析)79243001322252700100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(a)向上累积27616830300750100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(b)向下累积甲城市家庭对住房状况评价的累积频数分布课堂练习

80甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510248.0300100.0合计300100.0————课堂练习

81甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————3.2.2顺序数据的整理与图示

环形图(annularchart)82环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于结构比较研究环形图主要用于展示分类和顺序数据3.2.2顺序数据的整理与图示

环形图(例图)838%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

甲乙两城市家庭对住房状况的评价外环表示乙城市内环表示甲城市统计数据的整理与显示84统计数据的预处理审核筛选品质数据的整理与图示分类数据顺序数据整理:频数.比例.比率图示:条形.柱形.饼图整理:累计频数.累计频率图示:累计频数分布图

环形图排序透视表数值型数据的整理与图示3.3数值型数据的整理与显示※

3.3.1数据分组※3.3.2数值型数据的图示3.3.3频数分布的类型※内容提示3.3.1数据分组※

根据统计研究的需要,将原始数据按某种标准化分成不同的组别.组别频数频数分布表(一)分组方法分组方法等距分组异距分组单变量值分组组距分组1.单项式分组※

(要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况

表现形式例1:某村家庭拥有儿童情况

按家庭儿童个数分组家庭数(户)

05110023032

1372.组距分组

(要点)将变量值的一个区间作为一组适合于连续变量适合于变量值较多的离散变量情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组~~~~~表现形式例2:某公司所属15个企业,最大企业1500人,最小的企业100人,按规模(人数)

分成大中小型三类。

按人数分组企业个数

100~5004501~100081001以上3

15

例3:某课程考试成绩统计如下:

按成绩分组学生数60以下160~70670~801480~90790以上2

30组距分组的原理及方法※1、组数与组距的确定

组数与组距成反比关系,在标志值变动一定的条件下,组数越多,组距越窄;反之,组数越少,组距就越宽。组数和组距的确定,应以分组后能反映各类型特征、组与组之间有明显差异为适度。

有关概念:全距=极大值–极小值、等距、异距、上限、下限、组距=上限–下限、组限、闭口组、开口组。

按成绩分组(分)学生数(人)

60以下260~70570~80980~901290以上2

组距式分组可根据事物的特点,分别采用等距式分组和异距式分组两种形式。

2、等距式分组方法:(1)计算全距:R=Xmax–Xmin

(2)确定组数:k

(a)根据事物本身的特点确定分多少组(b)如事物本身的特点不明显,可按美国统计学家斯特格斯的经验公式,确定组数

k=1+3.322Logn(n为数据个数)

(3)确定组距:i=R/k(i的数据一般取5或10的整倍数)。

第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。(4)等距式分组的特点

:适合数据分布比较均匀,便于各组单位数或标志值直接比较,分组规整,易于编制,在实际中应用广泛。

(1)工资(元)工人数(人)(2)工资(元)工人数(人)

540-5502

545-5553

550-5603

555-5655

560-5705

565-5752

合计10合计10

4、组限的确定

1)组限的表示:若分组的数值型变量为离散型时,两相邻组的组限必须断开;若分组的数值型变量为连续型时,则两相邻组的组限必须重叠,且采用“上组限不在内”原则进行统计。540570545550555560565例:某工人小组10名工人月工资如下:(单位:元)

545549554556558560562564569570

要求:将10名工人“工资”进行分组,k=3i=10

▲▲▲▲▲▲▲▲▲▲2)确定组限的一般原则:

组限是划分事物质的数量界限,组限的确定一定要根据事物内在特点,保持组内的同质性,组间的差异性;且最低组的下限略小于最小标志值。最高组的上限略大于最大标志值,若出现了极大(或极小)的变量值,则适宜用开口组。

5、组中值:

1)概念:是各组变量值的代表值,通常为上限和下限的算术中点。

2)计算方法:组中值=(上限+下限)/2

开口组的组中值缺上限=下限+相邻组的组距/2

缺下限=上限–相邻组的组距/23)假设条件:每组内标志值为均匀分布

3、异距式分组(不等距分组):

根据事物内在的特点,保持组内的同质性。

如果数据分布不均匀,为了正确反映各类型特征,就应采用异距分组形式。如人口的年龄,按人的生命过程阶段特征分组,不宜用等距分组。比如瑞典人口学家桑德堡为研究人口的变化趋势,将人口分为增长型、稳定型、减少型三种类型,其年龄分组就是采用异距式.

有些社会经济现象的类型差异,几乎成几何级数变化,组距就宜按几何级数确定。

年龄人口构成类型(%)高炉按有效容积分组(立方米)分组增加稳定减少

100以下0~144026.520100~20015~505050.550200~40050以上1023.030400~800800~16001600以上近三年我国人口数及其构成年龄07年08年09年0-1419.419.018.5

15-6472.572.773.0

65岁以上8.18.38.5

年末人数(万人)132129132802133474

其中:男性比例(%)自然增长率(‰)6804851.55.176835751.55.086865251.45.05(二)组距分组

(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K确定组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即

组距=(最大值-最小值)÷组数统计出各组的频数并整理成频数分布表。(三)频数分布表的编制

(例题分析)【例】某电脑公司2009年前4个月各天的销售量数据(单位:台)。试对数据进行分组。

(四)频数分布表的编制

(步骤)确定组数:根据

Sturges提出的经验公式得组数K为:确定各组的组距:组距=(237-141)÷10=9.6

10用Excel制作频数分布表

等距分组表

(上下组限重叠)等距分组表

(上下组限间断)等距分组表

(使用开口组)等距分组与不等距分组

(在表现频数分布上的差异)等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况归纳与小结数值型数据的统计分组单项式分组组距式分组应用条件:变动范围较小的离散型变量应用条件:1.变动范围较大的离散型变量;2.连续型变量.等距异距组数组距组限内部特征3.3.2数值型数据的图示Excel

1.分组数据—直方图和折线图分组数据—直方图

(histogram)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1。分组数据的图示

(直方图的绘制)105110140直方图下的面积之和等于1某电脑公司销售量分布的直方图我一眼就看出来了,销售量在120~125台之间的天数最多!130135125115120频数(天)10864212分组数据—直方图

(直方图与条形图的区别)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数值型数据分组数据—折线图

(frequencypolygon)折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,中间各矩形顶部中点一一相连,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的120分组数据的图示

(折线图的绘制)某电脑公司销售量分布的折线图105110140直方图下的面积之和等于1130135125115频数(天)10864212思考:如果是异距分组时,

如何作直方图?

例:某厂职工月度奖金统计情况如下:月奖金组距工人数

85~95109095~11015200110~115525011515020240150~2005080要求:用直方图表示该企业月度奖金分布特征。频数密度9.013.350.022.712.01.6

归纳与小结组距分组直方图等距异距频数密度(f/i)频数或频率(向上.下累计)数据分组图示类型纵轴指标折线图单变量值分组数值型数据的图示STATISTICA

2.未分组数据—茎叶图和箱线图未分组数据—茎叶图

(stem-and-leafdisplay)用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字对于n(20

n

300)个数据,茎叶图最大行数不超过

L=[10×lg(n)]6.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息未分组数据—茎叶图

(例题分析)未分组数据—茎叶图

(扩展的茎叶图)练习题某电子元件厂生产一批电子元件,今从中随机地抽取20个测得其电阻值(单位:欧姆)如下:

101,93,97,87,102,97,108,105,101,102,106,95,96,110,102,98,107,98,103,99,(1)根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。(2)制作茎叶图,并与直方图作比较。未分组数据—箱线图

(boxplot)用于显示未分组的原始数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成最常见常用的箱线图绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me

和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接未分组数据—单批数据箱线图

(箱线图的构成)中位数4681012QUQLX最大值X最小值简单箱线图Me分布的形状与箱线图

对称分布QL中位数

QU左偏分布QL中位数

QU右偏分布QL

中位数

QU不同分布的箱线图未分组数据—多批数据箱线图

(例题分析)【应用实例】

从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据—多批数据箱线图

(例题分析)8门课程考试成绩的箱线图

识图与分析11名学生8门课程考试成绩的箱线图Min-Max25%-75%Medianvalue455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据—多批数据箱线图

(例题分析)

识图与分析数值型数据的图示

3.时间序列数据—线图Excel时间序列数据—线图

(lineplot)

绘制线图时应注意以下几点时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断时间序列数据—线图

(例题分析)【应用实例】我国1991~2003年城乡居民家庭的人均收入数据如右表。试绘制线图¥

1991~2003年城乡居民家庭人均收入年份城镇居民农村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2时间序列数据—线图

(例题分析)数值型数据的图示4.多变量数据—雷达图、二维(三维)散点图、气泡图Excel显示多个变量的图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度也称为蜘蛛图(spiderchart)多变量数据—雷达图

(radarchart)

设有n组样本S1,S2,…Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是多变量数据—雷达图

(雷达图的制作)

先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图多变量数据—雷达图

(例题分析)【例】2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图今天的主食是面包2003年城乡居民家庭平均每人生活消费支出构成(%)项目城镇居民农村居民

食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务37.129.796.307.3111.0814.3510.743.3045.595.674.205.968.3612.1315.872.21多变量数据—雷达图

(例题分析)

识图与分析两个变量间的关系—二维散点图

(2DScatterplots)展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi

,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的个点称为散点,由坐标及其散点形成的二维数据图温度/0C降雨量/mm产量/(kg/hm2

)62522508403450105845001368575014110580016987500211208250两个变量间的关系—二维散点图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论