第二章统计数据的描述.ppt_第1页
第二章统计数据的描述.ppt_第2页
第二章统计数据的描述.ppt_第3页
第二章统计数据的描述.ppt_第4页
第二章统计数据的描述.ppt_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华南理工大学精品课程,统计学,统计数据的描述,第二章,华南理工大学精品课程,第二章 统计数据的描述,录取中有无歧视? 某高校只有两个系,财经系和工程系。该校报考及录取的总体情况如下:,引例:,华南理工大学精品课程,第二章 统计数据的描述,如果我们只看该校男女生录取的比率,即男生350/800=44%, 女生200/600=33%。这时我们不免会问,是男同学的成绩比女同学好,还是在录取中存在着性别的歧视?学过统计学的同学不会简单地做出结论,而是继续搜集数据并得到两个系各自录取的男女生数据:,引例:,华南理工大学精品课程,第二章 统计数据的描述,引例:,华南理工大学精品课程,第二章 统计数据的描述

2、,有了分系的录取数据,不难看到工程系录取的人数比较多,男女生录取的比率都是50%。 而财经系招生名额较少,男女生录取的比率都是25%。由于女生报财经系的人多,男生报工科的人多,因而导致男生整个录取率偏高,而女生偏低。这个例子告诉我们对数据一是要从不同角度进行分析,二是要注意权数的影响,这就是本章要讨论的问题。,引例:,华南理工大学精品课程,6,引例提问,录取中有无歧视?,Q1,Q2,Q3,统计学怎样对数据进行有效分析?,怎样理解权数对均值的影响?,华南理工大学精品课程,7,本章学习内容,1.学习如何用数据对客观事物进行计量, 如何获取数据以及对数据质量的评价 2.如何对获取的数据进行整理 3.

3、数据分布的集中趋势和离散程度 4.非正态总体的分布偏态和峰度 5.茎叶图和箱线图的特点和优势 6.统计表及统计图,华南理工大学精品课程,8,本章学习目标,了解数据的计量尺度 了解统计数据的来源和数据的质量要求 掌握数值型数据的整理方法 掌握数据集中趋势和离散程度的测度方法 掌握茎叶图和箱线图的制作方法 掌握分布偏态与峰度的测度方法 掌握统计表和统计图的使用,华南理工大学精品课程,9,第一节 数据的计量尺度,2.1,2.2,2.3,2.4,2.5,第二章具体章节结构,第二节 统计数据的来源,第三节 统计数据的质量,第四节 统计数据的整理,第五节 分布集中趋势的测度,华南理工大学精品课程,10,第

4、六节 分布离散程度的测度,2.6,2.7,2.8,2.9,第七节 分布偏态与峰度的测度,第八节 茎叶图与箱线图,第九节 统计表与统计图,第二章具体章节结构,华南理工大学精品课程,第一节 数据的计量尺度,按照计量学的一般分类方法,对数据分为四种计量尺度,即:,一、列名尺度 二、顺序尺度 三、间隔尺度 四、比率尺度,华南理工大学精品课程,12,列名尺度 (Nominal scale),也称名义尺度或分类尺度 计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 数据表现为“类别” 具有=或的数学特性,华南理工大学精品课程,13,顺序尺度 (Ordina

5、l scale),也称定序尺度 对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 具有或的数学特性,华南理工大学精品课程,14,间隔尺度 (Interval scale),也称间隔尺度 对事物的准确测度 比定序尺度精确 数据表现为“数值” 没有绝对零点 具有 + 或 - 的数学特性,华南理工大学精品课程,15,比率尺度 (Ratio scale),也称比率尺度 对事物的准确测度 与定距尺度处于同一层次 数据表现为“数值” 有绝对零点 具有 或 的数学特性,华南理工大学精品课程,16,四种计量尺度的比较,“”表示该尺度所具有的特性,表2-1

6、 四种计量尺度的比较,华南理工大学精品课程,17,本节提问,数据的计量尺度分为哪几种?,Q1,Q2,Q3,不同计量尺度各有什么特点?,间隔尺度和比例尺度有何区别?,华南理工大学精品课程,第二节 统计数据的来源,统计数据来源于直接组织的调 查、观察和科学试验,我们称之为第一手数据或直接的数据;或者来源于已有的数据,我们称之为第二手数据或间接的数据。,一、间接获取的数据 二、直接获取的数据,华南理工大学精品课程,19,间接取得的数据,统计部门和政府部门公布的有关资料,如各类统计年鉴 各类经济信息中心、信息咨询机构、专业调查机构等提供的数据 各类专业期刊、报纸、书籍所提供的资料 各种会议,如博览会、

7、展销会、交易会及专业性、学术性研讨会上交流的有关资料 从互联网或图书馆查阅到的相关资料,华南理工大学精品课程,20,提供统计数据的部分政府网站,表2-2 提供统计数据的部分政府网站,华南理工大学精品课程,21,提供统计数据的部分政府网站,表2-2 提供统计数据的部分政府网站(续表),华南理工大学精品课程,22,普查 (census),为特定目的专门组织的非经常性全面调查 通常是一次性或周期性的 一般需要规定统一的标准调查时间 数据的规范化程度较高 应用范围比较狭窄,华南理工大学精品课程,23,抽样调查 (sampling survey),1.从总体中随机抽取一部分单位作为样本进行调查,并根据样

8、本调查结果来推断总体特征的数据收集方法 2.具有经济性、时效性强、 适应面广、准确性 高等特点,华南理工大学精品课程,24,本节提问,简要说明统计数据的来源?,Q1,Q2,获取直接统计数据的渠道主要有哪些?,华南理工大学精品课程,第三节 统计数据的质量,统计数据的误差:,一、抽样误差 二、非抽样误差,华南理工大学精品课程,26,统计数据的误差,华南理工大学精品课程,27,抽样误差 (sampling error),由于抽样的随机性所带来的误差 所有样本可能的结果与总体真值之间的平均性差异 影响抽样误差大小的因素 样本量的大小 总体的变异性,华南理工大学精品课程,28,非抽样误差 (non-sa

9、mpling error),相对于抽样误差而言 除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异 存在于所有的调查之中 概率抽样,非概率抽样,全面性调查 有抽样框误差、回答误差、无回答误差、调查员误差、测量误差,华南理工大学精品课程,29,误差的控制,抽样误差可计算和控制 非抽样误差的控制 调查员的挑选 调查员的培训 督导员的调查专业水平 调查过程控制 调查结果进行检验、评估 现场调查人员进行奖惩的制度,华南理工大学精品课程,30,本节提问,简要说明抽样误差和非抽样误差?,Q1,Q2,非抽样误差的控制有哪些途径?,华南理工大学精品课程,第四节 统计数据的整理,一、统计数据的

10、分组 二、次数分配 三、次数分配直方图 四、洛伦茨曲线,华南理工大学精品课程,32,统计数据的分组,统计分组是统计整理的第一步,它是按照统计研究的目的,将数据分别分入不同的组内。在本章第一节中,我们将数据分成四种计量尺度,即列名尺度、顺序尺度、间隔尺度和比例尺度。其中列名尺度和顺序尺度的数据是按照事物的性质和属性划分的,因而又称为按品质标志分组;间隔尺度和比例尺度是按照事物的数量标准划分的,又称为数量标志分组。,华南理工大学精品课程,33,组距分组(要点),将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用 不等距分组,华南

11、理工大学精品课程,34,组距分组 (步骤),确定组数:组数的确定应以能够显示数据的分布特征和规律为目的 确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距( 最大值 - 最小值) 组数 统计出各组的频数并整理成频数分布表,华南理工大学精品课程,35,组距分组 (几个概念),1. 下限(low limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值,华南理工大学精品

12、课程,36,案例分析 次数分配表的编制,【例】 某车间30名工人每周加工某种零件件数如右表试对数据进行分组。,表2-3 某车间30名工人周加工零件数 (单位:件),华南理工大学精品课程,37,案例分析 次数分配表,表2-4 某车间30名工人周加工零件数的频数分布,华南理工大学精品课程,38,使用Excel频数函数 (FREQUENCY), Excel的“直方图”工具的缺陷是:频数分布和直方图没有与数据联系起来,这样,如果你改变任何一个数据,频数分布表和直方图不会跟着改变 使用Excel中的统计函数“FREQUENCY”来创建 频数分布表和直方图,可解决这一问题。,华南理工大学精品课程,39,使

13、用Excel频数函数 (FREQUENCY),创建频数分布表的步骤是: 选择与接受区域相临近的单元格区域,作为频数分布表输出的区域 选择统计函数中的“FREQUENCY”函数 在对话框 Date-array 后输入数据区域,在Bins-array后输入接受区域 同时按下ctrl-shift-Enter组合键,即得到频数分布,统计函数FREQUENCY,华南理工大学精品课程,40,分组数据的图示 (直方图的绘制),我一眼就看出来了,周加工零件在100110之间的人数最多!,图2-1 某车间工人周加工零件直方图,华南理工大学精品课程,41,分组数据的图示 (折线图的绘制),折线图与直方图 下的面积

14、相等!,图2-2 某车间工人周加工零件折线图,华南理工大学精品课程,42,次数分配的类型,图2-3 几种常见的频数分布,华南理工大学精品课程,43,洛伦茨曲线,20世纪初美国经济学家、统计学家洛伦茨(M.E. Lorentz)根据意大利经济学家巴雷特(V. Pareto)提出的收入分配公式绘制而成 描述收入和财富分配性质 的曲线分析该国家或地区 分配的平均程度,累积的人口百分比,绝对公平线,累积的收入百分比,华南理工大学精品课程,44,基尼系数,20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标 A表示实际收入曲线与绝对平均线之间的面积 B表示实际收入曲

15、线与绝对不平均线之间的面积 如果A=0,则基尼系数=0,表示收入绝对平均,华南理工大学精品课程,45,基尼系数,5.如果B=0,则基尼系数=1,表示收入绝对不平均 6.基尼系数在0 和1之间取值 7.一般认为: 基尼系数若小于0.2,表明分配平均; 基尼系数在0.2至0.4之间是比较适当的, 即一个社会既有效率又没有造成极大的分配不公; 基尼系数在0.4被认为是收入分配不公平的警戒线, 超过了0.4应该采取措施缩小这一差距。,华南理工大学精品课程,46,本节提问,描述次数分配表的编制过程。,Q1,Q2,Q3,解释洛伦茨曲线及其用途。,说明基尼系数的含义和用途。,华南理工大学精品课程,第五节 分

16、布集中趋势的测度,一、众数 二、中位数 三、四分位数 四、均值 五、几何均值 六、切尾均值 七、众数、中位数和均值的比较,华南理工大学精品课程,48,众数 (mode),一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据,华南理工大学精品课程,49,众数 (不惟一性),无众数原始数据: 11 3 7 12 9 8,一个众数原始数据: 7 4 6 13 4 4,多于一个众数原始数据: 17 15 25 33 24 24,华南理工大学精品课程,50,中位数 (median),1.排序后处于中间位

17、置上的值 2.不受极端值的影响 3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据 4.各变量值与中位数的离差绝对值之和最小,即,华南理工大学精品课程,51,中位数 (位置的确定),华南理工大学精品课程,52,案例分析 (9个数据的算例),【例】 9个家庭的人均月收入数据 原始数据: 1400 750 760 1050 870 950 2100 1450 1540 排 序: 750 760 870 950 1050 1400 1450 1540 2100 位 置: 1 2 3 4 5 6 7 8 9,中位数 = 1050,华南理工大学精品课程,53,案例分析 (10个数据的算例),【例

18、】 10个家庭的人均月收入数据 排 序: 635 690 770 820 930 1078 1230 1450 1690 2150 位 置: 1 2 3 4 5 6 7 8 9 10,华南理工大学精品课程,54,四分位数 (quartile),1.排序后处于25%和75%位置上的值 2.不受极端值的影响 3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,华南理工大学精品课程,55,四分位数 (位置的确定),华南理工大学精品课程,56,案例分析 (四分位数7个数据的算例),原始数据: 23 21 30 32 28 25 26 排 序: 21 23 25 26 28 30 32 位 置

19、: 1 2 3 4 5 6 7,QL= 23,QU = 30,N+1,华南理工大学精品课程,57,案例分析(四分位数10个数据的算例),【例】 10个家庭的人均月收入数据 排 序: 500 650 760 780 940 1060 1350 1680 1790 1900 位 置: 1 2 3 4 5 6 7 8 9 10,统计函数QUARTILE,华南理工大学精品课程,58,均值 (mean),集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 用于数值型数据,不能用于分类数据和顺序数据,华南理工大学精品课程,59,简单均值 (simple mean),设一

20、组数据为: x1 ,x2 , ,xn,总体均值,样本均值,华南理工大学精品课程,60,加权均值 (weighted mean),设一组数据为: x1 ,x2 , ,xn 相应的频数为: f1 ,f2 , ,fk,总体均值,样本均值,华南理工大学精品课程,61,案例分析 加权均值,【例】根据表中的数据,计算50 名工人日加工零件数的均值 表2-5 某车间50名工人日加工零件均值计算表,华南理工大学精品课程,62,均值 (数学性质),1. 各变量值与均值的离差之和等于零 2. 各变量值与均值的离差平方和最小,华南理工大学精品课程,63,几何均值 (geometric mean),n 个变量值乘积的

21、 n 次方根 适用于对比率数据的平均 主要用于计算平均增长率 计算公式为: 可看作是均值的一种变形,华南理工大学精品课程,64,案例分析 几何均值,【例】 一位投资者购持有一种股票,在1997年、1998年、1999年和2000年收益率分别为 4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率,平均收益率103.84%-1=3.84%,华南理工大学精品课程,65,切尾均值 (trimmed Mean),去掉大小两端的若干数值后计算中间数据的均值 在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用 计算公式为:,n 表示观察值的个数;表示切尾系数,,华

22、南理工大学精品课程,66,案例分析 切尾均值,【例】某次求职面试中共有11名评委,对某位求职者的给分分别是:,经整理得到顺序统计量值为,去掉一个最高分和一个最低分,取1/11,华南理工大学精品课程,67,众数、中位数和均值的关系,图2-4 众数、中位数和均值的关系,华南理工大学精品课程,68,众数、中位数、均值的特点和应用,众数 -不受极端值影响 -具有不惟一性 -数据分布偏斜程度较大时应用 中位数 -不受极端值影响 -数据分布偏斜程度较大时应用 均值 -易受极端值影响 -数学性质优良 -数据对称分布或接近对称分布时应用,小结,红色为该数据类型最适合用的测度值,华南理工大学精品课程,70,本节

23、提问,一组数据的分布特征可以从哪几个方面进行测度?,Q1,Q2,Q3,怎样理解均值在统计学中的地位?,对于比率数据的平均,为什么采用几何平均?,简述众数、中位数和均值的特点和应用场合。,Q4,华南理工大学精品课程,第六节 分布离散程度的测度,一、极差 二、内距 三、方差和标准差 四、离散系数,华南理工大学精品课程,72,极差 (range),一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布,计算公式为:,R = max(xi) - min(xi),华南理工大学精品课程,73,内距 (Inter-Quartile Range,IQR),也称四分位差 上四分位

24、数与下四分位数之差 内 距 = Q3 Q1 反映了中间50%数据的离散程度 不受极端值的影响 可用于衡量中位数的代表性,华南理工大学精品课程,74,案例分析 四分位差,【例】 根据表中的数据,计算甲城市家庭对住房满意状况评价的四分位差,解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 已知 QL = 不满意 = 2 QU = 一般 = 3 四分位差: QD = QU = QL = 32 = 1,表2-6 甲城市家庭对住房状况评价的频数分布,华南理工大学精品课程,75,方差和标准差(Variance and Standard deviation),1.离散程度的测度值之

25、一 2.最常用的测度值 3.反映了数据的分布 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,华南理工大学精品课程,76,总体方差和标准差 (Population variance and Standard deviation),未分组数据:,方差的计算公式,标准差的计算公式,未分组数据:,组距分组数:,组距分组数:,华南理工大学精品课程,77,案例分析 总体标准差计算过程及结果,【例】根据表中的数据,计算工人日加工零件数的标准差,表2-7 某车间50名工人日加工零件标准差计算表,华南理工大学精品课程,78,样本方差和标准差

26、(simple variance and standard deviation),方差的计算公式,标准差的计算公式,未分组数据:,未分组数据:,组距分组数据:,组距分组数据:,华南理工大学精品课程,79,样本方差 自由度(degree of freedom),1.一组数据中可以自由取值的数据的个数 2.当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,

27、那么x3则必然取2,而不能取其他值 4.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,华南理工大学精品课程,80,案例分析 样本方差,样本方差与标准差,原始数据: 10 5 9 13 6 8,华南理工大学精品课程,81,离散系数(coefficient of variation),1.标准差与其相应的均值之比 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响 4.用于对不同组别数据离散程度的比较 5.计算公式为:,华南理工大学精品课程,82,案例分析 离散系数,【例】某公司抽查了所属的8家超市,其产品

28、销售数据如表。试比较产品销售额与销售利润的离散程度,表2-8 某公司所属8家超市的产品销售数据,华南理工大学精品课程,83,案例分析 离散系数,结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度,小结,为该数据类型最适合的用的测度值,华南理工大学精品课程,85,本节提问,为什么要计算离散系数?,Q1,Q2,华南理工大学精品课程,第七节 分布偏态与峰度的测度,一、偏态及其测度 二、峰度及其测度,华南理工大学精品课程,87,偏态与峰度分布的形状,偏态,峰度,图2-5 偏态与峰度分布的形状,华南理工大学精品课程,88,偏态,1、偏态:衡量频数分配不对称程度,或偏斜程度的指

29、标。 2、计算公式:(用距法测定),华南理工大学精品课程,89,当 =0时,左右完全对称,为正态分布;当 0时为正偏斜;当 0时为负偏斜。,图2-6 偏态示意图,偏态,华南理工大学精品课程,90,案例分析 偏态,【例】已知1997年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏态系数,表2-9 1997年农村居民家庭纯收入数据,华南理工大学精品课程,91,案例分析 偏态与峰度从直方图上观察,按纯收入分组(元),结论:1. 为右偏分布 2. 峰度适中,图2-7 农村居民家庭村收入数据的直方图,华南理工大学精品课程,92,案例分析 偏态系数(计算过程),表2-10 农村居民家庭纯收入数据偏态

30、及峰度计算表,华南理工大学精品课程,93,案例分析 偏态系数 (计算结果),根据上表数据计算得,将计算结果代入公式得,结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大,华南理工大学精品课程,94,峰度,1、峰度:用以衡量频数分配的集中程度,即分布曲线的尖峭程度的指标。 2、计算公式:(用距法测定),华南理工大学精品课程,95,峰度,峰度指标=0,分布为正态峰度,当峰度指标0时,表示频数分布比正态分布更集中,分布呈尖峰状态,0时表示频数分布比正态分布更分散,分布呈平坦峰。如图所示:,图2-8 峰度示

31、意图,华南理工大学精品课程,第八节 茎叶图与箱线图,一、茎叶图 二、箱线图,华南理工大学精品课程,97,茎叶图 (stem-and-leaf display),用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形由数字组成 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留一位数字 茎叶图类似于横置的直方图,但又有区别: -直方图可观察一组数据的分布状况,但没有给出具体的数值 -茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息,华南理工大学精品课程,98,案例分析 茎叶图,树茎,树叶,78,022347778889,0012222333344466

32、77789,0133445799,数据个数,图2-9 某车间30名工人周加工零件数据的茎叶图表,华南理工大学精品课程,99,案例分析 扩展的茎叶图,图2-10 扩展的茎叶图表,7 8 8 0 2 2 3 4 5 7 7 7 8 8 8 9 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9 0 1 3 3 4 4 5 7 9 9,树茎,树叶,10* 10. 11* 11. 12* 12. 13* 13.,华南理工大学精品课程,100,箱线图 (box plot),用于显示未分组的原始数据的分布 箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条

33、线段组成 箱线图的绘制方法 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接,华南理工大学精品课程,101,箱线图 (箱线图的构成),华南理工大学精品课程,102,案例分析 箱线图,华南理工大学精品课程,103,分布的形状与箱线图,图2-13 不同分布的箱线图,华南理工大学精品课程,104,案例分析 多批数据箱线图,【例】 从某大学工商管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征

34、,表2-11 11名学生各科的考试成绩数据,华南理工大学精品课程,105,图2-14 8门课程考试成绩的箱线图,案例分析 多批数据箱线图,华南理工大学精品课程,106,图2-15 11名学生8门课程考试成绩的箱线图,min-max,25%-75%,median value,45,55,65,75,85,95,105,学生1,学生2,学生3,学生4,学生5,学生6,学生7,学生8,学生9,学生10,学生11,案例分析 多批数据箱线图,华南理工大学精品课程,107,本节提问,描述茎叶图和箱线图的画法?,Q1,Q2,说明茎叶图和箱线图的用途。,Q2,Q2,华南理工大学精品课程,第九节 统计表与统计图

35、,统计表和统计图是显示统计数据的两种方式 统计表把杂乱的数据有条理地组织在一张简明的表格内; 统计图把数据形象地显示出来 。,华南理工大学精品课程,109,统计表,数字资料,行标题,附加,列标题,表2-12 19992000年城镇居民家庭抽样调查资料,表头,资料来源:中国统计年鉴2001,中国统计出版社,2001,第305页。 注:本表为城镇居民家庭收支抽样调查材料。,华南理工大学精品课程,110,统计表设计的一般要求,1.要合理安排统计表的结构 2.总标题内容应满足3W要求 3.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明 4.表中的上下两条横线一般用粗线

36、,其他线用细线 5.通常情况下,统计表的左右两边不封口,华南理工大学精品课程,111,6.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的为数应统一 7.对于没有小数点的单元,一般用“-”表示 8.必要时可在表的下方加上注释,统计表设计的一般要求,华南理工大学精品课程,112,统计图,常见的统计图: 直方图、茎叶图和箱线图 折线图、条形图和圆形图、 环行图、雷达图等等,华南理工大学精品课程,113,定类数据的图示条形图(条形图的制作),条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。 条形图有单式、复式等形式。 在表示定类数据的分布时,是用条形图的高度来表示各类别数据的

37、频数或频率。 绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。,华南理工大学精品课程,114,定类数据的图示-条形图,由 Excel 绘制的条形图,定类数据的图示圆形图(圆形图的制作),华南理工大学精品课程,115,1.也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形。 2.主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。 3.在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的。 4.例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推。,定类数据的图示圆形图,华南理工大学精品课程,116,由 Excel

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论