应用统计学完整教学课件_第1页
应用统计学完整教学课件_第2页
应用统计学完整教学课件_第3页
应用统计学完整教学课件_第4页
应用统计学完整教学课件_第5页
已阅读5页,还剩418页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计学完整教学课件统计学原理搜集数据整理数据分析数据

第二章统计调查与整理

第三章综合指标

第四章动态数列

第五章统计指数

第七章相关分析描述分析推断分析

第六章

抽样调查各章节内容概括绪论国民经济核算

可以分为描述统计和推断统计,都是为了找出总体内在的数量规律性。

描述统计内容包括搜集数据、整理数据、展示数据。目的是描述数据特征,找出数据的基本规律。利用图、表、指标。

推断统计内容包括参数估计、假设检验。利用样本信息和概率论对总体的数量特征进行估计和检验等。目的是对总体特征作出推断。理解统计思想掌握统计术语熟悉统计符号记住统计公式使用统计工具学习统计学的方法

◆《统计学原理》李洁明主编复旦大学出版社

◆《统计学》贾俊平等编著中国人民大学出版社

◆《统计学》王云主编四川大学出版社2001年9月第一版◆《统计学》徐国祥等主编上海财经大学出版社

2001年第一版◆

《统计学》袁卫等主编高等教育出版社2001年版

◆《统计学原理习题解答问题辨析》陈仁恩主编中国统计出版社2002年1月第一版

◆《统计学案例集》董逢谷等编著上海财经大学出版社2002年4月第一版◆《新编统计学原理习题集》刘柏霞等编著

东北大学出版社2009年12月第一版

参考文献绪论1、了解统计及统计学的产生与发展,理解统计的涵义;2、理解统计学的研究对象及特点;3、了解统计工作过程与统计的职能;4、掌握统计学的基本概念:(总体、总体单位、标志、指标)教学内容与要求:

第一章看看下面的问题:C、单亲家庭的孩子是否比一般家庭的孩子更容易出现心理问题?A、上学期土木两个班学生测量考试成绩是否正常?哪个班成绩更好?B、A血型的人是否比其他人更容易患上某种疾病?D、集美地区的空气受污染程度?E、今年8月份厦门市气温较往年高是正常的吗?气象统计教育统计医学统计社会统计环境统计

萌芽----原始社会(结绳计事)

正式开展----奴隶、封建社会(原始的调查登记、计数的初级阶段)

快速发展----资本主义社会1.1

统计学的产生和发展统计学:关于数据搜集、整理、归纳、分析的方法论的科学。一、统计学的产生:

中国:§秦朝:从中央到地方形成较为完善的统计报告制度

“强国知地十三数,欲强国,不知国十三数,地虽得利、民虽众,国愈弱至削。”---商鞅§西周:建立统计报告制度§汉代:完善的人口户藉登记制度§清朝:《清文献通考》统计一词约定俗成§我国最早的统计资料----《尚书》中公元前21世纪(夏朝)人口和土地数字记载:分中国为九州,人口约1355万人,土地约2438万顷。

国外:公元前27世纪,埃及进行人口和财产调查公元前15世纪,以色列进行男丁调查公元前6世纪,罗马帝国进行国事调查15-16世纪统计作为说明各国国情的工具16-17世纪:国家统计----经济统计18世纪:经济统计----工业、农业、商业统计19世纪30年代:经济统计---社会统计、科技统计、环境统计,设立专业统计机构(1870年:美国举办现代意义的人口普查)19世纪末:国际性统计组织——国际统计学会成立。20世纪:30年代随机抽样方法;

50年代国民经济帐户体系及投入产出分析;政治算术学派(17世纪):

“政治经济学之父统计学的创始人”

----马克思<英>威廉.配弟(W.petty)

代表作:《政治算术》

约翰.格朗特(JohnGraunt)

代表作:《对死亡率公报的自然观察与政治观察》

世界上第一张“死亡表”观点:主张对国家重要事项记录,注重用数字、重量和尺度来表达。二、早期三种主要学派:<德>康令(H.Conring):创立“国势学”课程

阿亨瓦尔(G.Achenwall):命名“统计学”观点:统计学是有关国家的各项重要事项的知识总称,其内容是对事项的记述,不注重计算。社会经济统计学国势学派(18世纪)数理统计学派(19世纪)

<比>凯特勒(A.Quetelet):

代表作《社会物理学》观点:将大数定律--平均数定律作为分析社会经济现象的工具。自然技术统计学数理统计学1.2

统计学的性质和特点统计统计工作统计资料统计学一、统计的含义:统计工作:是一种社会调查研究活动。是指对社会、政治、经济、文化等现象的数量方面进行调查、整理、和分析的工作活动过程的总称。统计资料:是统计工作的成果。是指用来反映各种社会经济现象和过程的数字资料,也可称为统计指标。它反映在统计资料汇编、统计年鉴、统计手册、统计图表、统计分析报告等。统计学:是关于统计过程的理论和方法的科学。研究大量社会现象的总体数量方面的方法论科学,包括统计活动的原理、原则、统计活动的应用核算和分析方法以及组织方法。1、数量性:用大量数字资料说明事物的特性。2、总体性:统计学是对社会现象总体数量方面的研究,运用综合研究的方法。3、具体性:研究的对象是社会现象的具体数量方面,不是抽象的数量关系。4、社会性:研究社会现象。5、广泛性:研究全部社会现象的数量方面。二、统计学的特点:1.3

统计工作的基本任务和工作过程监督职能咨询职能信息职能反映运行状态、检测、预警和监督积累统计资料、综合分析与过程研究搜集、处理、传输、存储、提供资料、制定政策、加强管理一、统计工作的基本任务:统计任务↓资料搜集资料的加工、汇总↓计算综合指标、揭示趋势与规律统计信息管理↓↓实现统计信息社会化统计调查统计整理统计分析统计设计二、统计工作的过程:总体:是在同一性质基础上结合起来的许多个别单位的整体。总体单位:构成总体的个别单位。总体同质性大量性变异性总体单位?

要了解200名从业人员的劳动报酬收入情况,总体单位是??某市高校的科研所进行调查,总体?总体单位?1.4

统计学的几个基本概念一、总体与总体单位:1.构成总体的单位必须是同质的;2.同质性是相对的,随着研究任务的转变而转变;3.总体和总体单位也是相对的,随着研究任务的转变而转变;第五次与第四次厦门市人口数量变动厦门市老年化程度全国各城市老年程度比较每个常住人口65岁以上的常住人口每个城市

总体和总体单位的关系标志是总体单位的特征,总体单位是标志的承担者每个人的年龄:15岁、22岁、30岁…..每个职工的学历:小学、中学、大学…..每个家庭的生活支出:300元、800元、750元、520元..标志:说明总体单位共同具有的属性和特征的名称。包括品质标志和数量标志。二、标志与指标:变异性●标志的分类:可变数量标志称为变量可变标志企业生产类型、工人性别、教师职称等职工工资、个人年龄、家庭人数、企业产量、楼层数等性质不变标志数量标志品质标志同质性变异性---离散型变量、连续型变量

特点指标:说明总体数量特征的概念。包括指标名称和指标数值两个部分。如:2014年人口普查显示,泉州市经济人口为728.07万人,就业人口514万人,就业率70.6%,就业人口中三次产业所占的比重分别是53.5%、17.3%、29.2%。5142014年泉州市在业人口万人空间限制综合性

要素具体性数量性时间限制指标名称具体数值计量单位反映现象发展的总规模、总水平反映现象发展的相对水平、工作质量

分类如:计划完成率、人口性别比率、产品合格率、职工劳动生产率、人均收入等如:人口总数、土地总面积、工资总额、总产值、投资总量等内容形式平均指标相对指标总量指标数量指标质量指标指标分类二者的主要区别是:②指标都是能用数值表示,而标志不一定。二者的主要联系是:①指标值往往由数量标志值汇总而来;②在一定条件下,数量标志和指标存在着变换关系。

①指标是说明总体特征的,标志是说明总体单位特征的;指标与标志的关系统计指标体系:相互联系的指标群构成的整体,综合说明客观现象相互制约与依存的关系。企业经济效益指标体系总资产贡献率全员劳动生产率资产保值增值率成本费用利润率资产负债率产品销售率流动资产周转率工业总产值=工人人数×劳动生产率期初结余购买力+本期形成购买力=

本期实现的购买力+期末结余购买力三、统计指标与统计指标体系:变异:标志在总体单位之间的不同具体表现。标志变异可分为属性变异和数量变异。如:性别标志分男、女;职工人数有60人、70人等变化。变量:可变的数量标志。变量值:数量标志的不同表现。如年龄15、16、30岁等。变量的分类:(1)按计数的特点分为:①连续变量:指其数值连续不断,在相邻的两值之间可无穷分割,表现为无穷小数。如:粮食产量有500-600公斤,600-700公斤等②离散变量:变量值只能表现为整数。如人口数是270人,950人等。四、变异与变量:(2)按其性质不同分:①确定性变量:能在事先确定下来的变量。如中奖人数等。②随机性变量:由各种因素引起,数值随机而成,有多种可能性,事先无法确定。如中奖号码等。数据的计量尺度(四种):定类尺度:按现象性质差异进行的辨别与区分。定类变量或指标的各类别间是平等的,没有高低、大小、优劣之分。定序尺度:除提供名称描述外,还可对事物进行排序。定距尺度:按现象绝对数量差异进行的辨别与区分。定比尺度:按现象绝对差异与相对差异进行的辨别与区分。计量尺度数学特征定类尺度定序尺度定距尺度定比尺度分类(=,≠)√√√√排序(<,>)√√√间距(+,-)√√比值(×,÷)√四种计量尺度的比较“√”表示该尺度所具有的特性数据类型和统计方法定类尺度和定序尺度是品质数据,采用非参数方法。定距数据定比数据是数量数据,采用参数方法。变量及其类型:定类变量、定序变量和数字变量(离散变量、连续变量)1数学为统计理论和条件方法提供基础。统计学主要是研究数据2数学研究抽象的数量规律,统计学研究具体的、实际现象的数量规律。3在研究方法上数学常常是用纯粹演绎的方法,是从一些假设命题、已知的事实出发,按一定的逻辑推理去得到有关的结论。而统计学在本质上是用归纳与演绎的方法,它是根据观察到的大量个别情况,“归纳”起来去推断总体的情况。1.5

统计学与其他学科的关系一、统计学与数学的关系:统计学应用性极强,统计方法可以帮助其他学科探索其他学科内在的数量规律性,但规律性的解释和各学科内在的规律只能由各学科的研究来完成。如大量观察法已经发现了新生婴儿的性别比是107:100,但为什么是这样的比例?形成这一比例的原因应由人类遗传学或医学来研究和解释,而非统计方法所能解决的。再如,利用统计方法对吸烟和不吸烟者患肺癌的数据进行分析,得出吸烟是导致肺癌的原因之一的结论,但为什么吸烟能导致肺癌?这就需要医学去解释了。能否用统计方法解决各学科的具体问题。首先要看使用统计工具的人能否正确选择统计方法,其次还要在定量分析的同时进行必要的定性分析。(应用该学科的专业知识对统计分析的结果作出合乎规律的解释和分析)二、统计学与其它学科的关系:厦门市的经济以年平均9.7%的速度高速增长,随着经济的增长,居民的消费率呈现不断上升的趋势,从2009年的43.16%上升到2013年的52.43%

,上升了9.27%,而全国居民的消费率从47.05%轻微回落到46.57%,下降0.48个百分点。所以,厦门的居民消费率的上升速度大大快于全国水平,到了2013年,居民消费率已经高于全国水平。导致厦门市居民消费率上升的主要原因是什么?

中国GDP增长情况(按不变价格计算)年份比上年同期增长(%)年份比上年同期增长(%)19998.820067.120009.020078.020019.620087.5200210.520098.020039.6201010.420048.820119.320057.820127.8

资料来源:国家统计局《统计年鉴》

问题:中国经济过热了吗?36统计调查

第二章Internethttp//WWW.中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社1.了解统计调查的主要类型及其特点;统计整理的涵义及内容;统计图表的主要形式。2.认识制定统计调查方案的内容;统计分组的重要性,掌握统计分组的基本要求与类型。3.掌握统计调查的常见的组织形式;分配数列的涵义及构成要素;编制分配数列的基本方法及相关指标;教学内容与要求按统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集原始资料的过程。1、社会调查是人们认识社会的基本方式。2、统计调查是统计工作的基础环节。3、统计调查理论和方法在统计学原理中占有重要地位。(基础)一、统计调查的意义统计调查2.1统计调查方案

1、确定调查目的2、确定调查对象和调查单位3、确定调查项目调查项目少而精、含义明确;需要与可能原则;项目之间保持联系为什么调查,调查解决什么问题。调查对象:需要进行研究的总体范围调查单位:所要研究的总体单位如:2001年重庆市第二次基本单位普查对象:重庆市辖区内除城乡住户和个体工商户以外的所有法人单位和产业活动单位注意:调查单位与填报单位的区别二、统计调查方案设计

4、设计调查表(问卷)封闭式问卷的结构问题的类型封面信、指导语、问题与答案、编码

开放式如:请问您过去从事什么工作?请问您对本商场服务有什么意见?如:请问您现在的职业是:

A.教师B.推销员C.医务人员

D.工人E.公务员F。其它1.问题回答简单、数据处理较容易;2.制作较复杂,问题简单化1.可以得到较全面的答案;2.回答难度较高,后期处理难度较大。

设计基本要求主题明确:问题的提出要紧扣主题提问科学:问句和标准答案要易于理解和回答逻辑性强:先易后难、先封闭后开放、先基本问题后派生问题容量适度:以不超过20分钟为宜如:1、你是否认为绿色香皂与红色香皂更温和?

2、吸二手烟危害更大,你是否愿意为家人戒烟呢?

3、你有没有认为到新校区上课不方便呢?

4、你知道甲烷泄漏会有么后果吗?

5、调查时间和期限6、选择调查方法其中数据的直接搜集方法:询问调查(访问调查、电话调查、邮寄调查、电脑辅助、座谈会、个别深访)和观察实验(观察、实验)统计数据的间接来源有1.公开出版物:中国统计年鉴》、《中国统计摘要》等2.网络7、调查工作的组织实施计划调查期限:调查工作开展的起止时间调查时间:调查资料所属时期或时点注意统计数据的误差和质量要求误差即统计数据与客观现实之间的差距。有登记性误差和代表性误差两类登记性误差:由于调查者或被调查者的人为因素所造成的误差。理论上讲可以消除代表性误差:用样本数据进行推断时所产生的误差。通常无法消除,但事先可以进行控制和计算统计数据的质量要求1.精度:最低的抽样误差或随机误差2.准确性:最小的非抽样误差或偏差3.关联性:满足用户决策、管理和研究的需要4.及时性:在最短的时间里取得并公布数据5.一致性:保持时间序列的可比性6.最低成本:以最经济的方式取得数据全面调查非全面调查调查范围抽样调查统计报表普查典型调查重点调查2.2统计调查的组织形式组织形式统计报表制度专门调查抽样调查普查典型调查重点调查登记事物的连续性经常调查一时调查定期取得全社会国民经济和社会发展情况的基本资料。2.能为各级提供相应的资料1.资料来源于基层部位的原始记录3.调查项目相对稳定,有利于动态对比特点1、统计报表(statisticalreportforms)作用特点一般普查、快速普查1.规定统一调查标准时点;

2.正确选择普查时期;

3.各调查点尽可能同时开展;

4.调查项目不能任意更改。作用1.属一次性调查;

2.专门组织的全面调查1.全面系统地搜集重要国情国力资料,为宏观决策、长远规划提供依据。2.为其它非全面调查提供总体单位的基本信息形式原则2、普查不能或不必作全面调查普查的补充与修正应用特点在全部调查单位中按随机原则抽取部分单位进行调查,根据结果推算总体特征的调查方法。样本单位的抽取不受主观因素的影响,每个总体单位都有一个不为零的入样概率。按随机原则抽取样本单位目的是推断总体的数量特征抽样误差可以事先计算并控制准确性、经济性、时效性、灵活性优点3、抽样调查从调查对象中有意识地选取若干具有代表性的单位进行的非全面调查。作用形式1.调查少数典型单位----说明总体的一般情况或规律;2.划类选典----推断总体数据。1.及时反映新问题、分析新事物;2.深入典型单位具体分析事物发展变化规律;3.补充验证全面统计数字,推测有关数据。4、典型调查在调查对象范围内选择部分重点单位搜集资料的非全面调查这些单位数目不多,但其标志值在总体标志总量中占有较大比重。原则根据调查任务确定重点单位的数量;重点的相对性;选择管理健全、统计基础较好的单位5、重点调查重点调查、典型调查、科学推算相结合开展周期性的普查制度----基础广泛普及抽样调查-----主体6、统计调查的方法体系一、统计整理的意义和内容根据统计任务,对原始资料加工汇总,使其系统化、条理化、科学化,得出反映总体综合特征资料的工作过程。统计整理2.3统计分组简单讲就是将统计调查所得到的个别的、分散的、不系统的原始资料,通过科学的方法加工、汇总和推算,从量的方面找到事物发展变化的规律性。如招生档案、学籍卡的统计整理。资料的积累和保管审核原始资料对数据的分组绘制统计图表检查统计误差整理的中心

显示数据的基本特征

深入分析的基础对数据汇总及加工整理的关键

统计调查首先根据整理纲要确定整理内容,整理纲要包括综合表和编制说明。

·综合表由分组和统计指标组成,见41页

·编制说明是关于该表的使用范围、程序、主栏的涵义、宾栏指标的计算方法等。统计整理阶段的工作内容一、审核的内容

1.完整性审核

检查应调查的单位或个体是否有遗漏

所有的调查项目或指标是否填写齐全

2.准确性审核

检查数据是否真实反映客观实际情况,内容是否符合实际

检查数据是否有错误,计算是否正确等

审核数据准确性的方法

1.逻辑检查

从定性角度,审核数据是否符合逻辑,内容是否

合理,各项目或数字之间有无相互矛盾的现象

主要用于对定类数据和定序数据的审核

2.计算检查

检查调查表中的各项数据在计算结果和计算方法

上有无错误

主要用于对定距和定比数据的审核对于第二手数据应进行

1.适用性审核

弄清楚数据的来源、数据的口径以及有关的背景材料

确定这些数据是否符合自己分析研究的需要

2.时效性审核

应尽可能使用最新的统计数据

3.确认是否必要做进一步的加工整理

然后进行数据的筛选

1.对审核过程中发现的错误应尽可能予以纠正

2.当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选

3.数据筛选的内容包括:

将某些不符合要求的数据或有明显错误的数据予以剔除

将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出最后进行数据的排序

(要点)

1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索

2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据

3.在某些场合,排序本身就是分析的目的之一

4.排序可借助于计算机完成

数据的排序(方法)

1.定类数据的排序

字母型数据,排序有升序降序之分,但习惯上用升序

汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分

2.定距和定比数据的排序

递增排序:设一组数据为X1,X2,…,XN,递

增排序后可表示为:X(1)<X(2)<…<X(N)

递减排序可表示为:X(1)>X(2)>…>X(N)

定类数据的整理与显示(基本问题)

1.要弄清所面对的数据类型,不同类型的数据,其处理方式和方法不同

2.对定类数据和定序数据主要是做分类整理

3.对定距数据和定比数据则主要是做分组整理

4.适合于低层次数据的整理和显示方法也适合于高层次的数据;反之不适合

定类数据的整理(基本过程)

1.列出各类别(分组)

2.计算各类别的频数

3.制作频数分布表(分配数列)

4.用图形显示数据(柱形图和饼形图)

定序数据的整理(可计算的指标)

1.累计频数:将各类别的频数逐级累加

2.累计频率:将各类别的频率(百分比)逐级累加

3.做累计频数分布图/环形图

根据统计研究目的和要求,将总体全部单位按一定的标志划分成若干个类型组的一种统计方法。目的:组内同质性、组间差异性(一)统计分组的作用

划分社会经济现象的类型:找出直接反映事物本质的类型揭示现象总体内部的构成情况(结构或比例分布)分析现象间的相互依存关系二、统计分组的意义和作用统计分组2、选择分组标志1、原则:(二)统计分组的方法:穷尽性、互斥性

根据研究问题的目的来选择选择最能反映被研究现象本质特征的标志结合现象的历史或经济条件选择3、分组标志的种类品质标志数量标志第一:各组数量界限的确定应能反映质的差别;如60分第二:采用适当的分组形式

指标19901995199619971998

投资总额(亿元)2986.3010898.2412006.2113091.7215369.30

按资金来源分

国家预算内资金394.27544.98553.20612.721080.62

国内贷款704.912578.192849.313008.123578.07

利用外资271.80859.38810.46663.11665.89

自筹投资1289.585307.156107.686902.897664.69

其他投资325.741731.821722.311865.822247.46

按构成分

建筑安装工程1789.446604.617245.538035.309594.45

设备、工具、器具购置892.092750.513022.533110.543315.78

其他费用304.771543.121738.161945.882459.07

按建设性质分

#新建911.603362.173874.874581.765507.37

扩建1161.723722.604253.804464.584984.90

改建581.251986.232124.342312.943058.98

按产业分

第一产业28.6573.64107.09138.92201.32

第二产业1765.694692.725102.865158.524874.79

第三产业1191.966131.886796.267794.2810293.19

按国民经济主要行业分

#农业34.0993.40125.55169.69237.08

工业1747.584526.204884.734958.104703.30#能源工业823.882025.282418.162924.002862.10

运输邮电业333.672306.542748.863187.074695.28国有经济按各种分组的固定资产投资1、平行分组(简单分组)对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年每一个都是简单分组(三)分组体系:中级按性别分类男性女性按职称分类按年龄分类高级中级初级青年组中年组高级初级男性女性男性女性男性女性男性女性男性女性2、复合分组采用一系列相互联系、相互补充的标志对现象进行多种分组,并构成一个体系。分组体系1分配数列

某地区从业劳动者产业分组统计产业从业人数(万人)人数比重(%)第一产业42846.47第二产业36439.52第三产业12914.01合计921100统计分组基础上,将总体所有单位按组归类,形成总体中各个单位在各组间的分布。总体的各个组频数频率2.4分配数列一、分配数列的概念和种类品质分配数列变量分配数列按品质标志分组,由各组名称和次数组成。次数可为绝对数频数或相对数频数单项数列组距数列总体按单项式分组形成的数列,用一个变量值代表一组。适于组数不多和组值变动幅度不大。总体按组距式分组形成的数列,用变量变动的一定范围代表一组。适于变量个数较多,变动幅度较大2分配数列的种类二、组距数列的编制1组距和组数组距:每组上限和下限之间的距离组数:用变量的变动范围代表一个组,组的数目称为组数2等距数列和异距数列等距数列:组距相等。适于标志变异比较均匀的现象。异距数列:各组的次数受组距不同的影响。适于社会经济现象的分布存在明显倾斜或标志变动范围较大。消除组距影响方法以数列中最小组距为标准组距,将不等组距次数折算为统一的标准组距次数。在原来数列的基础上,计算次数密度或频率密度,再绘图。频数(率)密度:

频数(率)/组距企业年生产能力(百吨)企业个数(个)频数密度(个/百吨)1百吨以下10101~52055~2030220~50100.3合计70次数密度:

次数/组距组距两端的数值。闭口组3组限和组中值:组限开口组上下限齐全无上限或无下限确定组限的原则分组后,标志值在各组的变动能反映事物的质的变化。组限的表示方法按连续变量分组:相邻两组上下限以同一数值表示。原则:上组限不在内。按离散变量分组:相邻两组上下限以两个确定的不同数值表示。例题:组限的确定关系是否反映真实情况有20个企业的年度利税率如下:6.4%7.6%

10.7%11.5%15.2%16.4%18.2%18.4%18.8%19.2%19.4%19.8%20.9%21.6%21.9%22.4%24.4%28.5%28.6%29.3%方式A方式B%企业数%企业数1-1025-15410-201015-251320-30825-303合计20合计20反映分在各组中个体单位变量值的一般水平。(闭口组)(无下限开口组)(无上限开口组)组中值调查得到40家个体餐饮企业上月的营业额如下(元):899、1258、1879、1988、2270、2593、2662、2889、3012、34583598、3688、3954、4015、4115、4228、4332、4402、4557、4682、4689、4794、4856、5105、5112、5234、5581、5622、5645、5876、5987、6078、6250、6315、6384、6572、6850、7224、7753、8074顺序排列数字资料,观察其中集中与变异的情况,确定数列形式,计算全距全距=8074–899=71754组距数列的编制

根据全距确定组数、组距、组限

计算各组频数、频率(等距分组)营业额(元)1000元以下1000~20002000~30003000~40004000~50005000~60006000~70007000元以上合计企业个数(个)134510863

40频率2.5%7.5%10%12.5%25%20%15%7.5%100%

重叠式组限

“上限不在内”原则

例:为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”

1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。

某城市居民关注广告类型的频数分布(定类数据整理)广告类型人数(人)

比例频率(%)商品广告1120.56056.0服务广告510.25525.5金融广告90.0454.5房地产广告160.0808.0招生招聘广告100.0505.0其他广告20.0101.0合计2001100三、累计次数分布1累计次数(频数)

将变量数列各组的次数和比率逐组累计相加就构成了累计分布次数。表明了某一标志值的某一水平上下总共包含的总体次数和比率。2累计次数的方法向上累计向下累计将各组次数和比率,由变量值低的组向变量高的组逐组累计。表明各组上限以下总共包含的总体次数和比率。将各组次数和比率,由变量值高的组向变量低的组逐组累计。表明各组下限以上总共包含的总体次数和比率。

应用:研究分配均匀度或集中度

——Lorenz曲线

成绩人数(频率)向上累计向下累计60分以下4(8%)60—7012(24%)70—8018(36%)80---9010(20%)90---1006(12%)合计50(100%)4(8%)16(32%)34(68%)44(88%)50(100%)50(100%)46(92%)34(68%)16(32%)6(12%)上限以下的单位数(比重)下限以下的单位数(比重)

例:在一项城市住房问题的研究中,研究人员在某个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?

1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。

某城市家庭对住房状况评价的频数分布回答类别户数百分比向上累计向下累计非常不满意24(8%)8/24户数100/300户数不满意108(36%)44/13292/276一般93(31%)75/22556/168满意45(15%)90/27025/75非常满意30(10%)100/30010/30合计300(100%)————钟形分布J形分布U形分布

以上是次数分布的三种主要类型。钟型分布分为对称分布和偏态分布。四、次数分布的主要类型2.5统计表一、统计表的作用1将大量资料系统化,条理化,能更清晰的表示统计资料内容。2便于比较各项目间关系,便于计算。3表述统计资料更紧凑、简明、醒目。4易于检查数字的完整性和正确性。二、统计表的结构内容主词宾词构成要素总标题分标题本身及表中数字各类节目收视情况统计表宾词节目类型收视率满意率新闻节目类82.3%85%教育讲座类42.6%75.8%体育比赛类80.7%89.4%综合文艺类88.4%77.3%总标题纵栏标题横行标题数值主词三、统计表的种类3复合表2分组表1简单表四、编制统计表应注意的问题1标题应简明概括2主词和宾词各栏应按先局部后整体的原则排列3注明数字资料的计量单位4必要时加注解企业个数410862

营业额(元)直方图与折线图五、统计图

(直方图的制作)

1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布

2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)

3.直方图下的总面积等于1

(折线图的制作)

1.折线图也称频数多边形图(Frequencypolygon)

2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉

3.折线图的两个终点要与横轴相交,具体的做法是

第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴

折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的

条形图(直方图与条形图的区别)

1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的

2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义

3.直方图的各矩形通常是连续排列,条形图则是分开排列

饼形图曲线图86综合指标

第三章1、理解总量指标的概念及作用,掌握总量指标类型、计算总量指标的原则;2、理解相对指标的概念及在统计分析中的意义掌握各种相对指标的计算方法与要求。教学内容与要求3、了解平均指标的涵义、作用及特点;4、掌握算术平均数、调和平均数、几何平均数的计算方法和应用条件;5、掌握中位数和众数的计算方法;6、理解标志变异指标的涵义与作用,了解全距、平均差,掌握标准差及变异系数的计算方法1是反映国家、部门、单位等人、财、物的基本数据;2是制定政策、编制计划、实行社会经济管理的基本依据;3是计算其他指标的基础。一、总量指标的概念和作用反映社会经济现象在一定的时间、地点、条件下的总规模、总水平的指标。

资某企业去年主要经济指标:料总产值:125082.2万元销售收入:122174万元利润总额:1104万元固定资产原值:103987万元职工人数:11670人

销售率产值利润率销售利润率人均产值、销售额资产产值率3.1总量指标作用内容时点指标总体标志总量:总体各单位某种数量标志的总和。如说明企业数量规模的总产量总体单位总量:总体内包含的总体单位总数。如某商贸公司职工人数时间时期指标二、总量指标的种类时期指标1、连续统计2、可加性3、数值大小与时期长短有关反映现象在一段时间发展变化结果的总量。如:贸易总额、工资总额、商品销售额、耗电量、成本支出

特点:反映现象在某一时刻上达到的总量时点指标如:人口数、土地面积、企业数、固定资产原(净)值、银行存款余额1、间断登记2、不可加性3、数值与时点间隔长短无关

特点:1计算原则1.注意现象的同类性2.明确每项总量指标的统计涵义3.计量单位一致三、总量指标的计算实物单位货币单位劳动单位自然单位度量衡单位多重单位复合单位现行价格不变价格工时、工日、台时个、辆、台、支千克、米、公里、吨吨公里、千瓦时、马力/台、吨/台、吨/马力/艘2计量单位两个有联系现象的数量比率,反映现象的发展程度、结构、强度、普遍程度或比例关系。反映社会经济现象之间的比例关系使不能直接对比的现象找到可以比较的基础。便于记忆,易于保密

作用一、相对指标的概念和作用结构相对指标比例相对指标比较相对指标计划完成相对指标强度相对指标动态相对指标3.2相对指标二、种类

例:某公司2002年计划销售额2.5亿元,实际销售额2.8亿元,该公司销售额计划完成率为:该公司2002年计划商品流通费用率3%,实际流通费用率3.4%,则流通费用率的计划完成程度为:(112%)(113.3%)1.计划完成相对指标

计划执行进度的考核单位全年计划产值(万元)截止到第三季度的实际累计产值(万元)截止到第三季度的实际完成进度(%)甲分公司6000459076.5乙分公司4000298074.5丙分公司100068068.0合计11000825075.0全期计划数累计完成数

长期计划的检查:(1)水平法:(只规定最后一年应达到的水平)例:某产品规定第五年产量为56万吨,实际完成63万吨,且第四、第五年各月完成数据如下:时间第1年第2年第3年第4年第5年1季2季3季4季1季2季3季4季产量3840451112141512151719计划规定的末期水平计划末实际达到水平计划完成程度=

=56

长期计划的检查:(2)累计法(规定五年累计完成量应达到的水平)例:1996年~2000年的五年计划的基建投资总额为2200亿元,5年内实际投资累计完成2240亿元。计划完成程度=2240/2200=101.8%假设截至2000年6月底止累计已完成累计投资额2200亿元。则提前6个月完成投资计划。计划规定累计数计划期间实际完成数计划完成程度=

计划与实际数为动态相对数:例:某企业计划2002年销售额比上年增长8%,实际比上年增长10%,则销售额计划完成程度是多少?%85.101%81%101=++2.结构相对指标作用1、可以反映总体内部结构特征2、从不同时期相对数可以看出事物的变化过程及发展趋势总体总量各组(部分)总量我国各产业产值比重(%)4、用于分析平均指标变动的原因。产业一二三1999年17.649.4332000年16.450.233.42001年15.251.133.63、能反映对人、财、物的利用程度及生产经营效果的好坏如:国民收入中消费额与积累额之比职工中生产工人与非生产工人之比3.比例相对指标例:我国某年国民收入使用额为19715亿元,其中消费额为12945亿元,积累额为6770亿元。则⒈为无名数,可用百分数或一比几或几比几表示;⒉用来反映组与组之间的联系程度或比例关系。说明如:两个城市的居民人均收入之比某企业劳动生产率与行业平均水平之比城镇与农村的人均居住面积之比4.比较相对指标例:某年某地区甲、乙两个公司商品销售额分别为5.4亿元和3.6亿元。则:⒈为无名数,一般用倍数、系数表示;⒉用来说明现象发展的不均衡程度。说明如:一地区的粮食产量与人口数之比利润总额与资金总额之比地区的人数与医院数之比说明一个国家、地区、部门经济实力或为社会服务的能力;反映和考核社会经济效益;为编制计划和长远规划提供参考依据;作用5.强度相对指标另一性质不同的总量指标值某一总量指标数值例:某地区某年末现有总人口为100万人,医院床位总数为24700张。则该地区(正指标)(逆指标)6.动态相对指标三、正确运用相对指标的原则可比性:对比的两个指标(分子和分母)在经济内容上要具有内在联系,在总体范围及指标口径上要求一致或相适应,在计算方法、计算价格上可比。否则必须进行调整和换算。对比的结果以能正确反映社会经济现象实质为根本。如由于统计和核算的目的不同,投资统计中的固定资产投资不完全等同于国民经济核算中的固定资本形成。1注意两个对比指标的可比性

相对指标具有抽象化的特点,从而掩盖了现象间绝对量的差别,对于全面认识现象本质不利。应结合总量指标进行分析现象。结合运用的两种方法:

·计算分子与分母的绝对差额

·计算每增长1%的绝对值第82页例题2相对指标和总量指标结合运用结构相对数比例相对数比较相对数动态相对数计划完成相对数强度相对数关联指标间关系3多种相对指标应当结合运用部分与总体关系部分与部分关系横向对比关系纵向对比关系实际与计划关系

例:以下是某城市的调查数据,根据下列资料可以计算哪些相对指标:(2013年GDP计划比2005)年增长7.5%)答案:除计划完成相对数指标2005年2013年GDP(亿元)12242024总人口(万人)24502885

其中:非农业人口655984

农业人口17951901全国人均GDP(元)45816875东部地区人均GDP(元)899210515同类两个企业今年2月份的产品资料4正确选择对比基数单位A企业B企业产量(台)35008000销售量(台)30005000产销比(%)85.762.5同期市场总销售量(台)12000市场占有率(%)2541.7

说明同质总体内某一数量标志在一定条件下一般水平

的综合指标。特点1.将数量标志抽象化2.只能就同类现象计算3.能反映总体变量值的集中趋势一、平均指标的概念和作用概念3.3平均指标数值平均数位置平均数种类算术平均数调和平均数几何平均数中位数众数作用1.同类现象在不同空间下对比2.同一指标在不同时间下对比3.分析现象之间的依存关系(一)基本公式:

注意:与强度相对数的区别

讨论:下面哪些属于平均指标?

居民人均GNP居民人均绿地面积居民人均消费职工人均工资二、算术平均数分子数值是各分母单位特征的总和(二)计算与应用未分组资料--简单算术平均数简单算术平均例:两组推销人员某日的销售量分别是(箱):一组:10、16、15、8、14、11

二组:8、11、13、12、17、14、9

比较哪个组的销售成绩好?

一组平均销售量:12.33

二组平均销售量:12例:以下是50个工人每人每天加工的某种零件数分组(件):

分组资料--加权算术平均数工人按日产量分组(X)人数(f)总产量(X•f)20120214842261322381842412288251025026718227254合计501194

工人的平均日产量:——加权算术平均

权数例:一次智力测试中,班级学生有30%得5分,50%得4分,10%得3分,10%得1分。

2)如果该班有20名学生,平均分是多少?3)如果不知道该班的学生数,能否算出平均分?1)如果该班有10名学生,平均分是多少?反映了各组的标志值对平均数的影响程度成绩(分)人数(人)甲班乙班丙班603915010013950平均成绩(分)619980影响总体平均数的因素?各组频率各组标志值【例】某投资项目评估,将项目投产时,市场可能发生景气、一般、不景气三种情况,分别估计项目年利润和可能的频率如下

:计算该项目年利润。市场情况年利润(万元)X频率(%)(fi/∑fi)景气一般不景气20012050503020100

算术平均数的数学性质算术平均是概括反映整个分配数列集中趋势的优良代表值。

在分析和计算上非常简捷、便利。不足:易受极端变量值的影响;开口式的组距数列,组中值不易确定,影响其代表性。例:市场上有三种苹果,价格分别为(斤):4元、2.5元、1.5元,若各买1斤,平均每斤多少钱?若每种各买1元,则平均每斤多少钱?简单调和平均数三、调和平均数定义:各个变量值倒数的算术平均值的倒数。适用于计算算术平均值时,缺少总体单位数的资料。例:某商品在三个市场上的平均价格与销售量资料如下,计算该商品销售的总平均价格。市场价格(元/千克)销售额(元)甲2.0060000乙2.5050000丙2.4060000合计----170000总平均价格(元/千克)

销售量30000200002500075000åå=iiiXmmHå¾¾¾¾®¾==immmxnn1.......21

应用:算术平均数的变形已知各组的标志值和标志总量

第i组标志总量(权数)第i组标志值加权平均调和数

标志值为绝对数形式:已知条件权数平均数形式一、组标志值xi、组频数bi(频率)组频数bi(频率)算术平均数二、组标志值xi、组标志总量ai组标志总量ai调和平均数权数选择

标志值为相对数形式:计划完成率(%)组中值(%)企业数(个)计划总产值(万元)90---100955100100—11010581200110—1201152500合计------151800实际产值(万元)100×95%1200×105%500×115%19301)计算该管理局企业产值的平均计划完成率:例:某管理局所属15个企业的产值计划完成情况的分组资料如下:15个企业产值的平均计划完成率15个企业总产值的计划完成率=

以企业个数作权数:必须要有经济意义(等于组标志总量)2)若把“计划值”改为“实际值”,计算企业产值的平均计划完成率。计划完成组中值(%)实际产值(万元)951001051200115500合计1800计划产值(万元)100/95%1200/105%500/115%1683四、几何平均数用于计算现象的平均比率或平均速度。应用:各个比率或速度的连乘积等于总比率或总速度;相乘的各个比率或速度不为零或负值。应用的前提条件:【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95﹪、92﹪、90﹪、85﹪、80﹪,求整个流水生产线产品的平均合格率。1简单几何平均数公式及应用分析设最初投产A个单位,则第一道工序的合格品为A×0.95;第二道工序的合格品为(A×0.95)×0.92;

……第五道工序的合格品为(A×0.95×0.92×0.90×0.85)×0.80;则该流水线产品总的合格率为:结论:即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。【例】某金融机构以复利计息。近12年来的年利率有4年为3﹪,2年为5﹪,2年为8﹪,3年为10﹪,1年为15﹪。求平均年利率。2加权几何平均数公式及应用分析:设本金为V,则至各年末的本利和应为:第1年末的本利和为:第2年末的本利和为:第12年末的本利和为:第2年的计息基础第12年的计息基础………………结论:即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。1定义分布数列中出现频数(率)最高的标志值。

存在条件五、众数

总体单位数较多;标志值的次数分布有明显的集中趋势特点不受极端值和开口组的影响,增强对数列一般水平的代表性;是一个不易确定的平均指标【例】:已知某企业某日工人的日产量资料如下:

计算工人日产量的众数。(单项数列)日产量(件)工人人数(人)101112131470100380150100合计8002众数的计算:【例】以下是教师按年龄分组的资料,计算教师年龄的众数。教师按年龄分组(岁)人数(人)20—30830—402840—501650—6010合计62组距数列1定义

各单位标志值按顺序排列,位于中点位置的标志值。用于反映现象的一般水平。1、未分组资料:4562747879818587903645487881848588总体单位为奇数,中位数位置为,居于之间的标志值是中位数。总体单位为偶数,居于之间位置的两项数值得算术平均值是中位数。

确定中位数组:

根据公式计算中位数(组距式分组):2、分组资料:六、中位数2计算【例】某企业某日工人的日产量资料如下:计算该企业该日全部工人日产量的中位数。日产量(件)工人人数(人)向上累计次数(人)10111213147010038015010070170550700800合计800—中位数的位次3、单项式数列:【例】以下是教师按年龄分组的资料,计算教师年龄的中位数。教师按年龄分组(岁)人数(人)向上累计人数向下累计人数20—30830—402840—501650—6010合计628365262----62542610---组距数列式中:U代表中位数所在组的上限;Sm+l代表向下累计中位数所在组以后一组的累计次数;Sm-1代表向上累计中位数在组以前一组的累计次数;∑f代表总次数;d代表中位数所在组的组距。fm是中位数所在组的次数一种位置平均数,不受极端值及开口组的影响,具有稳健性各单位标志值与中位数离差的绝对值之和为最小值;对不能用数字测定的现象,可用中位数测定一般水平。特点(二)数值平均数与位置平均数的区别:3、适用的数据类型

1、对数据的代表意义与概括性2、对数据变动的灵敏性七、几种平均数的关系(一)算术平均数、调和平均数、几何平均数之间的关系(三)平均数、中位数、众数的关系

对称分布

左偏分布右偏分布皮尔逊经验公式:oemmx<<xmmeo<<eoMM-»-3xx例:某地居民去年医疗费支出的众数是300元,算术平均数为250元,(1)计算中位数近似值;(2)说明该地居民医疗费支出额分布的态势(3)若该地居民医疗费支出额小于400元的人数占一半,众数仍为300元,估计算术平均数,并说明其分布态势。解:1.2.Me<Mo左偏3.

平均数计算只宜用于同质总体应结合分配数列和组平均数补充说明总平均数,还应分析平均数的位置及各个标志单位变动。按地势分组甲地乙地播种面积(亩)平均亩产(千克/亩)播种面积(亩)平均亩产(千克/亩)旱田190380200320水田70640300620合计260450500500应用平均指标须注意的问题

课程学生语文数学英语总成绩平均成绩甲乙丙606555656565706575195195195656565单位:分某班三名同学三门课程的成绩如下:请比较三名同学学习成绩的差异。一组:8576758281747279二组:7080829093546095平均值标志值频率一、标志变动度的意义和作用3.4标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度。定义测定变异指标的意义1.反映各单位标志值分布的离中趋势2.说明平均指标对总体的代表性程度3.说明现象变动的均匀性或稳定性程度指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标

来反映。离中趋势反映统计数据差异程度的综合指标,也称为标志变动度1、全距(极差)2、平均差(A.D.)

优点:计算方法简单、易懂;

缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差⑴简单平均差——适用于未分组资料二、标志变异指标的种类第一组数据8576758281747279第二组数据70808290935460957-2-343-4-61-8241215-24-1817

第一组A.D=第二组A.D=测试分数人数(人)90~100580~901270~803合计20451233909-1-11---⑵加权平均差——适用于分组资料

优点:

不易受极端数值的影响;能综合反映全部单位标志值的实际差异程度;缺点:

用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。平均差的特点3、标准差、方差方差:标准差:⑴简单标准差——适用于未分组资料第一组数据8576758281747279第二组数据70808290935460957-2-343-4-61-8241215-24-181749491691636164416144225576324289⑵加权标准差——适用于分组资料测试分数人数(人)90~100580~901270~803合计20811121---405123637809-1-11---平均差A.D.≤标准差

用于不同水平现象之间比较偏态的偏斜程度。SK>0右偏,SK<0左偏,标准差与平均差的数量关系标准差的应用1:偏态系数SK(-3,3)标准差的应用2:标准分(标准化)SK=(X-MO)/

用于不同均值和标准差的总体的个体数据比较。(先标准化转换为均值为0标准差为1的总体再比较)标准分=(Xi-X)/

标准差系数用来对比不同平均水平的同类现象、不同类现象总体平均数代表性的大小,避免了数列水平和离散程度的影响。4、离散系数(变异系数)标准分不改变原变量值大小的位序,不但表明各单位标志值在总体分布中的地位,还能用于不同分布原始数据的比较。【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。解:一班成绩的标准差系数为:二班成绩的标准差系数为:结论:因为,所以一班平均成绩的代表性比二班大。157

第四章动态数列1、了解时间数列的概念与编制原则,时间数列的种类及其特点;2、掌握发展水平,增减水平,平均发展水平指标的含义与计算公式;3、掌握发展速度,增长速度,平均速度指标的计算方法及其应用;4、理解时间数列的影响因素,着重长期趋势分析,包括移动平均法,指数平滑法,数学模型法的原理与具体计算,5、理解季节指数的两种基本测定方法。教学内容与要求

基本要素

现象所属时间一定时间下的指标值

将某一统计指标在不同时间上的数值按时间先后顺序排列形成的序列。某企业2001---2006年发展情况年份200120022003200420052006总产值(万元)101215182026年末职工人数(人)140150146142150155高级职称比重(%)1.62.52.42.82.93.1职工月人均工资(元/人)5896787958628841056一、动态数列的概念4.1动态数列的编制定义

1.计算各种水平和速度指标,考察现象发展变化的方向、快慢,作动态比较

2.建立数学模型,描述现象发展的趋势,进行预测

3.对时间序列进行回归分析,提示现象相关特征及动态演变作用二、动态数列的种类1、时期数列:说明现象在各个时期内的总量。(可相加、大小与时期长短有关、连续登记)

2、时点数列:说明现象在某一时点上的数量水平。(不可相加、大小与时期长短无关、一次登记)(一)绝对数动态数列:将一系列同类的总量指标按时间先后顺序排列。可比性指标时间统一总体范围统一经济内容统一计算方法统一计价与单位统一三、动态数列的编制原则(二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论