统计学原理孙40_第1页
统计学原理孙40_第2页
统计学原理孙40_第3页
统计学原理孙40_第4页
统计学原理孙40_第5页
已阅读5页,还剩279页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 绪 论第一节 统计学的产生和开展第二节 统计的根本问题第三节 统计学的假设干根本概念补 充: 统计学的分科本章小结一、统计的含义在不同的场合,分为: 1. 统计工作 收集数据的活动2. 统计资料数据对现象计量的结果3. 统计学 描述和分析数据的方法与技术关系:第一节 统计学的产生和开展统计学指导经验总结与概括统计工作统计资料取得二、统计开展史原始社会:统计萌芽时期奴隶社会:有了初步的国情统计封建社会:开始了初步的开展资本主义社会:统计成为一个独立部门社会主义社会:认识社会的有力武器三、统计学派及代表人物学派特点代表人物成就记述学派以文字记述比较国情德海尔曼康令第一个使用 “统计学”名称

2、政治算术学派用数字、重量、尺度来表达思想英威廉 配第英约翰格朗特政治算术; 统计学的发明者数理学派用数理统计方法进行社会、自然研究比阿道夫凯特勒第一次把概率论和数理统计方法应用于社会经济统计社会经济学派用大量观察法研究社会经济现象的数量表现和变化德 肯尼斯英梅尔恩格尔*Engel法则一、统计的研究对象统计工作的研究对象是社会经济现象的数量方面。统计学的研究对象是正确认识和反映社会经济现象的方法。第二节 统计的根本问题二、统计的作用及过程?统计法?规定:“统计的根本任务是对国民经济和社会开展情况进行统计调查、统计分析,提供统计资料,实行统计监督。职能:信息、咨询与监督;工作过程:统计设计、统计调

3、查、统计整理、统计分析 等三、统计的研究方法大量观察法统计分组法综合指标法归纳推断法第三节 统计学的假设干根本概念一、总体和样本总体:同质个体所组成的整体。特征:同质性、大量性、差异性;种类:有限总体和无限总体;相关概念:总体单位、总体容量和参数。样本:从总体中抽出的一局部单位构成的集合。相关概念:样本单位、样本容量和统计量。一标志1.概念:说明总体单位特征的名称。由标志名称标志值组成。2.标志的分类:A标志按其表现形式的不同: 品质标志:表示事物质 的特征,其值只能用文字表示。 数量标志:表示事物量 的特征,其值只能用数字表示。二、标志、指标和指标体系B标志按其变异情况不同: 不变标志:指某

4、标志在总体各单位的具体表现是相同的。 可变标志:指某标志在总体各单位的具体表现不尽相同。总体:具有中华人民共和国国籍的所有公民总体单位:每一位公民 标志名称 标志值国籍: 中国不变标志姓名: 张三可变标志、品质标志年龄: 50 可变标志、数量标志例:中华人民共和国人口普查1.概念:是说明总体数量特征的概念。由指标名称+指标值组成。2.特点:综合性、数量性和具体性3.指标的分类数量指标:是指反映事物的规模质量指标:是指反映事物内部数量比照关系和一般水平二指标总体:工业企业 指标名称 指标值 工业企业总数: 10000000 工业企业职工数: 3亿人 工业总产值: 5千亿 平均工资: 7000元/

5、年人总体单位:每一个工业企业例:工业普查;三标志和指标的区别和联系 区别:指标是说明总体数量特征,而标志是说明总体单位特征。指标都是用数值表示的,而标志有的是用数字表示,有的是用文字表示。 联系: 许多统计指标是由各单位的数量标志值汇总而来的; 指标和标志之间存在转化关系。四指标体系由假设干个相互联系的统计指标组成的一个整体称为统计指标体系。 例:各地区城市设施水平指标体系:人均居住面积;城市人口用水普及率;城市煤气普及率;每万人拥有公共汽(电)车;人均拥有铺装道路面积等三、流量与存量流量一定时段 测算的量,具有时间量纲,可加性;存量一定时点上测算的量,不具时间量纲,不可加性。补充: 统计学的

6、分科一、从统计方法的构成角度分一描述统计学(descriptive statistics):研究如何取得、整理和表现数据资料的方法。 二推断统计学(inferential statistics):研究如何根据样本数据去推断总体数量特征的方法。 三描述统计学和推断统计学的关系 描述统计学是根底和前提,推断统计学那么是核心和关键。二、从统计方法的研究和应用角度分一理论统计学theoretical statistics 利用数学原理研究统计学的一般理论和方法的统计学,如概率论与数理统计二应用统计学(applied statistics) 研究如何应用统计方法解决实际问题,大多是以数理统计为根底形成的

7、边缘学科。如自然科学领域的生物统计学、社会科学领域的社会经济统计学等。三、统计学与其他学科的关系一统计学与哲学的关系 哲学为统计学提供世界观和方法论的指导。二统计学与数学的关系 1.区别 1研究对象不同:数学研究抽象的量,统计研究具体的量。 2研究方法不同:数学是演绎,统计是归纳和演绎的结合。 2.联系 数学为统计研究提供数学公式、模型和分析方法。三统计学与其他学科的关系 统计几乎与所有学科都有联系,本书课程着重介绍统计与管理学和经济学的关系。本章小结一、统计的三层含义:统计工作、统计资料和统计学。二、统计的研究对象、职能、工作过程和研究方法三、统计学中的根本概念 一总体、总体单位和样本; 二

8、标志、指标和指标体系; 三流量和存量第二章 统计设计与统计调查第一节 数据的计量与类型第二节 统计调查方案设计第三节 统计调查的组织形式第四节 统计调查误差本章小结第一节 数据的计量与类型一、数据的计量尺度一定类尺度nominal scale 1.概念:区分现象类别 的一种测度。 2.举例:人的性别 、籍贯、民族、职称;企业的所有制性质、行业隶属。 3.特征 1只能区分事物的类别,无法比较优劣或大小 2对事物的区分必须遵循穷尽和互斥 的原那么 3对定类尺度计量分析的统计量主要是频数 和频率1.概念:区分事物之间等级或顺序差异。2.举例:教师的职称、学历,商品的质量等级等。 3.特征 1对事物可

9、以分类、比较优劣和大小。 2对事物的分类要求穷尽和互斥。 3对定序尺度计量分析的统计量除频数和频率外,还有累计频数和累计频率。二定序尺度(ordinal scale)三定距尺度(interval scale) 1.概念:测度事物类别或次序之间的间隔。 2.举例:考试成绩、身高、温度等。 3.特征 1能分类、排序、比较大小,计量差距。 2有确定意义的“零位 ,即“0是有意义的。 四定比尺度ratio scale1.概念:也称比率尺度,是对事物之间比值的一种测度。2.举例:人的收入、支出;企业的产值、利润;某地区的人口总数、失业人数等3.特征 1分类、排序、比较大小、求出差异、计算两个数值之间的比

10、率。 2无确定意义的“零位 ,即 “0是无意义的。 四种计量尺度的比较数学特征定类尺度定序尺度定距尺度定比尺度分类(,)排序(,)间距(+,)比值(,)可以可以可以可以可以可以可以可以可以可以二、数据的类型1.定性数据品质数据 1概念:说明事物的品质特征,不能以数值表示,只能以文字表述,由定类和定序尺度计量形成。 2举例:高校教师职称有助教、讲师、教授等。2.定量数据 数量数据 1概念:说明现象的数量特征,以数值表示。由定距和定比尺度计量形成。 2举例:考试成绩80分、95分、100分,身高米、米等。第二节 统计调查方案设计调查方案的内容调查目的调查对象与调查单位调查工程和调查表其他一确定调查

11、目的调查之前必须明确:调查要到达的具体目标答复“为什么调查?二调查对象和调查单位调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位答复“向谁调查?【注】同时需要明确:填报单位报告单位调查单位两者有时一致,有时不一致。三调查工程和调查表调查工程:调查的具体内容调查表:表现调查工程的表格或问卷答复“调查什么?Q1 Q2 Q3 Q4 调查表结构:一般由表头、表体和表脚组成。表头表名、封面信、指导语及调查单位的根本信息表体调查表的主要局部,调查工程在各种问题上的落实表脚包括调查者的签名和调查日期种类单一表:每个调查单位填写一份,可以容纳较多的内容一览表:把许多调查单位填写在一张表上方案

12、设计中的其他问题明确调查所采用的方法确定调查资料的所属时间和调查工作的期限调查的组织与实施细那么 牌牙膏用户市场调查方案调查目的:为了了解 牌牙膏在市场上的信用情况和销量情况,以及目前市场用户喜欢什么样的牙膏,其他牙膏比 牌牙膏优越之处在哪里。调查对象:所有牙膏用户调查单位:每一位牙膏用户报告单位:调查员调查工程及调查问卷见附表调查时间:2021年10月调查地点:各大商场牙膏销售柜台前调查方式:随机抽样调查调查方法:采访法调查工作的组织实施方案:此项调查由 牌牙膏厂市场部组织领导和宣传,由某大学学生协助调查,预算经费为30,000元。结果只作为该厂进行生产设计的参考,不公开发表。 牌牙膏调查问

13、卷1、你用过 牌牙膏吗? 是 否 2、你认为 牌牙膏怎么样? 很好好 较好 一般 差 3、你所用过的牙膏有哪些? a 竹盐b 两面针 c 黑妹d 中华 e 黑人 f 佳洁士 g 高露洁 h 雕牌 4、评分标准 很好10分;好8分;较好 6分;一般 4分;差2分 请按以上的评分标准给第三题中列出的牙膏质量评定分数,分数填入括号内。5、你对我厂生产的 牌牙膏有什么意见?专门调查统计报表统计调查经常调查一次性调查非全面调查全面调查直接观察法采访法报告法问卷调查法调查登记的时间被研究总体的范围收集资料的方式网上调查法重点调查普查全面报表典型调查抽样调查第三节 统计调查的组织形式 统计报表1、概念统计报

14、表是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间,自下而上逐级提供根本统计资料的一种调查方式。2、统计报表的特点统一性和时效性全面性资料的相对可靠性连续性和周期性三统计报表的种类按报送范围不同,有全面报表和非全面报表。按报送的周期不同,有日报、月报、季报、年报等。按报表的内容和性质不同,有国家统计报表、部门统计报表、地方统计报表。普查1、概念普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的一次性全面调查。2、特点一次性调查专门组织的全面调查3、作用搜集不宜用经常调查能搜集的全面、准确的统计资料掌握全面、系统的国情国力统计资料总体每逢末尾数字为“0的年份进

15、行人口普查。每逢末尾数字为“1或“6的年份进行根本统计单位普查。每逢末尾数字为“3的年份进行第三产业普查。每逢末尾数字为“5的年份进行工业普查。每逢末尾数字为“7的年份进行农业普查。2条件/前提只要求掌握事物的根本状况与根本的开展趋势存在着重点单位重点调查1概念是一种非全面调查,选择一局部重点单位进行调查。重点单位的某一主要标志的标志总量在总体标志总量中有绝大比重。3、重点调查的特点:实质上是范围比较小的全面调查不能推断总体重点单位的选择不带有主观因素典型调查1、概念在对被调查对象进行全面了解的根底上,有意识地选择假设干具有典型意义的或有代表性的单位进行的调查。2、优缺点优点: 灵活; 可取得

16、详实的统计资料缺点:受主观认识的影响3、方式 “解剖麻雀 “划类选典抽样调查1、概念抽样调查是一种非全面调查,它是按照随机原那么从总体中抽取一局部单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。总体随机样本 2、抽样调查的特点抽样调查是一种代表性调查代表性调查,即用局部单位代表总体目的:通过样本来推断总体抽样调查是按照随机原那么选取样本随机性原那么:调查单位确实定完全由随机因素来决定,单位中选或不中选不受主观因素的影响。第四节 统计调查误差一、调查误差的概念和种类1、概念:抽样统计量与总体参数之间的差异2、种类1登记性误差可防止2代表性误差不可防止、可减少二、控制调查误差的

17、方法扩大样本容量本章小结一、统计数据的计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。二、统计数据的类型 一定性数据:由定类和定序尺度计量而成,反映事物的品质特征。 二定量数据:由定距和定比尺度计量而成,反映事物的数量特征。本章小结三、统计调查 一统计调查的种类和方法 二统计调查方案的设计 三统计调查的组织方式:有普查、统计报表、抽样调查等,其中重点调查、抽样调查是最常用的科学的调查方法。四、统计调查误差:登记性误差、代表性误差第三章 统计资料的整理第一节 统计整理的根本问题第二节 统计分组第三节 分配数列第四节 统计资料的显示本章小结统计整理:指对调查所得原始材料 进行科学分组与汇总和对以

18、往的材料进行再加工。统计整理的程序设计方案审核完整性、及时性、准确性、适用性分组、汇总、计算再审核计算性误差编表,绘图第一节 统计整理的根本问题第二节 统计分组统计分组:按某种标志 把总体分成假设干局部的科学分类。统计分组的关键:1、选择分组标志 ;2、划分各组界限统计分组的种类:按分组标志的多少分为:简单分组 和复合分组按分组标志的性质分为:品质分组 和数量分组分组的作用:划分现象类型;揭示现象内部结构;分析现象的依存关系分组标志的选择的要求要符合统计研究的目的和要求必须选择最主要的标志作为分组依据要考虑社会经济现象所处的具体历史条件组数、组距、组限、组中值一组数:即将总体分为几组二组距:各

19、组的区间距离组数和组距确实定分下面两种情况:品质分组由两个因素决定:事物本身的属性特征统计研究的要求2、数量分组:全距=最大标志值最小标志值组距=各组最大标志值上限 各组最小标志值下限=全距组数组数、组距确定的斯特杰斯经验公式三组限:指每组两端数值;分上限和下限。上限:每组的终点数值最大值。下限:每组的起点数值最小值。组限的形式:重合式:指相邻两组中,前一组的上限和后一组的下限数值重合。一般用于连续型变量。组距=上限下限不重合式:指前一组的上限与后一组的下限,两值紧密相连而不相重复。一般用于离散型变量。组距=下组下限本组下限,或=本组上限前组上限四组中值:是各组上下限之间的中点值。代表各标志值

20、的一般水平。组中值(重合式组限) =上限下限2 =下限组距/2 =上限组距/2组中值(不重合式组限) =(本组上/下限下一组上/下限) 2 =本组下限组距/2 =下组上限组距/2缺下限的开口组:缺上限的开口组:组中值=上限-邻组组距/2组中值=下限+邻组组距/2第三节 分配数列分配数列:也称次数分布或次数分配,总体单位在各组分布状况。分配数列组成要素1、组的名称2、各组次数也称频数或频率考分人数(人)比率(%)60以下25.06070717.570801127.580901230.090100820.0合计40100.0某班统计学考试成绩次数分配 按分组标志 按分组形式 品质数列 变量数列 单

21、项式数列分 组距式数列 等距数列布 异距数列数 按次数分布特征列 钟形分布数列 正态分布 偏态分布 左偏分布 U形分布数列 右偏分布 J形分布数列 J形 倒J形分配数列的分类对称分布右偏分布左偏分布正J型分布反J型分布U型分布 几种常见的次数分布分配数列的编制1、品质数列的编制根本过程列出各类别计算各类别的频数制作分配数列性别人数(人)频率(%)男女301075.025.0合计40100.0某班学生的性别构成情况【例】某班学生有男生30人,女生10人,试编制分配数列2、变量数列的编制【例】按百分制记分,某班40位学生统计学考试成绩,试编制分配数列89 88 76 99 74 60 82 60

22、89 8693 99 94 82 77 79 97 78 95 9287 84 79 65 98 67 59 72 84 8556 81 77 73 65 66 83 63 79 701单项式分配数列的编制要点一个变量值作为一组适合于离散变量适合于变量值较少的情况某班统计学考试成绩表考分人数(人)考分人数(人)考分人数(人)考分人数(人)561721822921591731831931602741842941631761851951652772861971661781871981671793881992701811892合计402组距式分配数列的编制A、排序56 59 60 60 63 65

23、65 66 67 70 72 73 74 76 77 77 78 79 79 7981 82 82 83 84 84 85 86 87 88 89 89 92 93 94 95 97 98 99 99B、确定组数尽量取奇数3、5、7、9,本例取“5C、确定组距组距全距组数=99-56,为方便计算本例取“10D、确定组限离散型变量上下限都可以用准确的数值表示连续型变量前一组的上限与本组的下限为同一数值,“上组限不在内 考虑要反映总体质的区别,本例取第一组下限为50E、计算各组频数某班统计学考试成绩表按成绩分组频数(人)频率(%)50606070708080909010027111285.017.

24、527.530.020.0合计40100.0要点:将变量值的一个区间作为一组适合于连续变量适合于变量值较多离散变量的情况必须遵循“不重不漏的原那么另外:既可采用等距分组,也可采用不等距分组;既可使用开口组,也可使用闭口组分组数据直方图与折线图10864250 60 70 80 90100110考分折线图下的面积与直方图的面积相等!直方图下的面积之和等于112频数(人)某班学生统计学考试成绩次数分配曲线 (五) 累计次数分布1. 概念2. 种类:向上累计向下累计3. 编制4. 特点 同一数值的向上累计和向下累计频率之和等于一最后一组累计频率等于一某班统计学考试成绩次数分配考分次数向上累计向下累计

25、人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)506025.025.040100.06070717.5922.53895.070801127.52050.03177.580901230.03280.02050.090100820.040100.0820.0合计40100.0向上累计频数折线图向下累计频数折线图第四节 统计资料的显示统计表是集中而有序地表现统计资料的表格统计表的结构1、从形式组成因素:横行、纵栏、标题、标目、数字资料2、从内容:主词、宾词统计表的种类按主词的分组情况分简单表分组表复合表宾词指标设计平行设计层叠设计制表规那么标题醒目准确内容简明扼要工程排列有序字迹清楚

26、标准数字按个位数上下对齐,无数填号,缺报填号各栏应加编号规格符合要求上下粗线,左右开口,栏间划线,行间空白统计图:是具体显示统计资料数量特征的图形1、分布图:直方图 折线图 累计折线图2、形象图:饼图 条形图注:直方图与条形图的区别本章小结一、统计数据整理的根本过程二、统计分组的概念及种类三、分配数列 由两个要素构成,一是组别,二是各组次数或频率。根据需要,可以编制简单次数分布表和累计次数分布表。四、次数分布 主要有钟形分布、U形分布和J形分布。五、统计表和统计图:直方图与条形图的区别第四章 总量指标和相对指标 第一节 总量指标第二节 相对指标本章小结第一节 总量指标一、总量指标的含义总量指标

27、又称绝对指标或简称绝对数,是反映社会经济现象在一定时间、地点条件下规模或绝对水平 的综合指标。表现形式:绝对数。如:2000年中国GDP为89404亿元。 2000年中国外汇储藏为1656亿美元。二、总量指标的种类1、按总量指标的总体内容不同分:总体单位总量:指总体单位总数。总体标志总量:指总体单位某一数量标志值的总和。如:研究某地区的工业企业职工工资情况,“职工人数为总体总量,“工资总额为标志总量。2、按总量指标所反映的时间不同分:时期指标时期数时点指标时点数如:总产值、销售量为时期数;年末人口数、设备台数为时点数。时期数与时点数的比较3、按计量单位不同分: 实物指标 价值指标 劳动量指标三

28、、计算和运用总量指标应注意的问题1、正确确定指标含义、计算范围、指标界限。2、同类实物总量指标才能相加。3、使用统一计量单位。4、把总量指标与相对指标和平均指标结合起来使用。第二节 相对指标一、相对指标的含义 相对指标是两个有联系的统计指标进行比照的比值。也称为相对数。表现形式: 成数无名数 系数和倍数 百分数、千分数有名数 复名数二、相对指标的种类一方案完成相对数二结构相对数三比例相对数四比较相对数五动态相对数六强度相对数一方案完成相对数1、概念:方案期内实际完成数与方案数之比2、作用:考核、反映方案完成的程度和进度3、计算方法根本计算公式: 分子与分母位置不能互换 超额完成或未完成绝对数

29、=实际完成数方案数派生公式:1产量、产值增长百分数:2产品本钱降低百分数: 中长期方案的检查方法1水平法:将方案末期 实际完成数与同期方案规定数之比。2累计法:方案期内各年累计 实际完成数与同期方案规定的累计数之比。方案执行进度相对数的计算方法二结构相对数1、概念:局部占全体的比例。2、作用:反映事物的内部构成、性质、质量及其变化。3、计算公式:4、特点:各局部所占比重之和为100% ;分子与分母位置不能互换。三比例相对数1、概念:同一总体某一局部数值与另一局部数值比照的比值。2、作用:反映总体各局部间的内在联系与比例关系。同一总体不同局部比较3、计算公式: 4、特点:分子分母同属一个总体,而

30、且分子与分母的位置可以互换。四比较相对数1、概念:同一时间的同类指标在不同空间比照的比值。2、作用:反映同类现象在不同空间的数量差异,发现先进与后进。3、计算公式: 4、特点:用百分数或倍数表示,分子和分母可以互换。五动态相对数1、概念:某一统计指标在不同时期的两个数值比照的比率。又称开展速度或指数。2、作用:反映事物开展变化的方向与程度。3、计算公式: 其中:报告期又称计算期,是研究或计算时期。基期是作为比较根底的时期。4、特点:分子与分母的位置一般不能互换。常用百分数、倍数、千分数表示。六强度相对数1、概念:两个性质不同而又相互联系指标之比。2、作用:反映一国一地的开展水平、力量强弱。反映

31、事物存在的密度、普遍程度、运动强度、负担强度。反映经济效益的上下。3、计算公式: 4、特点:有正指标和逆指标之分,数值大小与强度成正比为正指标,反之为逆指标。有些指标分子与分母可互换。计量单位常用复名数。例题:想一想可以计算哪几种相对指标? 根据第四次人口普查调整数 1982年 1990年人口总数其中:男 女 101654 52352 49302 114333 58904 55429单位:万人又知我国国土面积为960万平方公里。结构相对指标比例相对指标比较相对指标强度相对指标动态相对指标三、计算和运用相对数应遵循的原那么1、两个比照指标要有可比性。2、相对数要和总量指标结合使用。3、各种相对指

32、标结合运用。部门卷烟库存量其中:霉变量霉变量占库存量%ABC 5 502000.10.52.0211本章小结总量指标:概念、总体单位总量和总体标志总量、时期指标和时点指标相对指标:种类及计算第五章 统计特征值 第一节 统计平均数集中趋势的测度 第二节 标志变动度离散程度的测度第三节 数据偏态与峰度的描述第一节 统计平均数集中趋势的测度一. 定类数据:众数二. 定序数据:中位数和分位数三. 定距和定比数据:算术平均数、调和平均数和几何平均数四. 众数、中位数和算术平均数的比较什么是集中趋势?一组数据向其中心值靠拢的倾向和程度一般水平的代表值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势

33、测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定一. 定类数据:众数一根本要点集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于定类数据,也可用于定序数据和数值型数据包括定距和定比数据二众数的测度无众数原始数据: 10 5 9 12 6 8一个众数原始数据: 6 5 9 8 5 5多于一个众数原始数据: 25 28 28 36 42 421.定类数据的众数【例】某城市居民关注广告类型的频数分布 广告类型人数(人)频率(%)商品广告服务广告金融广告房

34、地产广告招生招聘广告其他广告1125191610256.025.54.58.05.01.0合计200100解:这里的变量为“广告类型,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告这一类别,即 Mo商品广告2.定序数据的众数解:这里的数据为定序数据。变量为“答复类别。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意这一类别,即 Mo不满意【例】甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%) 非常不满意 不满意 一般 满意 非常满意24108

35、934530836311510合计300100.03.数值型分组数据的众数. 众数的值与相邻两组频数的分布有关. 该公式假定众数组的频数在众数组内均匀分布. 相邻两组的频数相等时,众数组的组中值即为众数Mo. 相邻两组的频数不相等时,众数采用以下近似公式计算MoMo 【例】某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50二.定序数据:中位数和分位数一中位数1.要点集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响主要用于定序数据,也可用

36、数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即Me50%50%2.中位数位置确实定未分组数据:组距分组数据:未分组数据的中位数:3.中位数的测算1定序数据的中位数解:中位数的位置为: 300/2150从累计频数看,中位数的在“一般这一组别中。因此 Me一般【例】甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计3002数值型未分组数据的中位数原始数据: 24 22 21 26 20排 序: 20 21 22 24 26位 置: 1 2 3 4 5中位数 22原

37、始数据: 10 5 9 12 6 8排 序: 5 6 8 9 10 12位 置: 1 2 3 4 5 6位置N+126+123.5中位数8 + 928.5根据位置公式确定中位数所在的组采用以下近似公式计算:注: 该公式假定中位数组的频数在该组内均匀分布3数值型分组数据的中位数向上累计频数组 【例】某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50二四分位数1.要点集中趋势的测度值之一排序后处于25%和75%位置上的值不受极端值的影响主要用于定序数据

38、,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%2.四分位数位置确实定未分组数据:3N上四分位数(QL)位置 =4N4下四分位数(QL)位置 =组距分组数据:上四分位数(QU)位置 =3(N+1)4下四分位数(QL)位置 =N+143. 四分位数的测算解:下四分位数(QL)的位置为: QL位置(300)/475 上四分位数(QL)的位置为: QU位置(3300)/4225从累计频数看,QL在“不满意这一组别中;QU在“一般这一组别中。因此 QL 不满意 QU 一般【例】甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满

39、意 非常满意2410893453024132225270300合计300原始数据: 23 21 30 32 28 25 26排 序: 21 23 25 26 28 30 32位 置: 1 2 3 4 5 6 7 QL= 23N+17+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QU = 30原始数据: 23 21 30 28 25 26排 序: 21 23 25 26 28 30位 置: 1 2 3 4 5 6QL= 21+0.75(23-21) = 22. 5QL位置 =N+14=6+14= 1.75QU位置 =3(N+1)43(6+1)4= 5.25QU =

40、28+0.25(30-28) = 上四分位数: 下四分位数: QL位置50/4QU位置350/4【例】某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50三.定距和定比数据:算术平均数、调和平均数和几何平均数一算术平均数均值1.要点集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响用于数值型数据,不能用于定类数据和定序数据2.算术平均数的计算设一组数据为:X1 ,X2 , ,XN ,简单均值的计算公式为设分组后的数据为:X1 ,X

41、2 , ,XK 相应的频数为: F1 , F2, ,FK加权均值的计算公式为原始数据:10591368【例】 某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计506160.0注:A.加权均值的权数对均值的影响 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下:X甲01+201+1008n10i=1Xi 82(

42、分)X乙08+201+1001n10i=1Xi 12(分)甲组考试成绩(X )人数分布(F )0 20 100 1 1 8乙组考试成绩(X )人数分布(F )0 20 1008 1 1注:B.均值的数学性质1.各变量值与均值的离差之和等于零 2. 各变量值与均值的离差平方和最小二调和平均数1、要点集中趋势的测度值之一均值的另一种表现形式易受极端值的影响用于定比数据不能用于定类数据和定序数据计算公式为原来只是计算时使用了不同的数据!2、计算某日三种蔬菜的批发成交数据蔬菜名称批发价格(元/公斤) Xi成交额(元) XiFi成交量(公斤)Fi甲乙丙1.200.500.8018000125006400

43、15000250008000合计3690048000【例】某蔬菜批发市场三种蔬菜的日成交数据下表,计算三种蔬菜该日的平均批发价格三几何平均数1、要点:集中趋势的测度值之一N 个变量值乘积的 N 次方根适用于特殊的数据主要用于计算平均开展速度计算公式为可看作是均值的一种变形2、计算一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。平均收益率103.84%-1=3.84%四、众数、中位数和均值的比较 对称分布均值= 中位数= 众数 左偏分布均值中位数众数 右偏分布众数中位数 均值注:数据类型

44、与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据 定序数据定距数据定比数据适用的测度值众数中位数均值均值四分位数众数调和平均数众数中位数几何平均数四分位数 中位数四分位数众数第二节 标志变动度离散程度的测度一. 定类数据:异众比率二. 定序数据:四分位差三. 定距和定比数据:方差及标准差四. 相对离散程度:变异系数什么是离中趋势?数据分布的另一个重要特征是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值一. 定类数据:异众比率1、要点离散程度的测度值之一,用于衡量众数的代表性

45、非众数组的频数占总频数的比率计算公式为2、计算某城市居民关注广告类型的频数分布 广告类型人数(人)频率(%) 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告1125191610256.025.54.58.05.01.0合计200100【例】根据下表的数据,计算异众比率解: 在所调查的200人当中,关注非商品广告的人数占44%,异众比率还是比较大。因此,用“商品广告来反映城市居民对广告关注的一般趋势,其代表性不是很好 Vr = 200 - 112200 = 1 - 112 200 = 0.44 = 44%二、定序数据:四分位差1、要点离散程度的测度值之一也称为内距或四分间距上四

46、分位数与下四分位数之差 QD = QU - QL反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性2、计算【例】计算甲城市家庭对住房满意状况评价的四分位差解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 QL = 不满意 = 2, QU = 一般 = 3四分位差: QD = QU = QL = 3 2 = 1甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300三、定距和定比数据:方差和标准差一极差1. 一组数据的最大值与最小值之差2.

47、 离散程度的最简单测度值3. 易受极端值影响4. 未考虑数据的分布5. 计算公式为7891078910未分组数据 R = max(Xi) - min(Xi).=组距分组数据 R 最高组上限 - 最低组下限二平均差1、要点离散程度的测度值之一各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少计算公式未分组数据组距分组数据2、计算某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)| Xi- X |Xi-X |Fi105110110115115120120125125130130135135140107.5112.5117.5122.

48、5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计50312【例】计算工人日加工零件数的平均差三方差和标准差1、要点离散程度的测度值之一最常用的测度值反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 12X = 8.32、计算公式未分组数据组距分组数据未分组数据组距分组数据方差的计算公式标准差的计算公式3、计算某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi-

49、X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计503100.5【例】计算工人日加工零件数的标准差4、标准化值也称标准分数给出某一个值在一组数据中的相对位置可用于判断一组数据是否有离群点用于对变量的标准化处理计算公式为四、相对离散程度:变异系数1、要点标准差与其相应的均值之比消除了数据水

50、平上下和计量单位的影响测度了数据的相对离散程度用于对不同组别数据离散程度的比较计算公式为2、计算某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据下表。试比较产品销售额与销售利润的离散程度X1=536.25(万元)S1=309.19(万元)536.25309.19V1=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论: 计算结

51、果说明,V1 0为右偏分布偏态系数 0为左偏分布计算公式为2、计算【例】某年我国农村居民家庭按纯收入分组的有关数据如右表。试计算偏态系数某年农村居民家庭纯收入数据按纯收入分组(元)户数比重(%)500以下500100010001500150020002000250025003000300035003500400040004500450050005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94农村居民家庭村收入数据的直方图按纯收入分组(元)4500户数比重(%)2520151055005000100015002000250030003

52、5004000结论:1. 为右偏分布 2. 峰度适中农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi- X ) Fi3(Xi- X ) Fi45以下5101015152020252530303535404045455050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154

53、686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计1001689.2572521.25根据上表数据计算得将计算结果代入公式得结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭那么占少数,而且偏斜的程度较大 二. 峰度及其测度1、要点数据分布扁平程度的测度峰度系数=3扁平程度适中偏态系数3为尖峰分布计算公式为2、计算代入公式得 【例】根据上例计算结果,计算农村居民家庭纯收入分布的峰度系数 结论:由于=3.43,说明我国农村居民家庭纯收入的分布为尖峰分

54、布,说明低收入家庭占有较大的比重 本章小结 1.数据集中趋势:各种平均数、中位数、众数的概念和特点;均值、中位数、众数的特点;重点介绍其计算方法和应用场合。 2.数据离中趋势:极差、平均差、方差、标准差、离散系数等的概念和计算方法。重点是方差、标准差及标准差系数的计算。 3. 偏态和峰态的根本概念及测定方法。 待续第六章 统计指数分析第一节 统计指数的概念和种类第二节 综合指数分析第三节 平均指数分析第四节 指数体系和因素分析第五节 统计指数的应用165第一节 统计指数的概念和种类 一、指数的概念二、指数的作用三、指数的种类一、指数的概念1、广义的概念 一切的相对数都是指数2、狭义的概念 综合

55、反映多种不能直接相加和比照的复杂社会经济现象综合变动程度的相对数 相对性、综合性、平均性指数二、指数的作用综合反映复杂现象总体数量上的变动状态方向、程度等分析现象总体变动中受各个因素变动的影响程度研究事物在长时间内的变动趋势三、统计指数的种类 按反映现象的范围不同个体指数反映个别现象 数量变动的相对数,如单位产品产量指数 总指数说明现象总体 变动的相对数,如多种商品价格综合指数 按编制指数的指标不同质量指标指数说明质量指标 变动的相对数,如价格指数、单位本钱指数 数量指标指数说明数量指标 变动的相对数,如销售量指数、产量指数 按编制方法的不同综合指数在确定同度量因素的根底上,通过先综合后比照

56、的方法计算得出的指数,反映现象总体的综合变动情况 平均指数是综合指数的代数变形,它是所研究现象的个体指数的加权平均数 按指数选择的基期不同定基指数在指数数列中都以某一固定时期的水平 作为比照基准编制的指数 环比指数在指数数列中都以前一期的水平 作为比照的基准编制的指数 第二节 综合指数分析综合指数的概念综合指数编制方法方法比值=总指数商品名称计量单位销售量单位价格基期q0报告期q1基期p0报告期p1甲件4806002525乙千克5006004036丙米2001805070合计q0q1p0p1600600180q1480500200q0一 综合指数的概念编制总指数的一种方法原那么:通过寻找同度量

57、因素并将其固定在恰当期数,来解决复杂总体不能直接相加的问题质量指标指数和数量指标指数1、数量指标指数 的编制二 综合指数的编制方法2、质量指标指数 的编制要求: 编制销售量指数和价格指数【例】某企业三种商品销售量及价格资料如下:解:1销售量总指数2价格总指数【总结】 综合指数的编制步骤要求:编制产量指数、单位本钱指数和总本钱指数例2:某企业产量和单位本钱资料如下第三节 平均指数分析平均指数的概念平均指数的编制方法平均指数与综合指数的关系比值=总指数600/480125个体指数商品名称计量单位销售量单位价格基期q0报告期q1基期p0报告期p1甲件4806002525乙千克5006004036丙米

58、2001805070合计q0q1p0p1一 平均指数的概念平均指数指数是计算总指数的另一种计算形式它是通过计算个体指数的平均数计算总指数的方法数量指标指数 和质量指标指数二 平均指数的编制方法例:要求: 编制销售量指数和价格指数步骤1.数量指标指数的编制 加权算术平均数2.质量指标指数的编制 加权调和平均数指数步骤三 平均指数与综合指数的关系一区别:1、计算指数的思路不同2、所运用的权数不同3、所依据的资料不同二联系:都为总指数存在变形关系一、指数体系:指数体系是指假设干个在经济上有联系、数量上有关系的指数所形成的整体。第四节 指数体系和因素分析静态关系:销售额销售量单位价格 总本钱产量单位本

59、钱 动态关系:销售额指数销售量总指数价格总指数 总本钱指数产量总指数单位本钱总指数二、因素分析一概念: 利用指数体系,对复杂社会经济现象的综合变动,从数量上分析其受各个构成因素变动影响的一种分析方法二种类:按分析指标的表现形式,分为总量指标变动因素分析和平均指标变动因素分析按影响因素的多少,分为两因素分析和多因素分析三因素排序原那么:先数量因素,后质量因素;先实物量、劳动量因素,后货币量因素1、两因素:产值指数=产量指数价格指数四总量指标变动因素分析2、三因素:例:总量指标两因素分析试从相对数和绝对数两方面对销售额的变动进行因素分析例:总量指标三因素分析原材料种类产品种类生产量单位产品原材料消

60、耗量单位原材料价格(元)q0q1m0m1p0p1甲(千克)A(件)6008000.50.42021乙(米)B(套)4004001.00.91514丙(米)C(套)80010002.22.33028试对影响总本钱的q、m和p三个因素进行多因素分析五平均指标变动因素分析平均指标指数体系平均指标变动的因素分析需要编制三种平均指标指数:可变构成指数、固定构成指数、结构影响指数。2、平均指数因素分析组别工人数月平均工资基期报告期基期报告期f0f1x0 x1技术人员706680008600管理人员307450005500合计10014071006960例:某企业技术人员、管理人员工资情况表试对该企业平均工

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论