统计学的对象与方法_第1页
统计学的对象与方法_第2页
统计学的对象与方法_第3页
统计学的对象与方法_第4页
统计学的对象与方法_第5页
已阅读5页,还剩240页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学,Statistics,第一章总论,统计学的对象与方法统计的职能与作用统计学的基本范畴,第一节统计学的对象与方法,一、统计学的对象及理论基础,三大主要统计学派,国势学派:,政治算术学派:,数理统计学派:,文字叙述国家显著事项,用算术方法和统计资料比较英法荷三国经济状况,证明英国实力。,认为统计学是现代应用数学的分支,以数理方法研究社会经济和自然现象。,(一)统计学的产生与发展,社会生产实践中产生,作为一门科学则是在17世纪后期,(二)统计的含义,三种含义,统计活动:,对社会经济现象的数量特征进行收集、整理和分析的全部活动过程,统计资料:,统计活动过程的结果,包括数据资料和统计分析资料,统计学:,指导统计活动的原理和方法论,对统计活动实践的总结,(三)统计学的研究对象及特点,1、研究对象,社会经济现象总体的数量方面,数量特征和数量关系,2、特点,数量性:,反映数量表现和数量关系,规模,水平,结构,比例关系,差异程度,发展速度,关联度,依存度,总体性:,研究总体数量,对整体进行大量观察和综合分析,社会性:,研究社会经济现象,反映人们从事社会经济活动的条件、过程和结果,以及人们之间的相互关系,包括物质资料占有关系、分配关系、交换关系及其他社会关系。,(四)统计学的理论基础和方法论基础,哲学:,根据辨证唯物主义,统计调查和分析必须尊重客观事实,根据质和量的辨证关系,统计学需分析大量现象和发展规律性,根据发展原理,统计学运用动态分析法、指数分析法,经济学:,统计学在统计指标设计、指标体系构建、计算和分析方法方面需以经济理论范畴为依据。,数学:,概率论的基本原理和方法在统计估计、推断方面起了重要作用。,二、统计学的基本方法,1、大量观察法:,主要用于统计调查阶段,强调大量性,大量性取决于以下因素:,(1)分析问题的精确度,精确度越高,经济现象的数量就越多,(2)现象各单位间的变异程度,差异程度越大,经济现象的数量就越多,2、分组法:,主要用于统计整理阶段,把有关个体单位的数量现象按一定标志划分为不同类型组,同类相聚异类相分,以便进行汇总分析,确定各类型的数量状况、比例及相互关系。,3、综合指标法:,适用于统计分析阶段,运用各种综合指标反映总体的一般数量特征,分析总体的差异和数量关系。,4、归纳推断法:,适用于统计分析阶段,根据样本数据推断总体数量特征,用于对总体的某些假设检验。,第二节统计的职能与作用,一、统计的职能1、信息职能:,系统地收集、整理和提供大量以数量描述为基本特征的社会经济信息,2、咨询职能:,根据丰富的统计资源,经过统计分析,为决策和管理提供咨询,3、监督职能:,根据统计调查分析,对经济运行状况进行定期检查、监测和预警,【显示器】,【参谋家】,【报警器】,二、统计的作用,1、统计的基本任务,对国民经济和社会发展情况进行统计调查与分析,提供统计资料和统计咨询意见,实行统计监督。,2、统计的作用,为宏观调控提供依据,为企事业单位经营管理提供依据,对政策计划执行情况进行检查监督,为社会公众参与社会经济活动提供信息,为科学研究提供统计资料,为国际交往提供资料,第三节统计学的基本范畴,一、统计总体和总体单位,集合体,统计总体,总体单位,个别事物,统计总体及总体单位的性质,大量性,同质性,变异性,相对性,二、统计标志和标志表现,统计标志,标志表现,共同具有的属性或特征,各标志的具体表现,品质标志:,数量标志:,文字表明属性特征,数字表明数量特征,【属性总体】,【变量总体】,不变标志:,可变标志:,各单位具体表现相同,各单位具体表现不同,品质标志和数量标志都存在变异性,变异性,变量与常量,品质标志表现:,数量标志表现:,具体名称,标志值或变量值,三、统计指标和指标体系,统计指标,反映总体数量特征,由单位标志值综合而成,包括指标名称和指标数值,特点:,可度量性反映总体数量,综合性表现总体特征,具体性不能脱离时间空间,分类:,按反映问题的数量特征,数量指标,质量指标,按作用不同,描述指标,评价指标,预测指标,按内容不同,客观指标,主观指标,按计量单位不同,实物指标,价值指标,劳动量指标,按表现形式不同,总量指标,相对指标,平均指标,指标体系,一系列相互联系制约的多个统计指标,形式:,函数关系,补充关系,总产值=总产量x单位价格,某国家居民健康状况指标,思考题,1、考生统计学成绩分别为:70、76、86、89、97。这五个数是(),A指标B标志C变量D标志值,2、下列属于数量标志的是(),A专业B年龄C性别D住址,3、某人月工资500元,“工资”是(),A数量标志B品质标志,C质量标志D数量指标,4、下列指标中属于数量指标的是(),A劳动生产率B产量,C人口密度D资金利润率,5、下列属于数量标志的是(),A人口的性别B人口的常住地址,C人口的年龄D人口的民族,6、总体单位特征或属性的名称是(),A统计指标B统计标志,C统计总体D标志表现,7、下列属于数量标志的有(),A企业工人人数B企业管理人员数,C企业经济类型D企业设备台数,E企业所属行业,8、研究某市工业企业的固定资产投资情况,统计总体单位是(),A全市所有的工业企业,B全市每一个工业企业,C全市工业企业的所有固定资产,D全市每一个工业企业的固定资产,C统计学D统计资料,A统计工作B统计方法,10、可称为“统计”一词含义的是(),9、统计总体和总体单位不是固定不变的,(),A单位有可能变为总体,总体也可变为单位,B单位能变为总体,总体不能变为单位,C单位不能变为总体,总体能变为单位,D任何条件下,单位和总体都可互换,第二章统计数据,统计调查统计整理综合指标,第一节统计调查,一、统计调查的意义,统计调查:,按统计研究的任务和要求,运用科学的调查方法,有组织有计划地向客观实际收集各种统计资料的工作过程。,意义:,是统计工作的基础环节,,是统计整理分析的必要前提。,统计调查与一般社会调查研究的关系,联系,广义上讲,统计调查是一般社会调查研究的一种形式,区别,统计调查着重收集数据资料,社会调查更侧重于了解情况,统计调查收集大量数据资料,社会调查通常收集个别资料,二、统计调查的基本要求,准确性:,客观反映真实情况,不能虚报瞒报、伪造篡改。,及时性:,规定时间内及时完成及时上报,否则时过境迁,起不到作用。,完整性:,全面系统反映全貌全过程。,操作性:,避繁就简,设计方便,操作简捷,通俗易懂。,经济性:,节省投入,注重效益。,三、统计调查的种类,1、按调查对象包括的范围不同,全面调查:,调查所有总体单位。,包括全面填报的统计报表和普查,非全面调查:,只调查部分总体单位。,包括重点调查、典型调查、抽样调查和非全面填报的统计报表,2、按调查登记的时间是否连续,连续调查:,又称经常性调查,调查总体现象在一段时期内的数量变化累计结果,用于调查时期现象。,不连续调查:,又称一次性调查,调查总体现象在某一时点的状态,用于调查时点现象。,时期现象:,现象量变过程与时期长短直接相关,可累计相加。,时点现象:,现象量变过程与时期长短不相关,不可累计相加。,3、按调查的组织方式不同,统计报表调查:,按国家统一规定的表式要求,自下而上提供统计资料。,专门调查:,为研究某种问题专门组织的调查。,包括普查、重点调查、典型调查、抽样调查,4、按收集资料方法不同,直接观察法,报告法,采访法,问卷调查法,四、统计调查方案的设计,确定调查目的和任务,确定调查对象和调查单位,拟订调查项目,确定调查时间、期限、地点、方法,制定统计调查组织实施计划,五、统计调查方法(组织方式),统计报表,以基层企事业单位原始记录为基础,按国家统一规定表式要求、指标解释、报送时间、报送程序,自下而上收集统计资料的调查方式。,特点:,统一性,报表内容、报送时间、指标涵义、计算方法、口径统一,可靠性,依据基层原始记录,种类:,按调查范围不同,全面统计报表,非全面统计报表,按报送周期长短不同,日报,旬报,月报,季报,半年报,年报,简明及时,系统详尽,优点:,全面、统一、连续,局限:,缺乏灵活性、时效性较差、虚报瞒报现象,普查,一次性全面调查,特点:,一次性,用于调查时点现象,全面性,范围广、单位多,周期长,面广工作量大,不可能也没必要经常进行,应尽可能进行必要的周期性普查,种类:,按汇总资料特点不同,一般普查:,快速普查:,任务布置到基层,越过中间环节集中汇总,普查工作组织原则:,(1)统一普查内容:统一规定指标口径和计算方法。,(2)统一普查时点:避免资料的重复或遗漏。,(3)统一普查期限:普查范围内各调查点应尽可能同时进行、按期完成。,(4)统一间隔时间:同类普查应按一定周期进行,便于数据动态对比。,如:我国人口、第三产业、工业、农业普查每十年一次,分别在逢0、3、5、7的年份进行。,重点调查,在统计总体中选择一部分重点单位进行调查,用以反映总体基本情况的非全面调查。,重点单位:,单位数量在总体中只占一小部分,但调查单位的标志值在标志总量中占绝大部分。,特点:,着眼于标志值,能够反映总体基本情况,只能反映基本情况,不能完整反映总体总量,也不能推断总体数量。,典型调查,在对统计总体有一定了解的基础上,有意识地选择少数典型单位进行的详细调查,目的是认识事物本质规律。,典型单位:,同类现象本质特征表现最充分、最具代表性的单位。,特点:,代表性,可用于对总体的推断,不严格的推断,不能指出推断的,把握程度,无法计算和控制推断误差,只能作发展趋势和规律性的推断,抽样调查,以概率论与数理统计为理论基础,在统计总体中按随机原则抽取一部分单位进行调查,并据以推断总体数量特征的非全面调查。,特点:,随机原则,受干扰的可能性小,可推断总体,节省人、物、财力和时间,可计算并控制抽样误差,较准确,抽样误差:,由随机性产生的样本指标与总体指标间的代表性误差,我国统计调查方法体系改革的目标模式,建立以周期性普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料的统计调查方法体系。,第二节统计整理,一、统计整理的意义,统计整理:,根据统计研究目的和任务,对调查阶段收集到的大量资料(原始或加工)进行科学分类汇总,为统计分析提供能描述现象总体数量特征资料的工作过程。,意义:,中间环节起承前启后的作用,统计调查的继续,统计分析的前提,二、统计整理的基本步骤,制定统计整理方案,对调查资料进行审核订正,数据处理,编制统计表绘制统计图,三、统计整理的基本方法统计分组,统计分组:,根据统计研究需要,将所有总体单位按一定统计标志分为若干个性质不同但有联系的部分。,相对总体是“分”,组间差异,相对个体是“合”,组内同质,作用:,划分社会经济现象类型,反映社会经济现象内部结构和比例关系,揭示社会经济现象间相互依存关系,特点:,原则:,科学性原则:,从研究目的出发,正确选择最能说明现象本质特征的分组标志,正确划定分组界限,保证组间差异、组内同质。,完备性原则:,任何一个总体单位或原始数据都能归属于某一个组,而不会遗漏在外。,互斥性原则:,任何一个总体单位或原始数据在一种统计分组中只能归属于某一个组,而不能归属于两个或两个以上的组。,方法:,简单分组,按一个标志分组。,如:工业企业按经济类型分组可分为国有、集体、私营、其他企业。,国有企业,集体企业,复合分组,按两个或以上标志多层次分组。,如:按经济类型分:,按规模分:,大型企业,中型企业,小型企业,大型企业,中型企业,小型企业,四、统计整理结果的表现形式(1234),分布数列,将总体各单位按一定标志分成若干组,列出各组总体单位数(次数/频数)或各组总体单位数在总体中所占的比重(频率),排列而成的数列称为分布数列(分配数列、次数分布、频数分布)。,意义,反映总体单位在各组间分布状况。,表明总体内部构成、平均水平及变异程度。,分布数列基本要素,标志及标志表现,各组频数或频率,按标志性质分类:,品质分布数列(表1),变量分布数列(表2),表1某市2000年工业企业构成表,分类,表2某企业三月份工人日产量表,变量分布数列按各组变量值多少及取值范围:,单项数列(表2),组距数列(表3),表3某县2001年家庭平均收入表,组距数列按各组组据是否相等:,等距数列(表4),异距数列(表3),表4某班第二学期统计学成绩表,组距数列基本概念,组限,各组两端变量值,上限,各组最大值,下限,各组最小值,组距,各组上下限之差,全距,数列中最大变量值与最小变量值之差,组中值,各组上下限和的一半,开口数列,闭口数列,开口组,开口组组距,开口组组中值,首末两组上下限齐全的数列,首组缺下限或末组缺上限,上限或下限不齐的组,以相邻组距近似代替,上限-邻组组距/2(缺下限),下限+邻组组距/2(缺上限),组距数列的编制,1、按数值大小顺序排列,2、确定组数、组限和组距,组数不宜过多也不宜过少,组限和组距确定要体现组与组间质的区别,要体现组内同质组间差异,3、,连续型变量,邻组上下限必须重叠,离散型变量,邻组上下限可重叠也可不重叠,组限重叠时,按“上组限不在内”原则,达到上限值的单位数计入下一组,4、可等距、可异距,累计分布数列,各组频数或频率逐组累计相加,表明总体在某一标志值的水平上总共包含的频数或频率。,如:表4中,成绩不到80分的有多少?80分以上的有多少?,向上累计,变量值小的组向变量值大的组逐组累计,表明各组上限以下总共包含的频数或频率,向下累计,变量值大的组向变量值小的组逐组累计,表明各组下限以上总共包含的频数或频率,(见表5),表5某班第二学期统计学成绩表,向上累计,向下累计,统计表,将统计调查得来的数据资料经过整理汇总,按一定结构顺序系统排列在一定表格内,此表格即统计表。,分类:,按用途不同,调查表,整理表,分析表,(原始数据),(分布数列),(指标分析),按分组情况,简单表(表6、7),简单分组表(表8),复合分组表(表9),表6某公司所属企业2000年产值表,表7我国近年地方财政收入统计表,表8某班学生按性别分组统计表,表92000年某市工业企业总产值,统计表的结构,表101997年我国三大产业总产值,总标题,横行标题,纵栏标题,数字资料,主词,宾词,统计表编制规则,1、标题应简明确切,总标题应注明具体时间空间;,2、必须注明计量单位,全表只有一种计量单位时在表的右上方;需分别注明计量单位时,横行的专设“计量单位”一栏,纵栏的与纵栏标题在一起;,3、数字为0或忽略不计的要以“0”表示;无数字的要以“”表示;缺乏资料的以“”表示;,4、表式一般是开口式,统计图,用统计图形表示分布数列。,分类:,按形状,直方图:,折线图:,曲线图:,钟型分布,U型分布,J型分布,横轴为组限,纵轴为频数,直方图各长方形顶端中点连线,向上累计从首组下限起,各组累计频数落在各组上限,向下累计从末组上限起,各组累计频数落在各组下限,极限描绘曲线,五、统计误差,统计误差:,统计数据与客观事物实际数值之间的差距。,分类:,按误差来源,登记性误差,代表性误差,按误差性质,偶然性误差,系统性误差,按产生原因,无意误差,有意误差,统计误差大部分由主观因素造成,可通过主观努力控制并消除;抽样误差是代表性误差中的偶然误差或称随机误差,不能消除,但可事先计算并控制。,第三节综合指标,一、总量指标,总量指标,反映一定时空条件下社会经济现象总体规模或水平的综合指标,又称绝对指标。,分类,按反映内容不同,总体总量:,标志总量:,总体单位数加总,总体各单位标志值加总,反映总体本身规模,说明总体特征总量,按反映的时间状况不同,时期指标,时点指标,时期指标:,反映一定时期内总量,受时期长短制约,可以累计相加。,时点指标:,反映某一时点上总量,与时期长短无关,不可累计相加。,计量单位,实物单位,价值单位:,劳动时间单位:,自然单位,度量衡单位,双重或多重单位,复合单位,标准单位,复合单位,货币计量,计算原则,科学性原则:,明确总量指标涵义、统计范围和计算方法。,同类性原则:,同类现象才能计算加总。,可比性原则:,便于动态分析。,统一性原则:,计算口径、计算方法、计量单位统一。,二、相对指标,相对指标,社会经济现象中两个有联系的指标数值对比的比率。,作用,1、相对指标本身可表明社会经济现象间关系,包括结构关系、比例关系、比较关系、动态关系、强度关系等。,2、可使原本不便于直接对比的现象有了共同的比较基础。,表现形式,无名数:,系数、倍数、番数、成数、百分数、千分数等,相对指标多以无名数表示。,名数:,复名数(即以分子分母计量单位共同构成),主要用于强度相对指标。,计算原则,1、正确选择对比基础。,2、可比性原则。,3、结合总量指标。,4、多种相对指标结合运用。,种类及计算,结构相对指标,比例相对指标,比较相对指标,动态相对指标,强度相对指标,计划完成相对指标,结构相对指标,表明总体内部构成及分布特征。,结构相对指标=,总体中部分数值,总体全部数值,特点:,在同一总体中,各部分结构相对指标加总等于100%或系数1。,比例相对指标,表明总体内部各组成部分间对比关系。,比例相对指标=,总体中某一部分数值,总体中另一部分数值,特点:,属于一种结构性的比例。,结构相对指标母项包含子项;比例相对指标母项与子项没有包含关系。,比较相对指标,表明同一时期同类现象在不同条件下的差异程度。,比较相对指标=,甲空间某类指标数值,乙空间同类指标数值,特点:,分子与分母可以互换。,动态相对指标,表明同一总体同类指标在不同时期的数值对比。,动态相对指标=,报告期数值,基期数值,特点:,比值大于1体现增加提高;比值小于1体现减少降低。,分子分母不能互换,基期可以是上一期,也可以是某特定时期。,强度相对指标,表明现象发展的强度、密度及普遍程度。,强度相对指标=,某一总量指标数值,另一性质不同但有联系,的总量指标数值,特点:,表现形式多为复名数,某些强度相对指标分子分母可互换,称为正指标与逆指标。,强度相对指标带有平均的意义,但不同于平均指标。,计划完成相对指标,表明一定时期某种社会经济现象计划任务完成百分比。,(1)计划任务数为绝对数时,计划完成相对指标=,实际完成数,计划任务数,分子减分母表明执行计划的绝对效果。,【例1】某企业计划全年总产值3500万元,实际4300万元,则计划完成相对指标为122.86%,实际比计划超额22.86%,实际产值比计划增加了800万元。,(2)计划任务数为相对数时,计划完成相对指标=,实际完成百分数,计划完成百分数,【例2】某企业计划2000年产品合格率为97.3%,企业该年度实际产品合格率为98.6%,则计划完成相对指标为101.3%。,另,计划任务数是计划提高率(降低率)形式时,需考虑原有基数100%,【例3】某企业计划本期比上期劳动生产率提高3%,实际提高了5%,则计划完成相对指标为,100%+5%,100%+3%,=101.9%,【例4】某企业计划2001年生产成本比上年降低5%,实际降低了7%,则计划完成相对指标为,100%-7%,100%-5%,=97.9%,(3)短期计划执行情况检查,当实际完成数与计划任务数时期长短为同一年度时,以年度实际数比年度计划数,说明年度计划执行结果。,当实际完成数与计划任务数时期长短不同,实际完成时期只是计划任务时期的一阶段时,以此阶段内累计实际完成数比全期计划任务数,说明年度计划执行进度。,(4)长期计划完成情况检查,水平法:只规定计划期末应达到的水平。,计划完成相对指标,计划期末实际达到水平,=,计划期末计划规定水平,只要计划期内有连续12个月指标数值达到计划规定最后一年的水平,余下时间就是提前完成计划时间。,累计法:按计划期内各年总和规定任务。,计划完成相对指标,=,计划全期累计实际完成数,计划全期累计计划完成数,只要累计实际完成数已经达到累计计划完成数,余下时间就是提前完成计划时间,思考题,1、某班第二学期统计学成绩(分)如下:92、85、78、51、63、88、60、71、87、70、56、97、80、68、77、75、64、72、89、87、90、81、95、76、79、73、76、79、72、86。,要求:作等距分组;编制频数分布与累计频数分布表;绘制直方、折线、累计频数分布图。,2、某工厂1999年计划产值为1080万元,计划完成程度为110%,1999年计划产值比1998年增长8%,试计算1999年实际产值比1998年增长百分之几?,3、某企业2003年计划单位产品成本比上年降低2%,实际比上年降低5%,问该企业单位产品成本降低计划是否完成?,4、某商店2000年计划销售收入比上年提高20%,实际销售收入为上年的1.5倍,问2000年销售收入的计划完成程度?,5、某企业某年产值资料如下,试补全,6、某市人口数1995年比1952年增长了1.2倍,比1972年增长了60%,那么1972年人口数比1952年增长了()倍。,A0.5,B0.375,C0.72,D2.52,三、平均指标,平均指标,反映总体单位标志值的代表性指标。,特点:,对总体单位间数量差异的抽象化,说明总体综合数量特征的一般水平具有最一般的代表性,作用:,可消除总体数量差异,使不同规模总体具有可比性;可反映同一总体在不同时间上的发展趋势;是统计推断的重要参数。,分类:,按时间状况,静态平均数:,动态平均数:,按计算方法,数值平均数:,位置平均数:,同一时间上总体各单位某数量标志的一般水平。,不同时间上总体某指标的一般水平。,根据各变量值计算而得的平均值,根据某变量值所处的特殊位置而得的平均值,(一)数值平均数,1、算术平均数,(1)简单算术平均数,X,=,i=1,n,Xi,n,(2)加权算术平均数,X,=,XiWi,Wi,=,Xi,Wi,Wi,若各组总体单位数(各组权数)相等,即W1=W2=Wn=W,则加权算术平均数与简单算术平均数存在下列关系:,X,=,XiWi,Wi,=,WXi,nW,=,Xi,n,【例1】某统计学家暑假在一小型统计咨询公司社会实践。该公司雇佣了数名高级顾问,周薪在700至950元;数名中级顾问,周薪在300至350元;数名公司职员,周薪为200元。每位雇员的周薪额具体如下:200,200,200,840,200,200,300,200,300,350,700,350,950元。,试计算该公司雇员的平均周薪额。,X,=,4990,13,=383.85(元/人),【例2】见教材P41,【例3】见教材P42,【例4】某上市公司所属三个分公司产品质量有关资料如下:,试求:三个分公司的平均一级品率。,X,=,XW,W,=,838,1000,=83.8%,【例5】见教材P43,各变量值与算术平均数的离差之和等于零,(X-X,(X-X,各变量值与算术平均数的离差平方之和为最小,(X-X),=最小值【未分组】,2,(X-X),2,W=最小值【分组】,两独立同质变量代数和的算术平均数等于各变量算术平均数的代数和,X+Y,两独立同质变量乘积的算术平均数等于各变量算术平均数的乘积,XY,)=0【未分组】,)W=0【分组】,=X,+Y,=X,Y,证明:,(X-X,)=X-nX,=X-n,n,X,=0,证明:,设X0为任一变量,则有X0=X,+C,则,(X-X0),2,=X-(X,+C),2,=(X-X,)-C,2,=(X-X,),2,-2C,(X-X,)+nC,2,=(X-X,),2,+nC,2,nC,2,0,(X-X,),2,=最小值,证明:,设变量X有m个值,变量Y有n个值,,X+Y,=,mn,i=1,m,j=1,n,(X+Y),=,mn,i=1,m,j=1,n,X+,i=1,m,j=1,n,Y,=,mn,n,i=1,m,X+m,j=1,n,Y,=,m,i=1,m,X,+,n,j=1,n,Y,=X,+Y,证明:,设变量X有m个值,变量Y有n个值,,XY,=,mn,i=1,m,j=1,n,XY,=,mn,i=1,m,X,j=1,n,Y,=X,Y,2、调和平均数,各变量值倒数的算术平均数的倒数。,(1)简单调和平均数,各总体单位标志值倒数的简单算术平均数的倒数。,H=,1,n,1,(,x1,1,x2,1,xn,1,+,+,+,),=,xi,1,n,【例1】青石桥市场某日提供三种大闸蟹,大、中、小单价分别为每公斤120元、100元、80元,问各买一公斤,平均每公斤多少钱?,X,=,120+100+80,3,=100(元/公斤),若每种蟹各买100元,平均每公斤多少钱?,H=,120,1,+,100,1,+,80,1,3,=97(元/公斤),(2)加权调和平均数,各总体单位标志值倒数的加权算术平均数的倒数。,H=,x1,1,m1+,x2,1,m2+,+,xn,1,mn,m1+m2+,+mn,1,=,m1+m2+,+mn,x1,m1,+,x2,m2,+,+,xn,mn,=,mi,xi,mi,【例2】某产品有三种不同的规格,单位成本与总成本资料如下,求三种不同规格商品的平均单位成本。,H=,mi,xi,mi,=,7372,220,=33.51(元/件),小结:,加权调和平均数公式中mi即为加权算术平均数公式中XiWi(各组标志总量),调和平均数是算术平均数的变形(P44),当统计实践中,只有各组标志总量(XiWi)资料,而缺少各组总体单位数资料时,通常用调和平均数计算平均数。,若各组标志总量相等,则用简单调和平均数计算(如例1);若各组标志总量不相等,则用加权调和平均数(如例2、例3)【例3】见教材P45,思考题,1、某车间50名工人,每日生产某种零件数如下,计算平均每人日产零件数。,2、某班第二学期统计学成绩调查资料如下,计算平均成绩。,3、某商品的销售额及单位价格资料如下,计算该商品的平均价格。,4、某商店进了三批货,途中有损坏,损坏率分别为1%、1.5%、2%,三批货物占总量的比重分别为30%、50%、20%,求三批货物的平均损坏率。,5、某公司所属分公司产品质量如下:,(1)分别计算计划和实际平均一级品率,(2)计算总公司及分公司全部产品产量的计划完成程度,3、几何平均数,n个数值连乘积的n次方根。,几何平均数在分析经济现象时要求变量值间在经济内容上具有连乘积关系,如平均速度、平均比率等。,(1)简单几何平均数,资料未分组情况下采用。,G=,n,x1x2,xn=,【例1】见教材P46,分析:由于是前后衔接的五道工序,后一道工序的合格率受前一道影响。,n,xi,【例2】某地区1995年至2000年六年间工业总产值增长率分别为9.8%,8.8%,7.8%,6.8%,8.8%,10.8%。求该地区六年工业总产值平均增长率。,分析:由于后年增长率受上年影响,即后年增长率都是在上年基础上计算的,所以不能简单地用算术平均数,而应用几何平均数计算。,又由于是增长率,所以要把原有基数100%考虑进去。,G=,6,109.8%,110.8%=108.8%,该地区工业总产值平均每年增长8.8%,(2)加权几何平均数,资料已分组情况下采用。,G=,w1+w2+wn,x1,w1,x2,w2,xn,wn,=,wi,xi,wi,【例3】见教材P46,wi为权数,即xi出现了wi次,如:x1,x1,x1,w1次,=x1,w1,分析:有4年为3%,即这4年的本利率都是103%,设本金为Q,则Q+3%Q=Q(1+3%)=103%Q,这12年的本利和为,4,105%,2,108%,Q(103%,2,110%,3,115%),(二)位置平均数,1、中位数,将变量值按大小排列后居中的一位数值。,(1)资料未分组时,若变量值个数为奇数,则中间位置的数即中位数;若变量值个数为偶数,则中间位置两个数值的算术平均数为中位数。,【例1】6个工人日产量分别为26、22、30、24、28、25件,则中位数Me是,(25+26)/2=25.5(件),(2)单项数列时,先计算累计频数,然后用(n+1)/2确定中间位置,该位置所在组对应的标志值即中位数。,【例2】某居民楼按家庭人口数分组资料如下,求中位数。,(16+1)/2=8.53即中位数Me。,(3)组距数列时,先计算累计频数,然后用wi/2确定中间位置(没必要wi+1,是组距数列,加了1也不能直接判断中位数),再用下列公式计算中位数:,Me=L+,Wm,2,Wi,-Sm-1,d(下限公式),Me=U-,Wm,Wi,2,-Sm+1,d(上限公式),式中:L中位数所在组下限,U中位数所在组上限,Wi总频数,Wm中位数所在组频数,d中位数所在组组距,Sm-1中位数所在组前一组的向上累计频数,Sm+1中位数所在组后一组的向下累计频数,【例3】某班统计学成绩如下:,Me=80+,19,2,40,-18,10=81.05(分),5060708090100,5060708090100,2、众数,总体中出现次数最多的标志值。,(1)资料未分组时,次数最多的那个标志值即众数。,(2)单项数列时,次数最多那一组的标志值即众数。,(3)组距数列时,M0=L+,1+2,1,d(下限公式),M0=U-,1+2,2,d(上限公式),式中:L众数所在组下限,U众数所在组上限,d众数所在组组距,1众数所在组频数与其前一组频数之差,2众数所在组频数与其后一组频数之差,【例1】某班统计学成绩如下:,M0=80+,9+16,9,10=83.6(分),5060708090100,算术平均数、中位数、众数间关系,M0MeX,【图1】右偏(正偏)分布,XMeM0,【图2】左偏(负偏)分布,X=Me=M0,【图3】正态分布,四、标志变异指标,反映各标志值间差异程度的指标。,标志变异指标越大,平均指标的代表性越小;标志变异指标越小,平均指标的代表性越大。,1、全距,R=Xmax-Xmin,特点:简单,但忽视了中间数据的分布情况。,【例1】大学生对网络时代反应不一,有的成了“网虫”整日沉迷,有的却无动于衷,以下是两寝室学生每周上网时间:,甲室学生:0、27、28、30、29、28,乙室学生:14、23、9、25、34、16,R甲组=300=30(小时),R乙组=349=25(小时),尽管甲组全距大,但除一位同学不上网外,其他同学上网时间分布较均匀;而乙组虽然全距小,但同学间差异较大,所以全距衡量差异程度有局限性。,2、平均差,各标志值与算术平均数离差绝对值的算术平均数。,AD=,n,|Xi-X,|,【未分组】,AD=,Wi,|Xi-X,|Wi,【分组】,【例1】某车间共有装配工人200人,某日从中随机抽取10人,日装配工件数为:5、7、7、8、8、8、8、10、11、12件,求该样本平均差。,AD=,10,3+21+40+2+3+4,=1.4(件),【例2】若对上述整个车间200名工人进行全面调查,日装配工件数分组资料如下,求总体平均差。,AD=,200,310,=1.55(件),【例3】见教材P49,【例4】某车间甲、乙两班组工人日产量资料如下,求两班组日产量平均差。,甲组:16、17、18、20、21、23、25,乙组:10、14、17、20、23、26、30,X,甲=140/7=20(件),X,乙=140/7=20(件),AD甲=18/7=2.57(件),AD乙=38/7=5.43(件),虽然两班组算术平均数相等,但甲组平均差小于乙组,所以甲组算术平均数代表性比乙组强。,3、方差与标准差,方差:各标志值与其算术平均数离差平方的算术平均数。,标准差:方差的平方根。,2,=,n,(Xi-X,),2,【未分组】,2,=,Wi,(Xi-X,),2,Wi,【分组】,=,n,(Xi-X,),2,【未分组】,=,Wi,(Xi-X,),2,Wi,【分组】,【例1】见教材P51,【例2】甲、乙两班组工人日产量资料如下,求两班组日产量标准差。,甲组:48、49、50、51、52,乙组:5、20、45、85、95,X,甲=,X,乙=250/5=50(件),甲=,5,10,=1.4(件),乙=,5,6200,=35.2(件),虽然两班组算术平均数相等,但甲组标准差小于乙组,所以甲组算术平均数代表性比乙组强。,【例3】某大学管理学院统计学考试成绩资料如下,求两个专业平均成绩与方差。,X,工商=X,财务=581/7=83(分),2,工商=96/7=13.71(分),2,财务=84/7=12(分),4、标志变异系数,当两组数据算术平均数不等时,通常不宜直接用全距、平均差、标准差比较两组数据差异程度。由此引入标志变异系数V(全距系数、平均差系数、标准差系数),以相对数形式进行比较。,VR=,X,R,VAD=,X,AD,V=,X,【例1】见教材P52,【例2】两组数据4、5、6、7、8与40、50、60、70、80标准差分别为1.58和15.8;但由于两组数据算术平均数不等,分别为6和60,单纯由标准差判断差异程度就不合适。两组数据的标准差系数分别为:,V1=1.58/6=0.26,V2=15.8/60=0.26,所以,两组数据的差异程度相同。,【例3】甲、乙两车间工人平均日产量分别为8件和12件,标准差分别为2.2件和2.7件。,仅从标准差来看,甲车间标准差小于乙车间,似乎甲车间工人平均日产量更有代表性;但事实上,V甲=2.2/8=0.275,V乙=2.7/12=0.225,甲车间标准差系数大于乙车间,乙车间工人平均日产量更有代表性。,方差的数学性质,方差等于各标志值平方的算术平均数减去各标志值算术平均数的平方,2,=X,2,-(X,),2,证明:,2,=,n,(X-X,),2,=,n,X,2,-,n,2XX,+,n,X,2,=X,2,-2X,2,+X,2,=X,2,-X,2,思考题,1、某学院2002级学生每月花钱情况如下,求算术平均数、中位数、众数。,第三章抽样估计,基本概念抽样误差抽样估计抽样组织方式,第一节抽样估计的基本概念,一、抽样估计的意义和一般步骤1、抽样估计的概念,抽样估计,按随机原则从总体中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。,也是一种收集资料的方法,所以也称为抽样调查。,2、抽样估计的特点,(1)按随机原则抽取调查单位。,(2)调查结果可以估计和推断总体的有关数量特征。,(3)以概率论和数理统计为理论基础,结果具有一定可靠程度,抽样误差可以估计和控制。,3、抽样估计的意义,(1)不可能进行全面调查时采用,(2)不必要进行全面调查时采用,(3)来不及进行全面调查时采用,(4)对全面调查资料进行补充修正,4、抽样估计的一般步骤,设计抽样方案,抽取样本单位,收集样本资料,整理样本资料,推断总体指标,(1)抽样方案设计的基本准则,随机原则:,确保每个总体单位都有被抽取的可能。,抽样误差最小:,控制和选择抽样数目及抽样组织方式,费用最少:,在误差达到一定要求的条件下,选择费用最少的方案。,(2)抽样方案设计的主要内容,编制抽样框,抽样框即总体单位的名单。,主要形式:,名单抽样框,区域抽样框,时间表抽样框,编制要求:,应包括全部总体单位,总体单位不应重复,应便于抽样的实施,应尽量利用资料,提高抽样效果,确定抽样方法,重复抽样:,每次抽出一个单位记录后,再放回总体参加下一次抽取,每次抽取是独立的,同一总体单位有可能被重复抽中。,不重复抽样:,随机抽出一个单位记录后,不再放回总体,下一个样本单位再从剩余总体单位中抽取,每次抽取不是独立的,同一总体单位不可能被再次抽中。,确定抽样组织方式,简单随机抽样:,对总体单位逐一编号,但不进行任何划分或排队,然后完全按随机原则直接从总体中抽出若干单位构成样本。,特点:,最基本的抽样组织方式;,但当总体单位很多时,对所有总体单位编号很麻烦;,有可能使样本单位在总体中分布不够均匀,导致样本代表性较差。,分层抽样:,按某主要标志将总体单位分成若干层,在各层按随机原则分别抽取一定数目的单位构成样本。,特点:,是统计分组与抽样的结合,可提高样本代表性;,可深化对现象的认识,满足分层次管理需要,不仅能用整个样本指标推断总体指标,也能用各子样本资料推断相应子总体指标。,等距抽样:,将总体单位按某一标志排队,并划分抽样间隔,在第一个间隔内确定抽样起点,按固定顺序和间隔抽取样本单位。,特点:,使样本单位分布均匀,样本代表性较强;,按排队标志与调查内容间关系不同,可分为无关标志排队和有关标志排队等距抽样,两者抽样起点确定和抽样效果不同。,整群抽样:,将总体单位分成若干群,按随机原则抽取部分群,抽中群体的所有单位构成样本。,特点:,不需对各总体单位编号,只需对各群体编号,简化了工作;,但样本单位较集中,分布不够均匀,样本代表性较差。,为遵循抽样误差最小及费用最少的基本准则,统计实践工作中常常将多种抽样组织方式结合使用。,抽样误差较小的分层抽样、有关标志排队等距抽样等费用较多;而费用较少的简单随机抽样、无关标志排队等距抽样、整群抽样等抽样误差又较大。,另外,分两个以上阶段完成抽取样本的多阶段抽样,多在总体单位数量多分布广时采用。一般前阶段采用分层或有关标志排队等距抽样;后阶段采用简单随机或无关标志排队等距抽样。,确定抽样数目,抽样数目:,即样本容量、样本单位数,大样本:n30,小样本:n30,抽样数目的确定,与抽样误差、费用及抽样组织方式有直接的关系。,误差小费用多时抽样数目多,误差大费用少时抽样数目少;分层抽样除确定整个样本容量外,还需确定子样本容量;整群抽样需确定样本群数;多阶段抽样需确定各阶段抽样数目。,二、抽样估计的基本概念,1、全及总体与抽样总体,全及总体,总体,总体单位数用N表示,抽样总体,样本,样本单位数用n表示,2、全及指标与样本指标,全及指标,全及平均数X,、全及成数P、,全及方差,2,样本指标,样本平均数x,、样本成数p、,样本方差S,2,成数:,总体中具有某一属性的单位数占全部总体单位数的比重。,是非标志的频数分布表,是非标志的平均数X,=P,是非标志的方差,2,=P(1-P),第二节抽样误差,一、抽样误差的概念,抽样误差,由于抽样的随机性而产生的样本指标与总体指标之间的代表性误差。,统计误差,登记性误差,代表性误差,偶然性误差,系统性误差,所有可能样本平均数的算术平均数等于总体平均数,即:,x,=X,(x,-X,)=0,x,-X,=0,x,-可能样本个数X,=0,x,可能样本个数,-X,=0,x,-X,=0,二、抽样平均误差,抽样平均误差,所有可能样本的样本指标的标准差。,而非所有可能样本的抽样误差的算术平均数。,x,=,(x,-X,),2,可能样本个数,p,=,(pP),2,可能样本个数,基本公式,抽样平均误差反映的是所有可能的样本指标与其中心即相应总体指标的平均差异程度,可衡量样本对总体的代表性大小。,抽样平均误差越小,样本指标对总体指标的代表性就越大;反之,抽样平均误差越大,样本指标对总体指标的代表性就越小。,【例1】见教材P114,x,=,2,n,p,=,P(1-P),n,x,=,2,(N-n),n(N-1),p,=,P(1-P)(N-n),n(N-1),计算公式,x,=,2,n,(1-,n,N,),p,=,P(1-P),n,(1-,n,N,),近似公式,代替计算方法,第一,大样本时,可用样本标准差S代替总体标准差;小样本时,用样本修正标准差S*代替总体标准差,第二,用近期总体标准差或同类地区同类现象的总体标准差代替所研究的总体标准差,抽样误差大小的影响因素:,1、总体标准差,2、样本单位数n,3、抽样方法,4、抽样组织方式,越大,抽样误差越大。,n越多,抽样误差越小;但二者增减并非等比例。,不重复抽样的抽样误差较重复抽样的抽样误差小。,三、抽样极限误差,抽样极限误差,一定概率下抽样误差的可能范围。,|x,-X,|x,(在一定概率下),置信度、概率保证度、可信度、把握程度,用(1-)表示。,(1-)与x,是一对矛盾,实践中可根据合理置信度求相应极限误差;也可根据极限误差范围求相应置信度,(一)大样本条件下,当样本单位n充分大时,样本平均数x渐进服从均值为总体平均数X、标准差为抽样平均误差x的正态分布,,x,-X,x,渐进服从标准正态分布。,若给定(1-),可由标准正态分布表查得临界值Z/2,使得(x-X)/x在区间(-Z/2,Z/2)的概率为(1-)。,即:,x,-X,x,|,Z/2的概率为(1-),在给定概率(1-)下,抽样极限误差x=Z/2x,概率度,与概率保证度一一对应,常见概率保证度与相应概率度:,(1-)=0.6827,Z/2=1,=0.9545,=2,=0.9973,=3,=0.95,=1.96,【例1】对某县水稻产量进行重复抽样调查,实测400亩得平均亩产620公斤,标准差90公斤,试计算当概率保证度为95.45%时平均亩产的抽样极限误差。,解:重复抽样条件下抽样平均误差,x,=,S,n,=,90,400,=4.5公斤,x=Z/2x,=9公斤,表明有95.45%的把握程度断定样本平均亩产与全县实际平均亩产之差不超过9公斤,【例2】【例3】见教材P119,(二)小样本条件下,根据t分布确定抽样极限误差。,若给定(1-),可由自由度为(n-1)的t分布表查得临界值t/2,使得(x-X)/x在区间(-t/2,t/2)的概率为(1-)。,即:,在给定概率(1-)下,抽样极限误差x=t/2x,第三节抽样估计,一、点估计,又称定值估计,直接以样本指标作为总体指标估计值。,样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论