统计学原理.docx_第1页
统计学原理.docx_第2页
统计学原理.docx_第3页
统计学原理.docx_第4页
统计学原理.docx_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录第一章总论第一节 记数活动与统计学的产生第二节 统计的涵义和应用第三节 统计的基本方法第四节 量度层次和计量尺度第五节 统计学中的基本概念第二章 统计资料的搜集与整理第一节 统计资料及其搜集方法第二节 调查方式与调查方案第三节 统计调查误差第四节 统计数据的整理第三章 统计数据的描述与显示第一节 绝对指标与相对指标第二节 集中趋势的测定第三节 离散程度的测定第四节 统计数据的显示第四章 抽样调查第一节 抽样调查的基本问题第二节 抽样误差第三节 参数估计第四节 抽样调查的组织形式第五章 相关分析与回归分析第一节 变量间的相关关系第二节 简单线性相关分析第三节 一元线性回归分析第六章 时间数列分析第一节 时间数列的描述方法第二节 时间数列的因素分解第三节 长期趋势分析第四节 季节变动分析第五节 周期波动分析第七章 统计指数法第一节 指数的外延和内涵第二节 综合指数第三节 平均数指数第四节 平均指标指数第五节 指数体系与因素分析第六节 指数数列的链接与指数平缩第一章总论统计的基本方法:1大量观察法2综合分析法3归纳推断法1统计是对事物数量特征进行分析的方法体系第一节 记数活动与统计学的产生2统计是一种具有特定目的、特定程序和一定组织形式的总体计数活动统计活动长达数千年历史,统计学不过是数百年历史统计学的产生于发展的三个影响源泉:1英的政治算术 配第2德的国势学 康令 和 阿亨瓦尔3法的概率统计 帕斯卡 和 费尔马 贝努利 拉普拉斯 凯特勒统计学的特征:1统计理论和方法不断得到完善和深化2计算机的使用和统计软件的问世强化了统计计算手段3通过方法论科学的属性更加突出第二节 统计的涵义和应用统计学的英文名词有单复数之分2单数名词的统计学是表示一门科学3复数名词的统计学是表示统计资料或数据统计的涵义包括三个方面内容:1统计工作2统计资料3统计学4统计工作是对客观事物总体数量方面进行计量、核算和分析的活动及过程5统计资料是统计工作的成果,表现为对客观事物总体数量方面加以反映和说明的各种数据6统计学是对统计工作及其成果的理论概括和总结三者紧密相连,体现出一种工作与成果、实践与理论的关系统计的根本职能是收集、整理和提供信息统计信息具有数量性和总体性两个重要特征,是社会信息的主体7咨询职能是利用已经掌握的丰富的统计信息,用科学先进的分析方法和技术,深入开展综合分析和专题研究,为科学决策和管理提供各种可供选择的咨询建议和对策方案8监督职能是根据统计调查和分析的结果,及时准确地从总体上反映经济、社会和科技的运行状况,并对其实行全面系统的定量检查、监督和预警,以促使国民经济按照客观规律的要求,持续、稳定、协调地发展三大职能相互联系、相辅相成,信息是另外两个有效发挥的基础,咨询师信息的延伸和深化,监督则体现了前两个能在外延和内涵上的拓展统计的信息、咨询和监督并称为统计的三大职能9统计学是一门关于随机现象总体的数据资料进行收集、整理和分析的方法论科学统计学的研究对象是对于客观存在的现象,只要能够按照特定性质加以归类,并能用总体性的数字来加以表现的现象统计方法和实验方法是科学研究的主要方法二者在应用范围上有差异:10试验方法是通过控制、设定某些条件来观察、计算和分析研究对象的数量表现或状况的,在一些领域(例如社会经济领域)这种控制或设定往往难以进行11统计方法是对研究对象的数量表现、状况进行收集、整理、分析,判定各项条件、因素对统计资料所产生的影响统计方法有如下应用:1搜集数据,对所研究对象的总体事实做出数量上的叙述说明2对获得的总体事实进行时间、空间和属性等的比较3探索总体事实的内在数量规律性第三节 统计的基本方法一项完整的统计实践包括以下几个环节“统计任务的确定、统计设计、统计调查、统计整理、统计资料分析、统计资料提供与管理统计的基本:1大量观察法2综合分析法3归纳推断法12大量观察法是统计要对研究对象的全部或足够多的单位进行数量上的调查和分析13综合是对大量观察所获得的个别单位的数量事实,运用各种指标加以综合,来反映现象的总体数量表现统计常用的三种指标:1总量指标2平均指标3相对指标14分析是对统计指标进行对比分析,以客观现象内部或客观现象之间的差异和数量关系对客观现象内部数量关系的分析,常借助于统计分组,一般先将其划分为性质不同的若干组,再利用各种方法揭示其内部的各种数量关系,使用的方法包括1动态趋势分析法2因素影响分析法3相关分析法15归纳是由个别到一般,由事实到概括的整理、描述方法16推断是以一定的逻辑标准,根据局部的、样本的数据来判断总体相应数量特征的归纳推理方法统计数据分为个体数据和总体数据16个体数据是研究对象中的个别单位所表现的数量事实16总体数据是所有人的平均年龄、总收入、平均收入、平均身高等统计数据主要来源与以下方面:1专门组织的调查2政府职能机构的统计报表3公开的出版物和统计媒体16统计专门调查是根据所要研究的问题,专门组织的,通常为一次性的统计调查活动,有普查、重点调查、抽样调查等形式第四节 量度层次和计量尺度从数据计量的量度层次来划分,计量尺度分为四种类型:1定类尺度2定序尺度3定距尺度4定比尺度17定类尺度是将所研究对象按某种特征将其划分成若干类别,并给每一类别定名,但不对类别之间的关系做任何假设定类尺度的量度层次是最低的定类尺度具有对称性、传递性两种属性对称性说明各类之间彼此相对称传递性表示运算上各类量值具有相等于不等的性质18定序尺度不仅可以将所研究的现象分成不同的类别,而且还可以确定这些类别的顺序,各类之间还能比较等级和次序上的差别19定距尺度是要求建立某种物理的量度单位,具有标准的量度单位,利用加减运算可以准确地给出数据的差异大小。一定条件下,定距尺度可换算成定序尺度,但定序尺度则不能转换成定距尺度20定比尺度是量度层次最高的数据计量尺度,它在定距尺度上确定了一个绝对的、有意义的零点。定距尺度的0只表示某一个值,即0值,不表示没有,定比尺度中的0是绝对零点,表示没有。第五节 统计学中的基本概念统计学中的基本概念:1统计总体和总体单位2统计标志和统计指标3变异和变量21统计总体简称总体,是客观存在的、具有一个或若干个相同性质的许多个体(亦称个别事物)所形成的集合(或整体、群体)统计总体分为有限总体、无线总体24有限总体是总体中包含的单位数是有限的25无线总体是总体中包含的单位数是无限的这个集合应同时具备以下要素:1客观存在性2组成集合的个体是大量的3组成集合的个体至少具有一个相同的属性或特征表现4组成集合的个体在所研究的属性或特征上的表现不尽相同21总体单位简称单位,是构成统计总体的每一个体(或个别事物)个体以自然单位来表示,如人、台、只、双个体以度量衡单位来表示,如千克、吨、升26统计标志简称标志或标识,是说明总体单位所具有的属性或特征的名称如民族、性别、文化程度等称谓就是统计标志27标志表现是指对统计标志的属性和特征的描述或取值如性别是标志,其标志表现为男或女年龄是标志,其标志表现为20岁,21岁等标志分为品质标志和数量标志28品质标志是说明总体单位属性的名称,如性别、民族29数量标志是说明总体单位特征的名称,如年龄、收入,其标志表现是具体数值30统计指标简称指标,是说明统计总体综合数量特征的名称。其都用数值来表现。如国内生产总值、商品库存额、人口总数等数量指标 人口密度、设备利用系数、平均亩产量等质量指标31指标值是指标的具体表现统计指标=名称+数值,总体性、数量性、综合性总体性是指标与标志的主要区别一个统计指标应包括一下构成要素:1指标名称2计量单位3计算方法当对指标作名称+数值时,还应包括三个要素,即指标值、指标值的时间和空间规定统计指标按所反映总体的数量状况不同分为数量指标、质量指标32数量指标是说明所研究特征的规模、水平的绝对量指标,如国内生产总值、商品库存额、人口总数33质量指标是反映所研究总体某一方面相对水平、工作质量的相对量和平均量指标,如人口密度、设备利用系数、平均亩产量35变异是总体各单位在所研究的标志上其表现不尽相同,即总体的差异性在统计总体中,除了构成总体所使用的标志(亦称不变标志)其各单位的标志表现相同之外(这个也成为总体的同质性),总体各单位在所研究标志的具体表现上会存在差别编译时统计的前提,不存在变异,就无需统计36变量是统计的数量标志和指标,其取值就成为变量值变量按取值之间能否无线分割,分为连续变量、离散变量。连续变量的两个取值之间可作无限分割,如工资、产值、价格水平等离散变量两个取值之间不能做无限分割,取值是证书,如人口数、设备数变量按性质又可以分为确定性变量、随机变量变量俺量化层次还可以分为定类变量、定序变量、定距变量、定比变量连续变量分组时,本组上限与后一组下限是重叠第二章 统计资料的搜集与整理搜集是统计工作的基础搜集原始资料的方式一般有抽样调查、普查、统计报表、重点调查、典型调查等统计整理的基本方法:统计分组统计整理的结果通常用统计表、统计图的方式表现。次数分布的曲线图是认识总体数量特征的重要方法第一节 统计资料及其搜集方法40统计资料是对客观事物的数量特征进行观察和度量所形成的数量信息资料。统计资料的三个基本性质:数量性、总体性、客观性统计学以事物数量特征为主要研究对象统计资料描述的是大量的、密集型事物的总体特征统计资料是用来反映总体的特征和规律的统计方法以大量观察为基础从获得资料的途径看,统计资料分为原始资料、初级资料。41原始资料是通过统计调查或实验所取得的统计资料,属于第一手资料42次级资料是来源于别人通过统计调查或实验所取得并已经加工整理过的统计资料,属于第二手资料次级资料的搜集主要有两种情况:间接渠道1公开出版的资料2非公开出版的资料原始资料的搜集方法:1访问调查2电话调查3邮寄问卷4观测5互联网调查专门调查在内容上分为:观察性、实验性观察性是指调查人员不对客观发生的事物进行干预,仅凭观测而获得统计资料实验性是指观察人员通过对一些具体事项的安排而获得不同条件下的统计数据搜集资料注意考虑的注意事项:1涉及范围要适度2事先进行规划,提高搜集资料的效率3注意版权问题第二节 调查方式与调查方案统计调查的方式:1普查2抽样调查3统计报表4重点调查5典型调查46专门组织是相对于常规性的、制度性的调查而言。47一次性是相对于经常调查而言48全面调查是相对于涉及部分对象的非全面调查而言49抽样调查是从大范围的总体现象中抽取一部分单位,对这部分单位进行测量与计算,并由此推测总体的数量特征。它的基本思路是以少推知多50统计报表是按国家有关法规的规定,自上而下地统一布置,自下而上地逐级填报统计报表的调查方式。以一定的原始记录为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。全面、强制性我国重要的搜集统计数据的方式,是政府统计的重要方式。51重点调查是在涉及的所有单位中仅对重要的、被调查项目数量较大。52典型调查是从调查对象的所有单位中选择若干具有代表性的单位进行较深入调查的调查方式。典型调查的目的是通过典型单位来描述或揭示所研究问题的本质和规律非全面调查:重点、抽样、典型调查的范围只涉及调查对象的部分单位我国政府统计的调查方式:统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料。53统计调查方案是指导整个调查活动的纲领性文件包括以下内容:1调查目的2调查对象和调查单位3调查内容和调查表4其他内容53调查目的是调查活动所要达到的具体目标,它解释为什么要调查或调查要解决什么样的问题,在调查方案中,调查目的一定要充分、准确地表述。54调查对象是根据调查目的确定的调查研究总体或调查范围。55调查单位是调查范围内的个别单位,它是具体调查项目和指标的承担者,即所要乐界的信息的载体。调查活动的核心是将要进行调查的内容,也就是需要向调查单位了解的情况和问题56调查表是把所调查的内容具体化为一些明确的项目或指标,并适当排列制成表格。57调查内容的时间特征是调查数据的所属时间。搜集数据的方法应明确是入户调查、问卷调查、电话采访或其他方式如果是抽样调查,还应明确抽样范围、具体的抽样方法和数据的推断方法等调查的组织实施工作包括调查人员的招募和培训、调查文件和表格的印刷、调查经费的预算等内容第三节 统计调查误差58统计调查误差是通过调查或实验所获得的统计数据与调查对象的实际数量的差别。统计调查误差分为登记误差、代表性误差两种59登记性误差是由于调查过程中在测量、记录、填报、计算等活动中产生的误差。60代表性误差是在非全面调查中,由于选取的那部分单位对全部单位的代表性不足而产生的误差抽样误差可以在调查之前实现加以计算和控制产生误差的客观原因:1客观随机性2操作不当3计算中的舍入误差4故意制造的误差怎么看待误差:1误差降低了统计数据的质量2误差是难以避免的3人们对准确性的要求是相对的4追求过高的准确性往往得不偿失第四节 统计数据的整理进行数据整理的基本目的是是数据简单化、系统化61简单化是把原始数据简化、抽象为可以与其他同类事物比较的少数几个特征值62系统化是把原始数据按照一定的原理和要求进行有序的排列和组织分组是进行数据整理的基本方法分组的依据是事物的相似性。统计数据整理的步骤:1对原始资料进行审核2对原始资料进行分组和汇总3将汇总结果用统计表或统计图的方式表现出来。审核的主要方法:1常识性审查2比较性审核3设置疑问框审核63统计分组是将总体所有单位按照一定的标志区分为若干部分,在不同的部分之间,存在着差异,而在每一部分内部,我们忽略其差异,视为性质相同。分组的关键是选择恰当的分组标志和准确地划分组的界限统计分组的类型一般有两种:品质分组、数量分组64品质分组是指按照事物的某种客观属性进行分组,或是对定类尺度和定序尺度的数据进行分组65数量分组是指按照事物的某一种数量特征来划分组间界限,或是对定距尺度和定比尺度的数据进行分组,66次数是指将原始资料按某个标志分成若干组,每个组内都会包括不同数目的个别单位,这个数目就是各组的次数。67次数分布是由次数与每组的数量界限共同排列而形成的68频率又称比重,是只各组次数与总次数之比一个次数分布共有8个组,即组数为8,每个组都形成了跨度为10的区间,成为组距,每一组都包含了个位数为09的数字,即组限,这个界限有较小和较大的两个数构成,其中较小的一个位于该区间的左端,叫下限,较大的一个位于该区间的右端,叫上限组距=上限-下限组属于组距基本上成反比关系,组距越大,组数越少,组距越小,组数越多。次数分布中,组距可以相等,形成等距式分组,适用于数值变化比较平缓的情况组距也可以不相等,形成不等距分组,适用于变量值变化比较剧烈的情况通常用尾数为0或5的数值作为组限73组限的表示方法:在分组两端的最小值和最大值的组距,有时可以使用“以下”和“以上”,形成“开口组”组中值=(下限+上限)/2用组中值代替本组的一般水平存在着一定的假定性,即没组内的平均水平并不一定恰好是组中值。计算组中值来代表各组数值的一般水平组中值的使用依赖于一个假定:变量在组内的变化是均匀的,即组距每经过10%,也包含着本组内10%的单位。开口组,组中值的计算方法:首组(数值最小的一组)组中值=本组上限-1/2邻组组距末组(数值最大的一组)组中值=本组下限-1/2邻组组距累计次数分布74在分组的基础上列出累计次数数值,为了统计分析之需要,有时要观察某一数值以上或某一数值以下的次数之和74数值由小向大的方向累计,称为“向上累积”75数值由大向小的方向累计,称为“向下累积”分组变量的类型数据是连续变量还是离散变量,来选择组限的标示方法76上组限不在内原则,180cm分到180190组。对连续变量分组时,本组的上限与后一组的下限是重叠的,即数值相同离散变量数值都是自然数,在划分组限时,本组的上限与后一组的下限是相邻的自然数注意,统计学在处理连续变量和离散变量时,并未完全依照数据自身数学特征来划分变量的性质。年龄连续却离散、人数离散却连续实际工作中,可以便宜行事。当数据数值较小、不易或不必连续变量的准确数值等情况时,科按照离散变量的方法处理;而当数据数值较大时,可按照连续变量的方法处理次数分布的图示77次数分布图是在平面直角坐标系上画出直方图或折现、曲线图,来表现不同的组各自的次数或频率的方法一般把横轴用作分组,纵轴来表示次数或频率品质分组次数分布的图示依照的是事物的内在性质,而不是可以度量的数量,所以横轴上的分组次序可以任意排列等距分组次数分布的图示由于相邻组的组限重叠或相邻,直方图中的柱形之间可以不留空隙77把每个柱形顶端的中点相连,可以得到折线图不等距分组次数分布的图示各组组距大小应该与各自的柱形宽度相适应累计次数分布的图示78洛伦茨曲线是吧累计次数分布图使用的非常出色的一种方法美经济学家、统计学家洛伦茨根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入或财富分配均衡性的曲线。79为了更准确反映收入分配的变化情况,意大利经济学家基尼,根据洛伦茨曲线计算了基尼系数基尼系数的计算方法是OC直线与曲线所围成的面值与直角三角形OPC的面积之比,表示为基尼系数G=A/A+B基尼系数为0时,表示绝对平均为1时,表示绝对集中现实中,基尼系数总是介于01之间,数值越小,平均程度越高。国际通行标准是,基尼系数的警告线为0.4,大于0.4时,收入分配的不均衡程度需引起重视可以估计基尼系数的近似值,方法是根据图中曲线与对角线之间所围成的等腰直角三角形和正方形个数,计算面积之比次数分布的类型:80当原始数据量很大、组距很小而且组数很多时,所绘制的直线图越来越光滑,近似于曲线,这种曲线就是次数分配曲线,是描述各种统计分布的有效方法81统计分布曲线图是一种非常有用的方法,通过形象使数据直观。常见的分布曲线有三种类型:1钟型曲线2 J型曲线3 U型曲线82钟型分布曲线基本特征,两头小,中间大,即靠近变量极大值和极小值的单位比较少,而靠近中间的单位比较多。83一种理想化的钟型分布曲线左右对称的钟型分布曲线正态分布曲线。钟型分布经常出现不对称情况,根据其长尾拖向哪个方向又分为右偏(正偏)和左偏(负偏)右偏时,靠近最小值一端的单位比较多左偏时,靠近最大值一端的单位比较多84 J型曲线根据其方向分为正J型曲线和反J型曲线85正J型曲线,随着变量值的上升,各组次数也上升,即越打越多.供给曲线反J型曲线例如需求曲线。85 U型曲线与钟型曲线刚好相反,两头大,中间小,靠近极端值的单位的数比较多。例如死亡曲线。第三章 统计数据的描述与显示按照统计指标反映事物数量特征的不同,可把统计指标分为三类:绝对指标、相对指标、平均指标第一节 绝对指标与相对指标86绝对指标(总量指标)是反映社会、经济现象整体规模和水平的指标一般都以绝对数形式表示。是我们对事物进行认识、比较和分析的基础。因为绝对指标反映的是某一事物在一定范围内的总数量,因此又叫总量指标。绝对指标按时间特征分为时点指标、时期指标87时点指标反映现象某一时刻的状态88时期指标反映现象在某一段时期的某一范围内的变化总量绝对指标的计量单位:实物单位、价值单位、劳动单位89实物单位按照实物的自然属性进行计量,使用物理或自然单位。92自然单位是具有独立物理形态的事物可使用计数的方法进行计量。 最早93度量衡单位是按照人为设定的尺度或计量单位进行计量,度指长度,量指体积,衡指重量94复合单位是按照多重标准计量95标准实物量单位是由于某些同类物质的某些特性、成分、规格不同,直接加总会混淆某种关键特性的实际情况,因此采用折合的方法计算标准实物量。90价值单位是用货币来表示社会财富或经济成果。 最常用91劳动单位是以劳动时间为计量对象。96相对指标是说明一个数值与另一个数值之间相对比所形成的数量关系,其基本计算方法是两个绝对指标之比。计算相对指标的方法:结构相对指标、比较相对指标、强度相对指标、动态相对指标97结构相对指标是部分与总体的同一指标之比,把总体视为1或100%,总体的某一部分在总体中所占的比重98比较相对指标是两个同类现象指标之比,可用倍数或百分数表示99强度相对指标是两个有联系但性质不同的指标之比,多数情况下,其计算单位是复合型的。100动态相对指标是同一事物不同时间的指标之比第二节 集中趋势的测定101众数(Mode,记作 Mo)的根本意义是在一个数据集合中出现次数最多的数。对于分组数列,通常采用近似公式确定Mo=L+(1/1+2)*dMo表示众数,L表示众数所在组(即次数最高的组)的下组限,1表示众数组次数与上一组(变量值比众数组小的一组)次数之差,2表示众数组次数与下一组(变量值比众数组大的一组)次数之差,是希腊字母delta的大写,读作德尔塔,d表示众数组的组距102中位数(Median,记作Me)是已经过排列的数列中位置居中的数值。奇数n个数据中,Me=(n+1)/2偶数n个数据中,Me=(位于中间的二项)/2对于未分组的,近似公式确定中位数Me= L+(f/2-Sm-1)/fm*dMe表示中位数,f/2表示中位数所在的位置表示连加关系,是希腊字母sigma的大写,读作西格玛。L表示中位数所在组的下组限Sm-1表示中位数所在组以下(数据较小的)各组的累计次数fm表示中位数所在组的次数d表示中位数所在组的组距103算术平均数又称均值,(Mean,记作X,读作x-bar,)是集中趋势最主要的测度值。其基本计算方法是各项数据之和与数据的个数之比。对于未分组资料,须用加权算术平均数公式计算104在算术平均数的计算中,权数又叫次数,是各组的次数,是数量分析方法中一个常用的概念在其他场合,他会有不同的表现方式。其基本作用是用以表现它所对应的变量值在总体一般

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论