统计学最新版_第1页
统计学最新版_第2页
统计学最新版_第3页
统计学最新版_第4页
统计学最新版_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、名词解释1、定性数据是指只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体又分为定类数据与定序数据。(定类数据是对事物进行分类的结果,表现为类别,由定类尺度计量而成。定序数据是对事物按照一定的排序进行分类的结果,表现为有顺序的类别,由定序尺度计量而成。)2、定量数据是指用数值来表现事物数量特征的数据,具体又分为定距数据与定比数据两种。(定距数据是一种不仅能反映事物所属的类别和顺序,还能反映事物类别或顺序之间数量差距的数据,由定距尺度计量而成。定比数据是一种不仅能体现事物之间数量差距,还能通过对比运算,即计算两个测度值之间的比值来体现相对程度的数据,由定比尺度计量而成。) 3、长期趋势是指时间数列中指标值在较长一段时间内,由于受普遍的、持续的、决定性的基本因素的作用,使发展水平沿着一个方向持续向上或向下发展或持续不变的基本态势。4、季节变动是指数列中各期指标值随着季节交替而出现周期性的、有规则的重复变动,这里的时间通常指一年。5、循环变动是指时间数列中各项指标值随着时间变动发生周期性的重复变化,但循环变动所需的时间更长,重复变动的规律性、变动周期和时间也不像季节变动来得稳定、可以预测。6、不规则变动是由未能得到解释的一些短期波动所组成的,常指时间数列由于受偶然因素或意外条件影响,在一段时间内(通常指短期内)呈现不规则的或自然不可预测的变动。7、相关关系,也称统计相关,是指现象之间存在的非确定性的数量依存关系。8、点估计也称定值估计,就是以样本观测数据为依据,对总体参数做出确定值的估计,也就是用一个样本的具体统计值去估计总体的未知参数。9、区间估计,就是指用一个具有一定可靠程度的区间范围来估计总体参数,即对于未知的总体参数,想办法找出两个数值1和2(12),使处于区间(1,2)内的概率为1-,即(12)=1-。区间(1,2)为总体参数的估计区间或置信区间,1为估计下限或置信下限,2为估计上限或置信上限。10、统计调查方式,就是运用合适的统计调查手段去收集统计调查对象总体的全部或部分个体的原始数据,也就是通过对调查对象总体的全部或部分个体的有关标志特征,进行调查或观测的方式来获取统计数据。11、普查是根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料(总体中的所有个体都是观测单位)。12、抽样调查是一种非全面调查,它从总体中抽取样本,以样本推断总体。重点调查也是一种非全面调查,是对数据收集对象总和中的部分重点个体进行观测的统计调查方式。13、统计推算是以已掌握的各种统计数据为基础,根据事物之间的内在联系或发展规律,对被研究现象数量特征做出估算或测算的一种间接统计调查方式。二、判断题1、统计学是一门关于统计数据的搜集、整理和分析的方法论科学。T2、统计学起源于德国的国势学派。F3、描述统计与推断统计的区别在于前者简单,后者复杂。F4、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来。F5、任何统计数据都可以归类于绝对数、相对数或平均数中的一种。T6、统计学可以被理解为关于样本的科学。T7、从广义上讲,可变标志、指标都是变量。F8、无论数量指标与质量指标,其数值大小都与总体容量(或样本容量)有关。F9、任何总体,其所包含的个体必须至少具备一个可变标志和一个不变标志。F10、电话号码是数量标志。F11、观测单位就是统计数据的提供单位。F12、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确。F13、无论是概率抽样还是非概率抽样,误差都是可以计算的。F14、偶然性误差只存在于抽样调查,观测性误差则可能存在于任何统计调查。T15、为了尽可能多地收集统计数据信息,所以问卷应尽可能地长。F16、统计分组应使组间差距尽量小。F17、凡是离散型变量都适合编制单向式数列。F18、各组的频数或频率都可以直接比较。F19、对于定义变量,不能确定平均数。F20、根据组距式数列计算的平均数、标准差等,都是近似值。T21、任何平均数都受变量数列中的极端值的影响。F22、中位数把变量数列分成了两半,一半数值比它大,另一半数值比它小。F23、任何变量数列都存在众数。F24、如果mem0 ,则变量分布为右偏。F25、若比较两个变量分布平均数代表性的高低,则方差或标准差大者平均数的代表性差。F26、只要变量分布聚义厅相同的标准差,就会有相同的分布形状。F27、变量分布的集中趋势就是众数组的频数占总频数的比重,离中趋势则是非众数组的频数占总频数的比重。T28、在实际应用中,调和平均数与算术平均数的计算形式虽然不同,但计算结果及其意义是一样的。T29、抽样估计的目的是用以说明总体特征。T30、抽样分布就是样本分布。F31、对于既定总体,当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布就唯一确定。T32、样本容量就是样本个数。F33、在抽样中,样本容量是越大越好。F34、抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。F35、当估计值有偏时,我们应该弃之不用。F36、对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。T37、抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。F38、非抽样误差会随着样本容量的扩大而下降。F39、正相关是指自变量和因变量的数量变动方向都是上升的。F40、回归系数b和相关系数r都可以用来判断现象之间相关的密切程度。F41、在相关分析中,要求两个变量都是随机的;在回归分析中,要求两个变量都不是随机的。F42、判定系数越大,估计标准误就越大;判定系数越小,估计标准误就越小。F43、利用最小二乘法拟合的直线回归方程,要求所有观测点和回归直线的距离平方和为零。F44、两个总量指标时间数列相对比得到的时间数列一定是相对时间数列。F45、构成时间数列的两个基本要素是时间和指标数值。T46、所谓序时平均数就是将同一总体的不同时期的平均数按时间先后顺序排列起来。F47、间隔相等的时期数列计算平均发展水平时,应用首尾折半的方法。F48、累计增长量除以时间数列的项数等于平均增长量。F三、单选题1、统计学的研究对象是(B)A各种现象的内在规律B各种现象的数量方面C统计活动过程D总体与样本的关系2、某班3名男生的身高分别为172厘米、176厘米和178厘米,这三个数是(C)A标志B变量C变量值D指标3、以一、二、三等来表示产品质量的优劣,那么产品等级是(B)A质量指标B品质标志C数量标志D数量指标4、下列哪个指标不属于质量指标(D)A企业职工平均工资 B企业利润率C企业产品合格率D企业增加值5、要了解某市30所中学的学生视力状况,则个体是(C)A每所中学B全部中学C每名学生D每名学生的视力6、最常用的统计调查方式是(C)A普查B重点调查C抽样调查D科学推算7、调查小学男生的身高,则身高是(A)A观测标志B观测单位C调查对象D变量值8、抽样调查中不可避免的误差是(B)A系统性误差B偶然性误差C观测性误差D登记性误差9、在组距式数列中,对组限制的处理原则是(A)A上组限不在内、下组限在内B下组限不在内、上组限在内C上下组限均不在内D上下组限均在内10、最常见的变量分布类型是(C)A正J形分布BU形分布C钟形分布D反J形分布11、由相对数计算平均数时,如果已知该相对数的子项数值,则应该采用(B)A算术平均数B调和平均数C几何平均数D位置平均数12、如果计算算术平均数的所有变量值都增加100,则方差(C)A增加100B增加1000C不变 D不能确定如何变化13、如果计算加权算术平均数的各组频数都减少为原来的4/5,则算术平均数(C)A减少4/5B减少为原来的4/5C不变D不能确定如何变化14、某企业有A、B两个车间,去年A车间人均产量3.6万件,B车间人均产量3.5万件。今年A车间生产人数增加6%,B车间生产人数增加8%。如果两个车间的人均产量都保持不变,则该企业今年总的人均产量与去年相比(B)A上升B下降C不变D不能确定如何变化15、已知某变量分布属于钟形分布且m0=900,me=930,则(C)A900B900930C930D=91516、对某一变量数列计算数学意义上的数值平均数,得=390,则(D)AH390,G390BG390,H390CG390,H390DG390,HG17、若两个变量数列的标准差相等且计量单位相同,但平均数不相等,则(A)A平均数大者代表性强B平均数小者代表性强C两个平均数的代表性一样D无法判断哪个平均数的代表性强18、离散指标中受极端值影响最大的是(C)A平均差B标准差C全距D方差19、统计学中最重要的离散指标是(C)A平均差B全距C标准差D变异系数20、根据动差的定义,方差属于(D)A一阶原点动差B二阶原点动差C一阶中心动差D二阶中心动差21、动差法峰度系数大于尖顶还是平顶的判断值是(D)A0B1C1.8D322、我们想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则(C)A观测单位是学校B观测单位是班级C观测单位是学生D前三者都可以23、下列误差中属于非一致性的有(D)A估计量偏差B偶然性误差C抽样标准误D非抽样误差24、抽样估计中最常用的分布理论是(C)At分布理论B二项分布理论C正态分布理论D超几何分布理论25、抽样标准误大小与下列哪个因素无关?(C)A样本容量B抽样方式、方法C概率保证程度D估计量26、下列关于抽样标准误的叙述哪个是错误的?(C)A抽样标准误是抽样分布的标准差B抽样标准误的理论值是唯一的,与所抽样本无关C抽样标准误比抽样极限误差小D抽样标准误只能衡量抽样中的偶然性误差的大小27、某企业2002年14月初的商品库存额如下:(单位:万元)月份(月)1234月初库存额20241822则第一季度的平均库存额为(C)A(20+24+18+22)/4B(20+24+18)/3C(10+24+18+11)/3D(10+24+9)/328、上题中若干把月初库存额指标换成企业利润额,则第一季度的平均利润额为(B)A(20+24+18+22)/4B(20+24+18)/3C(10+24+18+11)/3D(10+24+9)/329、某企业1998年的产值比1994年增长了200%,则年平均增长速度为(C)A50%B13.89%C31.61%D29.73%30、1990年某市年末人口为120万人,2000年末达到153万人,则年平均增长量为(A)A3.3万人B3万人C33万人D30万人31、上题中人口的平均发展速度是(D)A2.46%B2.23%C102.23%D102.46%32、当时期数列分析的目的侧重于研究某现象在各时期发展水平的累计总和时,应采用(C)A算术平均法B调和平均法C方程式法D几何平均法33、如果时间数列逐期增长量大体相等,则宜拟合(A)A直线模型B抛物线模型C曲线模型D指数曲线模型34、当时间数列逐期增长速度基本不变时,宜拟合(C)A直线模型B二次曲线模型C逻辑曲线模型D指数曲线模型35、当一个时间数列是以年为时间单位排列时,则其中没有(B)A长期趋势B季节变动C循环变动D不规则变动36、若无季节变动,则季节指数应该是(B)A等于零B等于1C大于1D小于零37、某一时间数列,当时间变量t=1,2,3,n时,得到趋势方程为y=38+72t,那么若取t=0,2,4,6,8,时,方程中的b将为(B)A144B36C110D3438、上题中,a的取值应为多少?(38)三、计算题(1)回归分析1、估计模型:2、最小平方法 或公式求解: a=3、 4、回归方程判定系数总变差=回归变差+剩余变差(2)区间统计【例题】从某高校的14500名学生中随机不重复抽取100名学生进行月生活费支出调查,经计算样本均值为=546元,样本方差为s2=45568元,要求以95%的概率保证估计该校全体学生的人均月生活费支出额。由题意知,N=14500,n=100,f=n/N=0.69%5%;由1-=95%可知,z/2=1.96。因为f5%,所以可用重复抽样公式,可估计抽样标准误差为:se()=根号下S2/n=根号下(45568/100)=21.35元抽样极限误差为= z/2se()=1.9621.35=41.85元。由此可得,全校学生人均月生活费支出额95%概率保证的区间估计为(546-41.85,546+41.85)=(504.15,587.85)元(3)长期趋势第一章 总论 本章对统计学的学科性质、统计数据类型及其研究方法和统计学中的有关基本概念进行介绍,具体要求:理解统计的含义与本质;对统计学产生与发展的简要历史,特别是对主要学派有所了解;比较全面地认识统计学的学科性质和作用;熟知统计数据的各种类型、特征以及计量尺度,掌握统计数据的研究过程和基本方法;对总体、个体、样本、标志、变量、指标和指标体系等统计学的基本概念有比较系统、全面的掌握。第一节 什么是统计学一、统计的含义与本质“统计学”是统计一词的三个含义之一。统计泛指:统计数据、统计活动和统计学。统计数据是统计活动的成果,统计学则是统计活动经验的科学总结和理论概括。统计的本质:关于为何统计,统计什么和如何统计的思想。 二、统计学的产生和发展从统计学的发展过程看,经历了古典统计学、近代统计学和现代统计学三个阶段,主要的学派有政治算术学派,国势学派(记述学派),数理统计学派,社会经济统计学派等。 三、统计学的学科性质 统计学是一门以现象的数量方面作为研究对象的独立的方法论科学。四、统计学的作用第二节 统计数据类型与研究方法一、统计数据类型可以分为定性数据与定量数据;绝对数、相对数和平均数;观测数据与实验数据;原始数据与次级数据;时序数据与截面数据。二、统计数据研究过程包括以下四个基本环节:统计设计,数据搜集,数据整理和数据分析与解释。三、统计数据研究方法基本方法有大量观察法、统计分组法、综合指标法、统计推断法和统计模型法。 第三节统计学的基本概念一、总体与样本(一)总体总体是有许多具有某种共同性质的个别事物所组成的有机整体,具有大量性、同质性和差异性三个特征。构成总体的个别事物称为个体,也叫总体单位。总体的种类分为有限总体与无限总体;具体总体和抽象总体;可相加总体和不可相加总体;个体可自然确定的总体与个体是人为划定的总体。总体和个体的关系表现在三个方面。(二)样本样本是从总体中抽取的一部分个体所组成的集合,也称子样。样本容量是指样本所包含的个体数。样本与总体的关系表现在三个方面。二、标志和变量 (一)标志标志是说明总体单位(个体)特征的名称。(二)变量狭义的变量是指可变的数量标志。广义讲,变量不仅指可变的数量标志,也包括可变的品质标志。变量有确定性变量和随机性变量;连续变量和离散变量之分。第四节 统计指标与指标体系 一、统计指标(一)、统计指标的概念,指标是说明总体数量特征的概念或范畴。统计指标具有数量性、综合性、具体性的特点。(二)指标与标志的关系(三)统计指标的种类1、分为总量指标(总体标志总量和总体单位总量;时期指标和时点指标),相对指标(结构相对指标、比例相对指标、比较相对指标、强度相对指标、计划完成相对指标和动态相对指标),平均指标(第三章介绍);2、分为数量指标和质量指标;3、分为静态指标和动态指标;(四)统计指标的设计确定指标的名称和涵义;计算范围和计算方法,计量单位;确定指标的资料搜集方法和统计量化尺度等。 二、统计指标体系(一)统计指标体系的概念及表现形式,反映同总体或样本多个方面数量特征的一系列相互联系的统计指标所形成的体系称统计指标体系。表现形式有:数学等式关系;相互补充关系;原因、条件与结果关系等。(二)统计指标体系的设计原则目的性原则、科学性原则、可行性原则、灵活性原则、层次性原则、联系性原则、协调性原则等。第二章统计数据的收集、整理与显示 本 章阐述统计数据收集、整理与显示的理论与方法,具体要求:理解统计数据收集的含义与要求,掌握统计数据收集方案设计;熟悉统计数据收集的各种方式、方 法并能加以应用;基本掌握调查问卷设计技能;理解统计数据整理的含义、要求与步骤;理解统计分组的意义,正确掌握统计分组方法;掌握分布数列、尤 其是变量数列的编制方法;了解统计表的结构、种类和编制方法;了解统计图的意义,掌握常用统计图的绘制方法。第一节 统计数据的收集一、统计数据收集的含义和要求统计数据收集也称为统计调查阶段。基本要求是准确性、及时性和完整性。二、统计数据收集方案设计确定数据收集目的、数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、数据所属时间和数据收集期限、数据收集地点、数据收集的组织。三、统计数据收集方式有两种:统计调查方式和实验方式。(一)统计调查方式统计调查就是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观对象搜集资料的过程。1、普查 普查的概念和特点;普查的组织方式;普查的组织原则。2、抽样调查抽样调查可分为概率抽样和非概率抽样两类。(1)概率抽样概率抽样按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来,它有五个特点。概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。(2)非概率抽样是非随机抽样调查,有任意抽样、典型抽样、定额抽样和流动总体抽样等几种。3、重点调查重点调查的含义和特点。 重点调查目的是掌握总体基本情况,关键是选好重点单位。4、统计推算统计推算的概念和特点;统计推算方法。 (二)实验方式 含义和原则;常用的实验设计。(三)数据收集误差存在两种误差:观测性误差和代表性误差。观测性误差也叫登记性误差或调查性误差,在全面调查和非全面调查中都会产生,是一种非一致性误差;代表性误差是指在抽样调查中,因样本不能完全代表总体而产生,又分为系统性代表性误差和偶然性代表性误差两种。四、统计数据收集方法统计数据收集方法,是指获取被调查对象数据的渠道或途径,常用的方法有直接观察法、通讯法、采访法、登记法等几种。五、问卷设计问卷一般由引言、被调查者基本情况、问题和答案、结语四个部分组成。设计时应考虑三个方面问题:问题的编排顺序;提问方式和措辞要点;问卷调查说明等。第二节 统计数据的整理 一、统计整理的含义与要求二、统计整理的内容和步骤分组、汇总、编表(图),其中汇总是中心内容。三、统计分组(一)含义和性质统计分组是根据事物内在的特点和统计研究的任务,按一定的标志,将统计总体划分为若干个不同的类型或部分(组)的一种统计方法。分组之后应保持组内资料的同质性和组间资料的差异性。(二)统计分组的种类:简单分组和复合分组;品质分组和数量分组四、分布数列 (一)分布数列的概念与种类当总体按一个或几个标志分成若干个不同的组之后,形成了按一定顺序排列的总体单位数在各组间的分布,即为次数分配或分配数列。分配数列的基本要素:组别、次数(频数)或比重(频率)分布数列的种类有品质分布数列和数量分布数列(又称变量数列)。变量数列有单项式数列和组距式数列两种,组距式数列还有等距数列和异距数列之分。(二)分布数列的编制1、单项数列的编制2、组距数列的编制在编制组距数列时,应考虑以下问题:(1)组距和组数。各组上限与下限之差,称为组距。所划分的区间数,则称为组数。组距与组数呈反比关系。单项式与组距式的定义与适用条件。(2)组限与组中值(三)频率分布1、频率分布的性质:一是各组频率都是一个介于0与1之间的分数,即大于0而小于1;二是各组频率之和等于1。2、累计频率分布各组累计频数与总频数之比,就形成累计频率分布。累计分布有向上累计分布与向下累计分布两种。第三节 统计图表 一、统计表(一)统计表的概念和作用经过统计整理、汇总所得的统计资料,按一定的次序和格式列在一定的表格上,就形成了统计表。(二)统计表的结构统计表从形式上看,包括总标题、横行标题,纵栏标题及数字资料。统计表从内容上看,包括主词和宾词两部分。(三)统计表的种类按主词是否分组及分组的程度,分为简单表、分组表、复合表。(四)宾词指标的设计(五)编制统计表应注意的问题。二、统计图了解直方图、折线图、曲线图、累计曲线图(介绍洛仑兹曲线和基尼系数)、茎叶图和箱形图。第三章 变量分布特征的描述 本章介绍如何对变量分布的特征进行描述,具体要求:理解变量分布三大特征的含义;理解平均指标、离散指标和形状指标的意义与作用;熟练掌握各种平均数的计算方法并加以正确的应用,科学理解加权平均数中权数的意义,正确认识算术平均数与调和平均数之间的应用关系,以及算术平均数、中位数和众数三者之间的数量关系;熟练掌握各种离散指标的计算方法并加以正确的应用,尤其是要深刻理解方差、标准差和离散系数的内涵;熟练掌握偏度系数和峰度系数的计算方法并加以正确的应用。第一节 集中趋势的描述一、集中趋势与平均指标集中趋势亦称为趋中性,是指变量分布以某一数值为中心的倾向。平均指标是将变量的各变量值差异抽象化、以反映变量值一般水平或平均水平的指标,其数值表现平均数。平均指标是度量统计总体分布集中趋势或中心位置的指标。平均指标的作用表现在五个方面。平均数因计算方法不同可分为数值平均数和位置平均数两类。数值平均数有算术平均数、调和平均数和几何平均数,位置平均数有中位数、众数和分位数。二、数值平均数(一)算术平均数()算术平均数的基本公式:总体标志总量/总体单位总数。 1、简单算术平均数:=x/n2、加权算术平均数:=xf/f=x(f/f)3、算术平均数的数学性质(二)调和平均数(H)它是变量值倒数的算术平均数的倒数。又称倒数平均数。它是算术平均数的变形。 1、简单调和平均数:H=n/(1/x)2、加权调和平均数:H=m/(m/x)(三)由相对数或平均数计算平均数当掌握了一个相对数(或平均数)的分母资料而不知道分子资料时,应采用加权算术平均法计算其平均数;反之,当掌握了一个相对数(或平均数)的分子资料而不知道其分母资料时,应采用加权调和平均法计算其平均数。(四)几何平均数(G)几何平均数是若干项变量值的连乘积开项数次方根的结果,它是计算平均比率和平均速度最常用的一种方法。1. 单几何平均数的计算:G=2、加权几何平均数的计算:G= 3、几何平均数与算术平均数、调和平均数的数学关系HG三、位置平均数 (一)中位数(Me)将总体单位的某一数量标志的各个数值按大小顺序排列,居中间位置的那个数值即为中位数。中位数的计算。分位数:将变量的数值按大小顺序排列并等分为若干部分后,处于等分点位置的数值。二、众数(Mo)众数是指总体中出现次数最多的那个标志值。众数的计算。三、众数、中位数和算术平均数的关系在对称分布(即正态)时,=Me=Mo在右偏时, MeMo在左偏时, MeMo并且,适度偏态时, (-Mo)=3(-Me)第二节 离中趋势的描述一、离中趋势和离散指标所谓离中趋势,就是变量分布中各变量值背离中心值的倾向。用离散指标来反映。常用的离散指标主要有:全距(亦称极差)、四分位差、异众比率、平均差、标准差、离散系数等。二、离散指标的测度 (一)全距全距是总体各单位标志值中最大值与最小值之间的差距。全距计算公式。特点。(二)四分位差四分位差是四分位数中第一个四分位数与第三个四分位数之差,也称为内距或四分间距。计算公式及作用。(三)异众比率异众比率是分布数列中非众数组的频数与总频数之比。计算公式及作用。(四)平均差(AD)平均差就是总体各单位标志值对其算术平均数的离差的绝对值的算术平均数。 A.D.= (简单式) A.D. (加权式)(五)方差和标准差 方差是变量的各变量值与其均值的离差平方的算术平均数,标准差是方差的平方根。标准差的计算方法: (根据未分组数据) (根据变量数列)根据组距式数列计算的方差和标准差只是一个近似值;二是在根据样本数据(甚至是有限总体数据)计算方差和标准差时,分母应该是。方差和标准差的性质。(六)离散系数相对离散指标也叫离散系数变异系数或标准差系数,是变量的标准差与均值之比,通常用来表示,即: 三、是非标志的平均数和标准差是非标志,又称交替标志,它是用“是” “否”或“有”“无”来表示的。“是”或“非”的单位数在全体单位数中所占比例,称为“成数”,分别记为p和q。 q=1-p 是非标志的均值为p(对于“是”而言)是非标志的方差为p(1-p)=pq。第三节 分布形状的描述一、分布形状和形状指标变量分布的形状要用形状指标来反映。形状指标就是反映变量分布具体形状,即左右是否对称、偏斜程度与陡峭程度如何的指标。二、偏度系数偏度指变量分布偏斜的方向及其程度。偏度系数来实现的,通常用来表示。偏度系数的计算主要有三种方法。三、峰度系数1、概念峰度通常是指钟型分布的顶峰与标准正态分布相比偏扁平或偏尖陡的程度。分为三种情况:标准正态峰度、尖顶峰度和平顶峰度。峰度系数通常用来表示。2、峰度系数的计算主要采用动差法。第四章 抽样估计 本章介绍抽样估计的基本理论和方法,具体要求:理解抽样分布的含义及总体分布、样本分布和抽样分布三者的关系,掌握常用的抽样分布定理;通过对抽样中误差构成的了解,正确理解抽样误差的含义及三种表现形式之间的关系,深刻领会抽样极限误差、抽样概率度与抽样标准误三者之间的关系;了解优良估计量的评价标准,熟练掌握区间估计的基本原理;掌握简单随机抽样形式下总体均值、总体成数的区间估计,了解其他抽样组织形式的含义和特点;掌握确定样本容量的一般方法。第一节 抽样分布一、抽样分布的基本问题(一)总体分布及其特征总体分布的含义。常用的总体参数:总体均值和总体方差(标准差)(二)样本分布及其特征样本分布的含义。常见的样本统计量:样本均值和样本方差(标准差)。(三)抽样分布及其特征1、抽样分布的概念及影响因素抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。取决于五个因素:总体分布、样本容量、抽样方法、抽样组织形式、估计量构造。2、抽样分布形式样本均值的抽样分布和样本成数的抽样分布。3、抽样分布特征样本统计量的数学期望与方差二、常用的抽样分布定理第二节 抽样误差一、抽样中的误差构成抽样中的总误差可以分为两类:抽样误差和非抽样误差。二、抽样误差的表现形式(一)抽样实际误差抽样实际误差是指样本估计值与总体参数值之间的离差,表示为。(二)抽样标准误抽样标准误即抽样分布的标准差或样本统计量的标准差,表示为=。抽样标准误能衡量抽样误差大小的一般水平。(三)抽样极限误差抽样极限误差是指以样本估计总体所允许的最大误差范围,。它取决于两个因素:抽样标准误和抽样估计概率保证程度(置信水平):。抽样极限误差、抽样标准误和抽样概率保证程度三者关系:= 。其中,称为抽样概率度。第三节 参数估计方法1. 估计量的评价标准无偏性、有效性、一致性和充分性。2. 参数估计的方法(一)点估计用样本指标的实际值直接作为相应总体参数的估计值。即 , (二)区间估计指用一个具有一定可靠程度的区间范围来估计总体参数。区间估计的特点和要求。第四节 各种抽样组织形式的参数估计 一、简单随机抽样1、总体均值的估计重复和不重复抽样方法下抽样标准误差的计算。抽样极限误差和估计区间的计算。2、总体成数的估计重复和不重复抽样方法下抽样标准误差的计算。抽样极限误差和估计区间的计算。3、样本容量的确定重复和不重复抽样方法下样本的计算。二、分层抽样定义及特点三、等距抽样定义及特点、种类四、整群抽样定义及特点。五、多阶段抽样 定义及特点。第七章 相关与回归分析 本章对相关关系的概念、种类及相关分析、回归分析的原理进行了介绍,具体要求:了解相关关系的概念及种类;掌握相关分析的原理、几种常用相关系数的测定方法及相关系数取值含义;掌握回归分析的原理、方法及应用,重点掌握简单线性回归方程的拟合及应用,明确直线回归方程中待定参数的含义。第一节 相关分析的基本问题 一、相关关系与函数关系 (一)函数关系 是指现象之间存在的确定性的数量依存关系。(二)相关关系是指现象之间存在的非确定性的数量依存关系。(三)相关关系与函数关系的区别与联系 二、相关关系的种类完全相关、不完全相关、不相关;正相关、负相关;线性相关、非线性相关;单相关、多元相关。三、相关分析的主要内容第二节 相关关系的测度 一、相关关系的判断 (一)根据定性认识的判断(二)利用相关表进行判断(三)相关图 二、相关系数的测定 (一)直线相关系数的计算直线相关系数就是在线性相关的条件下说明两个变量之间相关关系密切程度的统计分析指标。直线相关系数的各种计算公式。直线相关系数r的取值和意义。(二)等级相关系数的测定方法1、斯皮尔曼(Spearman)相关系数2、肯德尔(Kendall)等级相关系数(自学)第三节 回归分析的基本问题 一、回归分析的含义 在研究变量间相关关系的基础上,测定变量之间相关的具体形式和数量关系的统计方法,称为回归分析法。二、回归分析的主要内容3. 回归分析的特点 4. 回归分析的种类 简单回归和多元回归;线性回归和非线性回归。 第四节 回归分析的模型一、简单线性回归分析(一)简单线性回归模型1、估计模型: 2、模型的经济含义(二)参数估计方法:最小平方法 或公式求解: a= 最小平方法的要求 (三)回归估计标准误具体衡量回归估计值精确度高低或回归方程代表性大小的统计分析指标,称为回归估计标准误,记为Sy.x。 (四)回归方程判定系数总变差=回归变差+剩余变差(五)回归方程的统计检验(六)因变量的置信区间估计置信区间的公式为: 二、多元线性回归分析三、非线性回归分析第八章 时间数列 本章重点讨论动态变化的统计数据分析方法问题,要求通过本章的学习,了解时间数列的含义、构成要素与编制原则,注意不同类型时间数列的区别与联系;掌握水平指标的计算,特别是序时平均数的计算;掌握各类速度指标的计算,特别是平均速度指标的计算;了解时间数列变动要素的分解,掌握长期趋势的测定方法,重点是基于最小平方法的趋势方程拟合;了解季节变动的含义及测定方法。第一节 时间数列的基本问题 一、时间数列的含义将某一统计指标在不同时间上的不同数值,按其时间先后顺序排列起来,即为时间数列。又称动态序列。时间数列的基本要素:现象所属时间及指标数值。时间数列分析的意义 二、时间数列的种类(一)绝对指标时间数列1、时期数列含义及特点2、时点数列含义及特点(二)相对指标时间数列(三)平均指标时间数列 三、时间数列的影响因素长期趋势(T)、循环变动(C)、季节变动(S)和不规则变动(I)。时间数列的分解模式:加法模型和乘法模型四、时间数列的编制原则总的原则是一致性。具体表现在时间规定方面、总体范围和经济内容方面、计算方法及计量单位方面等的一致性。第二节 时间数列的水平分析一、发展水平()又称发展量或时间数列水平,它实际就是时间数列中每一项指标数值。有最初水平、最末水平和中间水平之分。 二、平均发展水平() 是将时间数列中不同时期的发展水平加以平均而得的平均数,又称序时平均数或动态平均数。 (一)绝对指标时间数列的序时平均数 1、时期数列的序时平均数(简单算术平均)2、时点数列的序时平均数间隔相等连续时点数列,间隔不等连续时点数列。间隔相等间断时点数列,间隔不等间断时点数列。(二)相对指标时间数列和平均指标时间数列的序时平均数总的计算原则是:分子分母分别平均。 三、增长量增长量是时间数列中两个发展水平之差。环比增长量;定基增长量。二者相互关系。年距增长量。四、平均增长量指标平均增长量是说明现象在一定时期内平均每期的增长量。平均增长量的计算公式。第三节 时间数列的速度分析 一、发展速度指标发展速度是两个不同时期发展水平相对比而得到的相对数指标,用来说明报告期发展水平是基期水平的多少或百分之几。又称动态系数。环比发展速度;定基发展速度。二者相互关系。年距发展速度。 二、平均发展速度平均发展速度是说明某种现象在一段时期内平均逐期发展变动的相对程度。根据计算目的的不同,有两种方法。 1、水平法(几何平均法)表示从基期发展水平(ao)出发,平均每期以多大的速度()发展,才能达到最末期发展水平(an)2累计法(方程式法)表示从最初水平(ao)出发,平均每期以多大的速度()发展,才能使各期计算水平的累计总和与实际水平总和相等。三、增长速度增长速度是报告期增长量与基期发展水平之比,说明现象增长的相对程度。增长速度的计算。环比增长速度,定基增长速度,年距增长速度,弹性系数,增长1%的绝对值。四、平均增长速度平均增长速度=平均发展速度-1第四节 长期趋势的测定一、移动平均法移动平均是一种简单的修匀方法。它是对原有时间数列进行平均修匀,以削弱短期的偶然因素引起的变动影响,从而呈现时间数列的基本发展趋势。移动平均法的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论