统计学复习提纲详细

上传人：m*** IP属地：天津上传时间：2022-07-28 格式：DOCX 页数：31 大小：351.27KB 积分：25 举报 版权申诉

已阅读5页，还剩26页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第二学期统计学复习提纲第一章：绪论1、统计的含义、研究对象和特点一、统计的含义：人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。在不同的场合，统计一词有统计工作、统计资料、统计科学三种含义。二、统计的研究对象：是统计工作的规律，即搜集、整理和分析统计数据的方法，是一门方法论科学。（P11）三、统计的特点：1）数量性（最基本特点）；2）具体性；3）综合性（或者总体性）（P4）2、统计学的基本概念：总体、总体单位、标志、指标、变量一、总体：在某种共性的基础上由许多个别事物结合起来的整体。其特征1）同质性；2）大量性；3）差异性。其分类：1）有限总体；2）无限总体。（P

2、13）确定总体是为了确定调查研究的对象和范围，确定总体单位是为确定调查登记项目的承担者。二、总体单位：构成总体的个别事物。（P13）三、标志：指说明总体单位特征的名称，由标志名称+标志值构成。其分类：1）品质标志、数量标志；2）不变标志、可变标志（包括变异和变量）。（P15）四、指标：是说明总体数量特征的概念。由指标名称+指标值组成。五、变量：可变的数量标志。（P15）3、补充：标志和指标的区别和联系1）区别：指标说明总体的特征；而标志说明总体单位的特征指标只反映总体的数量特征；标志既可以反映总体单位的数量特征，也可以反映总体单位的品质特征2）联系：指标的数值是由总体各单位的数量标志的标志

3、值汇总而得到的第二章：统计调查1、统计调查的组织形式有哪些。（红色字体）2、什么是随机抽样；什么是非随机抽样。（蓝色字体）3、非随机抽样的类型（粉红色字体）一、普查：是指为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查。特点：涉及面广、工作量大、时间性强、耗费较多、组织工作复杂。二、随机抽样调查：是指按随机原则从总体中抽取部分单位进行调查，并借以推断和认识总体的一种统计方法。特点：最科学的非全面调查。三、非随机抽样调查：是指调查者有意识地或随意而非随机地从总体中抽取部分单位进行调查的统计方法。特点：一般不用于推算总体指标。1）重点抽样，是指只对总体中为数不多但影响颇大的重点

4、单位进行研究的一种非全面调查。特点：以较少的人力、物力和财力，几时地掌握总体的基本情况及其发展变化的基本趋势。2）典型抽样，是指根据对调查对象的初步了解，有意识地从中挑选具有代表性的单位进行研究的一种非全面调查。特点：唯物辩证法的引用，从个体了解一般，灵活反驳，反应迅速，省时省力，深入具体。作用：“解剖麻雀”，推论一般，指导全局。研究新生书屋，推广新鲜经验，促进新生事物的发展。有利于全局与典型、数字与轻狂的结合，促进统计研究的深化。（=!不可靠的马克思产物）3）任意抽样（方便抽样、随意抽样），是指调查者随意抽取调查单位进行调查的一种方法。特点：不能保证每个单位都有相同的中选机会。

5、（与随机抽样相区分）4）配额抽样，是在总体作若干种分类和样本总容量既定的轻狂下，按配额从总体各部分抽取调查单位进行调查的方法。四、定期统计报表：是指按国家统一规定的指标体系、表格形式、报送程序和报送时间,定期地自下向上地向国家和上级主管部门报送统计资料的一种统计调查形式。4、调查误差的概念和种类。一、调查误差的概念：是指调查所得的统计数字与调查对象的实际数量之间的差异。二、调查误差的种类：1）工作误差：由于调查工作中的失误造成的误差。（人为误差，理论上可以消除）2）代表性误差：以部分推断总体时必然存在的误差。（无法消除，但可以进行控制和计5、补充：统计资料的搜集方法。一、直接观察法。二、采访

6、法。三、报告法。四、通讯法。五、实验调查法。六、网上调查法。6、补充：调查方案的基本内容。一、统计调查的目的。二、调查对象、调查单位和报告单位。三、调查项目和调查表。四、调查的时间和地点。五、调查的方式、方法。六、调查工作的组织实施计划。7、补充：调查技术。一、自由回答法。二、二项选择法。三、多项选择法。四、赋值评价法。五、空位答题法。六、等级定位法。七、排序顺位法。八、比较选择法。九、连线配合法。第三章：统计整理1、统计分组：组数、组距、组限、组中值（及其计算）一、组数：即将总体分为几组。1）品质分组的组数由两个因素决定：事物本身的特点和统计研究的任务2）数量分组的组数由两个因

7、素决定：全距=最大标志值-最小标志值组距=各组最大标志值（上限）-各组最小标志值（下限）=全距一组数二、组距：各组的最大标志值（上限）与最小标志值（下限）之差。三、组限：是指每组两端的数值，其中每组的起点数值（最小值）称为下限，最点数值（最大值）称为上限。四、组中值：是各组组距的中点值，代表组内各标志值的一般水平，具有平均数性质（但不是平均数）。五、计算：1）重合式：指相邻两组中，前一组的上限和后一组的下限数值重合。一般用于连续型变量。组距= 上限-下限组中值二（上限+下限）+ 2=下限+组距/2=上限一组距/22）不重合式：指前一组的上限与后一组的下限，两值紧密相连而不相重复。一般用于离

8、散型变量。组距= 下组下限-本组下限 =本组上限-前组上限组中距=（本组下限+下一组下限）+2=本组下限+组距/2=下组下限组距/2补充：组数、组距确定的斯特杰斯经验公式n 1 3.3lgN.R X max X min dn 1 3.3lg Nn:组数，N：总体单位数，d:组距，R:全距X max：最大变量值，X min ：最小变量值2435485261合计20君某车阊工人日加工零件数分组1按零件数分2且频数（人）频率%）105109361101145101151198161201241428125129102013013461213513948合计50100补充：分组形式：一、单项式分组：1

9、）适合于离散变量2）将一个变量值作为一组3）适合于变量值变动幅度较小的情况二、组距式分组：1、适合于连续变量和变动幅度较大的离散变量2、适合于变量值较多的情况3、将变量值的一个区间作为一组必须遵循“不重不漏” 的原则4、可采用等距分组，也可采用不等距分组补充：等距分组与不等距分组：一、等距分组：标志变量在各组保持相等组距。在分组标志变化比较均匀的情况下适合用等距分组。二、不等距分组：标志变量在各组中的组距不相同。标志值急剧增长或下降时适合用不等距分组。2、分布数列及其种类；一、分布数列（次数分布或次数分配）：指反映总体单位在各组分布状况的一系列数字。分布数列组成要素：1）组的名称；2）各组次数

10、（频数）或频率二、分布数列的种类：1）按分组标志的不同：品质数列，是指按品质标志分组所形成的分布数列，它由各组名称和各组单位数构成。变量数列，是指按数量标志分组所形成的分布数列，由变量和次数两个要素组成。2）按分组形式不同：1）单项式数列，是指各组都由一个具体的变量值（单项）来表示的数列。2）组距式数列，是指各组都由两个变量值界定的变量区间（组距）来表示数列，又分为等距数列和不等距数列。3）按次数分布的特征不同：1）钟形分布数列，数列中愈靠近变量值中点分布次数愈多，愈远离变量值中点分布次数愈少。又分为对称分布、右偏分布和左偏分布。审核一分组一汇总一制表。二、兜坐理的分组：1）统施如：指根据

11、社会经济现象的特点和统计研究的目的要求，按某种重要标志把总体分成若干部分的科学分类。分组原则：组内尽量相似，组间尽量差异。统计分组的关键:选择分组标志；划分各组界限。2）统计分组的作用：划分社会现象的不同类型揭示社会经济现象的内部结构分析社会现象间的依存关系3）统计分组的种类：按分组的作用或目的不同：类型分组、结构分组和分析分组。按分组标志的多少和分组形式：简单分组、复合分组和并列分组。按分组标志性质：品质分组和数量分组。4）统计分组的标志选择：分组标志：是指将总体划分为性质不同的组的标准或依据。分组标志选择的要求：I要符合统计研究的目的和要求n必须选择最主要的标志作为分组依据m要考虑社会经济

12、现象所处的具体历史条件三、统计整理的汇总：1）概念：将统计资料归并到各组中去，并计算各组和总体的合计数的工作过程。2）作用：将各个调查单位的情况，汇总成总体情况，使我们能看到全体，进而揭示总体在多方面的数量特征。四、统计整理的制表：1）要合理安排统计表的结构。2）总标题应该简要反映表的基本内容，还要指出资料所属时间和地点。3）数据计量单位相同时，可放在表的右上角标明，不同时应放在每个指标后或单列出一列标明。4）表中的上下两条横线一般用粗线，其他线用细线。5）通常情况下，统计表的左右两边不封口。6）表中的数据一般是右对齐，有小数点时应以小数点对齐，而且小数点的位数应统7）对于没有数字的表格单

13、元，一般用“一”表示8）必要时可在表的下方加上注释第四章：总量指标和相对指标1、总量指标和种类；一、总量指标（绝对指标）：是反映社会经济现象在一定时间、地点条件下所达到的总规模、总水平或工作总量的综合指标。、二、总量指标的种类：1）按其反映总体内容不同：总体总量，即总体单位数，是由每个总体单位加总而得到的。标志总量，是指总体各单位某一数量标志的总和。2）按其反映时间状态的不同：时期指标（时期数），是指反映社会经济现象在一段时间内所达到的总规模、总水平或工作总量。时点指标（时点数），是指反映社会经济现象在某一时点（时刻）所达到的数量状态。3）按采用的计量单位不同：实物指标，是指以实物单位计量

14、的总量指标，即以事物的物理属性或自然属性作为计量单位的指标。价值指标，是指以货币为计量单位的总量指标。劳动量指标，是指以劳动量单位计量的总量指标。补充：时期指标与时点指标的比较:时期指标的特点1）时期指标数值连续统计2）不同时期的时期指标数值可以累计相加3）时期指标数值大小与统计期限长短有关时点指标的特点1）时点指标的数值间断统计2）不同时期的时点的指标数值不能累计相加3）时点指标的数值大小与其时间间隔长短无直接相关1、相对指标和种类；一、相对指标：两个有联系的统计指标进行对比的比值，用以反映现象的发展程度、结构、强度、普遍程度或比例关系。表现形式：成数；系数和倍数；百分数、千分数、万分数；

15、单名数和复名数二、相对指标的种类：1）计划完成相对数：现象在某一段时间内的实际完成数与计划完成数之比。作用：考核、反映计划完成的程度（进度）。计算公式：计划完成相对数 =实际完成数/计划完成数x 100%产量、产值增长百分数：计划完成相对数=（100%+实际增长）/（100%+计戈ij增长）x 100%产品成本降低百分数：计划完成相对数=（100%-实际降低）/（100%-计划规定降低）X100%2）结构相对数：总体中某部分数值与该总体数值对比的比值。作用：反映总体内部构成情况的综合指标。特点：必须与统计分组相结合；分子的数值是分母数值的一部分；总体中各部分比重之和等于1或100%;表现

16、形式为无名数（百分数、千分数或成数）。计算公式：结构相对数 =总体某部分数值/总体数值X 100%3）比例相对数：同一总体内某一部分数值与另一部分数值对比的比值。作用：反映总体各部分间的内在联系与比例关系。（同一总体不同部分比较）特点：对比的分子分母属于同一总体；分子分母可以互换（与结构相对数的区别）；比例相对数的数值，一般用百分数或几比几的形式表示。计算公式：比例相对数 =总体中某一部分数值/同一总体另一部分数值x 100%4）比较相对数：同一时间的同类指标在不同空间对比的比值。作用：反映同类现象在不同空间的数量差异或不平衡程度，发现先进与后进。特点：分子分母的数值分别属于不同的总体；

17、分子分母是同类指标；分子分母可以互换。计算公式：比较相对数二甲地区某指标数值/乙地区同一指标数值X 100%5）动态相对数：某一社会经济现象在不同时期两个数值对比的比率，又称发展速度或指数。作用：反映事物发展变化的方向与程度。其中：报告期又称计算期，是研究或计算时期。基期是作为比较基础的时期。计算公式：动态相对数 =报告期数值/基期数值X 100%6）强度相对指标：两个性质不同但有一定联系的总量指标之间的对比。作用：反映事物存在的密度、普遍程度、运动强度、负担强度；反映经济效益的高低。特点强度相对数一般采用有名数（复名数）为计量单位，即由分子分母原有的计量单位构成。有的强度相对指标分子分

18、母可以互换，有正指标和逆指标，正指标的比值的大小与其反映的强度、密度和普遍程度成正比，而逆指标正好相反。计算公式：强度相对数 =某一指标数值/另一有联系的指标数值x 100%第五章：平均指标1、平均指标及其种类；一、平均指标：同质总体某一标志在一定时间、地点、条件下所达到的一般水平，是总体的代表值，它描述分布数列的集中趋势。特点：同质性、代表性和抽象性。作用：可以比较同类现象在不同单位、不同地区间的平均水平；可以比较同类现象在不同时期的平均水平；可用于研究事物之间的依存关系；利用平均数还可以进行推算和预测。二、平均指标的种类：1）数值平均数：算术平均数、调和平均数和几何平均数。2）

19、位置平均数：众数和中位数。、各种平均指标的计算:、算术平均数：算术平均数 =同一总体的标志总量/同一总体的总体总量Xii 1nXXif1X2 f2ff1）简单算术平均数:X Xi Xa L Xn n2）加权算术平均数：L q X 1 fi X ”2 L X n fnXfX & 。f22L fnf3）交替标志平均数：以1作为具有某种属性的单位标志值，以0作为不具有某种属性的单位标志值。利用加权算术平均数可得。补充：算术平均数的数学性质：1）算术平均数与总体单位数的乘积，等于各单位标志值的总和。 TOC o 1-5 h z 2）各单位标志值与算术平均数离差之和等于0.3）各单位标志值与算术平均数离

20、差平方之和为最小。4）对各单位标志值加或减一个任意数a,则算术平均数也要增加或者减少该数a。5）对各单位标志值乘以或除以一个任意数b,则算术平均数也要乘以或除以该数bo二、调和平均数（倒数平均数）1）简单调和平均数：是标志值倒数的算数平均数的倒数。计算公式:H1n111111XX2XnX1X2Xnnn 1i 1 Xi2）加权调和平均数：是指各单位标志值倒数的加权算术平均数的倒数。计算公式：m1m2mkmiH x.i 1m1m2mkk mX1X2.Xki 1 X inn 3）由相对数或平均数计算平均数：（P110）三、几何平均数：几何平均法是n个变量连乘积的n次根。一般适用于各变量值之间存在环

21、比关系的事物。1）简单几何平均数： _nG nx x2 x3 .X n X.2）加权几何平均数：3）注意:变量数列中任何一个变量值不能为0, 一个为0,则几何平均数为 0。用环比指数计算的几何平均易受最初水平和最末水平的影响。几何平均法主要用于动态平均数的计算。四、众数：总体中出现次数最多的变量值，通常以符号M0表示。优点：不受极端值的影响。可能没有众数或有几个众数。1）由组距数列计算众数：第一步确定众数所在的组，第二步通过公式计算众数值。下限公式：M=L+Ai/（ A i+A 2） Xi上限公式： M=U- A 2/（ A i+ A 2） X i2）通过绘图来求众数：第一步画相邻三组次数分布

22、直方图，第二步连接相邻两组次数差的对角线，第三步以对角线的交点向 X轴垂线，它与X轴的交点即为众数。通常以符号五、中位数：总体各单位标志值按大小排序后，处于中间位置上的标志值, M表示。优点：不受极端值的影响。1）未分组数据：中位数位置 =（N+1）/22）组距分组数据：中位数位置二N/23、几种平均数的关系：1）算术平均数、众数和中位数的关系:1、变异度指标的概念和种类；变异度指标（标志变动度指标）：是综合反映总体各单位标志值及其分布的差异程度的指标。变异度指标的作用：1）衡量平均数代表性的重要尺度。变异度指标值越大，平均数的代表性越低；反之亦然。2）衡量现象变动的稳定性和均衡程度。3

23、）计算抽样误差和确定样本量的依据。变异度指标的种类：1）全距、四分位差2）平均差、标准差、方差、离散系数3）偏度、峰度2、掌握各种变异度指标的含义和计算（若考计算，数据都很少，计算过程非常简单）：一、全距（极差）：是指总体各单位标志值中最大值与最小值之差，一般以R表示。计算公式：R=Xma）-X min二、四分位差：是指四分位数中间两个分位数之差，一般以Q表示。优缺点：计算简单，意义清楚，反映现象的差异程度较粗略和不全面，实用价值甚小。计算公式：四分位差 Q噪三个四分位数 Q一第一个四分位数 Q三、平均差：是指总体各单位标志值对其算术平均数的离差绝对值的算术平均数，一般以A.D.表不优缺点：

24、能全面反映一组数据的离散程度。由于采用绝对值运算，数学性质较差，实际中应用较少。计算公式:未分组数据（不加权）A.D.组距分组数据（加权）A.D.四、标准差（均方差）：是总体各单位标志值对算术平均数的离差的平方的算术平均数的平方根。一般以（T表示。方差：标准差的平方。一般以b2表示。优点：反映了各单位标志值与算术平均数的平均差异；且计算简单，易于数学处理。计算公式：1）总体方差和标准差：未分组数据（不加权）(x X)2(X X)2 组距分组数据（加权）2 （X X）&f f-1X)2f2)样本方差和标准差：未分组数据nn(XiiX)22c2 JiJs n 1组距分组数据k(Mi x)22f

25、i2 ii 1s n 12(Mi X)2fiii力n五、变异系数（离散系数或标志变动度系数）比得到的相对数。平均差系数：平均差与算术平均数的比值。标准差系数：标准差与算术平均数的比值。:是指各种变异度指标与其算术平均数对Va.d. =A.D./xV = 0- /X3、偏度和峰度：了解含义；能根据偏度和峰度系数判断分布的特点。一、偏度：反映总体次数分布偏侧方向和程度的指标。偏态系数：是偏度与总体标准差之比，反映分布列的相对偏斜程度。偏态系数=0为对称分布；偏态系数 0为右偏分布；偏态系数 0,右偏； SKP0,右偏；a 0,左偏。相对数指标。峰度磔偏分科度适中；偏态系数3为尖峰分布。右偏分布

26、计算公式：3 =m/b 4=mVm22或者一 4XFiii 1N 4补充：k阶隙点动若和 k阶中点动差的求法。(P156)补充:峰度的mi=M扁平分伍ms=M-3M2M+2MmpM4-4MlM1+6MM3南补充：间接法。变量值较大且为等距数列的情况。1)先对变量x作线性变化，令 y=(x-a)/b , a为中间组的组中值，b为(x-a)的最大公约数。2)求y的k阶原点动差。3)由y的k阶原点动差推算y的k阶中心动差。4)由y的中心动差推算 x的中心动差。公式为：mv(x)=b k. mk(y)第七章：抽样调查1、了解几种常用分布的特点：二项分布、泊松分布和(标准)正态分布一、二项分布：进行

27、n次重复试验，出现“成功”的次数的概率分布。PX=x=Cnx. px. (1-p) n-x, E(x)=np , D(x)=np(1-p)二、泊松分布：用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布。E(x)=D(x尸入。eP X x=e=(x 0,1,2,n)x!一给定的时间间隔、长度、面积、体积内“成功”的平均数，e = 2.71828 , x 给定的时间间隔、长度、面积、体积内“成功”的次数。f(x)e三、(标准)正态分布:/刈=随机变量X的频数, (- x ,一般以H表示。备择假设：与原假设对立的假设，研究者想收集证据予以支持的假设，总有w, v或,一

28、般以H表示。3、基本概念：显著性水平、置信水平、置信区间、P值；双侧检验和单侧检验；z检验、t检验一、显著性水平、置信水平、置信区间、P值：1）显著性水平：原假设为真时，拒绝原假设的概率，由研究者事先确定，一般以a表示，常用 a 值：0.01、0.05、0.10。2）置信水平：是指总体参数值落在样本统计值某一区间的概率，1- a。3）置信区间：是指在一定的概率保证程度下，某总体指标所在的区间范围，用 p- Sx p+ 8 x表不。P值：在原假设为真的条件下，检验统计量的观察值大于或等于其计算值的概率，反映实际观测到的数据与原假设H0之间不一致的程度。决策规则：单侧检验：若pa，则拒绝H；双侧检

29、验：若 p”或“”的假设检验。备择假设的方向为“ ”，称为右侧检验。不仅仅要检验样本平均数与总体平均数或样本成数与总体成数有没有显著差异，而且要追究是否发生预先指定方向的差异时，应采用单侧检验。二、z检验、t检验：z检验（正态分布检验）：（P233）t检验（t分布检验）（P234）4、总体均值检验、小样本检验方法的总结:假设双侧检验左侧检验右侧检验假设形式统计量”14拒绝域t - Q - DF式并-1）尸值决策第一类错误（弃真错误）：原假设为真时，拒绝原假设，第一类错误的概率为（显著性水平）。第二类错误（取伪错误）：原假设为假时，接受原假设，第二类错误的概率为3 （Beta）。“错误和3错误的

30、关系：a和3就像跷跷板，a小3就大，a大3就小，二者不能同时减少。影响3错误的因素：1）总体参数的真值：随着假设的总体参数的减少而增大；2）显著性水平：当减少时增大；3）总体标准差：当增大时增大；4）样本容量n：当n减少时增大。第九章：相关和回归1、区分函数关系和相关关系一、函数关系：是指现象之间存在着严格的依存关系。特点：对于某一变量的每一个数值，都有另一变量的确定值与之相对应，并且这种关系可用一个数学表达式反映出来。二、相关关系：是指现象之间存在着非严格的、不确定的依存关系。特点：某一现象在数量上发生变化会影响另一现象数量上的变化，而且这种变化在数量上具有一定的随机性。三、区别：1）函数关

31、系中两变量之间的关系是确定的；相关关系中两变量之间的关系是不确定。2）函数关系变量之间关系可以用方程y = f （x）表示出来；相关关系不能用一定的方程表示。3）函数关系是相关关系的特例，函数关系是完全的相关关系。2、相关关系的种类、相关系数的取值范围一、相关关系的种类：1）按相关的程度分为：完全相关、不完全相关、不相关。2）按相关的方向分为：正相关、负相关。3）按相关的形式分为：线性相关、非线性相关。4）按影响因素的多少分为：单相关、复相关。二、相关系数取值范围：1）符号：如果为正号，则表示正相关，如果为负号，则表示负相关。通俗点说，正相关就是变量会与参照数同方向变动，负相关就是变量与参照

32、数反向变动；2、取值为0,这是极端，表示不相关；3、取值为1,表示完全正相关，而且呈同向变动的幅度是一样的；4、如果为-1 ,表示完全负相关，以同样的幅度反向变动；5、取值范围：-1 , 1。3、熟悉回归的含义和种类；一、回归：研究自变量与因变量之间关系形势的分析方法，其目的在于根据已知自变量来估计和与预测因变量的总平均值。二、种类：1）按变量多少：一元回归方程和多元回归方程。2）按是否线性：线性回归方程和非线性回归方程。3）按是否有滞后关系：自身回归方程和无自身回归方程。4、相关分析和回归分析的区别和联系；一、相关分析：是研究现象之间是否存在某种依存关系，并对具体有依存关系的现象探讨其相关方

33、向以及相关程度，是研究随机变量之间的相关关系的一种统计方法。二、回归分析：是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。三、区别：1）相关分析中，变量 x变量y处于平等的地位；回归分析中，变量 y称为因变量，处在被解释的地位，x称为自变量，用于预测因变量的变化；2）相关分析中所涉及的变量 x和y都是随机变量；回归分析中，因变量y是随机变量，自变量x可以是随机变量，也可以是非随机的确定变量；3）相关分析主要是描述两个变量之间线性关系的密切程度；回归分析不仅可以揭示变量x对变量y的影响大小，还可以由回归方程进行预测和控制。 ?0 y紫四、联系：都是研究及测度两个或两个以上

34、变量之间关系的方法。5、简单直线回归的原理：最小平方法的中心思想一、相关分析与回归分析的步骤：1)进行相关关系的定性分析；2)确定回归方程；3)计算相关系数或相关指数，对回归方程变量之间的相关性进行显著性检验；4)利用回归方程式进行推算和预测；5)对推算和预测作出置信区间估计。二、简单直线回归的原理：1)简单直线回归分析：对两个具有线性关系的变量，配合线性回归方程，并根据自变量的变动来测定因变量平均发展趋势的分析方法。2)简单直线回归原理：总体回归参数3 0和3 1是未知的，必须利用样本数据去估计；样本统计量3。和3 1代替回归方程中的未知参数 3。和3 1,就得到了估计的回归方程；一元线性

35、回归中的估计回归方程为：?0?1X一元线性回归模型：描述因变量 y如何依赖于自变量x和误差项的方程称为回归模型。y = 3 0 + 3 1 x + e , 3。和3 1成为模型的参数。误差项e是一个期望值为 0的随机变量，即 E( e )=0。对于一个给定的X值，y的期望值为E ( y ) =0+ 1 X ；对于所有的X值，e的方差b 2都相同；误差项s是一个服从正态分布的随机变量，且相互独立。即e N( 0 , b 2 )。I独立性意味着对于一个特定的X值，它所对应的e与其他 X值所对应的e不相关。n对于一个特定的X值，它所对应的y值与其他X所对应的y值也不相关。一元线性回归方程：描述y

36、的平均值或期望值如何依赖于x的方程称为回归方程。E( y ) =3 0 + 3 1 x ,。是回归直线在y轴上的截距，是当 x=0时y的期望值；1是直线的斜率，称为回归系数，表示当 x每变动一个单位时，y的平均变动值。三、最小平方法的中心思想：通过数学方程，配合一条较为理想的趋势线，这条趋势线必须满足；1)原数列的观测值与方程的估计值的离差平方和为最小； TOC o 1-5 h z 2)原数列的观测值与方程的估计值的离差总和为0。即 nn(y y)2(y?0?x)2 最小 HYPERLINK l bookmark146 o Current Document ii 1i 1根据最小二乘法的要求，

37、可得求解？和?的公式如下01mmmn xhyh% yh? ii 11ii i 1nn222n xixii 1i 16、总平方和、回归平方和和残差平方和；可决系数的含义、可决系数和相关系数之间的数量关系。一、总方差和、回归平方和和残差平方和；1）总方差和（总变差、SST或Lyy）：反映因变量的n个观测值与其均值的总离差；2）回归平方和（回归变差、SSR或U）:反映自变量 x的变化对因变量 y取值变化的影响，或者说，是由于 x与y之间的线性关系引起的y的取值变化；3）残差平方和（剩余变差、SSE或Q）:反映除x以外的其他因素对 y取值的影响。 TOC o 1-5 h z mmm220=222/

38、y?ii y% ?i 1i 1ii 1iSST （Lyy） = SSR （U） + SSE （Q）、可决系数的含义、可决系数和相关系数之间的数量关系。1）可决系数（R2）:是回归变差（回归平方和）与总变差（总方差和）之比，是评价两个变量之间线性关系强弱的一个重要指标，反映回归直线的拟合程度。公式:SSRSSTm?iyii 1?2取值范围在0 , 1 myiii 1y之间;22R21,说明回归方程拟合的越好;R 0,说明回归方程拟合的越差。2）可决系数和相关系数之间的数量关系：判定系数等于相关系数的平方，即R2=r2。7、重点：在Excel回归分析表中，学会分析几方面：相关系数及其相关关系、判

39、定系数及其含义；回归系数显著性的P值检验；模型整体显著性的F检验；写出回归方程，并对回归系数的含义进行解释；根据构建的回归模型进行预测；了解回归系数的标准误差、t统计量的含义。回归统计HultipLe R0.S43571艮 Square0. 711613Adjusted R Square0. &99074标推误差1.979948观测值25方差分析dfSSMSFSignificance F回归分析1222. 486222, 48656.753841. 18349E-07域差2390.164423. 920192总计24312. 6504匚口iqt5标清误差t 5t 3P-irg-liuLE1U

40、pper 35%不时与工收卜限95,玳ntercert-0. 8295206170.7230U3FJ旧60. 2630&3-2,325246230, 66208392 32525 0.520839务行度余前Lt）a, 03739707CL 00503T. 533 Bl 51. LEBO70.0274S9050, 04E30036Qg 02T4sg0 胡30036一、相关系数及其相关关系：（Multiple R 和x的Coefficients联合判断）R=0为不相关；Excel默认Multiple R 的取值为0,1,要判断正负相关则需要用x的各项贷款余额c # . 1（8）0.03789470

41、7n 太口壬Coefficients二_1, Coefficients 大于 0,则正相关;Coefficients小于0,则负相关。二、判定系数及其含义：（Adjusted R Square ）可决系数（F2）:是评价两个变量之间线性关系强弱的一个重要指标，反映回归直线的拟合程度。取值范围在0 , 1 之间；R21,说明回归方程拟合的越好；R2 0,说明回归方程拟合的越差。三、回归系数显著性的P值检验：（x P-value ）若pa ,则不拒绝 H0。四、模型整体显著性的F检验：（F）F值为F”的值，进行比较。FF”，表明两组数据存在显著差异。五、写出回归方程，并对回归系数的含义进行解释：（

42、Coefficients ）3 0 为 Intercept Coefficients 的值，3 1为 x Coefficients 的值，y = 3。+ 3 1 x。0是回归直线在y轴上的截距，是当x=0时y的期望值；i是直线的斜率，称为回归系数，表示当 x每变动一个单位时，y的平均变动值。六、根据构建的回归模型进行预测：把给出的x或y代入回归方程，得出预测结果即可。七、了解回归系数的标准误差：（标准误差）回归系数的标准误差（S）为标准误差1. 979948用给定的x推测出y的预期结果后，根据所给的置信度（置信水平），求置信区间：1）落在y 土&区间内的概率为 68.27%;2）落在y 2&

43、区间内的概率为 95.45%;3）落在y 3&区间内的概率为 99.73%。八、t统计量的含义：（x t Stat ）t检验还可以用来检验样本为来自一元正态分布的总体的期望，即均值；和检验样本为来自二元正态分布的总体的期望是否相等。查表求出t”在n-1自由度下的值，若 t（x t Stat） t”则拒绝也若t（x t Stat） t“则不拒绝H）o第十章时间数列分析指标1、区分时期数列和时点数列一、时期数列，是指由一系列同类的总量指标数值所构成的时间数列。二、时点数列，是指由反映某种现象在一定时点（瞬间）上的发展状况的总量指标所构成的绝对数时间数列。2、水平分析指标：发展水平、平均发展水平

44、；增长量、平均增长量;一、发展水平：是指时间数列中的每一具体指标值，反映某种社会经济现象在一定时期或时点所达到的规模或水平。通常用ai表示。二、平均发展水平（序时平均数或动态平均数）：是指将不同时间的发展水平加以平均而得到的平均数，说明某一现象在不同时间数值的一般水平。1）时间数列的序时平均数：a2 L ann a二n2）时点数列的序时平均数: I根据每日时点资料计算时点数列资料逐日登记：a 琢 a2 L ann , n时点数列资料不是逐日登记:% ail a2f2 L anfnaffif2 Lfna 2 % Lan1ana& aa，L ，ann iam 力am2n根据间断相等的时点资料计算

45、首末班折法n 1m根据间断不等的时点资料计算计算出两个时点数值之间的平均数用相隔的时期长度（fi ）加权计算总的平均数aHa2a22%212% f2 an 力 am场 L 2 fnn 1L fn 1说明社会经济现象在一定时三、增长量：是指时间数列中计算期水平与基期水平之差, 期内增减变化的绝对数量。1）累计增长量：al ao), a2 ao,L , an ao2)逐期增长量：an ao),a2 an，L ,ann ani四、平均增长量：是指逐期增长量的简单算术平均数，说明经济现象在一段较长时间内，平均每期增减变化的数量。公式为：平均增长量=逐期增长量之和/逐期增长量个数=累计增长量/ （观

46、察期个数-1）3、速度分析指标：（环比、定基）发展速度、（环比、定基）增长速度；一、发展速度：是指计算期发展水平与基期发展水平之比，表示计算期水平已达到或相当于基期水平之多少，反映了某种社会经济现象在一定时期内发展的方向和速度，通常用倍数或百分数表示。1）定基发展速度：计算期水平与某一固定时期水平之比。 TOC o 1-5 h z al a2 a33 L ann ,ao ao ao）ao）2）环比发展速度：计算期水平与前一时期水平之比。色 0a3L ann, ,aoalaa ann 1二、增长速度：是指计算期增长量与基期发展水平之比，说明社会经济现象在一定时期内增减的快慢程度，通常用倍数或

47、百分数表示。公式：增长速度=增长量/基期水平=（计算期水平-基期水平）/基期水平1）定基增长速度：亘 1生 i,ai 1,L ,包 1aoa（oaoao）2）环比增长速度：曳 1,a2 1学 1,L , 1aoa1iaaan 14、平均发展速度和平均增长速度说明某种社会经济现象在一段较一、平均发展速度：是指环比发展速度的序时平均数, 长时期内逐期发展变化的平均速度。1）水平法（几何平均法）：一般用这种来求解。R-定期发展速度2）累计法（方程法）：原理：从最初水平出发，按照此法计算的平均发展速度所推算出来的各期发展水平的总和，应等于各期实际发展水平的累计数公式：解方程，正根为平均发展速度。na

48、ii 1ao二、平均增长速度：平均增长速度=平均发展速度-1,说明某种社会经济现象在一段较长时期内逐期平均增减变化的程度。5、增长1%勺绝对值速度每增长一个百分点而增加的绝对量，用于弥补速度分析中的局限性。公式：增长1%色对值=逐期增长量/（环比增长速度x 100）=前期水平/100第十一章时间数列预测方法1、时间数列的因素分解：长期趋势、季节变动、循环变动和不规则变动及其含义。时间数列，是指社会经济现象发展过程的数量表现，隐含着社会经济现象发展变化的规律。一、长期趋势，是指受事物发展的根本原因制约而形成的事物在一段较长时期内持续增长或持续下降的基本趋势。二、季节变动，是指由于自然条件、

49、社会条件的影响，社会经济现象在 1年内随着季节的转变而引起的周期性变动。三、循环变动：是指社会经济现象以若干年为周期呈现波浪式的变动。四、不规则变动：由意外的偶然性因素引起的，突然发生的，无周期的随机波动。2、了解时间数列预测分析的基本原理：乘法型和加法型时间数列预测分析的基本原理：在长期趋势、季节变动、循环变动和不规则变动四种因素中，先剔除其余几种因素的影响来测定一种因素变动的影响；然后再结合起来测定各种因素变动的综合影响。一、乘法型：是指时间数列由各种因素相乘的乘积所形成的结构类型。关系式为：Y = T xsxcx I二、加法型：是指时间数列由各种因素相加的总和所形成的结构类型。关

50、系式为：Y = T + S + C + I三、乘加法，是指时间数列由有关因素分别乘积之后再相加的总和所形成的结构类型。关系式为：Y=TX S+CX I3、长期趋势预测：了解时距扩大法、移动平均法、一次指数平滑法、最小平方一、时距扩大法（间隔扩大法）：是指将原有时间数列中若干时期加以合并，得出扩大间隔的较大时间单位的数据，以便消除较小时距单位所受到的不规则变动影响，以显示事物发展变化长期趋势的方法。二、移动平均法，是指根据时间数列资料，逐项递推移动，依次计算包含一定项数的扩大时距平均数，形成一个新的时间数列，反映长期趋势并进行外推预测的方法。P为奇数项:ai 叫 1 L ai pp 11PP为

51、偶数项aiiaii P二aii 11 L -22P2）移动间隔的长度应长短注意：1）移动平均后的趋势值应放在各移动项的中间位置;适中。三、指数平滑法，是一种特殊的加权平均法。利用本期实际观察值和本期趋势预测值，分别给予不同权数进行加权，求得一个指数平滑值，作为下一期趋势预测的预测方法。一次指数平滑值：S（1）Vt 1S11四、最小平方法（最小二乘法）：要求实际值和趋势预测值的离差平法和为最小值，列出联立方程，估计参数，配合趋势模型，是分析预测长期趋势的方法。1）直线模型：Tt a bx2）指数模型：Tt=abx。（其对数直线模型为：lg T t=|g a + x Ig b ）3）二次曲线：Tt a bx cx

人人文库> 全部分类> 办公材料 > 办公文档

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

统计学复习提纲详细

文档简介

温馨提示

最新文档

评论

统计学复习提纲详细

文档简介

温馨提示

最新文档

评论

相关文档