《统计学》名词解释及公式_第1页
《统计学》名词解释及公式_第2页
《统计学》名词解释及公式_第3页
《统计学》名词解释及公式_第4页
《统计学》名词解释及公式_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章统计与统计数据、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点统计及其应用领域什么是统计学►概念:统计学,描述统计,推断统计。统计的应用领域►统计在工商管理中的应用。►统计的其他应用领域。数据的类型分类数据、顺序数据、数值型数据►概念:分类数据,顺序数据,数值型数据。►不同数据的特点。观测数据和实验数据►概念:观测数据,实验数据。截面数据和时间序列数据►概念:截面数据,时间序列数据。数据来源数据的间接来源►统计数据的间接来源。►二手数据的特点。数据的直接来源►概念:抽样调查,普查。►数据的间接来源。►数据的收集方法。调查方案设计►调查方案的内容。数据质量►概念。抽样误差,非抽样误差。►统计数据的质量。统计中的几个基本概念总体和样本►概念:总体,样本。参数和统计量►概念:参数,统计量。变量►概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。二、主要术语统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。描述统计:研究数据收集、处理和描述的统计学分支。推断统计:研究如何利用样本数据来推断总体特征的统计学分支。分类数据:只能归于某一类别的非数字型数据。顺序数据:只能归于某一有序类别的非数字型数据。数值型数据:按数字尺度测量的观察值。观测数据:通过调查或观测而收集到的数据。实验数据:在实验中控制实验对象而收集到的数据。截面数据:在相同或近似相同的时间点上收集的数据。时间序列数据:在不同时间上收集到的数据。

抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。普查:为特定目的而专门组织的全面调查。总体:包含所研究的全部个体(数据)的集合。样本:从总体中抽取的一部分元素的集合。样本容量:也称样本量,是构成样本的元素数目。参数:用来描述总体特征的概括性数字度量。统计量:用来描述样本特征的概括性数字度量。变量:说明现象某种特征的概念。分类变量:说明事物类别的一个名称。顺序变量:说明事物有序类别的一个名称。数值型变量:说明事物数字特征的一个名称。离散型变量:只能取可数值的变量。连续型变量:可以在一个或多个区间中取任何值的变量。四、习题答案DDABADDDABADCBAAC、CBACDCACDACCBDCBDADABCAAADBBCCDCDABCACDACDAB第2章数据的图表展示、学习指导数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点数据的预处理数据审核►数据审核的目的。►原始数据和二手数据的审核内容。数据排序►数据排序的目的。►分类数据和数值型数据的排序方法。数据筛选►数据筛选的目的。►用Excel进行数据筛选。数据透视表►数据透视表的用途。►用Excel进行数据透视。品质数据的整理与展示分类数据的整理与图示概念:频数,频数分布,比例,百分比,比率。用Excel制作分类数据的频数分布表。分类数据的图示:条形图,帕累托图,对比条形图,饼图。顺序数据的整理与图示概念:累积频数,累积频率。累积频数分布图。数值型数据的整理与展示数据分组概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。►频数分布表的制作步骤。用Excel制作频数分布表。数值型数据的图示►直方图的绘制。►茎叶图的绘制。►箱线图的绘制。►直方图与条形图的区别。►茎叶图与直方图的区别。►线图的绘制。►散点图的绘制。►气泡图的绘制。►雷达图的绘制。合理使用图表鉴别图形优劣的准则图形应包括的基本特征。鉴别图形优劣的准则。统计表的设计►统计表的结构。►统计表的设计。二、主要术语频数:落在某一特定类别(或组)中的数据个数。频数分布:数据在各类别(或组)中的分配。比例:一个样本(或总体)中各个部分的数据与全部数据之比。比率:样本(或总体)中各不同类别数值之间的比值。累积频数:将各有序类别或组的频数逐级累加起来得到的频数。数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距:一个组的上限与下限的差。组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。四、习题答案1.C8.B15.C22.D29.D2.A9.B16.B23.D30.C3.B10.C17.D24.B31.B4.C11.A18.D25.D32.C5.D12.B19.C26.B33.C6.B13.B20.B27.B34.A7.C14.C21.C28.D35.B第3章数据的概括性度量、学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点集中趋势的度量众数►概念:众数。►众数的特点。中位数和分位数概念:中位数,四分位数。►中位数和四分位数的特点。中位数和四分位数的计算。平均数►概念:平均数,简单平均数,加权平均数,几何平均数。►简单平均数和加权平均数的计算。►平均数的性质。►几何平均数的计算和应用场合。众数、中位数和平均数的比较►众数、中位数和平均数在分布上的关系。►众数、中位数和平均数的特点及应用场合。离散程度的度量异众比率概念:异众比率。异众比率的计算和应用场合。四分位差概念:四分位差。四分位差的计算和应用场合。方差和标准差►概念:极差,平均差,方差,标准差。►极差的计算和特点。►平均差的计算和特点。►样本方差和标准差的计算。►总体方差和标准差的计算。相对位置的度量概念:标准分数。►标准分数的计算和应用。经验法则。►切比雪夫不等式。离散系数►概念:离散系数。►离散系数的计算。►离散系数的用途。偏态与峰态的度量偏态及其测度►概念:偏态,偏态系数。►偏态系数的计算。►偏态系数数值的意义。峰态及其测度概念:峰态,峰态系数。►峰态系数的计算。►峰态系数数值的意义。用Excel计算描述统计量。Excel统计函数的应用。二、主要术语和公式(一)主要术语众数:一组数据中出现频数最多的变量值,用M。表示。中位数:一组数据排序后处于中间位置上的变量值,用Me表示。四分位数:一组数据排序后处于25%和75%位置上的值。平均数:一组数据相加后除以数据的个数而得到的结果。几何平均数:n个变量值乘积的n次方根,用Gm表示。异众比率:非众数组的频数占总频数的比率。四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。极差:也称全距,一组数据的最大值与最小值之差。平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。方差:各变量值与其平均数离差平方的平均数。标准差:方差的平方根。标准分数:变量值与其平均数的离差除以标准差后的值。离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。偏态:数据分布的不对称性。偏态系数:对数据分布不对称性的度量值。峰态:数据分布的平峰或尖峰程度。峰态系数:对数据分布峰态的度量值。(二)主要公式名称公式中位数M=<X]9X+X1"心n为奇数>n为偶数简单样本平均数/xix=4=1——n

加权样本平均数X=41 n几何平均数G=Jxxxxxx= xm 1 2 n]l i异众比率V= _L=1-sfmr乙f Nfi i四分位差Qd=Qu-Ql极差R=max(x.)-min(x^)简单平均差斗一xM=-i= d n加权平均差Nmi-ALMd=^= 简单样本方差N(x.-x)2S2=-i= n—1简单样本标准方差片(x.-x)2S=]l^= }n—1加权样本方差N(M.-x)2fS2=-i=1 n—1加权样本标准差NM-x)2fS=\'=‘ n—1标准分数x—xi S离散系数VS=S

未分组数据的偏态系数SK=——-——Z[iz^]3(n-l)(n-2) "s)分组数据的偏态系数E(MT)3fi iSK=-r=i ns3未分组数据的峰态系数n(n+1)E(x-x)4-3(E(x-x)2)2(n-1)(n-1)(n-2)(n-3)s4分组数据的峰态系数E(M-x)4fK= ——: 3ns4四、习题答案1.A19.C37.A55.B73.D2.C20.A38.C56.A74.C3.B21.B39.B57.B75.A4.C22.C40.A58.D76.D5.D23.C41.A59.A77.D6.B24.C42.B60.B78.A7.D25.C43.B61.C79.A8.A26.D44.A62.D80.C9.A27.A45.B63.A81.D10.C28.A46.A64.C82.D11.B29.B47.C65.D83.A12.C30.B48.D66.D84.A13.A31.A49.B67.C85.A14.B32.A50.A68.B86.D15.A33.B51.C69.D16.B34.B52.D70.D17.A35.A53.B71.A18.B36.B54.D72.B第4章抽样与参数估计一、学习指导参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。11章节主要内容学习要点抽样与抽样分布概率抽样方法►概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系统抽样,整群抽样。►用Excel抽取简单随机样本。抽样分布►概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布。►中心极限定理。►样本均值抽样分布的特征。►样本均值的抽样分布与总体分布的关系。►样本比例抽样分布的形式和特征。►样本方差抽样分布的形式。参数估计的估计量与估计值►概念:估计量,估计值。

一般问题点估计与区间估计►概念:点估计,区间估计,置信区间,置信水平。►置信区间构建的原理。►置信区间的解释。评价估计量的标准►概念:无偏性,有效性,一致性。总体均值的区间估计正态总体、方差已知,或非正态总体、大样本►正态总体、方差已知时的置信区间。►非正态总体、大样本时的置信区间。►用Excel计算给定a的正态分布的临界值。正态总体、方差未知、小样本►正态总体、方差已知时的小样本置信区间。►正态总体、方差未知时的小样本置信区间。►用Excel计算给定a的t分布的临界值。总体比例的区间估计总体比例的区间估计►总体比例的置信区间。总体方差的区间估计总体方差的区间估计►总体方差的直信区间。►用Excel计算给定a的x2分布的临界值。样本容量的确定估计总体均值时样本容量的确定►样本容量的计算方法。估计总体比例时样本容量的确定样本容量的计算方法。二、主要术语和公式(一)主要术语简单随机抽样:也称纯随机抽样,它是从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。简单随机样本:从含有N个元素的总体中,抽取n个元素作为样本,使得总体中每一个样本量为n的样本都有相同的机会(概率)被抽中。重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取n个元素为止。分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一^样本。整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。抽样分布:在重复选取样本量为n的样本时,由样本统计量的所有可能取值形成的相对频数分布。样本均值的抽样分布:在重复选取样本量为〃的样本时,由样本均值的所有可能取值形成的相对频数分布。样本比例抽样分布:在重复选取样本量为〃的样本时,由样本比例的所有可能取值形成的相对频数分布。标准误差:也称为标准误,它是样本统计量的抽样分布的标准差。估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量代替计算的标准误。估计量:用来估计总体参数的统计量的名称,用符号§表示。估计值:用来估计总体参数时计算出来的估计量的具体数值。点估计:用样本统计量§的某个取值直接作为总体参数。的估计值。区间估计:在点估计的基础上,给出总体参数估计的一个范围。置信区间:由样本统计量所构造的总体参数的估计区间。置信水平:也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。(二)主要公式名称公式总体均值的置信区间(止态总体,b已知)_ b尤+Z>La2"总体均值的置信区间(b未知,大样本)元土Z2亍总体均值的置信区间(正志总体,。未知,小样本)X土t.a2Jn总体比例的置信区间P士履丐总体方差的直信区间(n-1)s2<b2<(n-1)s2X2, 一一一X2..a-2 1—a,2估计总体均值时的样本容量_(%2)2b2—E2估计总体比例时的样本容量_(za2)2.兀(1-兀)— E2四、习题答案87.A121.B155.A189.C223.B88.B122.A156.B190.A224.A89.A123.B157.C191.B225.A90.B124.D158.C192.C226.D91.B125.B159.D193.A227.C92.C126.A160.B194.D228.B93.D127.C161.D195.A229.A94.C128.A162.D196.B230.A95.A129.B163.C197.C231.B96.C130.A164.C198.A232.B97.A131.C165.B199.A233.B98.A132.D166.C200.A234.C99.C133.C167.D201.A235.B100.A134.B168.D202.A236.B101.D135.D169.A203.C237.D102.B136.C170.B204.B238.A103.D137.A171.C205.B239.B104.B138.A172.A206.A240.B105.B139.D173.A207.C241.C106.B140.A174.C208.C242.D107.A141.B175.C209.B108.A142.C176.C210.C109.A143.A177.B211.C110.D144.C178.A212.B111.D145.B179.B213.C112.B146.A180.B214.B113.C147.A181.A215.A114.C148.A182.D216.B

115.B149.A183.C217.A116.B150.A184.A218.A117.B151.A185.B219.A118.D152.A186.B220.C119.D153.B187.C221.C120.C154.A188.B222.D第5章假设检验一、学习指导假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。本章各节的主要内容和学习要点如下表所。章节主要内容学习要点假设检验的基本问题假设的陈述概念:假设,假设检验,原假设,备择假设,单侧检验,双侧检验。针对具体的实际问题,建立合理的原假设和备择假设。两类错误与显着性水平概念:第I类错误,第II类错误,显着性水平。两类错误的控制。两类错误的关系。检验统计量与拒绝域概念:检验统计量,标准化检验统计量,拒绝域,临界值。统计量检验的原理。利用统计量检验的决策准则。利用P值进行决策概念:P值。P值决策的原理,P值的计算。P值检验与统计量检验的异同。P值决策的准则。小结►假设检验的步骤。►假设检验结果的表述。总体均值的检验大样本的检验方法总体方差c2已知时,均值检验的统计量和程序。总体方差c2未知时,均值检验的统计量和程序。用Excel计算P值。小样本的检验方法总体方差c2已知时,均值检验的统计量和程序。总体方差c2未知时,均值检验的统计量和程序。用Excel计算P值。总体比例的检验总体比例的检验►检验的统计量。►检验的程序。►用Excel计算P值。总体方差的检验总体方差的检验►检验的统计量。►检验的程序。►用Excel计算P值。二、主要术语和公式(一)主要术语假设:对总体参数的具体数值所做的陈述。假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用H]或Ha表示。原假设:也称零假设,是研究者想收集证据予以反对的假设,用H0表示。单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“?”的假设检验。第I类错误:当原假设为正确时拒绝原假设,犯第I类错误的概率记为a。第II类错误:当原假设为错误时没有拒绝原假设,犯第II类错误的概率通常记为6。显着性水平:假设检验中发生第I类错误的概率,记为a。检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。临界值:根据给定的显着性水平确定的拒绝域的边界值。P值:也称观察到的显着性水平,如果原假设H。是正确的,那么所得的样本结果出现实际观测结果那么极端的概率。(二)主要公式名称公式总体均值检验的统计量(正态总体,。已知)x—U乙= ^0b/Jn

总体均值检验的统计量(。未知,大样本)x—Hz= 我s/Vn总体均值检验的统计量(正态总体,b未知,小样本)t—X—%_总体比例检验的统计量z=—Vp—丸0 兀(1—兀)n总体方差检验的统计量(n—1)s2X2= b20

四、习题答案1.A34.A66.D99.A2.D35.C67.D100.B3.C36.B68.A101.D4.A37.A69.C102.C5.B38.D70.D103.B6.C39.D71.A104.D7.A40.C72.C105.B8.B41.C73.B106.B9.A42.C74.A107.A10.B43.C75.A108.A11.A44.A76.B109.B12.C45.B77.C110.A13.A46.A78.D111.B14.C47.B79.A112.A15.D48.D80.C113.A16.C49.A81.D114.B17.A50.A82.B115.B18.B51.B83.A116.B19.A52.D84.A117.B20.B53.C85.C118.A21.B54.A86.B119.B22.A55.B87.A120.B23.B56.C88.C121.B24.B57.A89.A122.D25.A58.C90.A123.A26.D59.D91.A27.D60.C92.A28.D61.C93.A29.A62.A94.B30.B63.D95.C31.B64.B96.B32.C65.A97.A33.B98.A第6章方差分析一、学习指导本章主要介绍检验多个总体均值是否相等的一种统计方法,即方差分析。它

是通过对各观察数据误差来源的分析来判断多个总体均值是否相等。本章首先介绍方差分析中的一些基本问题,包括方差分析中的一些术语、方差分析的基本思想和基本假设,然后介绍单因素方差分析方法,最后介绍方差分析中的多重比较。本章各节的主要内容和学习要点如下表所示。11章节主要内容学习要点方差分析的基本问题方差分析及有关术语►概念:方差分析,因子,处理。方差分析的基本思想和原理►概念:组内误差,组间误差,总平方和,组内平方和,组间平方和。►误差的分解►总平方和、组内平方和、组间平方和的关系。方差分析中的基本假定►方差分析中的3个基本假定。问题的一般提法►方差分析中假设的提法。单因素方差分析数据结构►概念:单因素方差分析。►数据结构。

分析步骤►概念:总平方和,组内方差,组间方差。►假设的提法。►总平方和、组内方差、组间方差的计算方法。►检验统计量的计算方法。►统计决策。►方差分析表的结构。►用Excel进行方差分析。关系强度的测量►关系强度的测量方法。方差分析中的多重比较方差分析中的多重比较►多重比较的前提。►多重比较的作用。►多重比较的方法。二、主要术语和公式(一)主要术语方差分析(ANOVA):检验多个总体均值是否相等的统计方法。因素:也称因子,是方差分析中所要检验的对象。水平:也称处理,是因素的不同表现。组内误差:来自水平内部的数据误差。组间误差:来自不同水平之间的数据误差。总平方和:反映全部数据误差大小的平方和,记为sst。

组内平方和:反映组内误差大小的平方和,记为SSE。组间平方和:反映组间误差大小的平方和,记为SSA。单因素方差分析:只涉及一个分类型自变量的方差分析。组内方差:组内平方和除以相应的自由度。组间方差:组间平方和除以相应的自由度。(二)主要公式名称公式组间方差睥"组间平方和^^^MSA=——,——= 自由度 k—1组内方差ms组内平方和SSEMSE=——,——= 自由度 n—k方差分析的检验统计量F=^^A〜F(k—1,n—k)MSE关系强度的测量R2=SSA(组间SS)—SST(总SS)多重比较的LSD,1 1 1LSD="MSE(一+—)nn四、习题答案1.C20.D39.C58.A2.B21.B40.A59.B3.B22.A41.A60.C4.D23.B42.B61.D5.A24.C43.A62.B6.A25.D44.A63.A7.C26.C45.B8.D27.A46.A9.D28.B47.D10.C29.A48.C11.C30.C49.B

12.A31.A50.B13.A32.C51.D14.B33.B52.B15.A34.C53.B16.A35.C54.A17.A36.B55.D18.A37.D56.A19.D38.D57.B第7章相关与回归分析、学习指导相关与回归是研究变量之间关系的统计方法,该方法广泛应用于自然科学和社会科学的各个领域。本章首先介绍相关分析方法,然后介绍一元线性回归和多元线性回归分析方法。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点变量间关系的度量变量间的关系►概念:函数关系,相关关系。►相关关系的特点。相关关系的描述与测度►概念:相关系数。►相关分析的内容。►散点图的绘制和分析。►相关系数的计算。►相关系数的性质。相关系数的显着性检验►相关系数检验的目的。►相关系数检验的程序。一元线性回归一元线性回归模型►概念:回归模型,回归方程,估计的回归方程。►回归分析的内容。►回归模型的基本假定。参数的最小二乘估计►概念:最小二乘法。广 L P0和七的计算。七的解释。用Excel进行回归。

回归直线的拟合优度概念:总平方和,回归平方和,残差平方和,判定系数,估计量的标准误差。►判定系数的计算和解释。►判定系数与相关系数的关系。估计量的标准误差的计算和解释。显着性检验►线性相关检验的目的。►线性关系显着性检验的程序。►回归系数检验的目的。►回归系数检验的程序。►Excel输出的回归结果的解释和应用。利用回归方程进行估计和预测概念:平均值的点估计,个别值的点估计,平均值的置信区间估计,个别值的预测区间估计。►平均值的点估计和个别值的点估计的区另U。平均值的置信区间估计和个别值的预测区间估计的区别。点估计和区间估计的计算方法。多元线性回归多元回归模型与回归方程►概念:多元线性回归模型,多元线性回归方程,估计的多元线性回归方程。►偏回归系数的解释。参数的最小二乘估计►参数的最小二乘估计方法。►用Excel进行回归。回归方程的拟合优度概念:多重判定系数,修正的多重判定系数,估计标准误差。►判定系数的实际意义。估计标准误差的实际意义。Excel回归结果的解释。显着性检验线性关系检验与回归系数检验的区别。►线性关系检验的程序。►回归系数检验的程序。Excel回归结果的解释和应用。二、主要术语和公式(一)主要术语相关关系:变量之间存在的不确定的数量关系。相关系数:也称Pearson相关系数,是根据样本数据计算的度量两个变量之间线性关系强度的统计量。因变量:被预测或被解释的变量,用y表示。自变量:用来预测或用来解释因变量的一个或多个变量,用x表示。回归模型:描述因变量y如何依赖于自变量x和误差项的方程。回归方程:描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程:根据样本数据求出的回归方程的估计。最小二乘法:也称最小平方法,使因变量的观察值七与估计值*之间的离差平方和达 人 .到最小来求得P和叭的方法。0 1判定系数:回归平方和占总平方和的比例,记为R2。51.估计量的标准误差:均方残差(MSE)的平方根,用七来表示。J的平均值的点估计:利用估计的回归方程,对于x的一个特定值七,求出J的平均值的一个估计值E(y)。0y的个别值的估计值:利用估计的回归方程,对于X的一个特定值x0,求出y的一个个别值的估计值y。0y的平均值的置信区间估计:对x的一个给定值七,求出y的平均值的区间估计。y的个别值的预测区间估计:对x的一个给定值X0,求出y的一个个别值的区间估计。多元线性回归模型:描述因变量y如何依赖于自变量气,x2,…,七和误差项8的方程。多元线性回归方程:描述y的期望值如何依赖于X,x,…,x的方程。1 2 k估计的多元线性回归方程:根据样本数据得到的多元线性回归方程的估计。多重判定系数:在多元回归中,回归平方和占总平方和的比例。修正的多重判定系数:用模型中自变量的个数和样本量进行调整的多重判定系数,记为R2。a(二)主要公式名称公式相关系数"xy-XxxXyr=―,― ―= ,― ―=:JnXx2-(Xx)xJnXy2-(Xy)2相关系数检验的统计量t=rJ_—~t(n-2)¥1-r2回归方程的截距B=y-Bx0 1

回归方程的斜率(回归系数)〃"二人 ii i ig=i^i i^ii^i1 〃乙2一[乙]2i"i=1iJ判定系数sSSR_Z3-刃2R2— 一 iSSTZ(七-刃2估计标准误差s=『(y-y*=^sse线性关系检验的统计量F-湖1〜F(n-2)SSEn-2回归系数检验的统计的统计量t-土〜t(n—2)s人gJ的平均值的置信区间' I,yo土y七1*(X-X)2n zn(xi-x)2' i=1J的个别值的预测区间y0士'仪2七1 (x—X)21+—+ 0 nz(xi-X)2i=1修正的多重判定系数n_1R2=1—(1—R2)X n—k—1四、习题答案36.D52.C68.C84.A100.B37.D53.A69.B85.C101.B38.A54.A70.D86.C102.A39.B55.D71.D87.C103.C40.B56.B72.C88.B104.A41.A57.A73.B89.D105.A42.B58.B74.D90.B106.C43.C59.A75.A91.C107.A44.C60.C76.B92.A108.D45.A61.C77.B93.A109.B46.A62.A78.A94.C110.C47.B63.A79.B95.A111.A

48.D64.B80.A96.A112.D49.C65.B81.B97.B113.B50.A66.B82.A98.D114.B51.C67.C83.A99.C115.D第8章时间序列分析和预测一、学习指导分析时间序列数据的主要目的是对未来的观测值进行预测。本章在给出时间序列概念及分类的基础上,首先介绍了时间序列的描述性分析方法,然后介绍了平稳序列和非平稳序列的一些简单预测方法。本章各节的主要内容和学习要点如下表所示。章节主要内容学习要点时间序列及其分解时间序列及其分解概念:时间序列,平稳序列,非平稳序列,趋势,季节性,周期性,随机性。时间序列的分解模型。时间序列的描述性分析图形描述►时间序列的图形描述。增长率分析概念:增长率,环比增长率,定基增长率,平均增长率,年度化增长率,增长1%绝对值。一般增长率的计算与分析。►平均增长率的计算与分析。►年度化增长率的计算与分析。增长率分析中应注意的问题。►增长1%绝对值的计算和应用。时间序列的预测程序确定时间序列的成分►时间序列的预测步骤。►趋势成分的确定方法。►季节性成分的确定方法。选择预测方法►时间序列的类型和预测方法的预测方法的评估►概念:平均误差,平均绝对误差,均方误差,平均百分比误差和平均绝对百分比误差。►各种误差的计算方法。平稳序列的预测简单平均法►简单平均法预测。移动平均法►移动平均法预测。►用Excel进行移动平均预测。指数平滑法►指数平滑法预测。►用Excel进行指数平滑预测。趋势型序列的预测线性趋势预测►直线趋势方程的求法。►直线趋势方程预测。非线性趋势预测二次曲线预测。►指数趋势预测,指数曲线和直线的区别。►修正指数曲线预测。►龚伯茨曲线预测。Logistic曲线预测复合型序列的分解预测确定并分离季节成分►季节指数的计算。►分离季节成分。建立预测模型并进行预测►建立预测模型。计算最后的预测值►最终预测值的计算。二、主要术语和公式(一)主要术语时间序列:同一现象在不同时间上的相继观察值排列而成的序列。平稳序列:基本上不存在趋势的序列。非平稳序列:包含趋势性、季节性或周期性的序列。趋势:也称长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。季节性:也称季节变动,是指时间序列在一年内重复出现的周期性波动。周期性:也称循环波动,是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。随机性:也称不规则波动,是指时间序列中除去趋势、周期性和季节性之后的偶然性波动。增长率:也称增长速度,是指时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示。平均增长率:也称平均发展速度,是指时间序列中各逐期环比值(也称环比发展速度)的几何平均数减1后的结果。增长1%绝对值:增长率每增长一个百分点而增加的绝对数量。简单平均法预测:根据过去已有的,期观察值通过简单平均来预测下一期的数值。移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。指数平滑法预测:对过去的观察值加权平均进行预测的一种方法,该方法使得第/+1期的预测值等于/期的实际观察值与第r期指数预测值的加权平均值。(二)主要公式名称公式环比增长率G=;-1i-1

定基增长率G=^i—^o=Y-1iYY平均增长率G=inY Y,—x—x…、一—一1=Y1 Y1 \Y1n1Y0年度化增长率G=(—1~)mn 1AYi-1平均预测误差£(Y-F)ME=-4=1―i——-n平均绝对预测误差MAD=£Yi-Fin均方预测误差£(Y-F)2MSE=-4=1―:———n平均百分比预测误差£Y^—F^x100MPE=—^i Zn简单平均法预测F=Z(Y+Y+…+Y)=1WYt+1t1 2 t t ii=1移动平均法预测口正Y+Y+…+Y+YF=Y=―tk11 1kl2 t-1 t-指数平滑法预测F1=aY+(1-a)F线性趋势方程的截距和斜率\'n£tY-£t£Yb=n£t2-(£t)2a=Y一bt二次曲线的标准方程组1,£Y=na+b£t+c£12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论