《统计学》名词解释及公式_第1页
《统计学》名词解释及公式_第2页
《统计学》名词解释及公式_第3页
《统计学》名词解释及公式_第4页
《统计学》名词解释及公式_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学就是处理与分析数据的方法与技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义与应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容与学习要点如下表所示。学学习要点概念:统计学,描述统计,推断统计。统计在工商管理中的应用。。概念:分类数据,顺序数据,数值型数据。概念:观测数据,实验数据。概念:截面数据,时间序列数据。。概念:抽样调查,普查。概念。抽样误差,非抽样误差。:参数,统计量。概念:变量,分类变量,顺序变量,数值型变量,连续型变量,离散型变量。主要内容什么就是统计学统计的应用领域分类数据、顺序数据、数值数据观测数据与实验数据截面数据与时间序列数据数据的间接来源数据的直接来源调查方案设计数据质量总体与样本参数与统计量变量应用领域型几个基本概念1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。2.描述统计:研究数据收集、处理与描述的统计学分支。3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。4.分类数据:只能归于某一类别的非数字型数据。5.顺序数据:只能归于某一有序类别的非数字型数据。6.数值型数据:按数字尺度测量的观察值。7.观测数据:通过调查或观测而收集到的数据。8.实验数据:在实验中控制实验对象而收集到的数据。9.截面数据:在相同或近似相同的时间点上收集的数据。10.时间序列数据:在不同时间上收集到的数据。11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推体特征的数据收集方法。12.普查:为特定目的而专门组织的全面调查。13.总体:包含所研究的全部个体(数据)的集合。14.样本:从总体中抽取的一部分元素的集合。15.样本容量:也称样本量,就是构成样本的元素数目。16.参数:用来描述总体特征的概括性数字度量。17.统计量:用来描述样本特征的概括性数字度量。18.变量:说明现象某种特征的概念。19.分类变量:说明事物类别的一个名称。20.顺序变量:说明事物有序类别的一个名称。21.数值型变量:说明事物数字特征的一个名称。22.离散型变量:只能取可数值的变量。23.连续型变量:可以在一个或多个区间中取任何值的变量。DCCA45.ADBBA46.BAADA47.CBCCD48.AADBB49.CDCDBCAA.CBCD.CADA.DAAB.CCC、CC.D数据的图表展示就是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容与学2、1数据的预处理2、2品质数据的整理与展示2、3数值型数据的整理与展示2、4合理使用图表主要内容数据审核数据排序数据筛选数据透视表分类数据的整理与图示顺序数据的整理与图示数据分组数值型数据的图示鉴别图形优劣的准则统计表的设计学习要点数据审核的目的。原始数据与二手数据的审核内容。数据排序的目的。分类数据与数值型数据的排序方法。数据筛选的目的。数据透视表的用途。概念:频数,频数分布,比例,百分比,比率。分类数据的图示:条形图,帕累托图,对比条概念:累积频数,累积频率。累积频数分布图。概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中值。频数分布表的制作步骤。直方图的绘制。茎叶图的绘制。箱线图的绘制。直方图与条形图的区别。茎叶图与直方图的区别。线图的绘制。散点图的绘制。气泡图的绘制。雷达图的绘制。图形应包括的基本特征。鉴别图形优劣的准则。统计表的结构。统计表的设计。24.频数:落在某一特定类别(或组)中的数据个数。25.频数分布:数据在各类别(或组)中的分配。26.比例:一个样本(或总体)中各个部分的数据与全部数据之比。27.比率:样本(或总体)中各不同类别数值之间的比值。28.累积频数:将各有序类别或组的频数逐级累加起来得到的频数。29.数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。30.组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。31.组距:一个组的上限与下限的差。32.组中值:每一组的下限与上限之间的中点值,即组中值=(下限值+上限值)/2。33.直方图:用矩形的宽度与高度(即面积)来表示频数分布的图形。34.茎叶图:由“茎”与“叶”两部分组成的、反应原始数据分布的图形。反应原始数据分布的图形。1.C8.B15.C22.D29.D2.A9.B16.B23.D30.C3.B10.C17.D24.B31.B4.C11.A18.D25.D32.C5.D12.B19.C26.B33.C6.B13.B20.B27.B34.A7.C14.C21.C28.D35.B数据分布的特征可以从三个方面进行描述:一就是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容与学习要点如下表所示。态的度量主要内容位数与分位数平均数众数、中位数与平均数异众比率方差与标准差相对位置的度量离散系数偏态及其测度学习要点概念:众数。众数的特点。概念:中位数,四分位数。中位数与四分位数的特点。中位数与四分位数的计算。概念:平均数,简单平均数,加权平均数,几简单平均数与加权平均数的计算。平均数的性质。几何平均数的计算与应用场合。众数、中位数与平均数在分布上的关系。众数、中位数与平均数的特点及应用场合。概念:异众比率。异众比率的计算与应用场合。概念:四分位差。四分位差的计算与应用场合。概念:极差,平均差,方差,标准差。极差的计算与特点。平均差的计算与特点。样本方差与标准差的计算。总体方差与标准差的计算。概念:标准分数。标准分数的计算与应用。经验法则。切比雪夫不等式。概念:离散系数。离散系数的计算。离散系数的用途。概念:偏态,偏态系数。偏态系数的计算。偏态系数数值的意义。概念:峰态,峰态系数。峰态系数的计算。峰态系数数值的意义。Excel统计函数的应用。峰态及其测度1.众数:一组数据中出现频数最多的变量值,用M表示。o2.中位数:一组数据排序后处于中间位置上的变量值,用M表示。e4.平均数:一组数据相加后除以数据的个数而得到的结果。m6.异众比率:非众数组的频数占总频数的比率。7.四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。8.极差:也称全距,一组数据的最大值与最小值之差。9.平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。10.方差:各变量值与其平均数离差平方的平均数。11.标准差:方差的平方根。12.标准分数:变量值与其平均数的离差除以标准差后的值。13.离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。14.偏态:数据分布的不对称性。15.偏态系数:对数据分布不对称性的度量值。16.峰态:数据分布的平峰或尖峰程度。17.峰态系数:对数据分布峰态的度量值。x2Me1xx21n为奇数n为偶数简单样本平均数ixi1n加权样本平均数kMfiix=i=1n几何平均数异众比率简单平均差Gm=nx1x2…xn=nnnxii=1fffVr=ifm=1iiQ=QQdULiiiMM=i=1d加权平均差简单样本方差简单样本标准方差加权样本方差加权样本标准差kMxfiiM=i=1dnin(xx)2is=i=1k(Mx)2fii2=i=1n1k(Mx)2fii=i=1n1标准分数离散系数xxz=iissv=sxSKSK=nx(|xi-x)|3(n-1)(n-2)(s)xk(M-x)3fiiSK=i=1K=iixk(M-x)4fiiK=i=1-3未分组数据的偏态系数分组数据的偏态系数未分组数据的峰态系数分组数据的峰态系数ACABCACABBBBCC40.ADDC41.AABC42.BBDC43.BCAD44.AD0.CAA45.BA1.DCA46.AC2.DBB47.CD3.ACB48.DD4.AAA49.BC5.ABAAB6.DABCDBBDDAABABBDB参数估计就是推断统计的重要内容之一,它就是在抽样及抽样分布的基础上,知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法与参数估计中样本容量的确定问题。本章各节的主要内容与学习要点如下表所示。节主要内容概率抽样方法学习要点概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽样,系统用Excel抽取简单随机样本。概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的分布。抽样分布抽样分布中心极限定理。样本均值抽样分布的特征。样本均值的抽样分布与总体分布的关样本比例抽样分布的形式与特征。样本方差抽样分布的形式。估计量,估计值。题估计评价估计量的标准正态总体、方差已知,或非正态总体、大样本计正态总体、方差未知、小样本4、4总体比总体比例的区间估计计总体方差的区间估计计概念:点估计,区间估计,置信区间,置构建的原理。释。,有效性,一致性。正态总体、方差已知时的置信区间。非正态总体、大样本时的置信区间。用Excel计算给定的正态分布的临正态总体、方差已知时的小样本置信正态总体、方差未知时的小样本置信总体比例的置信区间。总体方差的置信区间。用Excel计算给定的X2分布的临界估估计总体均值时样样本容量的计算方法。本容量的确定估计总体比例时样样本容量的计算方法。本容量的确定量的确定36.简单随机抽样:也称纯随机抽样,它就是从含有N个元素的总体中,抽取n个37.简单随机样本:从含有N个元素的总体中,抽取n个元素作为样本,使得总体38.重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二取n个元素为止。39.不重复抽样:一个元素被抽中后不再放回总体,而就是从所剩元素中抽取第n素为止。40.分层抽样:也称分类抽样,它就是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。41.系统抽样:也称等距抽样或机械抽样,它就是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元42.整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,的各个群中所包含的所有元素进行观察。47.估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量代。49.估计值:用来估计总体参数时计算出来的估计量的具体数值。51.区间估计:在点估计的基础上,给出总体参数估计的一个范围。52.置信区间:由样本统计量所构造的总体参数的估计区间。53.置信水平:也称为置信系数,它就是将构造置信区间的步骤重复多次后,置信称式xzsxzEEEE总总体均值的置信区间(正态总体,未知,小样s总体比例的置信区间总体方差的置信区间估计总体均值时的样本容量2n=a222a21a2(z)22n=a2估计总体比例时的样本容量na2BACABAABCBADCCBDAABDCDAAADBABCCACACBADCACDA100.ABDA101.DDAC102.BCBBA103.DACB104.BAAA105.BDAC106.BACC107.ABCB108.ACCC109.AABC110.DCA12.BDBBBABCAAACADBACABAAABABADABDBCCAB222.假设检验就是推断统计的另一项重要内容,它就是利用样本信息判断假设就是否成立的一种统计方法。本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。本章各节的主要内容与学习要点如下表所。主要内容假设的陈述两类错误与显著性水平检验统计量与拒绝域大样本的检验方法学习要点概念:假设,假设检验,原假设,备择假设,单侧检验,双针对具体的实际问题,建立合理的原假设与备择假设。概念:第Ⅰ类错误,第Ⅱ类错误,显著性水平。两类错误的控制。两类错误的关系。概念:检验统计量,标准化检验统计量,拒绝域,临界值。统计量检验的原理。利用统计量检验的决策准则。P量检验的异同。假设检验的步骤。假设检验结果的表述。总体方差2已知时,均值检验的统计量与程序。总体方差2未知时,均值检验的统计量与程序。总体方差2已知时,均值检验的统计量与程序。总体方差2未知时,均值检验的统计量与程序。检验的统计量。检验的程序。检验的统计量。检验的程序。小样本的检验方法总体比例的检验总体方差的检验18.假设:对总体参数的具体数值所做的陈述。19.假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设就是否成立的过程。20.备择假设:也称研究假设,就是研究者想收集证据予以支持的假设,用H或H表示。1a21.原假设:也称零假设,就是研究者想收集证据予以反对的假设,用H表示。022.单侧检验:也称单尾检验,就是指备择假设具有特定的方向性,并含有符号“>”或“<”23.双侧检验:也称双尾检验,就是指备择假设没有特定的方向性,并含有符号“”的假设检24.第Ⅰ类错误:当原假设为正确时拒绝原假设,犯第Ⅰ类错误的概率记为a。25.第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为。26.显著性水平:假设检验中发生第Ⅰ类错误的概率,记为a。27.检验统计量:根据样本观测结果计算得到的,并据以对原假设与备择假设做出决策的某28.拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。29.临界值:根据给定的显著性水平确定的拒绝域的边界值。30.P值:也称观察到的显著性水平,如果原假设H就是正确的,那么所得的样本结果出现0实际观测结果那么极端的概率。xz=0z/n总体均值检验的统计量(Q未知,大样本)总体均值检验的统计量(正态总体,Q未知,小样本)总体比例检验的统计量总体方差检验的统计量xz=0xt=0puz=000n2=Q20AAD99.ADCDCBAAACBDDCDAA.CCB.CBA.CAB.CAA.ABC.BCA.ADC.BAD.D.CC.A.DAA.BBB.AAD.ABC.CBA.BAB.ABC.CBA.AAC.ADD.ADC.ADC.AAA.BBD.CBB.BCBA..AA方差分析。首先介绍方差分析中的一些基本问题,包括方差分析中的一些术语、方差分析的基本思想与基本假设,然后介绍单因素方差分析方法,最后介绍方差分析中的多重比较。本章各节的主要内容与学习要点如下表所示。学学习要点概念:方差分析,因子,处理。概念:组内误差,组间误差,总平方与,误差的分解总平方与、组内平方与、组间平方与方差分析中的3个基本假定。方差分析中假设的提法。概念:单因素方差分析。数据结构。主要内容方差分析及有关术语方差分析的基本思想与原理方差分析中的基本假定问题的一般提法数据结构节析的基本问题6、2单因素方差分析间方差。总平方与、组内方差、组间方差的计骤关系强度的测量方差分析中的多重析中的多重比较检验统计量的计算方法。表的结构。强度的测量方法。多重比较的前提。多重比较的作用。多重比较的方法。36.总平方与:反映全部数据误差大小的平方与,记为SST。37.组内平方与:反映组内误差大小的平方与,记为SSE。38.组间平方与:反映组间误差大小的平方与,记为SSA。。。组间平方和SSAMSA==组内平方和SSEMSE==a2MSE(+)nnij60.C61.D62.B63.A32.C相关与回归就是研究变量之间关系的统计方法,该方法广泛应用于自然科学与社会科学,然后介绍一元线性回归与多元线性回归分析方法。本章各节的主要内容与学习要点如下表所示。系的度量主要内容变量间的关系相关关系的描述与测度相关系数的显著性检验一元线性回归模型参数的最小二乘估计回归直线的拟合优度学习要点概念:函数关系,相关关系。相关关系的特点。概念:相关系数。相关分析的内容。散点图的绘制与分析。相关系数的计算。相关系数的性质。相关系数检验的目的。相关系数检验的程序。概念:回归模型,回归方程,估计的回归方回归分析的内容。回归模型的基本假定。概念:最小二乘法。011概念:总平方与,回归平方与,残差平方与,判定系数,估计量的标准误差。判定系数的计算与解释。判定系数与相关系数的关系。估计量的标准误差的计算与解释。线性相关检验的目的。线性关系显著性检验的程序。回归系数检验的目的。回归系数检验的程序。Excel输出的回归结果的解释与应用。概念:平均值的点估计,个别值的点估计,平均值的置信区间估计,个别值的预测区间平均值的点估计与个别值的点估计的区平均值的置信区间估计与个别值的预测区点估计与区间估计的计算方法。概念:多元线性回归模型,多元线性回归方程,估计的多元线性回归方程。偏回归系数的解释。参数的最小二乘估计方法。概念:多重判定系数,修正的多重判定系判定系数的实际意义。估计标准误差的实际意义。Excel回归结果的解释。线性关系检验与回归系数检验的区别。线性关系检验的程序。回归系数检验的程序。Excel回归结果的解释与应用。显著性检验利用回归方程进行估计与预测多元回归模型与回归方程参数的最小二乘估计回归方程的拟合优度显著性检验42.相关关系:变量之间存在的不确定的数量关系。43.相关系数:也称Pearson相关系数,就是根据样本数据计算的度量两个变量之间线性关48.估计的回归方程:根据样本数据求出的回归方程的估计。49.最小二乘法:也称最小平方法,使因变量的观察值y与估计值之间的离差平方与达到ii0150.判定系数:回归平方与占总平方与的比例,记为R2。51.估计量的标准误差:均方残差(MSE)的平方根,用s来表示。e52.y的平均值的点估计:利用估计的回归方程,对于x的一个特定值x,求出y的平均值0的一个估计值E(y)。053.y的个别值的估计值:利用估计的回归方程,对于x的一个特定值x,求出y的一个个0054.y的平均值的置信区间估计:对x的一个给定值x,求出y的平均值的区间估计。055.y的个别值的预测区间估计:对x的一个给定值x,求出y的一个个别值的区间估计。012k12k58.估计的多元线性回归方程:根据样本数据得到的多元线性回归方程的估计。59.多重判定系数:在多元回归中,回归平方与占总平方与的比例。60.修正的多重判定系数:用模型中自变量的个数与样本量进行调整的多重判定系数,记为a公公式rnx2(x)2ny2(y)2trn2~t(n2)01ii相关系数相关系数检验的统计量程的截距回归方程的斜率(回归系数)RR2=SSR=(iy)2SST(yy)2i=ii=enn2F=~F(n2)ˆi(xx)202e判定系数估计标准误差线性关系检验的统计量回归系数检验的统计的统计量y的平均值的置信区间y的个别值的预测区间修正的多重判定系数ii=1nn(xx)2ii=1s02e1(xx)21++0+0ˆAAAAA分析时间序列数据的主要目的就是对未来的观测值进行预测。本章在给出时间序列概念及分类的基础上,首先介绍了时间序列的描述性分析方法,然后介绍了平稳序列与非平稳序列的一些简单预测方法。本章各节的主要内容与学习要点如下表所示。及其分解分析列的预测主要内容时间序列及其分解增长率分析确定时间序列的成分选择预测方法预测方法的评估简单平均法移动平均法指数平滑法线性趋势预测学习要点概念:时间序列,平稳序列,非平稳序列,趋势,季节性,周期性,随机性。时间序列的分解模型。时间序列的图形描述。概念:增长率,环比增长率,定基增长率,一般增长率的计算与分析。平均增长率的计算与分析。年度化增长率的计算与分析。增长率分析中应注意的问题。增长1%绝对值的计算与应用。时间序列的预测步骤。趋势成分的确定方法。季节性成分的确定方法。时间序列的类型与预测方法的概念:平均误差,平均绝对误差,均方误差,平均百分比误差与平均绝对百分比误差。各种误差的计算方法。简单平均法预测。移动平均法预测。指数平滑法预测。直线趋势方程的求法。直线趋势方程预测。二次曲线预测。指数趋势预测,指数曲线与直线的区别。修正指数曲线预测。龚铂茨曲线预测。Logistic曲线预测季节指数的计算。分离季节成分。建立预测模型。最终预测值的计算。非线性趋势预测确定并分离季节成分建立预测模型并进行预测计算最后的预测值列的分解预测61.时间序列:同一现象在不同时间上的相继观察值排列而成的序列。62.平稳序列:基本上不存在趋势的序列。63.非平稳序列:包含趋势性、季节性或周期性的序列。64.趋势:也称长期趋势,就是指时间序列在长时期内呈现出来的某种持续向上或持续下降65.季节性:也称季节变动,就是指时间序列在一年内重复出现的周期性波动。66.周期性:也称循环波动,就是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振67.随机性:也称不规则波动,就是指时间序列中除去趋势、周期性与季节性之后的偶然性波68.增长率:也称增长速度,就是指时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示。69.平均增长率:也称平均发展速度,就是指时间序列中各逐期环比值(也称环比发展速度)70.增长1%绝对值:增长率每增长一个百分点而增加的绝对数量。71.简单平均法预测:根据过去已有的t期观察值通过简单平均来预测下一期的数值。72.移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。73.指数平滑法预测:对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1期的预测值等于t期的实际观察值与第t期指数预测值的加权平均值。环比增长率定基增长率YG=i1iYi1YYYG=i0=i1iYY00平均增长率年度化增长率平均预测误差平均绝对预测误差均方预测误差平均百分比预测误差简单平均法预测移动平均法预测指数平滑法预测线性趋势方程的截距与斜率二次曲线的标准方程组指数曲线的标准方程组YYYYnnYYYnnn-10YG=(i)mn-1AYi-1x(Y-F) iiME=i=1nYY-FMAD=iinnx(Y-F)2nxiinMPE=iMPE=int+1t12ttii1FYtkt-k+2t-1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论