统计学简答题答案修订.doc_第1页
统计学简答题答案修订.doc_第2页
统计学简答题答案修订.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学简答答案 1. 一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述:(1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;(2)分布的离散程度,反映各数据远离其中心值的趋势;(3)分布的形状,反映数据分布的偏态和峰态。2. 影响样本量大小的因素有哪些?简述这些因素与样本量的关系。(1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。(2) 关系:其他条件不变的情况下:1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大;2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大;3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。3. 简述统计数据的类型和特点。类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。(2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。(3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。4. 在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5. 什么是判定系数?它在回归分析中的主要作用是什么?(1) 判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST.(2) 在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是0,1。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。6. 解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。8. 测度两个分类变量相关性的统计量有哪些?他们有什么不同?测度两个分类变量相关性的统计量有以下几个:相关系数、列联相关系数(c系数)、v相关系数(1) 相关系数:描述22列联表数据相关程度最常用的一种相关系数且系数没有上限。(2) 列联相关系数(c系数):主要用于大于22列联表的情况且c系数小于1.(3) v相关系数:取值在0-1之间,当两个变量相互独立时,v=0;当两个变量完全相关时,v=1.若列联表中有一维为2,v相关系数=相关系数。9.什么是方差分析?它研究的是什么?(1)方差分析:就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。(2)本质上来说它所研究的是分类型自变量对数值型因变量的影响。10. 方差分析中有哪些基本假定? 方差分析有三个基本假定:(1) 每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。(2) 各个总体的方差2必须相同。也就是说,各组观察数据是从具有相同方差的正态总体中抽取的。(3)观测值是独立的。也就是说,每个样本数据是来自因子各水平的独立样本11.相关分析主要解决哪些问题?相关分析就是对两个变量之间线性关系的描述与变量,它要解决的问题包括:(1)变量之间是否存在关系?(2)如果存在关系,它们之间是什么样的关系?(3)变量之间的关系强度如何?(4)样本所反映的变量之间的关系能否代表总体变量之间的关系?为解决这些问题,在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系。(2)两个变量都是随机变量12.在回归分析中,F检验和t检验各有什么作用? (1)t检验常能用作检验回归方程中各个参数的显著性,而F检验则能用作检验整个回归关系的显著性。 (2)各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释变量分别对被解释变量有显著的线性关系。 (3)在一般情形下,t检验与F检验的结果没有必然联系;但当解释变量之间两两不相关时,若所有解释变量的系数均通过t检验,那么回归方程也能通过F检验。13. 解释回归模型和估计的回归方程的含义(1)回归模型:描述因变量y如何依赖于自变量x和误差项的方程。只涉及一个自变量的一元线性回归模型可表示为:y=0+1 X+(2) 估计的回归方程:回归模型中的参数0和1是未知数,必须利用样本数据去估计他们。用样本统计量0和1代替回归方程中的未知数0和1,就得到了估计的回归方程。它是根据样本数据求出的回归方程的估计。对于一元线性回归,估计的回归方程形式是:y=0+1x14.解释多重判定系数和调整的多重判定系数的含义和作用 (1)多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反应了在因变量y的变差中被估计的回 归方程所解释的比例。(2)调 整 的 多 重 判 定 系 数:用样本容量n和自变量的个数k去调整R2 得到,这使得 Ra 2 的值永远小于 R2 且 Ra 2 的值不会由于模型中自变量个数的增加而越来越接近1,避免增加自变量而高估多重判定系数。 15. 解释多重共线性的含义当回归模型中两个或两个以上的自变量彼此相关时,称回归模型中存在多重共线性。16多重共线性的判别方法主要有哪些?(1)模型中各对自变量之间显著相关。(2)当模型的线性关系检验(F检验)显著时,几乎所有回归系数i的t检验却不显著。(3)回归系数的正负号与预期的相反。(4)容忍度与方差扩大因子(VIF)。容忍度越小,多重共线性越严重,当小于0.1时,存在严重多重共线性。VIF越大,多重共线性越严重,一般认为VIF大于10时,存在严重多重共线性。17.时间序列由哪几个要素组成? 时间序列由4要素组成,即趋势(T)、季节性或季节波动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势。季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动。周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡变动。时间序列除去趋势、周期性和季

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论