统计学简答题_第1页
统计学简答题_第2页
统计学简答题_第3页
统计学简答题_第4页
统计学简答题_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 获得数据的概率抽样方法有哪些? (1)简单随机抽样。就是从包括总体N个单位的抽样框中随机地,一个个抽取n个单位作为样本,每个单位的入样概率是相等的。(2)分层抽样。是将抽样单位按某种规则划分为不同的层,然后从不同的层里独立、随机的抽取样本。(3)整群抽样。将总体若干个单位合并成组,这样的组成为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。(4)系统抽样。将总体中所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。(5)多阶段抽样。首先抽取群,然后再进一步抽样,从若干个单位进行调查,将这种方法推广,使抽样的段数增多,及

2、称为多阶段抽样。2. 什么是统计学?统计学数据可分为哪几类数据?统计学就是收集、处理、分析、解释数据并从中得出结论的科学。按所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据、和数值数据。分类数据是只能归于某种类型的非数字型数据;顺序数据是只能归于某种有序类别的分数字型数据;数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。按统计数据的收集方法,可以将数据分为观测数据和实验数据。观测数据是欧诺个过调查或观测收集到的数据;实验数据则是在实验中控制实验对象而收集到的数据。按照被描述的现象的时间关系,可以将推荐数据分为截面数据和时间序列顺序。截面数据是在相同或近似相同的时间点上收集

3、的数据;时间序列数据是在不同时间收集到的数据。3、 说明平均数、中位数和众数的特点及应用场合。 数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时

4、应考虑中位数或众数。4 、搜集数据的基本方法有哪些?(1) 自填式。指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。(2) 面访式。指现场调查中调查员提问、被调查者回答的调查方式。(3) 电话式。指调查人员通过打电话的方式向被调查者实施调查。5、 叙述正态分布曲线的特点(1) 集中性。正态曲线的高峰位于正中央,即均数所在位置。(2) 对称性。正态曲线一均数为中心,左右对称,曲线两端永远不与横轴相交。(3)均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;(4)正态分布有两个参数,即均数和标准差,可记作N(,):均数决定正态曲线的中心位置;标准差决定正态曲线的陡峭或扁

5、平程度。越小,曲线越陡峭;越大,曲线越扁平;(5)u变换:为了便于描述和应用,常将正态变量作数据转换;,6、数据的预处理包含那些内容,并对内容简单解析? 数据预处理是对数据分类之前所做的必要处理,内容包括数据的审核、筛选、排序等。数据审核就是检查数据中是否有错误。通过调查取得的原始数据,主要从完整性和准确性两个方面去审核;对于通过其他渠道取得的二手数据,应着重审核数据的实效性和使用性。数据筛选时根据需要找出符合特定条件的某类数据。数据排序是指按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决解决问题的线索。 7、 什么是统计量?为什么要引进统计量?统计量中为什么不含

6、任何未知参数? 统计量是统计理论中用来对数据进行分析、检验的变量。设X1 ,X2,XN是从总体X中抽取的容量为N德一个样本,如果由此样本构造一个函数T=T(X1 ,X2,XN) ,不依赖于任何未知参数,则称此函数为一个统计量。常用的统计量有:样本均值(即n个样本的算术平均值) ,样本方差(即n个样本与样本均值之间平均偏离程度的度量),样本极差(样本中最大值减最小值),众数,样本的各阶原点矩和中心矩。 由样本构造具体的统计量,实际上是对样本所有的总体信息按某种要求进行加工处理,把分撒在样本信息集中到统计量的取值上,因此统计推断问题就由样本信息推断总体特征转变为由样本构成的统计量推断总体参数,而且

7、对于不同的统计推断问题可以根据同一样本构造不同的统计量进行研究。由于样本室已经抽出来的,所以统计量总是知道的,故统计量不含任何未知参数。 8、怎样理解置信区间? 置信区间:由样本统计量所构造的总体参数的估计区间9、 评价估计量的标准有哪些? 无偏性:指估计量分布的数学期望等于被估计的总体参数。 有效性:指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。一致性:指随着样本量的增大,点估计量的值越来越接近被估计总体参数。10、 如何理解显著性水平?通常以表示,是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。越小,犯拒绝“假设”的错误可

8、能性越小。11、 抽样估计中在不同样本状况下使用什么统计量、分布及其假设条件是什么?12什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?假设检验中我们可能犯的错误类型有两种:一类错误是原假设为真却被我们拒绝了,另一类是原假设为伪我们却没有拒绝。对于一定样本量,不能同时做到犯这两类错误的概率都很小。如果减少第一类错误,就会增大犯第二类错误的机会,反之亦然。、什么是P值,利用p值和利用统计量检验有什么不同?当原假设为真时锁得到的样本观察结果或更极端结果出现的概率 不同:1.P值决策优先于统计量决策。与传统的统计量相比,P值决策提供了更多的信息。2.根据统计量决策,如果拒绝

9、原假设,也仅仅是知道犯错误的可能性是a那么大,但究竟是多少却不知道。而P值则是算出的犯第I类错误的实际概率。什么是方差分析?方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。、 方差分析的基本原理是什么?、 一元线性回归模型中有哪些基本的假定?() 因变量与自变量之间有线性关系。() 在重复抽样中自变量的取值是固定的,即假定是非随机的。() 误差项是一个期望值为的随机变量,即()() 对于所有的值,的方差都相同。() 误差项是一个服从正态分布的随机变量、 判定系数R及其含义判定系数R是回归平方和占总平方和的比,测度了回归直线对观测数据的拟合程度。若则拟合是完全的,越接近于,回归直线拟合程度越差。、 简述相关系数的性质() 的取值范围是,。() 具有对称性。() 的数值大小与和的原点和尺度无关。(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论