全国名校432统计学[专业硕士]考研真题汇编(含部分答案)_第1页
全国名校432统计学[专业硕士]考研真题汇编(含部分答案)_第2页
全国名校432统计学[专业硕士]考研真题汇编(含部分答案)_第3页
全国名校432统计学[专业硕士]考研真题汇编(含部分答案)_第4页
全国名校432统计学[专业硕士]考研真题汇编(含部分答案)_第5页
已阅读5页,还剩504页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

全国名校432统计学专业硕士考研真题汇编(含部分答案) 1中央财经大学统计与数学学院432统计学专业硕士考研真题及详解2013年中央财经大学统计与数学学院432统计学专业硕士考研真题2013年中央财经大学统计与数学学院432统计学专业硕士考研真题及详解中央财经大学2013年硕士研究生入学考试试题统计学(432)一、单项选择题(本题包括120题共20个小题,每小题1.5分,共30分)1在假设检验中,原假设与备择假设( )。A都有可能被接受B都有可能不被接受8C只有一个被接受而且必有一个被接受D原假设一定被接受,备择假设不一定被接受【答案】C【解析】原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。2小王收集了19778年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,应选择( )。A直方图B散点图C饼图D折线图【答案】B【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。直方图是用于展示分组数据分布的一种图形。饼图主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。折线图主要用于反映现象随时间变化的特征。3若一元回归方程中的回归系数为0,则自变量和因变量相关系数( )。ABCD无法确定【答案】C【解析】相关系数的计算公式为:,回归系数的计算公式为:,所以。据此可知,回归系数与相关系数的符号一致,且当一元回归方程中的回归系数为0时,相关系数也为0。4某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( )。A230 B200 C210 D180【答案】A【解析】对于求开口组的组中值公式为:首组开口组组中值=组上限邻组组距的一半末组开口组组中值=组下限+邻组组距的一半由于本题要求的是末组开口组的组中值,因此为200+(200-170)=230。5计算平均增长率最适宜的方法是( )。A算术平均数B调和平均数C几何平均数D加权平均数【答案】C【解析】平均增长率也称平均增长速度,它是时间序列中逐期环比值(也称环比发展速度的几何平均数减1后的结果。因此,计算平均增长率最适宜的方法几何平均数。6抽样推断的精确度和抽样误差的关系是( )。A前者高说明后者小B前者高说明后者大C前者变化而后者不变D两者没有关系【答案】A【解析】估计误差越小,估计的精度就越好;估计误差越大,估计的精度就越差。7受极端数值影响最大的变异指标是( )。A极差B平均差C标准差D方差【答案】A【解析】极差是指一组数据的最大值与最小值之差。根据定义可知,极差只是利用了一组数据两端的信息,因此它极容易受极端值的影响。8分别采用重复随机抽样和不重复随机抽样,两者样本均值的期望值( )。A相等B有时相等,有时不等C前者小于后者D后者小于前者【答案】A【解析】在无限总体情况下,总体均值设为,总体方差为,则重复随机抽样的样本均值服从期望为,方差为的正态分布,不重复随机抽样的样本均值服从期望为,方差为的正态分布。据此可知,采用重复随机抽样和不重复随机抽样,两者样本均值的期望值是相等的,但是方差前者比后者大。9在假设检验中,不能拒绝原假设意味着( )。A原假设肯定是正确的B原假设肯定是错误的C没有充分证据证明原假设是正确的D没有充分证据证明原假设是错误的【答案】D【解析】不拒绝原假设意味着所构造的与原假设相矛盾的小概率事件没有发生,但可能还有许多其他的与原假设矛盾的小概率事件,只能解释为“在显著性水平下没有发现充足的证据反对”。10某商店销售量增长10%,商品零售价格也增长10%,则商品销售额增长( )。A25%B15%C20%D21%【答案】D【解析】销售额=销售量销售价格,销售量增长10%,商品零售价格也增长10%,则商品销售额增长=(1+10%)(1+10%)1=21%。11已知,( )。ABCD12设两个相互独立的随机变量与分别服从正态分布和,则( )。ABCD【答案】B【解析】随机变量与相互独立,则有,且,因此,即。13设与为两随机变量,且,则( )。A40B34C25.6D17.6【答案】C【解析】,根据已知条件,可得,而,故。14若随机变量服从参数为的泊松分布,则的数学期望是( )。AB C D【答案】D【解析】根据已知条件可知,则。15设,.,是来自于正态总体的简单随机样本,为样本方差,记 则服从自由度为的分布的随机变量是( )。A B CD【答案】A【解析】由中心极限定理可知,则。而,故,即。16设总体均值与方差都存在,且均为未知参数,而,.,是该总体的一个样本,为样本均值,则总体方差的矩估计量是( )。ABCD【答案】C【解析】。因此总体方差的矩估计量为。17在假设检验时,若增大样本容量,则犯两类错误的概率( )。A都增大B都减小C都不变D一个增大一个减小【答案】B【解析】在样本容量不变的条件下,与常常呈现反向的变化,即如果减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小,只有增大样本量。18在复合假设检验中,“=”一般放在( )。A原假设上B备择假设上C可以放在原假设上,也可以放在备择假设上D有时放在原假设上,有时放在备择假设上【答案】A【解析】在复合假设检验中,等号总是放在原假设上。将符号“=”放在原假设上是因为我们想涵盖备择假设不出现的所有情况。19当峰度系数等于0时,次数分布曲线为( )。A尖顶峰度B标准峰度C平顶峰度DU型分布【答案】B【解析】峰度是描述分布尖峭程度和(或)尾部粗细的一个特征数。峰度通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰度系数为0;如果峰度系数大于0,此时为尖峰分布;如果峰度系数小于0,此时为扁平分布。20样本,., 来自正态总体,统计量适用于( )。A未知,检验B已知,检验C未知,检验D已知,检验【答案】C【解析】在正态总体、方差已知或非正态总体、大样本情况下,总体均值的假设检验统计量采用的是z统计量。在正态总体、方差未知、小样本情况下,总体均值的假设检验统计量采用的是t统计量。AB两项采用的都是检验。二、简答题(本题包括15题共5个小题,每小题10分,共50分)。1简述非抽样误差类型。答:非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:(1)抽样框误差,是指抽样框中的单位与研究总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理解误差、记忆误差和有意识误差。(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。(4)调查员误差,是指由于调查员的原因而产生的调查误差。(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。2简述描述离散程度的统计量和适用类型。答:衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。(1)极差是指一组数据的最大值与最小值之差。用表示,其计算公式为:极差是描述数据离散程度的最简单测度值,计算简单,易于理解,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理解。(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号,然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。3简述估计量的无偏性,有效性和一致性。答:(1)无偏性若估计量的数学期望等于未知参数,即:则称为的无偏估计量。估计量的值不一定就是的真值,因为它是一个随机变量,若是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。(2)有效性设与都是的无偏估计量,若对于任意,有且至少对于某一个上式中的不等号成立,则称较有效。(3)一致性(相合性)如果依概率收敛于,即,有则称是的一致估计量。4简述相关系数和函数关系的差别。答:变量之间的关系可分为两种类型:函数关系和相关关系。(1)函数关系设有两个变量和,变量随变量一起变化,并完全依赖于,当变量取某个数值时,依确定的关系取相应的值,则称是的函数。由此可见函数关系是一种一一对应的确定性关系。(2)相关关系相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。这是一种非确定的关系。5简述时间序列的组成要素。答:时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。(1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;(2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;(3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;(4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。三、计算与分析题(本题包括14题共4个小题,第1-2题每题10分,第3-4题每题25分,共70分)1某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平为95%。解:抽取的样本容量为大样本,因此样本均值经过标准化以后的随机变量服从标准正态分布,即。此时可用样本方差代替总体方差,则总体均值在置信水平为95%下的置信区间为:。根据表格中的数据可求得:小时,小时。代入数据可得该校大学生平均上网时间在置信水平为95%下的置信区间为:。 2一学生接连参加同一课程的两次考试。第一次及格的概率为,若第一次及格则第二次及格的概率也为;若第一次不及格则第二次及格的概率为。若至少有一次及格则他能取得某种资格,求他取得该资格的概率。解:设事件A为第一次及格,事件B为第二次及格,事件C为至少有一次及格。则有,。则至少有一次及格的概率:即他取得该资格的概率为。3一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。下面是获得的月销售额数据(单位:万元)。竞争者数量超市位置0123个以上位于市内4138594730314840居民小区45395139位于写字楼252944433135484222305053位于郊区187229242917282733252632对上述数据做双因素交互效应方差分析,结果如下。差异源 SS df MS F P-va1ue 超市位置 930.66672 465.3333 4.7713 0.0180交互 1042.2220 6 173.7037 1.7811 0.1457内部 2340.6670 24 97.5278总计 5028.0000 35 根据上述信息,撰写一份研究报告,报告至少涵盖下面三项内容:(1)竞争者的数量对销售额是否有显著影响;(2)超市的位置对销售额是否有显著影响;(3)竞争者的数量和超市的位置对销售额是否有交互影响。解:由Excel输出的方差分析表如下表所示。方差分析表由于P-value=1.57E-5<=0.01(或=14.2042>(3,24)=4.7181),拒绝原假设。表明竞争者的数量对销售额有显著影响;P-value=9.18E-08<=0.01(或=34.3052>F0.01(2,24)=5.6136),拒绝原假设。表明超市的位置对销售额有显著影响;P-value=0.01605>=0.01(或=3.3150<F0.01(6,24)=3.6667),不拒绝原假设。没有证据表明竞争者的数量和超市的位置对销售额有交互影响。4一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据。月销售收入(万元)电视广告费用(万元)报纸广告费用(万元)96909592959494945242.533.52.531.521.52.53.32.34.22.5以月销售收入为因变量,电视广告费用和报纸广告费用为自变量,得到结果如下。 系数估计 标准误差 t Stat P-va1ue Intercept 81.9401 1.3542 60.5080 0.0000电视广告费用 2.7687 0.3252 8.5135 0.0010报纸广告费用1.2929 0.2464 5.2473 0.0063根据上述信息,撰写一份报告,报告至少涵盖下面三项内容:(1)回归方程的假定;(2)电视广告费用对月销售收入的作用;(3)报纸广告费用对月销售收入的作用。解:(1)由结果可得回归方程为:。回归方程的假定条件是:因变量y与自变量x之间具有线性关系。在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。误差项是一个期望值为0的随机变量,即E()=0。对于所有的x值,的方差2都相同。误差项是一个服从正态分布的随机变量,且独立,即N(0,2)(2)回归系数表示,电视广告费用每增加1万元,月销售收入平均增加2.7687万元。由于P-value=0.0010=0.05,线性关系显著,说明电视广告费用是影响月销售收入的一个因素。(3)回归系数表示,报纸广告费用每增加1万元,月销售收入平均增加1.2929万元。由于P-value=0.0063=0.05,线性关系显著,说明报纸广告费用是影响月销售收入的一个因素。2012年中央财经大学统计学院432统计学专业硕士考研真题2012年中央财经大学统计学院432统计学专业硕士考研真题及详解中央财经大学二零一二年硕士研究生入学考试试题招生专业:应用统计硕士考试科目:统计学(432)注意:本试题所有答案,应按试题顺序写在答题纸上,不必抄题,写清题号。写在试卷上不得分。一单项选择题(本题包括l20题共20个小题,每小题15分,共30分)1研究如何利用样本数据来推断总体特征的统计学方法是( )。A描述统计B理论统计C推断统计D应用统计【答案】C【解析】统计学主要分为描述统计学和推断统计学。描述统计是指描绘(describe)或总结(summarize)观察量的基本情况的统计总称。推断统计是研究如何利用样本数据来推断总体特征的统计方法。推断统计学非常有用,因为它允许给予有限的信息(样本)对总体得出结论。2根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是( )。A名义尺度B顺序尺度C差距尺度D比例尺度【答案】A【解析】定类尺度又称为名义尺度,它是对个体进行类别划分的测度计量尺度。所使用的数值,用于表现它是否属于同一个人或物。顺序尺度所使用的数值的大小,是与研究对象的特定顺序相对应的。间距尺度所使用的数值,不仅表示测定对象所具有的量的多少,还表示它们大小的程度即间隔的大小。比例尺度测定值的差和比都是可以比较的。3某市场调查公司为了对一家大型商场做顾客满意度调查,对不同性别和年龄的顾客按事先规定的人数随意进行了一些调查询问,这种调查属于( )。A任意调查B立意调查C配额抽样D整群抽样【答案】A【解析】任意抽样又称为便利抽样或偶遇抽样,它是任由调查者的便利而随意选取一些个体作为样本。立意抽样又称判断抽样,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法。配额抽样也称定额抽样,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。整群抽样又称聚类抽样,是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。4变量x与y的相关系数的符号取决于( )。A变量x的标准差B变最y的标准差C变量x和y两标准差的乘积D变量x和y的协方差【答案】D【解析】随机变量x和y相关系数的计算公式为:分子为随机变量x和y的协方差的计算公式为:,分母始终为正,所以由此可见:随机变量x和y的相关系数符号和协方差符号一致。5有一个样本容量为10的样本,其均值为1300小时,方差为8175.56。若按放回抽样计算,则样本均值的标准误是( )。A28.35小时B28.59小时C29.61小时D30.02小时【答案】B【解析】样本均值的标准误计算公式为(小时)6如果时间序列的环比增长量大致相等,则应采用的趋势模型为( )。A直线趋势模型B指数曲线趋势模型C二次曲线趋势模型D修正指数曲线趋势模型【答案】A【解析】对于给定的时间序列,究竟选择哪个趋势模型应该根据该时间序列本身的变动特点和其图形形状来定。如对于年度资料时间序列,若其逐年增长量又称环比增长量大致相等,则应采用直线趋势模型;若其逐年发展速度即环比发展速度大致相等,则应采用指数曲线趋势模型;若其二级增长量即环比增长量大致相等,则应采用二次曲线趋势模型;若其环比增长量的环比发展速度大致相等,则应采用修正指数曲线模型,等等。7移动平均法是通过计算逐项移动的序时平均数,来形成派生数列,从而达到( )对数列的影响。A消除偶然因素引起的不规则变动B消除非偶然因素引起的不规则变动C消除绝对数变动D消除计算误差【答案】A【解析】平稳时间序列通常只含有随机成分,其预测方法主要有简单平均法、移动平均法和指数平滑法等,这些方法主要是通过对时间序列进行平滑以消除其随机波动。8Q为销售量,P为价格,当,时,按一般原则计算的销售量总指数是( )。A1125B1167C1179D1222【答案】A【解析】销售量总指数是以基期价格为同度量,销售量总指数。9用简单随机重复抽样方法选择样本单位,如果要使抽样平均误差降低50,则抽样单位数需要增加到原单位数的( )。A2倍B3倍C4倍D1倍【答案】C【解析】抽样平均误差是反映抽样误差一般水平的指标,它的实际含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度,其计算公式为,要使变为原来的一半,即可将扩大到原来的四倍。10根据抽样调查资料,某企业工人生产定额平均完成105,抽样平均误差为1,置信概率为0.9545(t=2)时,可以确定该企业生产定额平均完成百分比( )。A大于107B在104和106之间C在103和107之间D小于103【答案】C【解析】总体比例在置信水平下的置信区间为:11下面对矩估计法中原点矩和中心矩表述正确的是( )。A样本的一阶原点矩就是样本的原数据值B样本的一阶原点矩就是样本的均值C样本的二阶原点矩就是样本的均值D样本的二阶中心矩就是样本的标准差【答案】B【解析】 =1,2,,称为的阶原点矩; 2,3,称为的阶中心矩,可见均值是的一阶原点矩,方差是的二阶中心矩。12下面变量中属于顺序变量的是( )。A职业B产品产量C年龄D产品等级【答案】D【解析】顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。13当对单个正态总体均值检验时,如果总体方差未知则应该进行( )。AZ检验BF检验Ct检验D卡方检验【答案】C【解析】当总体方差未知时,其中代表样本均值,代表样本的标准差。故可采用检验。14某种产品的单位成本y(元件)对产量x(千件)的回归方程为=90-0.5x,其中“-0.5”的意义是( )。A产量每增加1千件,单位成本下降0.5元B产量每增加1千件,单位成本平均下降0.5元C产量每增加1千件,单位成本下降50D产量每增加1千件,单位成本平均下降50【答案】B【解析】一元线性回归方程的形式为:,其中0是回归直线在y轴上的截距,是当x=0时y的期望值;1是直线的斜率,它表示当x每变动一个单位时,y的平均变动值。题中直线的斜率,它表示当产量每增加一千件时,单位成本下降0.5元。15制定一个完整的统计调查方案,不包括( )。A确定调查目的B明确调查对象和调查单位C选择调查方式方法D确定调查结果的公布时间【答案】D【解析】统计调查方案的主要内容包括:调查目的、调查的对象和调查单位、调查表、调查方法和组织方式、调查经费预算。16在线性回归模型中,根据判定系数R2与F统计量的关系可知,当R2=0时,有( )。AF=-1BF=0CF=lDF=【答案】B【解析】回归平方和占总平方和的比例称为判定系数,记为R2,其计算公式为:。F统计量的计算公式为。比较两个公式可知,当R2=0时,有F=0。17回归分析中的估计标准误( )。A可以是负值B等于因变量的平方根C是根据残差平方和计算的D等于自变量的平方根【答案】C【解析】估计标准误差就是度量各实际观测点在直线周围的散布状况的一个统计量,它是对误差项的标准差的估计,是均方残差(MSE)的平方根,用Se来表示。其计算公式为:18在线性回归模型中,若与之间存在线性关系,则异方差形式为( )。【答案】D【解析】当随机误差项的方差与解释变量之间存在相关性时,线性回归模型存在异方差性。其异方差形式为。19在DW检验中,无序列相关的区间为( )。【答案】B【解析】德宾-沃森(Durbin-Watson)检验简称D-W检验,是目前检验自相关性最常用的方法,但它只适用于检验一阶自相关性及小样本情况。当存在正序列相关;时,不能确定;时,无序列相关;时,不能确定;时,存在负序列相关。20对一组数据的描述统计分析表明,样本均值=12.45美元,中位数=9.21美元,方差=22.85。由此可以计算样本数据的离散系数为( )。AO.38B0.40C0.54D2.48【答案】A【解析】离散系数也称为变异系数(coefficient of variation),它是一组数据的标准差与其相应的平均数之比。其计算公式为:。得到。二、简答题(本题包括15题共5个小题,每小题10分,共50分)。1简述古典概率法和经验概率法如何定义事件发生的概率。答:概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值,记为:。经验概率又称主观概率,是指对一些无法重复的试验,只能根据以往的经验,人为确定这个事件的概率。2在研究总体特征时,往往采用抽样调查,试给出采用抽样的理由。答:抽样调查(sampling survey)是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽取。根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。概率抽样是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。习惯上将概率抽样称为抽样调查。抽样调查同其他调查比较,具有如下几个特点:第一,样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响。第二,能够根据部分调查的实际资料对调查对象的总体的数量特征进行推断,从而达到对调查总体的认识。第三,在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。因此,抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。3举例说明什么是列联表的独立性检验。答:变量分为定量变量和定性变量。对于定量变量我们用回归分析等方法机进行研究。对于定性变量,如吸烟是否与患癌症有关、性别与是否喜欢数学有关、年龄和喜欢的电视节目类型是否有关等等,我们对其进行列联表的独立性检验。列联表的独立性检验是对一个分类变量的检验,因其分析过程可以通过列联表的方式呈现,故又可称为列联分析。独立性检验就是分析列联表中行变量和列变量是否相互独立。例如:为了研究年龄和喜欢的节目类型是否有关系,某单位对闲暇时间进行了全面调查,根据不同年龄档和喜爱收看电视节目的类型进行了如下的统计分类:老年中年青年合计戏曲2010232歌舞5203560球赛2102032合计274057124按照假设检验的步骤:设定假设:Pij Pi* P*j (行变量与列变量独立):Pij ( Pi* P*j (行变量与列变量不独立)(其中Pi*是行变量,P*j是列变量)选取统计量:(其中,为列联表中第i行第j列类别的实际频数;为列联表中第i行第j列类别的期望频数;并且)最后带入数字,进行判断。看是否有行向量与列向量独立。若拒绝原假设,即行向量与列向量不独立,即年龄和喜欢的节目类型有关系。反之,年龄和喜欢的节目类型无关。4给出显著性检验中,P值的含义,以及如何利用P值决定是否拒绝原假设。答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设。P值越小,我们拒绝原假设的理由就越充分。从研究总体中抽取一个随机样本,计算检验统计量的值和概率P值,即在假设为真的前提下,检验统计量大于或等于实际观测值的概率。如果,说明是较强的判定结果,拒绝假定的参数取值;如果,说明是较弱的判定结果,拒绝假定的参数取值;如果,说明结果更倾向于接受假定的参数取值。即一般以P<0.05为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。但是,P值不能赋予数据任何重要性,只能说明某事件发生的机率。P<0.01时样本间的差异比P<0.05时更大,这种说法是错误的。5给出在一元线性回归中:(1)相关系数的定义和直观意义;(2)判定系数的定义和直观意义;(3)相关系数和判定系数的关系。答:(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;若是根据样本数据计算的,则称为样本相关系数,记为r。样本相关系数的计算公式为:按上述计算公式计算的相关系数也称为线性相关系数,或称为 Pearson相关系数。r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的解释。(2)回归平方和占总平方和的比例称为判定系数,记为R2,其计算公式为:判定系数测度了回归直线对观测数据的拟合程度。的取值范围是0,1。越接近于l,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x的变化来解释y值变差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0,回归直线的拟合程度就越差。(3)相关系数和判定系数都是用来表明X与Y的关系,即X对Y的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在之间。判定系数取值范围在之间。三、计算与分析题(本题包括13题共3个小题,第1题10分,第2-3题30分,共70分)1盒子中有10个球,6个红球和4个黑球,无放回随机选出4个球。计算选出球中包含黑球数的期望和方差。解:设为所取的4个球中包含黑球的个数,则,。,。所以选出球中包含黑球数的期望为,方差为。2美国会计学会最近进行了一项研究,比较在政府或私人会计部门的男女雇员的周工资。研究收集20个个体,数据见表1。关于周工资的含交互作用的双因素方差分析结果见表2。就上述结果,试写一份报告,解释美国会计行业中工作部门和性别对员工工资的影响。报告中至少涵盖以下内容:(1)不同行业、不同性别员工的平均周工资情况。(2)结合表2,用方差分析的术语解释行业、性别、以及二者的交互作用对员工工资是否有影响。答:(1)设部门为因素A,性别为因素B,政府部门为A1,私人部门为A2,男性为B1,女性为B2计算不同行业员工的平均周工资如下:计算不同性别员工的平均周工资如下:计算不同行业、不同性别员工的平均周工资如下:(2)由表2结果可知:,P值为1.8910(-6),在显著性水平为0.05时,拒绝原假设,认为不同部门员工的周工资有显著差异,即部门这个因素对员工工资有显著影响。,P值为0.001013,在显著性水平为0.05时,拒绝原假设,认为不同性别员工的周工资有显著差异,即性别这个因素对员工工资有显著影响。,P值为0.025478,在显著性水平为0.05时,拒绝原假设,认为不同行业不同性别员工的周工资有显著差异,如上述计算中A2与B1搭配的员工平均周工资要明显高于其他水平的搭配,即认为行业和性别的交互作用对员工工资有显著影响。报告:略。3某艺术家想研究拍卖会上油画价格和油画年龄的关系。研究收集25个样本,数据见表3。以油画价格为因变量,油画年龄为自变量建立一元线性回归模型,结果见表4。就上述结果,试写一份报告,解释油画年龄如何影响油画价格。报告中至少涵盖以下内容:(1)油画年龄如何影响油画价格的线性模型是什么?(2)前述模型是否合理?(3)按前述模型,哪些油画被低估了。解:(1)Excel输出的回归结果,如表3.1,3.2和3.3所示表3.1 回归结果回归统计Multiple R0.579780018R Square0.336144869Adjusted R Square0.307281602标准误差298.1784807观测值25表3.2 方差分析表方差分析SSMSFSignificance F回归分析11035460.654103546111.646110.002384331残差232044939.34688910.41总计243080400表3.3 参数估计表Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept2636.77678441.60184335.9709374.35E-061723.25383550.3X Variable 117.306713265.0713559643.412640.0023846.815814227.7976由表3.3可以得到,线性回归方程为:回归系数=17.30671326表示:油画年龄每增加1岁,油画价格平均增加17.3067132(单位)R233.6144869%,表明在油画价格的变差中被油画价格与油画年龄之间的线性关系所解释的比例为33.6144869%,回归方程的拟合程度比较差。估计标准误差se298.1784807表示,当用油画年龄来预测油画价格时,平均的预测误差为298.1784807%,表明预测误差十分大,该一元线性回归模型不太合理。其中第16幅油画价格明显被估低,这是因为在表3中油画年龄都是71的有两副油画,但是它们的价格明显不同。由方差分析表可知,Significance 0.002384331165097<=0.05,即回归方程的线性关系显著。回归系数检验的P-值0.002384 <0.05,表明回归系数显著,即油画年龄是影响油画价格的显著性因素。(2)略。(3)略。报告略。2011年中央财经大学统计学院432统计学专业硕士考研真题2011年中央财经大学统计学院432统计学专业硕士考研真题及详解中央财经大学二零一一年硕士研究生入学考试试题招生专业:应用统计硕士考试科目:统计学(432)注意:本试题所有答案,应按试题顺序写在答题纸上,不必抄题,写清题号。写在试卷上不得分。一、单项选择题(本题包括1-20题共20个小题,每小题15分,共30分)1网站把调查问卷刊登在网页上,然后由感兴趣的网民自行填写。对于此类调查,以下说法正确的是( )。A这是简单随机抽样B这是方便抽样C这是雪球抽样D这是全面调查【答案】B【解析】简单随机抽样是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。方便抽样是指调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。滚雪球抽样是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象,往往用于对稀少群体的调查。全面调查是指国家统计系统和各个业务部门为了定期取得系统的、全面的基本统计资料,按一定的要求和表式自上而下统一布置,自下而上提供资料的一种统计调查方法。2随机变量X的方差为2,随机变量Y=2X,那么Y的方差是( )。A1B2C4D8【答案】D【解析】3某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是( )。A面访B深度访谈C计算机辅助电话调查D邮寄调查【答案】C【解析】面访即调查者直接走访被调查者,当面听取被调查者的意见。形式上可以个别面谈,也可以小组座谈。面访比较全面、深入,能获得大量真实的研究资料,但这种方法容易使研究结论带有主观成分。深度访谈是一种无结构的、直接的、一对一的访问形式。最常应用于探测性调查,但是这种访谈方法所得的资料难以进行统计处理和定量分析,而且特别耗费时间,使得访谈的规模受到较大的限制。邮寄调查法,是指将事先设计好的调查问卷,通过邮政系统寄给被调查者,由被调查者根据要求填写后再寄回,是市场调查中一种比较特殊的调查方法。这种调查方法的调查周期通常比较长,时效性差。计算机辅助电话调查是利用现代化电脑程控通讯设备进行的随机电话访问方式,采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。4将一颗质地均匀的硬币先后抛掷3次,至少出现2次正面的概率是( )。A14B38C12D58【答案】C【解析】记为抛掷3次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论