中国人民大学统计学院805统计学历年考研真题汇编(含部分答案)_第1页
中国人民大学统计学院805统计学历年考研真题汇编(含部分答案)_第2页
中国人民大学统计学院805统计学历年考研真题汇编(含部分答案)_第3页
中国人民大学统计学院805统计学历年考研真题汇编(含部分答案)_第4页
中国人民大学统计学院805统计学历年考研真题汇编(含部分答案)_第5页
已阅读5页,还剩135页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录

2017年中国人民大学统计学院805统计

学考研真题(回忆版)

2016年中国人民大学统计学院805统计

学考研真题(回忆版)

2015年中国人民大学统计学院805统计

学考研真题(回忆版)

2014年中国人民大学统计学院805统计

学考研真题(回忆版)

2013年中国人民大学统计学院805统计

学考研真题(回忆版)

2012年中国人民大学统计学院805统计

学考研真题(回忆版)

2011年中国人民大学统计学院804统计

学考研真题(回忆版)

2010年中国人民大学统计学院833统计

学考研真题(回忆版)(含部分答

案)

2009年中国人民大学统计学院871统计

学考研真题(回忆版)(含部分答

案)

2008年中国人民大学统计学院统计学

考研真题(回忆版)

2007年中国人民大学统计学院458统计

学考研真题(含部分答案)

2006年中国人民大学统计学院436统计

学考研真题(含部分答案)

2005年中国人民大学统计学院427统计

学考研真题(含部分答案)

2004年中国人民大学统计学院417统计

学考研真题(含部分答案)

2003年中国人民大学统计学系417统计

学和经济统计考研真题(含部分答

案)

2002年中国人民大学统计学系517统计

学(含描述统计、推论统计)考研真

题(含部分答案)

2001年中国人民大学统计学系517统计

学(描述统计、推论统计)考研真题

(含部分答案)

2000年中国人民大学统计学系统计学

(描述统计、推论统计)考研真题

(含部分答案)

1999年中国人民大学统计学系统计学

考研真题(含部分答案)

1998年中国人民大学统计学系统计学

考研真题

2017年中国人民大学统计学院805统计学考研真题(回忆版)

1.设{ξn}是随机变量序列,ξ服从参数为0和1的均匀分布,Y是ξ1,

ξ2……,ξ2n+1的中位数,证明:Y几乎处处收敛于1/2。

2.设X是随机变量,证明。

3.设随机变量X,W相互独立,其概率密度函数分别为f(x),g(w)。设

h(x)为R上的可导函数,Y=W+h(X),证明:Y关于{X=x}的条件分布

与Y的分布函数相同。

4.研究广告投放区域(住宅区,商业区和办公区)与广告投放方式

(传单,电视广告,广告牌)对于营业额的影响,选择适合的统计方法

进行分析。(给出具体模型)

5.设X服从参数为n和p的二项分布,试求X的一个最小方差估计并证明

它的最小方差性和无偏性。对于N=1的情形,比较X的贝叶斯估计和最

小方差估计性质的优良性。

6.在回归分析中,对于误差项有什么假设?为什么会有这些假设?并

给出检验假定的方法。

7.题目忘记了,很复杂,是二次回归的内容,涉及到证明设计矩阵列

向量正交等等,欢迎补充。

8.在假设检验中,为什么要讨论第一类错误和第二类错误?并说明两

类错误的关系。

2016年中国人民大学统计学院805统计学考研真题(回忆版)

2015年中国人民大学统计学院805统计学考研真题(回忆版)

1.一1000住户的小区,每户人家没车的概率0.1,有一辆车的概率0.7,

有两辆车的概率0.2,问应该设多少停车位才能有95%以上的概率使小区

的每辆车都有车位。

2.证明多元回归分析中最小二乘估计具有最小方差线性无偏性。

3.有一件什么事抽了100个人,分别给出了其中没有投诉,投诉一次,

两次,三次,大于等于四次的具体人数,用卡方拟合检验判断其是否符

合均值为1的泊松分布。再假设确实服从泊松分布,求泊松分布参数的

极大似然估计。

4.假设检验中的p值指什么,用p值和用统计量进行检验有什么不同,

再举例说明为什么假设检验不能证明原假设的正确性。

5.A袋中有编号1到n的n个红球,B袋中有n个篮球,每次从A中取出一

个球后再从B中取一个球放入A中(若B中取完则只取A),问A中取出

的最后一个球为红球的概率。

6.从五个正态总体中一共抽取五组样本,有一张表给出了每组样本的

样本容量以及偏差平方和,假设这五个正态总体具有相同的方差,求方

差95%的置信区间。

7.现要研究位置(居民区商业区某某区)和竞争者数量(0123)对

销售额的大小有无影响,给出具体的做法。

2014年中国人民大学统计学院805统计学考研真题(回忆版)

1.A袋中n个分别标记为1~n的红色球,B袋中n个无标记的相同白色

球。试验每次从A中取出一个球,不放回,再从B中取出一个球放入A

中,当B中球取完后就只从A中取出。求最后一个取出的球是标记为n的

红球的概率;求最后一个取出的球是红球的概率。

2.Θ服从N(μ,σ^2),当Θ=θ时,ξ服从N(θ,1),证明(Θ,ξ)

的分布为二维正态分布。求当ξ=x时,Θ的条件分布

3.以统计思想证明,max(x1,x2,…,xn)的(-n+1)次方的n重

定积分(积分下限是0,上限是a)=na。

4.几乎全忘了,Sn=X1+X2+…+Xn,证明Sn/n-μ的期望为μ,还有

依概率收敛什么的……

5.X服从参数为r的泊松分布,求参数r的广义似然比检验统计量,拒绝

域,势函数。

6.贝叶斯后验分布函数与极大似然函数的异同;统计决策中损失函数

与风险函数,及贝叶斯风险。

7.列联表检验,Pearson方法,广义似然比检验。

8.题中给出了甲乙两种药物的效果,以时间来表示,求甲乙两种药物

药效的显著程度。

2013年中国人民大学统计学院805统计学考研真题(回忆版)

一、证明题:(共20分,每题10分)

1.袋子里有两种颜色的球红球a个,白球b个

第一步:从袋子里取出一个球观察其颜色然后丢掉

第二步:从袋子里再取出一个球,若和上一次取出的球颜色不同,则放

回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二

步。

证明:取出的最后一个球是红球的概率是1/2。

2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。

二、简述:(30分,每题10分)

1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有

卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=

P(X+i|X>0),求P(Y为偶数)和E(Y)。

2.2n+1个独立同分布样本,分布函数是F(x)求中位数x(n+1)的

分布

3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花

的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱

数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多

少?(茆诗松、周纪芗《概率论与数理统计》206页原题只改动了数

字)

三、已知Y1,…,Yn是相互独立的随机变量,且均服从____。求____的

矩估计和最大似然估计,并求他们的均方误差_____。(25分)

四、X和Y是两个相关的随机变量:求证var(Y)=E(var(Y|X))+

var(E(Y|X))并谈谈你对它的理解和应用。(25分)

五、谈谈你对双因素方差分析的理解和认识。(25分)

六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验

以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。

(25分)

2012年中国人民大学统计学院805统计学考研真题(回忆版)

一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到

如下的数据:

对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。

对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。

二、为检验一厂家生产的产品,提出如下的假设检验:

H0:μ=500,H1:μ≠500

现在抽取了部分的样品进行检验。若检验结果拒绝H0,则意味着什

么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样

本证明H0:μ=500成立?为什么?若检验的P=0.03,则意味着什么?P

值的真实含义是什么?

三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年

末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表:

表1:整体拟合优度:R,R2,调整的可决系数

表2:整体线性关系的F检验

表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性)

请对上述回归模型进行综合评价。

四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时

间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,

并简要叙述可种方法的基本原理。

五、说明距离判别法与贝叶斯判别法的联系。

六、说明大数定律与中心极限定理的内容和应用?

七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下

方法:以比例p的人回答敏感性问题

(1)你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答

问题

(2)比如你的手机号尾数是奇数吗?回答是的比例为t。

假设总体具有特征A的人数比例为q,样本中回答是的比例为R。

1.试提出q的一个估计。

2.证明该估计是q的一个无偏估计。

求出q的方差的表达式。

2011年中国人民大学统计学院804统计学考研真题(回忆版)

感觉很注重统计思想和方法的考察,题目很不错!

一、简答题(50分)

1.简述加权最小二乘估计的基本思想。

2.进行主成分分析需是否要知道数据的具体分布,请说明原因。

3.K-均值聚类对比分层聚类,优点在哪里。

4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问

据图分析可能出现了什么问题。

5.简述方差分析和回归分析的异同。

二、已知X与W相互独立(30分)。

1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y

的联合分布。

22

2.W服从正态分布,其期望为零,方差为Ɛ,Y=b0+b1X+b2X+

W,当X=x时求Y的条件期望。

三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶

段和确定权数的两个阶段,(描述了这六个阶段的具体操作方法)。

(30分)

1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大

家来修正)。

2.指出CPI的调查过程中误差的可能来源。

3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。

4.如果每个阶段的调查都严格按照1-α的置信水平,那么总的置信水

平是多少。

四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书

的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得

他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此

得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什

么?应该怎样验证?(20分)

五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图

(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问

用什么应该模型,写出模型的具体形式和模型的建立过程(20分)

2010年中国人民大学统计学院833统计学考研真题(回忆版)(含部分

答案)

(一)五道问答题(50分)

1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为

0.132,据此能否得出这两个地区的均值相等的结论?

2.在参数统计中,卡方分布有哪些应用,并举例说明。

答:卡方分布在参数估计和假设检验中的应用具体包括:一个总体方差

的区间估计;一个总体方差的卡方检验等。另外在列联分析中也可以用

于变量间拟合优度检验和独立性检验。

3.贝叶斯统计与经典统计的区别。

4.时间序列的弱平稳的含义。

5.对于多元回归中的多重共线性的解决方法加以评述。

答:多元回归中的多重共线性的解决方法有:

(1)将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可

能不相关。

(2)如果要在模型中保留所有的自变量,那就应该:①避免根据t统计

量对单个参数β进行检验;②对因变量y值的推断(估计或预测)限定在

自变量样本值的范围内。

(二)给出三个运动员10次射击的数据,问哪些统计图图可以表示这些

数据,及这些图的适用场合和特点。用哪些统计量综合分析三个运动员

的表现,这些统计量各有什么特点。(15分)

(三)R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类

的步骤?(25分)

(四)消费者认为土豆片平均重量<60g,商家怀疑是运输过程中土豆

片碎片沉积造成的。商家从其最大供应商抽取样品进行检验,H0:均值

大于等于60g,H1:均值小于60g,如果得出均值小于60g的结论商家将

拒绝该供应商的土豆片并对其起诉。(15分)

(1)该题中的第一类错误是什么?

(2)第二类错误是什么?

(3)顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?

答:(1)第一类错误是土豆片平均重量大于等于60g,商家拒绝该供应

商的土豆片并对其起诉。

(2)第二类错误是土豆片平均重量小于60g,商家接受该供应商的土豆

片。

(3)对顾客而言,第二类错误比较重要。而对商家而言,第一类错误

重要。

(五)给出x1,x2,…,x7个自变量,要求找出能描述某市各县区经济

发展的综合变量,从而分析经济发展的的内在原因。用什么模型?这种

模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何

根据结果分析该模型?(25分)

(六)银行估计其排队时间,随机抽取了15位顾客进行调查。得到了一

个排队均值的置信区间,请问要计算出均值的置信区间需要什么假设?

如何验证数据是否满足这一假设?能不能说这个区间包含均值的真值?

为什么?检验得到的p=一个很小的数(好像是10的负十次方),能不

能说银行的认识正确?(20分)

答:为了得到排队均值的置信区间,需要做的假设是总体服从正态分

布。如果总体方差已知,则采用z统计量;如果总体方差未知,则采用t

统计量。

不能说这个区间包含均值的真值。在给定的置信水平下,所构造的

是与给定的样本相联系的的置信区间,这是一个特定的区间,而不

再是一个随机区间,所以无法知道这个样本所产生的区间是否包含总体

参数的真值。

若检验得到的p值是一个很小的值,不能说银行的认识是正确的。

2009年中国人民大学统计学院871统计学考研真题(回忆版)(含部分

答案)

1.有两个正态总体,均值和方差未知。但已知方差相等,从第一个总

体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽

取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均

值是否大于第二个总体的均值。

解:设第一个总体的均值为,第二个总体的均值为,则建立假设:

由于两总体均为正态总体,方差未知但相等,并且,,

,,,,则

于是,检验统计量的值为:

给定检验的显著性水平,若

则拒绝原假设,即认为第一个总体的均值大于第二个总体的均值;若

则接受原假设,即认为第一个总体的均值不大于第二个总体的均值。

2.在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因

并指出解决办法。

3.周期过程Xt=Acos(ωt+ψ),其中频率ω和振幅A都是常数,而相

位ψ是一个在区间[-π,π]上服从均匀分布的随机变量,问{Xt}是否平

稳?说明原因。

4.把一个总体分为三层,各层的权重和预估的比例见下表。待估计的

参数为总体比例,如采用内曼分层抽样,请说明需要多大的样本容量才

能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假

设各层总体单位数量Nh都充分大,忽略“有限总体校正系数”)

5.与人大出版社的21世纪统计学系列教材的《统计学(第二版)》的

第四章习题中的第十题是一样的。

6.若有线性回归模型

(t=1,2,……,n),其中;,,

问:

(1)该模型是否违背古典线性回归模型的假定,请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

答:(1)该模型违背了古典线性回归模型的假定。古典线性回归模型

要求误差项具有等方差性,即对于不同的自变量x具有相同的方差。而

由题意可知,误差项εt的方差为,与自变量xt有关。

(2)如果对该模型进行估计,会采用加权最小二乘法。加权最小二乘

法是在平方和中加入权数,以调整各项在平方和中的作用。

即寻找参数的估计值使得离差平方和

达到最小。这样,就消除了异方

差性的影响。

7.测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随

机分为两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂

养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中

随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的

活动情况:吃药后立即记录,药后一小时记录,药后两小时记录。对于

不吃药的白鼠,记录时间与统一对中另外一只白鼠的记录时间相同。假

定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药

的效果?

8.某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不

满意,100分表示非常满意。数据汇总如下表,欲分析教师职称和性别

对满意度有无显著性影响。

(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不

需计算结果)。

(2)要采用该分析方法,数据必须满足哪些基本假定?请加以说明。

解:(1)根据题意,应该采用方差分析的方法。

设不同性别教师的平均满意程度分别为。

提出假设::,:

设教授、副教授和讲师的平均满意度分别为。

提出假设:H0:,H1:不全相等

根据已知数据分别计算P值,若在给定的显著性水平下,P值>,则

不能拒绝原假设;反之,拒绝原假设。

(2)方差分析中有三个基本假定:

①每个总体都应服从正态分布

不同性别教师的满意度和不同职称教师的满意度服从正态分布。

②各个总体的方差σ2相同

不同性别教师的满意度和不同职称教师的满意度的方差相同。

③观测值是独立的

教师职称的满意度和性别的满意度是独立的。

2008年中国人民大学统计学院统计学考研真题(回忆版)

一、2007年香港一则报道说:“随着经济的增长,香港低收入家庭的比

例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的

角度对该报道做简要评论。(10分)

二、经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫

方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的

基本思路。(10分)

三、如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认

为可以建立什么样的预测模型。请你写出模型形式并加以简要说明(10

分)

四、食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不

是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验

(30分)

(1)如果厂家自己检验,你认为提出什么样的原假设和备则假设?并

说明理由。

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备则

假设?并说明理由。

(3)消协抽取20袋,如下数据(略了没抄),得p值为0.4297,在α=

0.05的显著水平下,检验假设意味着什么?p值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,

257.5),你认为这种食品实际平均重量是否在该区间?为什么?

五、在经典的多元线性回归模型里,针对自变量事实上是有许多假设

的。(15分)

(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用。

(3)请讨论这些假设最终产生的影响。

六、在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只

有三种,并不包括整群抽样,请说明你赞同与否并详列理由。(15分)

七、叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(30分)

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特

点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不

同?

八、在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关

键,要考虑许多因素,

(1)以大坝为例,概略说明需考虑的主要因素。

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标

准确定,请写出计算坝高详细的具体步骤(画出框图,并尽量避免过多

使用文字)。(30分)

2007年中国人民大学统计学院458统计学考研真题(含部分答案)

参考答案:

一、(20分)下面是一种零件误差的数据(单位:克)

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间

为(4.637785,5.728882)。请问,若使该置信区间有意义,需要对总

体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的

概率覆盖真实总体均值?如果不是,说出理由及合适的说法。

(2)对于该数据所代表的总体的均值进行检验;零假设为总体均值等

于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪

些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05

时,接受零假设”?为什么?你的结论是什么?

解:(1)若使该置信区间有意义,需要假定总体服从正态分布,且总

体方差未知。这种假定可以通过数据得到证明。

该区间以0.95的概率覆盖真实总体均值,这种表述是不正确的。因为总

体均值μ是一个常数,而不是一个随机变量。μ要么落在这个范围内,要

么不在这个范围内,这里并不涉及概率。0.95这个概率表示的是由100个

样本构造的总体参数的100个置信区间中大约有95%的区间包含了总体

参数的真值,大约有5%的区间不包含总体参数的真值。它不是用来描

述某个特定的区间包含总体参数真值可能性的,而是针对随机区间而言

的。一个特定的区间“总是包含”或“绝对不包含”参数的真值,不存在“以

多大的概率包含总体参数”的问题。

(2)对该数据所代表的总体均值进行t检验,需要的假定有:总体服从

正态分布,样本为小样本,且总体标准差未知。

不能说“在显著性水平为0.05时,接受零假设”。从假设检验的原理看,

不拒绝原假设意味着所构造的与原假设相矛盾的小概率事件没有发生,

但可能还有许多其他的与原假设矛盾的小概率事件,我们没有也无法证

实所有的这些小概率事件不会发生,因此把假设检验中出现接受H0的结

果解释为“在显著性水平为0.05时,不拒绝零假设”,而不用“接受零假

设”,因为我们无法证明原假设是真的。

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班

的平均时间,为此进行抽样调查。请回答以下问题。

(1)如对这些员工进行随机电子邮件调查,由答复的邮件所得到的数

据是不是简单随机样本?为什么?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?

(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?

答:(1)简单随机抽样就是从包括总体N个单位的抽样框中随机地、

一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的。题

中对这些员工进行随机邮件调查,由答复的邮件所得到的数据构成的样

本不能算作是简单随机样本,因为每个员工答复邮件的概率不等导致每

个员工入样的概率也不相等。

(2)抽样调查中,响应误差不一定是人们不说实话导致的。回答误差

是指被调查者在接受调查时给出的回答与真实情况不符。控制调查中的

回答误差需要根据导致回答误差的原因进行分析,导致回答误差的原因

有多种,主要有理解误差、记忆误差和有意识误差。

①理解误差

不同的被调查者对调查问题的理解不同,每个人都按自己的理解回答,

大家的标准不一致,由此造成理解误差;

②记忆误差

有时调查的问题是关于一段时期内的现象或事实,需要被调查者回忆。

需要回忆的时间间隔越久,会议的数据可能就越不准确;

③有意识误差

当调查的问题比较敏感,被调查者不愿意回答,迫于各种原因又必须回

答时,可能会告诉一个不真实的数字。

(3)不同网络公司的员工的加班时间可能不是独立的。网络公司之间

存在着竞争,这就使得管理者是否要求员工加班时需要考虑其他网络公

司的员工是否加班。

三、(20分)某城市交通管理部门的一项调查表明,该城市中自驾车上

班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不

到这一水平上。为证明自己的看法,该研究机构准备抽取一个简单随机

样本进行检验。

(1)请写出检验的原假设和备择假设。

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对

大样本情况,写出检验统计量的公式以及使该统计量有意义所需要假定

的条件。

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上

也显著?

解:(1)由题意知,应该建立的原假设为,备择假设为

。(2)设调查的人数为n,自驾车上班的人数为X,,则

X~B(n,0.3)。在一次抽样中,样本数为n的样本中有x人是自驾车上

班。则p值的计算公式为:

所依赖的分布为二项分布。以X表示n次重复独立试验中事件A(成功)

出现的次数,则随机变量X服从二项分布,参数为n、p,并记作

X~B(n,p)。即

二项分布的期望值和方差分别为:E(X)=np,D(X)=npq。

对大样本情况,一般采用z统计量。其计算公式为:

对大样本情况下,使该统计量有意义所需要假定的条件为:

(3)对于一般检验来说,可能会犯两类错误,即错误或弃真错误和

错误或取伪错误。所以若结果表明“统计上显著”,但是在实际上不一定

是显著的。

四、(10分)在对某项产品认可的抽样调查报告中,如果报告仅仅

说,“对该产品认可的有90%”,那么该报告是否负责?一个负责的调查

报告,应该给出什么有关信息?

答:略。

五、(10分)对于主成份分析,有人进行了主成份分析之后,对得到的

主成份又进行了第二次主成份分析,以得到更加精确的结果。请问,这

样做是否有道理?请加以说明。什么样的数据不适宜于主成份分析?选

择那些主成份累积方差贡献率为70-80%之类的准则是不是总是适用?

为什么?

答:略。

六、(20分)回归模型中的一定是随机误差

吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最

小二乘回归是不是需要对误差项作出假定?如果不是,那么,在什么情

况下需要对误差项作出假定?做什么假定?

答:回归模型中的是随机误差。最小二乘回

归需要对误差项作出假定。这些假定具体包括:

①误差项是一个期望值为0的随机变量,即;

2

②对于自变量x1,x2,…,的所有值,ε的方差σ都相同;

③误差项是一个服从正态分布的随机变量,且相互独立,即

七、(25分)对于聚类分析,请回答以下问题。

(1)分层聚类前,需要对什么进行选择。

(2)描述分层聚类分析的详细步骤。

(3)描述K均值(快速)聚类分析的详细步骤。

答:略。

八、(25分)应用多元线性回归模型

如果一个SPSS回归分析的结果如下表所示:

ANOVA

aPredictors:(Constant),BeginningSalary

bPredictors:(Constant),BeginningSalary,EmploymentCategory

则:

(1)表中所用选择自变量的方法可能是什么?

(2)表中的最后一个Sig.如何求得?意义是什么?

(3)请给出该表最后一个F所表示的统计量服从F分布所需要假定的条

件,并对该统计量服从F分布予以证明。

解:(1)选择自变量的方法可能是逐步回归法。

逐步回归是向前选择和向后剔除的结合。逐步回归在增加了一个自变量

后,它会对模型中所有的变量进行考察,看看有没有可能剔除某个自变

量。如果在增加了一个自变量后,前面增加的某个自变量对模型的贡献

变得不显著,这个变量就会被剔除。它就是通过不停地增加变量并考虑

剔除以前增加的变量的可能性,直至增加变量已经不能导致SSE显著减

少,这个过程可通过F统计量来检验。

(2)设随机变量F服从第一自由度为2,第二自由度为471的F分布。Sig.

实际上就是P值,其计算公式为:P值=P(F>977.312)=0.000。

若Sig.<显著性水平α,表明回归方程的线性关系显著,若Sig.>显著性

水平α,表明线性关系不显著。

(3)在随机误差项为标准正态分布下,当原假设成立

时,F服从自由度为(p,n-p-1)的F分布。

2006年中国人民大学统计学院436统计学考研真题(含部分答案)

参考答案:

一、(20分)某银行为缩短顾客到银行办理业务等待的时间,准备采用

两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种

是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等

待的时间更短,两种排对方式各随机抽取的9名顾客,得到第一种排队

方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的

等待时间(单位:分钟)如下:

(1)画出第二种排队方式等待时间的茎叶图。

(2)比较两种排队方式等待时间的离散程度。

(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

解:(1)第二种排队方式等待时间的茎叶图如下:

叶单位=0.1

(2)第二种排队方式等待时间的均值为:

标准差为:

第一种排队方式的均值分钟,标准差为s1=1.97分钟,则离散系

第二种排队方式的离散系数

由于,因此第二种排队方式的离散程度较小。

(3)由于第二种排队方式的平均等待时间小于第一种排队方式,并且

离散程度较小,所以会选择第二种排队方式。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重

量为100克。现从某天生产的一批产品中按重复抽样方式随机抽取50包

进行检查,测得每包重量(单位:克)如下:

已知食品包重服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间。

(2)如果厂家认为每袋重量不低于100克。请写出检验的原假设和备择

假设。

(3)利用P值进行检验和利用统计量进行检验有什么不同?

解:(1)由表中数据可得:

该种食品的平均重量和标准差分别为:

该种食品平均重量的95%的置信区间为:

即(100.87,101.77)。

(2)设该食品的平均重量为。则检验的原假设和备择假设分别为:

(3)利用统计量进行检验是根据检验统计量落入的区域作出是否拒绝

原假设的决策。在确定以后,拒绝域的位置也就相应确定了。其好处

是进行决策的界限清晰,但弱点是进行决策面临的风险是笼统的。而P

值可以精确地反映决策的风险度,它是当原假设为真时所得到的样本观

察结果或更极端结果出现的概率。

由于n=50>30,为大样本,所以检验的统计量的值为:

①利用P值进行检验,需要利用P值和显著性水平进行比较,如果P值>

,则接受原假设,如果P值<,则拒绝原假设。

P值=P(z>5.726)=0.0000<,所以拒绝原假设,即每袋重量

不低于100克。

②利用统计量进行检验,需要得出拒绝域,根据检验统计量落入的区域

做出是否拒绝原假设的决策。

这是一个右单侧检验问题,临界值,而

,所以拒绝原假设。

三、(20分)一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮

胎供应商牌和耐磨程度。为了对磨损程度进行测试,分别在低速(40公

里/小时)、中速(80公里/小时)、高速(120公里/小时)下进行测

试。根据对5家供应商抽取的轮胎随机样本在轮胎行驶1000公里后磨损

程度进行试验,在显著性水平下得到的有关结果如下:

(1)不同车速对磨损程度是否有显著影响?

(2)不同供应商生产的轮胎之间磨损程度是否有显著差异?

(3)在上面的分析中,你都作了哪些假设?

解:方差分析表中的“行”指行因素,即轮胎供应商因素;“列”指列因

素,即车速因素。

(1)设低速、中速、高速的平均磨损程度分别为。

提出假设:H0:,H1:不全相等。

由于P-value=0.000002<α=0.01(或=97.68>(2,8)=

8.65),拒绝原假设。表明不同车速对磨损程度有显著影响。

(2)设不同供应商轮胎的平均磨损程度分别为。

提出假设::,:不全相等。

由方差分析表可知,P-value=0.000236<α=0.01(或=21.72>

(4,8)=7.01),拒绝原假设。表明不同供应商生产的轮胎的磨损程

度有显著差异。

(3)在上面的分析中,所作出的假设有:

①每个总体都应服从正态分布。

每家供应商的轮胎在行驶1000公里后的磨损程度服从正态分布

轮胎在低速、中速和高速行驶1000公里后的磨损程度服从正态分布

②各个总体的方差σ2相同。

每家供应商的轮胎在行驶1000公里后的磨损程度的方差相同

轮胎在低速、中速和高速行驶1000公里后的磨损程度的方差相同

③观测值是独立的。

轮胎供应商牌和不同车速对轮胎的耐磨程度是独立的

四、(15分)说明什么条件下适合采取简单随机抽样?

答:抽样调查的特点决定了它的应用范围:第一,对一些不可能进行全

面调查的现象,必须用抽样调查的方式取得资料;第二,对一些难于进

行全面调查而又必须取得全面数值的总体现象;第三,对一些不必要进

行全面调查的社会现象;第四,对普查等全面调查资料的质量进行检

验,可利用抽样调查方法。

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方

法。

答:(1)多元回归模型的基本假定有:

①自变量是非随机的、固定的,且相互之间互不相关(无

多重共线性);

②误差项是一个期望值为0的随机变量,即;

③对于自变量的所有值,ε的方差都相同,且不序列相

关,即D(εi)=,Cov(εi,εj)=0,i≠j;

④误差项ε是一个服从正态分布的随机变量,且相互独立,即

(2)若模型中存在多重共线性时,解决的方法有:

第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可

能不相关。

第二,如果要在模型中保留所有的自变量,那就应该:避免根据t统计

量对单个参数进行检验;对因变量Y值的推断(估计或预测)限定在

自变量样本值的范围内。

若模型中存在序列相关时,解决的方法有:如果误差项ε不是相互独立

的,则说明回归模型存在序列相关性,这时首先要查明序列相关产生的

原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺

少重要的自变量,则应增加自变量;如果以上两种方法都不能消除序列

相关性,则需采用迭代法、差分法等方法处理。

若模型中存在异方差性时,解决的方法有:当存在异方差性时,普通最

小二乘估计不再具有最小方差线性估计等号的性质,而加权最小二乘估

计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一

个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差

性的地位,使离差平方和中各项的作用相同。

六、(20分)解释因子模型的意义并写出模型的假设。

答:略。

七、(15分)以下是《中国统计年鉴-2005》摘引的资料,要求:

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均

GDP水平的原因;

(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简

要分析。

答:略。

八、(15分)下表是中国全部国有及规模以下非国有工业企业统计的主

要指标,要求:

(1)设计并计算反映企业经济效益的指标;

(2)对经济效益指标的动态变化状况做简要分析。

答:略。

2005年中国人民大学统计学院427统计学考研真题(含部分答案)

参考答案:

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25

人,得到他们的年龄数据如下:

表1

(1)画出该组数据的茎叶图。

(2)画出该组数据的箱线图。

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

解:(1)该组数据的茎叶图如下:

(2)由表中数据可得:最大值=41,最小值=15

所以中位数=23。

即QL在第6个数值(19)和第7个数值(19)之间0.5的位置上,因此QL

=19×0.5+19×0.5=19。

即QU在第19个数值(27)和第20个数值(29)之间0.5的位置上,因此

QU=27×0.5+29×0.5=28。

由以上数据可得箱线图,如图1所示。

图1

(3)由茎叶图和箱线图可以看出,上网者年龄为右偏分布。

二、(15分)设有三个总体的均值分别为:,要检验三个总体

的均值是否相等()。我们为什么不先将它们简单地配对,即

、、,然后分别进行检验,而是采用方差

分析方法?

答:如果对三个总体的均值检验其是否相等,需要做3次检验。若显著

性水平=0.05,每次检验犯第Ⅰ类错误的概率都是0.05,做多次检验

会使犯第Ⅰ类错误的概率相应增加,检验完成时,犯第Ⅰ类错误的概率

会大于0.05,即连续作3次检验犯第Ⅰ类错误的概率为,

而置信水平则会降低到0.857(即0.953)。一般来说,随着增加个体显

著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的

存在差别)。而利用方差分析方法不仅可以提高检验的效率,而且同时

考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实

的原假设。

三、(20分)某城市的餐饮业管理协会估计,餐馆的月平均用水量为

100吨。一家研究机构认为实际用水量要高于这个数字。该研究机构随

机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经初步

计算得到样本数据的部分描述统计量如下:

表2

(1)确定餐馆月平均用水量95%的置信区间。

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原

因。

(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备

择假设?并谈谈拒绝和不拒绝原假设的含义。

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请

简要解释这一定理。

解:(1)已知n=36,,。由于总体方差未

知,但为大样本,所以餐馆月平均用水量95%的置信区间为:

(2)餐馆实际月平均用水量包含在所建立的置信区间里。理由:略。

(3)设为餐馆月平均用水量。建立的原假设和备择假设分别为:

拒绝原假设意味着所构造的与原假设相矛盾的小概率事件发生了,即结

论H1为真出错的概率不超过。

不拒绝原假设意味着所构造的与原假设相矛盾的小概率事件没有发生,

但可能还有许多其他的与原假设矛盾的小概率事件,我们没有也无法证

实所有的这些小概率事件会不会发生,因此,我们把假设检验中出现接

受H0结果解释为“没有发现充足的证据反对H0”,或更严格地解释为“在

显著性水平α下没有发现充足的证据反对H0”。

(4)在上面的估计和检验中,使用了中心极限定理。

中心极限定理:设从均值为、方差为(有限)的任意一个总体中抽

取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均

值为、方差为的正态分布。

四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)

与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一

个模型,以便对销售价格作出合理预测。为此,收集了15栋住宅的房地

产评估数据,经回归得到下面的有关结果():

表3方差分析

表4

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元

线性回归方程,并解释各回归系数的意义。

(2)检验回归方程的线性关系是否显著?

(3)检验各回归系数是否显著?

(4)计算多重判定系数R2,并说明它的实际意义。

(5)计算估计标准误差sy,并说明它的实际意义。

(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理

由。

解:(1)由表中数据可得多元线性回归方程为:=207.9037+

1.4378x1+0.8545x2+0.0626x3。

=1.4378表示当房产评估价值(x2)和使用面积(x3)不变时,地产

评估价值(x1)每变动一个单位,房地产销售价格(y)的平均变动量

为1.4378个单位。

=0.8545表示当地产评估价值(x1)和使用面积(x3)不变时,房产

评估价值(x2)每变动一个单位,房地产销售价格(y)的平均变动量

为0.8545个单位。

=0.0626表示当地产评估价值(x1)和房产评估价值(x2)不变时,

使用面积(x3)每变动一个单位,房地产销售价格(y)的平均变动量

为0.0626个单位。

(2)建立假设:

由方差分析表可知,P值=0.00<,拒绝原假设,即回归方程的

线性关系是显著的。

(3)建立假设。对于任意参数(i=1,2,3),有

由表中数据可得,对应的P值=0.0271<;对应的P值=

0.0083<;对应的P值=0.3607>。所以地产评估价值

(x1)和房产评估价值(x2)的影响是显著的,而使用面积(x3)的影

响是不显著的。

(4)多重判定系数

在销售价格的变动中,由92.99%的变动可以由地产评估价值、房产评估

价值和使用面积来解释。

(5)

估计标准误差sy的实际意义:用地产评估价值、房产评估价值和使用面

积来预测销售价格时,平均的预测误差为693.21。

(6)使用面积(x3)在预测销售价格时的影响不大。由于在(3)题

中,未通过显著性检验。

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

(1)绘出散点图。

(2)如果根据Y的数据值将总体分成两个子总体,最好的分法是什

么?

(3)举例说明上表数据所反映的现象可能是什么?

(4)计算出Y的总体均值和总体方差S2。

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明

理由。

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对

应的全部可能样本,并计算样本均值的数学期望和方差。

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

解:(1)

(2)略。

(3)略。

(4)由表中数据可知Y的总体均值为:

总体方差为:

(5)略

(6)略

(7)略

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区

别。

答:略

七、(共6分)请解释下面的说法:“生产核算的范围决定了收入分配和

收入使用核算的范围”。

答:略

八、(共9分)A、B两个地区的贫困线均为年收入1000元。A地区有

11%的人年均收入900元,9%的人年均收入200元;B地区有1%的人年均

收入900元,9%的人年均收入500元。

(1)根据上述数据,计算两地的贫困者比重和贫困深度。(2分)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较

分析。(4分)

(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果

不能,应当如何改进?(3分)

解:略

九、(共15分)下面是某国某核算年度的国际收支平衡表(单位:亿

元)

(1)在表中括号内填上适当的数字。(3分)

(2)请解释储备资产所对应的-125亿元的含义。(3分)

(3)请根据表中数字分析该国国内生产总值、国民总收入和国民可支

配收入三者之间的关系。(6分)

(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结

论?(3分)

解:(1)由误差与遗漏=-(经常账户差额+资本和金融账户差额+

储备资产差额)可得:

储备资产差额=10-205+125=-70(亿元)

收益差额=经常账户差额-货物与服务差额-经常转移差额=205-230

+65=40(亿元)

金融账户差额=资本与金融账户差额-资本账户差额=-70+40=-

30(亿元)

因此可得:

(2)该国的储备资产有较大幅度的增加,当年净增为125亿元。

(3)略

(4)略

2004年中国人民大学统计学院417统计学考研真题(含部分答案)

参考答案:

第一部分必答题

1.(25分)下面是A、B两个班学生的数学考试成绩数据:

A班:

B班:

(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考

试成绩分布的特点。

(2)两个班考试成绩的描述统计量如下:试进行比较分析。

(3)要判断考试成绩是否有离群点,可使用哪些方法?

(4)要判断考试成绩是否服从正态分布,可使用哪些描述性方法?

解:(1)

构建两个班考试成绩的茎叶图,如图所示。

图3-12两个班考试成绩的茎叶图

从茎叶图可以看出,A班考试成绩的分布比较集中;B班考试成绩的分

布比A班分散。

(2)从平均数、众数与中位数可以看出A班成绩明显好于B班;A班成

绩的方差小于B班,说明A班成绩相对于B班比较集中;两个班成绩的偏

斜度较低,成绩分布比较对称;从极差可以看出B班的成绩差异大于A

班。

(3)可使用“3σ”准则:A班学生的数学成绩全部在±3个标准差之内,即

75±3×10.44=(43.68,106.32),所以A班学生的成绩中没有离群点。

B班学生的数学成绩全部在±3个标准差之内,即68±3×17.64=(15.08,

120.92),所以B班学生的成绩中没有离群点。

还可以使用四分位数的方法:当观测值落在区间(QU+3IQR,+∞)或

(-∞,QL-3IQR)上时,认为该观测值为离群值。其中,IQR﹦QU-

QL为四分位距,QU和QL分别为上、下四分位数。

(4)可使用偏度系数和峰度系数:由于A班的偏度系数SK=0.11>0,

峰度系数K=-0.35<0,说明A班学生成绩的分布为右偏分布,且与正

态分布相比略有一些扁平。B班的偏度系数SK=0.11,峰度系数K=-

0.76<0,说明B班学生成绩的分布也为右偏分布,且与正态分布相比较

为扁平。

还可以使用箱线图的方法:当数据服从正态分布时箱线图应该是对称

的;当Me(中位数)在箱子内部靠左时,数据呈右偏分布;当Me(中

位数)在箱子内部靠右时,数据呈左偏分布。

2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方

法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使

用其中的一种方法,通过Excel进行方差分析得到下面的部分结果:

方差分析表

(1)完成上面的方差分析表

(2)若显著性水平,检验三种方法组装的产品数量之间是否有

显著差异?

(3)在上面的方差分析中包含了哪些基本假定?

(4)简述多重比较的前提和作用。

解:(1)组间平方和的自由度为3-1=2,所以组间平方和SSA=

2×210=420

组内平方和的自由度为30-3=27,所以组内均方MSE=3836/27=

142.0741

总平方和SST=420+3836=4256

F=MSA/MSE=210/142.0741=1.4781

(2)F0.05(2,27)=3.354131>1.4781,所以不拒绝原假设,即认为

三种方法组装的产品数量之间没有显著差异。

(3)以上方差分析的基本假定有:①三个总体都服从正态分布;②各

个总体的方差相同;③各个观测值是相互独立的。

(4)进行多重比较的前提是拒绝原假设,即认为三种方法组装的产品

数量之间有显著差异,但不能确定到底是哪两种组装方法之间有差异。

多重比较的作用是通过对总体均值之间的配对比较来进一步检验到底哪

些均值之间存在差异。

3.(20分)一袋中装有黑、白两种球,p表示白球所占的比例,待检验

假设为

从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。试给

出以下内容:

(1)总体及其分布;

(2)样本量n;

(3)拒绝域;

(4)第一类错误的概率。

解:(1)总体是一袋中黑白两种颜色的球,设袋中球的数量为N,则

白球的数量服从参数为p和N的二项分布。

(2)样本量n=4

(3)拒绝域为X<2,其中X为抽取的4个球中白球的数量。

(4)第一类错误是指当原假设为真时,拒绝原假设。所以第一类错误

的概率为:

4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的

数学模型。

解:略

5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最

小二乘估计相同。

解:一元线性回归模型为

其中。所以,对于一个特定的x值,

因此,对于一组数据,其极大似然函数为:

从而,对似然函数两边取对数,分别对和求导,并令导数等于0,

得:

解方程组得:

所以,正态线性回归模型其回归系数的最大似然估计与最小二乘估计相

同。

第二部分选答题(在下面五道题中任选三道题)

6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资

料。要求:

(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指

标;

(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说

明。

中国国民经济核算有关资料(单位:亿元)

解:略

7.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的

《内地与香港关于建立更紧密经贸关系的安排》。其中内容之一是自

2004年起,273种香港原产货物进入内地市场将实行零关税;内容之二

是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和

资质条件等。可以预见,由此将大大促进香港对内地的贸易和投资活

动。

要求:根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,

说明对中国未来国际收支所产生的影响。(说明:根据目前中国国民经

济核算,仍然将香港作为“非常住单位”,即作为“境外”看待。)

解:略

8.(15分)假定某地区人口和劳动力就业统计数据如下表所示

要求:

A.计算有关指标,描述该地区人口基本结构状况;

B.计算有关指标,描述该地区人口变动状况;

C.计算有关指标,描述该地区劳动就业状况。

解:略

9.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两

年内每年缴一次。已知预定利率为5%,,假设

费用发生在保单年初,各年费用为:

赔付处理费发生在死亡年末,每1000元保额为10元,假设没有退保。计

算(1)每年总保费。(2)第一年末在总保费下的责任准备金。

解:略

10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果

他在60岁退休,存款利率假设恒定为4%,(1)求退休时个人账户的累

积额。(2)如果个人账户累积额在退休后以固定年金的方式在30年内

每月领取一次,求每月可以领取的数额。

解:略

2003年中国人民大学统计学系417统计学和经济统计考研真题(含部分

答案)

参考答案:

一、(共15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇

率水平上,甲国GDP与乙国GDP之间的比例为1∶20;一场金融危机发

生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水

平上,两国GDP之间的比例将变化为1∶40。请问:我们能否根据比较

结果说甲国的经济发展水平下降了50%?这种比较中所包含的统计方法

问题是什么?

解:略

二、(共15分)假定一时期国际收支平衡表上“储备资产变动”一项为正

差额100亿元,据此,应用国际收支平衡表原理判定当期国际收支的

顺、逆差状况?

答:储备资产是指我国中央银行拥有的可以直接对外支付的金融资产储

备,包括外汇储备、黄金储备、特别提款权、在国际货币基金组织的储

备头寸等。

经常收支与资本金融收支统称为国际收支。由于各种原因,一国的经常

收支和资本收支常常会出现顺差或逆差。这时,储备资产可起到弥补国

际收支差额、平衡国际收支的作用。

当经常项目及资本和金融项目均为顺差时,储备资产变动额表现为负

值,即储备资产增加;当经常项目及资本和金融项目均为逆差时,储备

资产变动额表现为正值,即储备资产减少;如果经常项目与资本和金融

项目一方表现为顺差,另一方表现为逆差,则当顺差者绝对值大时,储

备资产增加,逆差者绝对值大时,储备资产减少。

题中,“储备资产变动”一项为正差额100亿元,所以储备资产减少,经

常项目及资本和金融项目均为逆差。

三、(共30分)以下是某经济总体1985和2001两年份城镇居民住户部门

的调查资料。要求:

第一,列表计算各年城镇住户部门的原始收入、可支配收入、最终消费

支出;(15分)

第二,计算有关指标,比较说明城镇居民住户部门经济活动特征的变

化。(15分)

四、(共30分)一家种业开发股份公司研究出三个新的小麦品种:品种

一、品种二、品种三。公司为研究不同品种对产量的影响,选择了四个

面积相同的地块进行试验,分别为:地块一、地块二、地块三、地块

四。经过试验获得产量数据,经分析得到下面的方差分析表(

):(题干中的方差分析表有问题)

(1)将方差分析表中划横线部分的数值补齐。(6分)

(2)分析小麦品种对产量的影响是否显著?(4分)

(3)分析不同地块对产量的影响是否显著?(4分)

(4)在产量变动的差异中,被品种所解释的百分比是多少?(3分)

(5)在产量变动的差异中,被地块所解释的百分比是多少?(3分)

(6)上面的分析中包含哪些假定?(10分)

解:(1)由可得:

由于品种这一因素产生的误差平方和记为SSR,地块产生的误差平方和

记为SSC,则

SSR=SST-SSC-SSE=2675774-2669290-2368.8=4115.2

所以可得方差分析表如下表所示。

(2)设品种一、品种二、品种三的平均产量分别为。

提出假设:,不全相等。

由于P-值=0.00178<=0.05(或=6.949>(2,8)=

4.4590),拒绝原假设。表明小麦品种对产量有显著影响。

(3)设地块一、地块二、地块三、地块四的平均产量分别

提出假设:H0:,H1:不全相

等。

由于P-值=0.0000<=0.05(或=6.949>(4,8)=

3.8379),拒绝原假设。表明不同地块对产量的影响是显著的。

(4)在产量变动的差异中,被品种所解释的百分比=

(5)在产量变动的差异中,被地块所解释的百分比=

(6)在上面的分析中,所作出的假设有:

①每个总体都服从正态分布。

每个品种的产量和每个地块的产量都服从正态分布。

②各个总体的方差相同。

每个品种的产量和每个地块的产量的方差都相同。

③观测值是独立的。

不同品种和不同地块对产量是独立的。

五、(共30分)统计资料表明,某地区职工年人均病假天数为5.1天。

某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假

天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其

他单位的职工更容易生病。

(1)公司领导感兴趣的原假设和替换假设是什么?(3分)

(2)若令α=0.05,请用假设检验的方法帮助公司领导做出判断。(写

清检验的步骤,并做图示意)(10分)

(3)在假设检验中,P值代表什么含义?(6分)

(4)在本例中,P=0.001说明了什么?(3分)

(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数

显著不同的临界点。(8分)

解:(1)设该地区公司职工年人均病假天数为。则领导感兴趣的原

假设和替换假设分别为:

(2)由于n=46>30,为大样本,故选用z统计量

这是右单侧检验,α=0.05对应的临界值为。

因为z=5.5146>zα=1.96,所以拒绝原假设,即本公司职工比其他单位的

职工更容易生病。

作图略。

(3)P值是指当原假设为真时所得到的样本观察结果或更极端结果出现

的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现

了,根据小概率原理,就有理由拒绝原假设,P值越小,拒绝原假设的

理由越充分。

(4)由于P值=0.001<,所以拒绝原假设,即本公司职工比其

他单位的职工更容易生病。

(5)在的置信水平下,该公司职工病假天数的置信区间为:

故显著不同的临界点为7-0.722=6.278(天)

六、(共30分)关于回归分析讨论下列问题:

(1)画出回归建模步骤的流程框图;(7分)

(2)简要描述各个步骤的内容;(8分)

(3)设是多元回归方程参数的最小二乘估计,证明

;(8分)

(4)根据,结合一元线性回归你能看出对建模有指导意

义的什么信息?(7分)

解:略

2002年中国人民大学统计学系517统计学(含描述统计、推论统计)考

研真题(含部分答案)

一、简要回答下列问题(每小题7分,共21分)

1.什么是数据变换?它具有哪些作用?

答:略

2.简述众数、中位数、均值的特点和应用场合。

答:(1)众数是一组数据中出现次数最多的变量值。它主要用于测度

分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中

趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意

义。

(2)中位数是一组数据排序后处于中间位置上的变量值,主要用于测

度顺序数据的集中趋势,当然也适用于作为数值型数据的集中趋势,但

不适用于分类数据。

(3)均值是一组数据相加后除以数据个数得到的结果,是集中趋势的

最主要测度值。它主要适用于数值型数据,而不适用于分类数据和顺序

数据。

3.简述方差分析的基本原理。

答:方差分析通过检验各总体的均值是否相等来判断分类型自变量对数

值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来

表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包

含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间

误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差

经过平均后的数值就应该很接近,它们的比值就会接近l;反之,如果

在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差

平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大

于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在

着显著差异,也就是自变量对因变量有影响。

二、(12分)某种灯泡的质量标准是平均使用寿命不低于1000小时。已

知灯泡批量产品的使用寿命服从正态分布,且标准差为100小时。商店

欲从工厂进货,随机抽取了81只灯泡检查,测得小时。令

,回答下面的问题:

1.如果采用假设检验,你打算如何设立原假设和备择假设,并说明其

理由。

2.按你设立的假设进行检验,帮助商店决定是否购进该批灯泡?

解:(1)设灯泡的寿命均值为μ,检验假设为:

理由如下:①题中抽取的样本的均值为980小时,小于1000小时,所以

初步认为灯泡寿命没有达标,因此应将备择假设设定为;②

在假设检验中,通常将等号“=”放在原假设上,因为它可以涵盖备择假

设不出现的所有情况。

(2)计算检验统计量

查表得,因为-1.8<-1.645,所以拒绝原假设,即认为灯泡

的使用寿命低于1000小时,商店不应该购进该批灯泡。

三、(16分)某住宅调查居民用水情况,该区共有N=1000户,采用无

放回抽样随机抽取了n=100户,测得吨,s2=15.52,其中有40户用

水超过了规定标准。要求计算(列出计算公式):

1.该住宅区的总用水量及95%的置信区间。

2.若要求估计的相对误差不超过10%,应抽多少户作样本?

3.以95%的可靠性估计用水超过标准的户数。

4.若认为估计用水的超标户的置信区间过宽,要求缩短一半,这时应

抽多少户作样本?

解:(1)由于是无放回抽样,则抽样平均误差为

由于总体的方差未知,故用样本方差代替,则该住宅区平均用水量的

95%的置信区间为:

即(11.842,13.158)。

(2)若要求估计的相对误差不超过10%,即要求

代入数据解得n≥827.87,即至少应抽取828户作样本。

(3)设用户超过标准的比例为p,由于是无放回抽样,从而p的95%的

置信区间为

其中p0=0.4,代入数据解得:(0.3089,0.4911),所以以95%的可靠性

估计用水超过标准的户数在309与491之间。

(4)若要求置信区间的宽度缩小为原来的一半,即要求应抽取的户数

n1满足方程:

代入数据解得n1=307.69。

即若使用水的超标户的置信区间缩短一半,则应取308户作样本。

四、(10分)下表是2000年某商业银行各月份的存货款数据:

根据上表中的数据回答下列问题:

1.已知年初的存款余额为20亿元,计算2000年各月份的平均存款额,

并用水平法计算存款额的月平均增长率。

2.根据年初存款额20亿元和6月份的存款额70亿元,计算年度化增长

率。

解:(1)由题中数据可得,2000年各月份的平均存款额为:

用水平法计算的存款额的月平均增长率为:

(2)略

五、(15分)某家用电器生产厂家主要生产空调、电冰箱和洗衣机三种

产品,2000年,空调、电冰箱和洗衣机的总生产费用分别为1500万元、

1200万元、1000万元。2001年三种产品的总生产费用分别增长了

15.36%、3.88%、2.6%,产品产量分别增长了12%、6%、8%。单位产

品成本的变化情况是:空调增长了3%,电冰箱下降了2%,洗衣机下降

了5%。

1.计算全部产品总生产费用增长的百分比及增长的绝对额。

2.用2000年的总生产费用作权数,计算三种产品总产量增长的百分

比,以及由于产量变动而增加的生产费用。

3.用2001年的总生产费用作权数,计算三种产品单位成本增长的百分

比,以及由于单位成本变动增加的总生产费用。

解:设p为单位产品成本,q为产品产量。

(1)全部产品总生产费用增长率为:

即总生产费用增长的百分比为8.19%。

费用增长的绝对额为4002.96-3700=302.96(万元)。

(2)三种产品总产量增长率为:

即总产量增长的百分比为8.973%。

由于产量变动而增加的生产费用为4032-3700=332(万元)。

(3)三种产品单位成本增长率为:

即三种产品单位成本下降了0.72%。

由于单位成本下降使总生产费减少了4032-4002.96=29.04(万元)。

六、(10分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论