2023年人民大学统计学在职题库统计综述答案_第1页
2023年人民大学统计学在职题库统计综述答案_第2页
2023年人民大学统计学在职题库统计综述答案_第3页
2023年人民大学统计学在职题库统计综述答案_第4页
2023年人民大学统计学在职题库统计综述答案_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:1

一、(2()分)随机抽取2()块电池,测得其使用寿命数据如下

(单位:小时):

100899399810071011

100210139991008995

98399510009771015

101099810051011996

列出描述上述数据所合用时记录图形,并阐明这些图形的用

途。

直方图:直观的展示一组数据(电池使用寿命)FT、J分布状况。

箱线图:直观反应原始数据(电池寿命)H勺数据分布口勺特性,如

偏态,与否有离群点。

二、(20分)方差分析中有哪些基本假定?这些假定中对哪个假

定的规定比较严格?

1、方差分析有3个基本假定:

(1)正态性:每个总体都应服从正态分布,即对于因子时每一种

水平,其观测值是来自正态分布总体的简朴随机样本;

(2)方差齐性:各个总体的方差必须相似;

(3)独立性:每个样本数据是来自因子各水平H勺独立样本

2、对独立性规定比较严格,独立性得不到满足会对方差分析成果

有较大影响,对正态性和方差齐性的规定相对比较宽松。

三、(20分)某种食品每袋日勺原则重量是100克,从该批食品中

抽取一种随机样本,检查假设"o:〃=100,H/W1(X)。

(1)假如拒绝,你的I结论是什么?,假如不拒绝H。,你

的结论是什么?

(2)能否得到一种样本可以证明该食品H勺平均重量是100

克?请阐明理由。

(3)假如由该样本得到的检查的P=0.03,你H勺结论是什

么?0.03这个值是犯第I类错误H勺概率,是实际算出来

的明显性水平,你怎样解释这个P值?

(1)拒绝“°:该种食品每袋的平均重量不是l()()g

不拒绝仇:提供日勺样本不能证明该种食品每袋的平均重量不是

100g

(2)不能,样本得出日勺结论只能是拒绝或不拒绝原假设,并不能

直接确定原假设为真

(3)结论:若给定明显性水平为0.05,则可以拒绝原假设,认为

该食品每袋日勺平均重量不是100克;但若给定明显性水平为

0.01,则不能拒绝原假设

P值:假如该种食品每袋日勺平均重量是100g,样本成果会像实

际观测那样极端或更极端的概率仅为0.03

四、(20分)在建立多元线性回归模型时,一般需要对自变量进

行筛选。

(1)请谈谈你对变量筛选出J必要性W、J见解。

(2)列出变量筛选的措施,请简要阐明这些措施的特点。

(1)若将所有的自变量都引入回归模型,往往会导致所建立H勺模

型不能进行有效的解释,也也许会导致多重共线性,增长自变量

还会导致鉴定系数Iy增大,从而高估模型拟合优度。

(2)变量筛选有向前选择、向后剔除、逐渐回归等措施。特点如

下:

向前选择:从没有自变量开始,不停向模型中增长自变量,直到

增长不能导致SSE明显增长为止。

向后剔除:从所有自变量开始,不停从模型中剔除自变量,直到

剔除不能导致SSE明显减小为止。

逐渐回归:结合向前选择和向后剔除,从没有自变量开始,不停

向模型中增长自变量,每增长一种自变量就对所有既有日勺自变量

进行考察,若某个自变量对模型的奉献变得不明显就剔除C如此

反复,直到增长变量不能导致SSE明显减少为止。

五、(2()分)假如一种时间序列包括趋势、季节成分、随机波

动,合用H勺预测措施有哪些?对这些措施做检查阐明。

可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分

解法等进行预测。

(1)Winter指数平滑模型

包括三个平滑参数,即a、0、Y(取值均在()~1),以及平滑值豆、趋势项

更新九、季节项更新4、未来第k期的预测值工+k。

L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季

节调整因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项

更新是t期的季节调整因子,匕+L(&+以.-“喝用于预测日勺模型。

使用Wimer模型进行预测,规定数据至少是按季度或月份搜集的,并且需

要有四个以上的季节周期(4年以上的数据)。

使用Winter模型进行预测,规定数据至少是按季度或月份搜集

出J,并且需要有四个以上的季节周期(4年以上的J数据)。

(2)引入季节哑变量的多元回归

对于以季度记录H勺数据,引入3个哑变量

Qz、Q3、Q4,其中Q^l(第1季度)或()(其他季度),以此类推,则季

产性多元回归模型表达为:

?=+bit+WQ2+^3^3+

其中b()是常数项,bl是趋势成分的系数,表达趋势给时间序列带

来的影响,b2、b3、b4表达每一季度与参照的第1季度的平均差

值。

(3)分解预测

第1步,确定并分离季节成分。计算季节指数,然后将季节成分

从时间序列中分离出去,即用每一种时间序列观测值除以对应的I

季节指数以消除季节性。

第2步,建立预测模型并进行预测。对消除了季节成分的时间序

列建立合适日勺预测模型,并根据这一模型进行预测。

第3步,计算出最终的预测值。用预测值乘以对应H勺季节指数,

得到最终H勺预测值。

2中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:2

一、(20分)在某小学随机抽取35名小学生,调查他们每

周购置零食的花费状况,得到H勺数据如下(单位:

元):

2417262938

62844398

3017263240

1020274333

154283526

4725172645

163629375

列出描述上述数据所合用的记录量,并阐明这些记录量出J

用途。

平均数:用于度量对象的一般水平。

中位数(分位数):用中间(某个)位置上时值代表数

据水平,也用于度量对象H勺一般状况,且不受极值的影响具

有稳定性。

方差(原则差):用于描述一组数据的差异水平,越大

阐明数据H勺分布越分散不稳定。

偏态系数:用于描述数据分布H勺不对称性,越靠近()越

对称。

峰度系数:用于描述数据分布峰值高下,不小于0为尖

峰,不不小于0为扁平分布。

二、(20分)简要阐明,分布和尸分布在推断记录中应用。

t分布:当正态总体原则差未知时,在小样本H勺条件下对总体

均值的估计和检查要用到t分布。描述样本均值分布,用于

对两个样本均值差异进行明显性测试、估算置信区间等。

F分布:一般用于比较不一样总体的方差与否有明显差异。

应用于方差分析、协方差分析和回归分析等,还可用于似然

比检查。

三、(20分)什么是P值?要证明原假设不对的,怎样确定

合理的P值?

P值:犯第I类错误的真实概率,也称观测到H勺明显性水平。

是当原假设为真时,得到H勺样本成果会像实际观测成果这样

极端或者更极端H勺概率。

若要证明原假设不对H勺,则由样本得到H勺P值应不不小于给

定时明显性水平。

四、(20分)某企业准备用三种措施组装一种新日勺产品,为

确定哪种措施每小时生产日勺产品数量最多,随机抽取了

30名工人,并指定每个人使用其中的一种措施。通过对

每个工人生产日勺产品数进行方差分析得到下面的成果:

方差分析表

差异源SSdfMSFP-valuc

组间2100.245940

组内3836——

总计2———

(1)完毕上面的方差分析表。

(2)组装措施与组装产品数量之间的关系强度怎样?

(3)若明显性水平。=().()5,检查三种措施组装的产品数

量之间与否有明显差异?

(1)

差异

源SSdfMSFP-value

210

组间2*210=4201-1=22104.锣4

142.07'

3836

30-亏-=142.0

组内3836——

3=277

420+3836

总计29———

二4256

(2)

从P值来看,组装措施与组装产品数量之间日勺关系强度

较弱。

(3)

原假设:三种措施每小时组装H勺产品数量没有差异

若明显性水平为0.05,则P>0.05,因此不能拒绝原假

设,即不能证明三种措施组装的产品数量之间有明显差异。

五、(20分)简要阐明分解预测H勺基本环节。

第1步,确定并分离季节成分。计算季节指数,然后将季节

成分从时间序列中分离出去,即用每一种时间序列观测值除

以对应日勺季节指数以消除季节性。

第2步,建立预测模型并进行预测。对消除了季节成分日勺时

间序列建立合适日勺预测模型,并根据这一模型进行预测。

第3步,计算出最终H勺预测值。用预测值乘以对应的季节指

数,得到最终的预测值。

3中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:3

~~~(2()分)在2008年8月1()日举行的第29届北京奥运会女子

10米气手枪决赛中,进入决赛的8名运动员口勺初赛成绩和最

终1()枪的决赛成绩如下表:

姓名国家预赛成绩决赛10枪成绩(环)

纳塔利娅帕杰林娜俄罗斯39110.08.510.C10.210.610.59.89.79.59.3

郭文培中国39010.010.510.410.410.110.39.410.710.89.7

卓格巴德拉赫费赫珠劫蒙古3879.310.08.78.39.29.58.510.79.29.2

妮诺萨卢克瓦泽格鲁吉亚3869.810.310.C9.510.210.710.410.69.110.8

维多利亚柴卡白俄罗斯3849.39.410.410.110.210.59.210.59.88.6

莱万多夫斯卡萨贡波兰3848.110.39.29.99.810.49.99.410.79.6

亚斯娜舍卡里奇塞尔维亚38410.29.69.S9.99.39.19.710.09.39.9

米拉内万苏芬兰3848.79.39.210.39.810.09.79.99.99.7

要对各名运动员进行综合评价,使用日勺记录量有哪些?简要阐

明这些记录量的用途。

(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反

应选手射击成绩中心点日勺位置

平均数:一组数据相加后除以数据H勺个数得到H勺成果。若各组数

据在组内是平均分布的,则计算日勺成果还是比较精确的,否则误

差会比较大。(如中国选手发挥很稳定,适合使用平均数判断其

成绩)

中位数:一组数据排序后处在中间位置上的变量值,但不受极端

值的影响。(如波兰选手大多数成绩比较平均,但有一枪打到

8.1,会严重影响其平均值,但不会影响中位数)

(2)离散程度:各变量值远离其中心值的程度,它可以反应选手

发挥日勺稳定性

原则差:方差的平方根,可以很好的反应出数据的离散程度,若

选手出J平均成绩差异不大,可以通过直接比较原则差的方式进行

衡量

离散系数:一组数据的原则差与其对应的平均数之比,离散系数

越大则数据日勺离散程度也大,若选手的平均成绩差异很大,则需

要计算离散系数比较稳定性

极差:一组数据口勺最大值与最小值之差,它轻易受极端值的影

响,不能反应中间数据日勺分散状况,但可从另首先选手与否存在

发挥异常

(3)分布形状

峰态:峰态是对数据分布平峰或尖峰程度的测度,当K〉0时为尖

峰分布,数据W、J分布更集中;当K<0时为扁平分布,数据H勺分布

越分散。通过对选手的峰态分布状况分析,可看出成绩分布与否

平均。

偏态:偏态是对数据分布对称性的测量,若偏态系数明显不等于

0,表明分布是非对称的,偏态系数日勺数值越大,表达偏斜日勺程度

越大。通过对选手的偏态分布状况状况分析,可看出选手成绩分

布与否对称,与否受比赛时长影响。

二、(20分)为何说假设检查不能证明原假设对日勺?

(1)假设检查日勺目日勺重要是搜集证据拒绝原假设,而支持你所倾

向的备择假设。由于假设检查只提供不利于原假设的证据(证据

的强弱取决于P值口勺大小)。因此,当拒绝原假设时,表明样本

提供的证据证明它是错误出J;当没有拒绝原假设时,我们也没法

证明它是对日勺的,由于假设检查H勺程序没有提供它对的H勺证据c

(2)假设检查得出的结论都是根据原假设进行论述的I。我们要么

拒绝原假设,要么不拒绝原假设。当不能拒绝原假设时,我们也

不能说“接受原假设”,由于没有足够的证据拒绝原假设并不等

于你已经证明了原假设时真区J,它仅仅意味着目前我们还没有足

够的证据证明原假设,只表达目前口勺样本提供口勺证据还局限性以

拒绝原假设。

(3)假设检查一般是先确定明显性水平。,这等于控制了第I类

错误的概率;但犯第II类错误口勺概率B却是不确定的。在拒绝?10

时,犯第I类错误日勺概率不超过给定的明显性水平&;当样本成

果显示没有充足理由拒绝原假设时,也难以确定第H类错误发生

的概率。因此,在假设检查中采用“不拒绝H0”而不采用“接受

H0”的表述措施,这样在多数场所下便防止了第H类错误发生内

风险O

三、(20分)为估计公共汽车从起点到终点平均行驶的时间,一

家公交企业随机抽取36班公共汽车,得到平均行驶口勺时间为

26分钟,原则差为8分钟。

(1)阐明样本均值服从什么分布?根据是什么?

(2)计算平均行驶时间95%的置信区间。

(3)解释95%日勺置信水平日勺含义c

z

(o.o.5二L645,z0.025=1.96,z0.05=1.860,

,o.o25=2.306)

(1)样本均值服从正态分布。通过中心极限定理:设从均值为

山方差为。2(有限)H勺任意一种总体中抽取样本量为nH勺样本,

当n充足大时,样本均值的抽样分布近似服从均值3方差标/几的

正态分布。一般记录学中的nN30为大样本,本题中抽取了36个

样本,因此样本均值服从正态分布。

_7a70.05

(2)已知n=36,x=26,s=8,置信区间95%因此片—=1.96

平均行驶时间95%日勺置信区间为:

—+ZaS8

x一5赤二26±1.96X辰=26±2.61即(23.39,28.61)

(3)一般地,假如将构造置信区间的环节反复多次,置信区间中

包括总体参数真值的次数所占的比例称为置信水平。假如用某种

措施构造的所有区间中有95%日勺区间包括总体参数的真值,5%的区

间不包括总体参数的真值,那么用该措施构造H勺区间称为置信水

平为95%的置信区间。

四、(20分)设单原因方差分析口勺数学模型为:

兀。解释这一模型H勺含义,并阐明对这一模

型的基本假定。

单原因方差分析指的是只有一种处理原因在影响成果,或者说只

有一种自变量在影响因变量口勺状况。

(1)设任何一次试验成果都可以表达成如下形式:Yi=u+£i

其中Yi是第i次试验的实际成果,u是该成果的最佳估计值,其

实就是总体均值,£i是均值和实际成果口勺偏差也就是随机误差

(2)假定£i服从均值为0,原则差为某个定值的正态分布,把

以上形式按照方差分析进行推广,假设我们要研究几种水平之间

H勺差异,每种水平抽取一定样本并搜集有关数据,那么模型公式

可以表达为:Yij=ui+eij

其中Yij是第i组水平日勺第j个样本的实际成果,ui是第i组H勺

均值,£ij是第i组第j个样本相对于实际成果日勺偏差。同样假

定£i服从均值为0,原则差为某个定值的正态分布,假如这i组

水平没有差异,则Yij应等于总体均值加上随机误差项。

(3)为了以便记录推断,模型公式改为如下形式:

Yij=u+ai+£ij

其中u表达不考虑分组时的I总体均值,«i表达第i组的附加效

应,即在第i组时的均值变化状况,例如Qi=10,表达第i组的

均值要比总体均值多10,假如这i组均值并无差异,那么

a1二a2=。3二...=ai,反之则不等,据此我们可以建立假设:

HO:i取任意值时,ai=0

Hl:i取任意值时,至少有一种ai<〉0

结合差异分解的方差分析思绪,我们发现ai实际上就是处理原因

导致的差异。

五、(20分)在多元回归中,判断共线性的记录量有哪些?简要

解释这些记录量。

(1)自变量间H勺有关系数矩阵:假如有关系数超过0.9的变量在

分析时将会存在共线性问题。在0.8以上也许会有问题。但这种

措施只能对共线性作初步的判断,并不全面。

(2)容忍度(Tolerance):以每个自变量作为应变量对其他自变

量进、行同归分析时得到的残差比例,大小用1减决定系数来表

达。该指标越小,则阐明该自变量被其他变量预测日勺越精确,共

线性也许就越严重。

(3)方差膨胀因子(Varianceinflationfactor,VIF):

VIF.=1/(1—偌)j=12…,/〃

其布代物乙写其他(m-1)个白变量线性回归日勺决定系数c

值越大,七元共线程度越严重。

4、特性根(Eigenvalue):重要包括条件指数和方差比。条件指

数是最大特性根与每个特性根之比日勺平方根。当对应口勺方差比不

小于0.5时,可认为多元共线性严重存在

4中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:4

—(2()分)在2008年8月10日举行的第29届北京奥运会男

子1()米气手枪决赛中,最终获得金牌和银牌的(两名运动员

1()枪的决赛成绩如下表所示:

运动员决赛成绩

庞伟9.310.310.510.310.410.310.710.410.79.3

秦钟午9.59.910.610.39.410.210.110.89.99.8

根据上表计算的韩国运动员秦钟午的平均环数是10.05环,原

则差是0.445环。比较分析哪个运动员的发挥更稳定。

(1)平均数、原则差:庞伟的平均环数=10.22环,原则差是

0.507;秦钟午日勺平均环数=10.05环,原则差是0.445环,由于庞

伟的平均环数明显不小于秦钟午,因此只比较原则差不能阐明二

人的稳定性

(2)中位数:庞伟口勺中位数=10.35,秦钟午的中位数=10,同样

可以看出庞伟的成绩更优秀某些

(3)极差:庞伟的I极差二1.4,秦钟午的极差二1.4,两者极差相似

(4)离散系数:庞伟的离散系数二0.0496,秦钟午时离散系数

=0.0443

综上所述,选手庞伟的成绩更优秀,但秦钟午出J发挥更稳定。

二、(20分)什么是记录意义上日勺明显性?为何说记录上明显

不一定就有现实意义?

(1)在假设检查中,拒绝原假设称样本成果在“记录上是明显

日勺”;不拒绝原假设则称成果是“记录上不明显的”O“明显

的”在这里口勺意思是指非偶尔的,它表达这样的样本成果不是偶

尔得到的,同样,成果是不明显的则表明这样日勺样本成果很也许

是偶尔得到的。

(2)在进行决策时,我们只能说P值越小,拒绝原假设的证据就

越强,检查日勺成果也就越明显。当P值很小而拒绝原假设时,并

不一定意味着检查的成果就有实际意义。由于在假设检查中的

“明显”仅仅是“记录意义上的明显”。P值与样本日勺大小亲密有

关,样本量越大,检查记录量时值也就越大,P值就越小,就越也

许拒绝原假设。因此,当样本量很大时,解释假设检查的成果需

要小心,由于在大样本状况下,总能把与假设值的任何细微差异

查出来,虽然这种差异几乎没有任何实际意义。因此,在实际检

查中,不能把“记录意义上日勺明显性”与“实际意义上的明显

性”混淆起来。

三、(20分)简要阐明判断一组数据与否服从正态分布的记录

措施。

(1)图示法

1.P-P图

以样本的合计频率作为横坐标,以按照正态分布计算的对应

合计概率作为纵坐标,以样本值体现为直角坐标系[1勺散点。假如

数据服从正态分布,则样本点应围绕第一象限日勺对角线分布。

2.Q-Q图

以样本的分位数作为横坐标,以按照正态分布计算的对应分

位点作为纵坐标,把样本体现为直角坐标系的散点。假如数据服

从正太分布,则样本点应围绕第一象限的对角线分布。

3.直方图(频率直方图)

判断措施:与否以钟型分布,同步可以选择输出正态性曲

线。

4.箱线图

判断措施:观测矩形位置和中位数,若矩形位于中间位置且中

位数位于矩形的中间位置,则分布较为对称,否则是偏态分布C

5.茎叶图

判断措施:观测图形的分布状态,与否是对称分布。

(2)偏度、峰度检查法

峰态:峰态是对数据分布平峰或尖峰程度的测度,当K>0时

为尖峰分布,数据时分布更集中;当K<0时为扁平分布,数据内

分布越分散。

偏态:偏态是对数据分布对称性的测量,若偏态系数明显不

等于0,表明分布是非对称的,偏态系数口勺数值越大,表达偏斜口勺

程度越大。

(3)非参数检查

非参数检查措施包括Kolmogorov-Smirnov检查(D检查)和

Shapiro-Wilk(

W检查)。当样本数N<2023时,shapiro-wilk日勺W记录量检查正

态性;当样本数N>2023时,Kolmogorov-Smirnov的D记录量检查

正态性;检查时,根据样本计算一种记录量即检查记录量D。它把

样本分布日勺形状和正态分布相比较,比较得出一种数值P

(0<p<l,即实际的明显性水平)来描述对这个想法的怀疑程度。

假如P值不不小于给定时明显性水平,则拒绝原假设,认为数据

不是来自正态分布,反之则认为数据来自正态分布。

正态分布的拟合优度检查

如PearsonX2检查、对数似然比检查

四、(20分)国家记录局目前对地区的划分中,将我国31个省

市自治区划分为东部地区、中部地区、西部地区、东北地

区。

(1)要分析四个地区口勺平均消费水平与否存在明显差异,

所用日勺记录措施有哪些?这些措施的区别是什么?

(2)你会选择什么措施进行分析?你的假设是什么?

(1)可两两之间进行t检查或4组数据进行方差分析。

T检查:两独立样本t检查(twoindependentsamplest-

test),又称成组t检查。合用于完全随机设计的两样本均数内

比较,其目日勺是检查两样本所来自总体的均数与否相等。完全随

机设计是分别从不一样总体中随机抽样进行研究,即本项目中从

不一样地区随机抽样进行研究相符合。

单原因方差分析:研究一种分类型自变量对一种数值型因变量内

影响,如本项目中就是研究四个不一样地区对平均消费水平的影

响。

区别:T检查属于均值分析,它是用来检查两类母体均值与否相

等。均值分析是来考察不一样样本之间与否存在差异,即两个不

一样地区之间消费水平与否存在明显差异;而方差分析则是评估

不一样样本之间的差异与否由某个原因起重要作用,即消费水平

日勺明显差异与否是由地区不一样引起的。并且通过单原因方差分

析只能得出4组数据与否存在明显差异,并不能得出详细是哪几

种地区之间有明显差异。

Kruskal-Wallis检查。用于检杳多种独立总体与否相似口勺一种非参数

检查措施。原假设:四个地区平均消费水平相等,备择假设:四个

地区平均消费水平不全相等。不需要方差分析的正态分布且方差相等的

假设。该检查可用于次序数据也可用于数值型数据

(2)我选择用单原因方差分析,由于本项目共分为4组数据,只

规定分析他们之间与否存在明显差异,并不用确定详细差异怎样

存在日勺。原假设为:四个地区之间日勺平均消费水平没有明显差

异。若最终拒绝原假设,则阐明四个地区之间的I平均水平存在明

显差异。即证明了题目中W、J规定。

由于对四个地区日勺分布和方差未知,选择非参数措施。

五、(20分)一家房地产评估企业想对某都市日勺房地产销售价

格y(元/m2)与地产的评估价值七(万元)、房产的评估

价值九2(万元)和使用面积与(m2)建立一种模型,以便

对销售价格作出合理预测。为此,搜集了20栋住宅的房地

产评估数据,由记录软件给出口勺部分回归成果如下(明显

性水平为95%):

方差分析

dfSSMSFSig.

回归387803505.4629267835.1546.703.879E-08

残差1610028174.54626760.91

总计1997831680

Coefficients原则误差tStatP-value

Intercept148.7005574.42130.25890.799

XVariable10.81470.5121.59130.1311

XVariable20.8210.21123.88760.0013

XVariable30.1350.06592.05030.0571

对所建立的回归模型进行综合评价。

(1)线性回归方程为

y=148,7005+0.8147%!+0.8212%2+0.135%3

其中第i(i=l,2,3)个回归系数勺意义是,在其他自变

量保持不变时,玉每变动一种单位,y就平均变动£.个单

位。例如在房产日勺评估价值和使用面积都不变的状况下,

地产日勺评估价值每上升1万元,房地产销售价格就上升

8147元。

(2)设a=0.05,由〃值二3.879*10知,回归方程日勺线性

关系是明显的。

(3)第1,2.3个回归系数明显性检查〃值分别是

0.1311>a,0.0013<«,0.0571>a

故第2个回归系数明显,第1、3个回归系数不明显。

(4)多重鉴定系数

.SSR87803505.

R2=——=-------------=0.8975

SST

它反应了因变量变异中能用自变量解释的比例,描述了

回归直线拟合样本观测值时优劣程度。此处

R2=0.8975,表明回归拟合效果很好。

(5)估计原则误差

SSE

=MSE=7626760.91=791.68

n-p-1v

八是y日勺原则差的估计,反应了y(房地产销售价格)

的波动程度。

(6)有用。虽然该变量的部分系数没通过明显性检查,但并

不意味着该变量没用,它在经济解释上也许还是有一定意

义H勺,方程总体明显,阐明方程包括该变量总体上是有用

的。也也许是多重共线性导致了不明显。

5中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:5

—(2()分)为研究大学生的逃课状况。随机抽取35()名大学

生进行调查,得到的男女学生逃课状况的汇总表如下。

与否逃课男女合计

逃过课8488172

未逃过课78100178

合计162188350

(1)这里波及口勺变量有哪些?这些变量属于什么类型?

波及的变量有性别、与否逃课。与否逃课及性别为分类型变

量,不一样性别口勺逃课和非逃课人数,为数值变量。

(2)描述上述数据所合用日勺记录图形有哪些?

可以用条形图、复式条形图,饼图、复式饼图,环形图。

二、(20分)现从一批零件中随机抽取16只,测得其长度(单

位:厘米)如下:

~15A~~145~~148~~146~~\52~~148~~149~~14.6

14,815,115.314.715.015.15.114.7

(1)假如要使用/分布构建零件平均长度H勺置信区间,基本

的假定条件是什么?

在小样本(水30)状况下,对钟体均值得估计都是建立在总体服

从正太分布假设前提下。当正态总体B勺5未知,样本均值通过

原则化后服从自由度为n-1B勺t分布,用样本方差s2替代总

体方差。

(2)构建该批零件平均长度的95%的置信区间。

样本均值平均长度为元=14.9,95%曰勺置信区间为

M±,"(〃-l)s/«=14.9±2.131x0.247656/4

=14.9±0.132'即

(14.77z15.03)

(3)能否确定该批零件的实际平均长度就在你所构建的区间

内?为何?(注:“2(…fox(15)=2.131)

不能。由于该样本所构造的是一种特定的区间,不再是随机区

间。只能说在95%置信水平下,该区间是大量包括真值的区间中的一种。

也也许是少数几种不包括参数真值的区间中的一种。

三、(20分)在假设检查中,当不拒绝原假设时,为何一般不

采用“接受原假设”H勺表达方式?

1、假设检查的目时重要是搜集证据拒绝原假设,而支持你所倾向的备

择假设。由于假设检查只提供不利于原假设I付证据

2.假设检查得出日勺结论都是根据原假设进行论述的。当不能拒绝原假

设时,我们也历来不说“接受原假设”,由于没有证明原假设是真的。

没有足够的证据拒绝原假设并不等于你己经“证明”了原假设是真的,

它仅仅意为着目前还没有足够的证据拒绝原假设,只表达手头上这个样

本提供日勺证据还局限性以拒绝原假设。“不拒绝”日勺表述方式实际上意

味着没有得出明确的结论

3.假设检查中一般是先确定明显性水平,这就等于控制了第I类错误

的概率,但犯第n类错误的概率却是不确定的。

四、(20分)简要阐明/分布在记录中的应用。

卡方分布应用很广,常用于假设检查和置信区间口勺计算,例如应用到独立

性检查中,同质性检查、适合性检查等等

独立性检查:重要用于两个或两个以上原因多项分类的计数资料分析,也

就是研窕两类变量之间的I关联性和依存性问题

拟合优度检查:检查单个多项分类名义型变量各分类间的实际观测次数与

理论次数之间与否一致欧I问题

同质性检查:检查两个或两个以上总体的某一特性分布,也就是各“类

别”的比例与否统一或相近

适合性检查:检查某一类分类资料所在总体的分布与否符合某个假设或理

论『、J分布

【感觉简答题可以合适写多点,也可以只说检查名字】

五、(20分)简要阐明处理多元回归中共线性H勺措施。

1:变量日勺选择措施:向前选择、向后剔除、逐渐回归。

2:岭回归措施:有偏估计

3:主成分分析:降维,提取信息

4:偏最小二乘回归法:原理与主成分措施相似

6中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:6

(20分)一家电视台为理解观众对某档娱乐节目日勺喜欢程

度,对不一样年龄段日勺男女观众进行了调查,得到喜欢该

档娱乐节目的观众比例(单位:%)如下:

年龄段男性女性

20岁如下56

20—30岁2532

30—40岁1615

40—50岁1212

5()岁以上68

(1)这里波及的变量有哪些?这些变量属于什么类型?

有分类变量和数量变量。分类变量有性别,年龄段。数

量变量有各年龄段日勺男女人数。

(2)描述上述数据所合用的记录图形有哪些?

可以用条形图和饼图【直方图用于持续变量的这里最佳不用】

二、(20分)假定总体共有1000个个体,均值〃=32,原则差

。=5。从中抽取容量为1()()的所有简朴随机样本。样本均

值元口勺期望值和原则差各是多少?得出上述结论所根据欧(

是记录中的哪一种定理?请简要论述这一定理。

样本均值口勺期望值为32,原则差为0.5

是中心极限定理,定理如下

设从均值为口、方差为。-2;(有限)的任意一种总体中抽取样本量

为nH勺样本,当n充足大时,样本均值的抽样分布近似服从均值为口、方

差为。-2/n的正态分布

三、(20分)在假设检查中,运用户决策与运用记录量决黄有

什么不一样?

P值:假如能把犯第I类错误的真实概率算出来,就可以直接用这

个概率做出决策。而不需要管什么事先给定时明显性水平。,这个

犯第I类错误的真实概率就是P值。

记录量检查是根据事先确定的明显性水平。围成欧J拒绝域作出决

策,不管检查记录量H勺值是大是小,只要把它落入拒绝域就拒绝原

假设Ho否则就不拒绝Ho这样,无论记录量落在拒绝域的什么位

置,你也只能说犯第一错误的概率为。,而用P值检查则能把犯第

I类错误日勺真实概率算出来。P值决策优于记录量决策。P值决策

提供了更多的信息。

四、(20分)简要阐明方差分析的基本原理。

方差分析被解释为检查多种总体均值与否相等的记录措施,这种解释侧

重于方差分析日勺过程和形式。

本质上,方差分析研究时是分类自变量对数值因变量的影响

方差分析总的思想是通过计算来比较因某一特定原因带来的样本值H勺差异

与随机偶尔原因对样本值日勺差异的大小,从而判断该原因对总体与否有记

录意义

五、(20分)比较阐明指数曲线和直线的异同。

一、相似点:指数曲线模型和直线模型都可以对时间序列进行拟

合;都可以进行参数估计和假设检查;都可以对于未来的时点进

行预测。

二、不一样点:

1、直线为线性的,指数曲线为非线性的。

2、两者合用于不一样特点的时间序列;线性趋势是时间序列按一

种固定时常数(不变的)斜率)增长或下降,指数曲线是时间序列

各期观测值按一定的增长率增长或衰减;

3、两者日勺模型体现式不一样;

4、系数日勺求解措施不一样。直线用最小二乘法求得。指数曲线,

需先采用线性化手段将其化为对数直线形式,根据最小二乘法,

求解出系数的对数,再取其反对数。

5、两者的预测措施不一样,直线趋势可以用Holt指数平滑和一元

线性回归法预测,指数曲线可以用指数模型来预测。

7中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:7

(20分)一项有关大学生体重状况日勺研究发现,男生的平

均体重为60kg,原则差为5kg;女生的平均体重为50kg,

原则差为5kg。请回答下面出J问题

(1)是男生出J体重差异大还是女生出J体重差异大?为

何?

(2)粗略地估计一下,男生中有百分之几的人体重在

55kg到65kg之间?

(3)粗略地估计一下,女生中有百分之几的人体重在

40kg到60kg之间?

(1)女生的体重差异大。

男生体重的I离散系数是VI=5/60=0.083

女生体重的离散系数是V2=5/5()=0.1

离散系数大日勺离散程度也就大,V2>VI,因此,女

生的体重差异大

(2)设男生n勺体重为XI,XLN(6(),52)

设ZI=(XI-60)/5

男生体重在55kg到65kg之间的概率为P,则

P(55<X<65)=P(-l<Zi<1)=68%

因此,男生有68%的体重在55〜65kg之间。

(3)设女生时体重为X2,则X2〜N(50S),

设Z2=(X2-50)/5,则Z2〜N(O,1)

P(40<X2<60)=P(-2<Z2<2)=95%

故女生有95%日勺体制在40〜60kg之间。

二、(2()分)论述评价估计量的原则。

评价估计量的原则重要有3个。

<1>无偏性。无偏性是指估计量抽样分布的期望值等于被估计

H勺总体参数。设总体参数为6,所选择H勺估计量为

6"假如E(歹尸一则称歹为。的无偏估计量。

<2>有效性。有效性是指估计量的方差尽量小。一种无偏

估计量并不意味着它就非常靠近被估计的总体参数,

估计量与参数的靠近程度是用估计量的方差来度量

Wo对同一总体参数的两个无偏估计量,有更小方差

的估计量更有效。

<3>一致性。一致性是指伴随样本量口勺增大,点估计量的

值越靠近总体参数。一种大样本给出的估计量要匕一

种小样本给出口勺估计量更靠近总体日勺参数。样本均值

的I原则误差。x=0右与样本量的大小有关,样本量

越大,。X时值就越小。因此,大样本量给出日勺估计

量更靠近总体均值U,从这个意义上来说,样本均值是

总体均值的一种一致估计量。

三、(20分)一家房地产开发企业准备购进一批灯泡,企业打

算在两个供货商之间选择一家购置,两家供货商生产的灯

泡使用寿命的方差大小基本相似,价格也很相近,房地产

企业购进灯泡时考虑的重要原因就是使用寿命。其中一家

供货商声称其生产的灯泡平均使用寿命在1500小时以上。

假如在1500小时以上,在房地产企业就考虑购置。由36

只灯泡构成的随机样本表明,平均使用寿命为1510小时,

原则差为193小时。

(1)假如是房地产开发企业进行检查,会提出怎样的假

设?请阐明理由。

(2)假如是灯泡供应商进行检查,会提出怎样的假设,

请阐明理由。

(1)设灯泡的平均使用寿命为u

Ho:uN1500(使用寿命符合原则)Hi:uvl500(使用寿命不符合原

则)

房地产开发企业倾向于证明灯泡W、J使用寿命不不小于1500个

小时,由于这会损害企业的利益(假如房地产企业非常相信灯泡

H勺使用寿命在1500小时以上,也就没有必要抽检了)一般备择假

设用于体现研究者倾向于支持的见解,因此,备择假设为u<1500

小时,原假设为哈1为0。

(2)设灯泡的平均使用寿命为u.

Ho:u<1500Hi:u>1500

灯泡供应商倾向于支持灯泡日勺使用寿命不小于1500小时,因

此备择假设为:u>1500;原假设为:u<1500

四、(20分)什么是鉴定系数?它在回归分析中日勺重要作用是

什么?

1.鉴定系数是对估计的回归方程拟合优度的度量。引起y值

变化H勺这种波动称为变差。变差重要有两种:一是自变量x

的变化引起y变化,这部分H勺平方和称为回归平方和;二

是除x以外日勺其他随机原因导致y变化,这部分变差H勺平

方和称为残差平方和。变差日勺平方和=回归H勺平方和+残差

日勺平方和

鉴定系数(R2)=回归的平方和(SSR)/变差的平方和

(SST)

2.鉴定系数测度了回归直线对观测数据日勺拟合程度。回归

直线拟合日勺好坏取决于SSR/SST比值日勺大小。各观测点越靠近直

线,值越大,直线拟合的越好;值越小,直线拟合日勺越差。

五、(20分)阐明f分布日勺合用条件,怎样判断某个过程产生的

数据满足这一条件?

1.当正态总体口勺原则差未知时,在小样本的条件下对总体均值

口勺估计和检查要用到t分布

2.正态性:可以划出样本数据的直方图和茎叶图或者P-P图,Q-Q图检查

数据的正态性

小样本:当样本日勺数量不不小于30个,当成小样本处理

8中国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:8

(20分)在金融证券领域,一项投资日勺H勺预期收益率的变

化一般用该项投资H勺风险来衡量。预期收益率H勺变化越

小,投资风险越低,预期收益率H勺变化越大,投资风险就

越高。下面H勺两个直方图,分别反应了20()种商业类股票

和200种高科技类股票口勺收益率分布。在股票市场上,高

收益率往往伴伴随高风险。但投资于哪类股票,往往与投

资者日勺类型有一定关系。

(a)商业类股票(b)高科技类股票

(1)你认为该用什么样口勺记录量来反应投资的风险?

(2)假如选择风险小区I股票进行投资,应当选择商业类

股票还是高科技类股票?

(3)假如你进行股票投资,你会选择商一业类股票还是高

科技类股票?

(1)方差或原则差

(2)风险小口勺股票应选商业类股票

(3)假如选择风险小日勺股票,选择商业类股票,假如选

择高收益的股票,选择高科技类股票。

二、(20分)某种感冒冲剂规定每包重量为12克,超重或过轻

都是严重问题。从过去日勺生产数据得知。=0.6克,质检员

抽取25包冲剂称重检查,平均每包的重量为11.85克。假

定产品重量服从正态分布。

(1)根据上述检查计算出的P=0.02,感冒冲剂日勺每包重量

与否符合原则规定(。=0.05)?

(2)阐明上述检查中也许犯哪类错误?该错误口勺实际含义

是什么?

(1)不符合原则P=0.02<0.05点评人:原假设为H0:产品

符合原则规定,由于P值不不小于0.05,因此拒绝原

假设,即,每包重量不符合原则规定。【P为犯第一类

错误的概率,即原假设对日勺,实际拒绝的概率为

03,位于拒绝域内,推翻

(2)也许犯第I类错误(a错误)。原假设是对出JH勺,实际

确拒绝了原假设。

三、(20分)简述方差分析的基本假定。

正态性:每种处理所对应的总体都应服从正态分布。

方差齐性:各个总体日勺方差必须相等。

独立性:每个样本数据都来自不一样处理的独立样本。

方差分析对独立性日勺规定比较严格,若该假设得不到满

足,方差分析日勺成果会受到较大影响。而对正态性和方差

齐性的规定相对较宽松,当正态性不满足和方差略有不齐

时,对分析的成果影响不是很大。

四、(20分)怎样自有关图和偏自有关图来识别

ARIMA(p,4M)模型中H勺参数?

第一步:将序列平稳化。只有平稳序列才能建立ARIMA模

型,当原始序列不平稳时,通过差分可以将其平稳化.

第二步:识别模型的阶数。假如原始序列(或差分序列)

的偏自有关系数有p个明显的峰值,在p个值后截尾,而

它的自有关函数展现出指数衰减或正弦衰减,展现出拖

尾,为AR(p)序列,模型为ARIMA(p,0,0),假如序列时自有

关函数有q个明显口勺峰值,在q个值后截尾,而它的偏自

有关函数呈指数或正弦衰减,展现出拖尾,为MA(q)序

歹U,模型为ARIMA(OQq).假如序列口勺自有关图和偏自有关

图的前p个条和前q个条没有固定规律,其后都是趋渐于0

而不是忽然变为0,都展现出拖尾,模型为ARMA(EQ),

“I”的取值取决于差分的阶数。

第三步:模型诊断。假如模型对时,模型预测产生的误差

是白噪声序列,残差序列H勺自有关图没有什么固定模式。

书上245页

五、(20分)什么是回归中H勺置信区间估计和预测区间估计?

两个区间的宽度与否同样?x取何值时两个区间宽度最窄?

平均值的置信区间估计:是对xH勺一种给定值xo,求出y的

平均值的估计区间。

个别值的预测区间估计:是对x的一种给定值xo,求出y的

一种个别值的估计区间。

两个区间的宽度是不一样样的。预测区间要比置信区间宽

某些。

当x=1时,两个区间的宽度最窄,此时,两个区间也都是

最精确的。

9国人民大学接受同等学历人员申请硕士学位考试试题

招生专业:记录学

考试科目:记录思想综述

课程代码:123201考题卷号:9

一、(20分)为研究少年小朋友日勺成长发育状况,某研究所日勺

一位调查人员在某都市抽取10()名7〜17岁的少年小朋友

作为样本,另一位调查人员则抽取了1000名7〜17岁的少

年小朋友作为样本。请回答下面的问题,并解释其原因C

(1)哪一位调查研究人员在其所抽取的样本中得到的少年

小朋友的平均身高较大?或者这两组样本的平均身高

相似?

(2)哪一位调查研究人员在其所抽取的样本中得到的少年

小朋友身高的原则差较大?或者这两组样本的原则差

相似?

(3)哪一位调查研究人员有也许得到这1100名少年小朋友

的最高者或最低者?或者对两位调查研究人员来说,

这种机会是相似的J?

解:(1)、假如抽样是随机的,抽样样本数目对样本平均值没

有决

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论