南京财经大学经济学院《432统计学》专业硕士历年考研真题及详解合集_第1页
南京财经大学经济学院《432统计学》专业硕士历年考研真题及详解合集_第2页
南京财经大学经济学院《432统计学》专业硕士历年考研真题及详解合集_第3页
南京财经大学经济学院《432统计学》专业硕士历年考研真题及详解合集_第4页
南京财经大学经济学院《432统计学》专业硕士历年考研真题及详解合集_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录第一部分南京财经大学432统计学考研真题及详解2012年南京财经大学经济学院432统计学[专业硕士]考研真题2012年南京财经大学经济学院432统计学[专业硕士]考研真题及详解2011年南京财经大学经济学院432统计学[专业硕士]考研真题2011年南京财经大学经济学院432统计学[专业硕士]考研真题及详解第二部分兄弟院校432统计学考研真题2014年首都经济贸易大学统计学院432统计学[专业硕士]考研真题2014年首都经济贸易大学统计学院432统计学[专业硕士]考研真题及详解2013年首都经济贸易大学统计学院432统计学[专业硕士]考研真题2013年首都经济贸易大学统计学院432统计学[专业硕士]考研真题及详解2014年河北大学经济学院432统计学[专业硕士]考研真题2013年河北大学经济学院432统计学[专业硕士]考研真题第一部分南京财经大学432统计学考研真题及详解2012年南京财经大学经济学院432统计学[专业硕士]考研真题科目代码:432科目名称:统计学注意:①认真阅读答题纸上的注意事项;②所有答案必须写在答题纸上,写在本试题纸或草稿纸上均无效;③本试题纸须随答题纸一起装入试题袋中交回!一、简要回答下列问题(本题包括1-6题共6个小题,每小题5分,共30分)。1.一组数据的分布特征可以从哪几个方面进行测度?2.简述单因素方差分析的基本思想。3.什么是分组标志?如何正确选择分组标志?4.什么是序时平均数?它与一般平均数有何异同?5.什么是同度量因素?什么是指数化因素?6.点估计与区间估计有什么区别?二、计算与分析题(本题包括1-7题共7个小题,其中1-4题每小题15分,5-7题每小题20分,共120分)1.甲乙两班同时参加统计学课程的测试,甲班的平均成绩为70分,标准差为9分;乙班的成绩分组资料如下:按成绩分组60以下60-7070-802580-901290-1005合计(分)学生人数(人)2650要求:计算乙班学生的平均成绩,并比较甲乙两班哪个班的平均成绩更有代表性?2.一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500个观众作样本(重复抽样),结果发现喜欢该节目的有175人。(1)试以95%的概率估计观众喜欢这一专题节目的区间范围。(2)若该节目主持人希望估计的极限误差不超过5.5%,问有多大把握程度?注:本题可能要用到的数据见下表:概率度t1.96概率F(t)0.952.580.993.假设总体的概率密度为,其中是未知参数,,,…,是来自总体X的一个简单随机样本,求参数的极大似然估计。4.食品厂用自动装罐机装罐头食品,每罐标准重量500克。某日抽取10罐,测得重量(克)分别如下:495,510,505,498,503,492,502,512,497,506算得样本均值为502,样本标准差为6.4979。设罐头重量服从正态分布可以认为平均重量为500克(α=0.05)?(,如果标准差未知,是否)5.某工厂工资水平和工人人数资料如下:工资水平(元)工资级别工人人数(人)基期报告期基期报告期一二三四3003502003001008025071078027714011892090013301435要求:①计算全厂平均工资指数;②用相对数和绝对数说明平均工资变动中两个因素的影响,并说明它们之间的关系。6.设随机变量X的概率密度为,试求:(1)系数A;内的概率;(4)EX。(2)X的分布函数及图形;(3)X落在区间7.将没有截距项的一元回归模型称之为过原点回归。试证明:(1)如果通过相应的样本回归模型可得到通常的正规方程组:则可以得到的两个不同的估计值:,。(2)在基本假设下,与均为无偏估计量。(3)只有是的OLS估计量。2012年南京财经大学经济学院432统计学[专业硕士]考研真题及详解科目代码:432科目名称:统计学注意:①认真阅读答题纸上的注意事项;②所有答案必须写在答题纸上,写在本试题纸或草稿纸上均无效;③本试题纸须随答题纸一起装入试题袋中交回!一、简要回答下列问题(本题包括1-6题共6个小题,每小题5分,共30分)。1.一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征可以从三方面进行测度和描述:(1)分布的集中趋势,反映各数据向其中心值靠拢或集中的程度,测度集中趋势的指标主要包括两类:一类是数据平均数,他们是根据数据计算得到的代表值,主要有算数平均数、调和平均数及几何平均数;另一类是位置代表值,是根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。(2)分布的离散程度,反映各数据远离其中心值的趋势,即说明数据之间差异程度的大小,测度离散程度的指标称为变异指标,,主要分两类:一类是用绝对数或平均数表示的,主要有极差、四分位差、平均差、标准差等;另一类是用相对数表示的,主要有离散系数、异众比率等。(3)分布的形状,反映数据分布的偏态和峰态,主要指标有偏度和峰度。2.简述单因素方差分析的基本思想。答:当方差分析中只涉及一个分类型自变量时称为单因素方差分析。单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。它是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。单因素方差分析的步骤为:(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。(2)构造检验统计量,计算各样本均值,样本总均值,误差平方和、和。(3)计算样本统计量。(4)统计决策。比较统计量和的值。若,拒绝原假设;反之,不能拒绝原假设。3.什么是分组标志?如何正确选择分组标志?答:分组标志就是将统计总体划分为几个性质不同部分的标准或依据。分组标志是统计分组的依据。正确选择分组标志,能使分组作用得以充分发挥,也是使统计研究获得正确结论的前提。正确选择分组标志,须考虑到以下三点:(1)应根据研究问题的目的和任务选择分组标志。每一总体都可以按照许多个标志来进行分组,具体按什么标志分组,主要取决于统计研究的目的和任务。例如:研究人口的年龄构成时,就应该按“年龄”分组;研究各类型的工业企业在工业生产中的地位和作用时,就应该按“经济类型”分组,等等。(2)在若干个同类标志中,应选择能反映问题本质的标志进行分组。有时可能有几个标志似乎都可以达到同一研究目的,这种情况下,应该进行深入分析,选择主要的、能反映问题本质的标志进行分组。(3)结合所研究现象所处的具体历史条件,采用具体问题具体分析的方法来选择分组标志。例如,有的标志在当时能反映问题的本质,但后来由于社会经济的发展变化,可能已经时过境迁,此时,进行统计分组就要选择新的分组标志来进行分组。4.什么是序时平均数?它与一般平均数有何异同?答:将不同时期的发展水平加以平均而得到的平均数称为平均发展水平,在统计上将这种平均数又称为序时平均数或动态平均数。序时平均数与一般平均数的区别:(1)两者所说明的问题不同:序时平均数是从动态上表明整个总体在不同时期内的一般水平;一般平均数是从静态上表明总体内部各单位的一般水平;(2)计算依据不同:序时平均数是根据时间数列计算的,而一般平均数通常是根据变量数列计算的;(3)计算方法不同:序时平均数是根据不同时期的指标数值和时期的项数计算的;一般平均数是根据同一时期的标志总量和总体单位总量

计算的。序时平均数与一般平均数的共同点:两者都是将各个变量值差异抽象化,以反映现象总体的一般水平。5.什么是同度量因素?什么是指数化因素?答:(1)同度量因素亦称“同度量系数”或“指数权数”,是指使若干由于度量单位不同不能直接相加的指标,过渡到可以加总和比较而使用的媒介因素。在编制总指数时,把不能直接相加的要素过渡到能够相加的总体的媒介因素。同度量因素在计算总指数的过程中对各指数因素起着权衡轻重的作用,所以也叫权数。选择同度量因素,要从经济分析入手,并从指标的经济联系中来确定。(2)在指数编制中,将所要测定变动的因素称为指数化因素。在由两个因素构成的经济现象中,其中一个因素必然是数量指标,另一个因素必然是质量指标。当测定数量指标变动时,则数量指标为指数化因素,相应的质量指标为同度量因素;反之,当测定质量指标的变化时,质量指标为指数化因素,相应的数量指标为同度量因素。6.点估计与区间估计有什么区别?答:点估计与区间估计的区别:(1)点估计又称定值估计,它是以抽样得到的样本统计量的某个取值直接作为总体参数的估计值。区间估计也是参数估计的一种形式,是在点估计的基础上,根据样本指标、抽样误差和概率保证程度去推断总体参数的可能区间范围,该区间通常由样本统计量加减估计误差得到。(2)两者的区别表现为:①点估计的方法简单,一般不考虑抽样误差和可靠程度,适用于对推断准确程度与可靠程度要求不高的情况;区间估计则是要根据样本指标和抽样误差构成的区间来估计总体参数,并以一定的概率保证总体参数包含在估计区间内,适用于对推断准确程度与可靠程度要求极高的情况。②点估计得出的是一个具体的值,而区间估计是一个区间。二、计算与分析题(本题包括1-7题共7个小题,其中1-4题每小题15分,5-7题每小题20分,共120分)1.甲乙两班同时参加统计学课程的测试,甲班的平均成绩为70分,标准差为9分;乙班的成绩分组资料如下:按成绩分组(分)60以下60-7070-802580-901290-1005合计学生人数(人)2650要求:计算乙班学生的平均成绩,并比较甲乙两班哪个班的平均成绩更有代表性?解:乙班平均成绩:乙班成绩的标准差:乙班成绩的离散系数为甲班成绩的离散系数为因为,所以乙班的平均成绩更有代表性。2.一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500个观众作样本(重复抽样),结果发现喜欢该节目的有175人。(1)试以95%的概率估计观众喜欢这一专题节目的区间范围。(2)若该节目主持人希望估计的极限误差不超过5.5%,问有多大把握程度?注:本题可能要用到的数据见下表:概率度t1.96概率F(t)0.950.992.58解:(1)由于为大样本,根据中心极限定理可知,观众喜欢这一专题节目的平均比例近似服从正态分布。其中,。则以95%的概率估计观众喜欢这一专题节目的区间范围为:即以95%的概率估计观众喜欢这一专题节目的区间范围为。(2)若该节目主持人希望估计的极限误差不超过5.5%,则,得到,此时。所以若该节目主持人希望估计的极限误差不超过5.5%,则有99%的把握程度。3.假设总体的概率密度为,其中是未知参数,,,…,是来自总体X的一个简单随机样本,求参数的极大似然估计。解:似然函数:对数似然函数:似然方程:求解似然方程:即参数的极大似然估计量为:4.食品厂用自动装罐机装罐头食品,每罐标准重量500克。某日抽取10罐,测得重量(克)分别如下:495,如果标准差未知,是否可以认为平均重量为500克(α=0.05)?()解:根据题意提出假设;由于总体服从正态分布,但总体标准差未知,应该采用检验统计量。由已知条件为小样本,所以,样本标准差,,可得:说明在0.05的显著水平下,检验统计量的值未落在拒绝域内,故不能拒绝原假设。由此可以认为食品厂罐头的平均重量为500克。5.某工厂工资水平和工人人数资料如下:工资水平(元)工人人数(人)工资级别基期报告期基期20030010080报告期一二三四30071035078025027714011892090013301435要求:①计算全厂平均工资指数;②用相对数和绝对数说明平均工资变动中两个因素的影响,并说明它们之间的关系。解:列表计算如下:工资水平(元)工人人数(人)工资总额(元)工资级别一二三四300710350200300100802506000087500216060126000169330750007809002771401182160009200019667012880015694092013301435106400合计680785471400598890557410①全厂平均工资指数(可变构成指数)由于全厂平均工资上升而增加的平均工资额(元)②全厂工资水平指数(结构固定指数)由于各级别工资水平上升而增加的平均工资额(元)工人人数结构指数(结构变动影响指数)由于工人人数结构变化而增加的平均工资额(元)6.设随机变量X的概率密度为,试求:(1)系数A;内的概率;(4)EX。(2)X的分布函数及图形;(3)X落在区间解:(1)有概率密度函数的正则性知所以(2)因为当当时,时,当时,故的分布函数为分布函数的图形为:(3)X落在区间内的概率为;(4)7.将没有截距项的一元回归模型称之为过原点回归。试证明:(1)如果通过相应的样本回归模型可得到通常的的正规方程组:则可以得到的两个不同的估计值:,。(2)在基本假设下,与均为无偏估计量。(3)只有是的OLS估计量。解:(1)由第一个正规方程得或求解得由第2个正规方程得求解得(2)对于,求期望对于,求期望即在基本假设下,与均为的无偏估计量。(3)OLS方法要求残差平方和最小关于求偏导得即有唯一解:可见只有是0LS估计量。2011年南京财经大学经济学院432统计学[专业硕士]考研真题考试科目:432统计学适用专业:应用统计硕士考试时间:2011年1月16日下午2:00——5:00注意事项:所有答案必须写在答题纸上,做在试卷或草稿纸上无效;请认真阅读答题纸上的注意事项,试题随答卷一起装入试题袋中交回。注:答题过程中可能要用到的数据:u0.975=1.96,u0.95=1.65,t0.95(9)=1.833,t0.95(10)=1.812,t0.975(9)=2.262,t0.975(10)=2.228一、单项选择题(本题包括1-30题共30个小题,每小题1分,共30分。在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题纸相应的序号内)。1.从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()。A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样2.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他将问卷发给就餐者,填上后再收上来。他的收集数据的方法属于()。A.自填式问卷调查B.面访式问卷调查C.实验调查D.观察式调查3.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为()。A.单变量值分组B.组距分组C.等距分组D.连续分组4.将某企业职工的月收入依次分为2000元以下、2000元-3000元、3000元-4000元、4000元-5000元。5000元以上几个组。第一组的组中值近似为()。A.2000

B.1000C.1500D.25005.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围内大约有()。A.68%的数据B.95%的数据C.99%的数据D.89%的数据6.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的()。A.标准差不同B.方差不同C.数据个数不同D.计量单位不同7.在一家宾馆门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。如果从宾馆门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从()。A.正态分布,均值为12分钟,标准差为0.3分钟

B.正态分布,均值为12分钟,标准差为3分钟C.左偏分布,均值为12分钟,标准差为3分钟D.左偏分布,均值为12分钟,标准差为0.3分钟8.一个95%的置信区间是指()。A.总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数9.从一个正态总体中随机抽取n=20的一个样本,样本均值为17.25,样本标准差为3.3。则总体均值的95%的置信区间为()。A.(15.97,18.53)B.(15.71,18.79)C.(15.14,19.36)D.(14.89,20.45)10.一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设应为()。A.B.C.D.11.一项调查表明,5年前每个家庭每天看电视的平均时间为6.7小时。而最近对200个家庭的调查结果是:每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。在的显著性水平下,检验假设,得到的结论为()。A.拒绝B.不拒绝C.可以拒绝也可以不拒绝D.可能拒绝也可能不拒绝12.如果变量之间的关系近似地表现为一条直线,则称两个变量之间为()。A.正线性相关关系B.负线性相关关系C.线性相关关系D.非线性相关关系13.在一元线性回归方程中,回归系数的实际意义是()。A.当x=0时,y的期望值B.当x变动一个单位时,y的平均变动数量C.当x变动一个单位时,y增加的总数量D.当y变动一个单位时,x的平均变动数量14.残差平方和SSE反映了y的总变差中()。A.由于x和y之间的线性关系引起的y的变化部分B.除了x对y的线性影响之外的其他因素对y变差的影响C.由于x和y之间的非线性关系引起的y的变化部分D.由于x和y之间的函数关系引起的y的变化部分15.在多元线性回归分析中,如果t检验表明回归系数不显著,则意味着()。A.整个回归方程的线性关系不显著B.整个回归方程的线性关系显著C.自变量与因变量之间的线性关系不显著D.自变量与因变量之间的线性关系显著16.一家出租车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行驶时间(小时)、行驶的里程(公里)之间的关系,为此随机调查了20位出租车司机,根据每天的收入(y)、行驶时间()和行驶的里程()的有关数据进行回归,得到下面的有关结果():方程的截距=42.38截距的标准差=36.59回归平方和SSR=29882回归系数=9.16回归系数的标准差=4.78残差平方和SSE=5205回归系数=0.46回归系数的标准差=0.14根据以上结果计算的判定系数为()。A.0.9229B.1.1483C.0.3852D.0.851617.多重相关系数的平方根度量了()。A.个自变量之间的相关程度B.因变量同k个自变量之间的相关程度C.因变量之间的相关程度D.因变量同某个自变量之间的相关程度18.时间序列在长期内呈现出来的某种持续向上或持续下降的变动称为()。A.趋势B.季节性C.周期性D.随机性19.某地区农民家庭的年平均收入2004年为1500元,2005年增长了8%,那么2005年比2004年相比,每增长1个百分点增加的收入额为()。A.7元B.8元C.15元D.40元20.拉氏指数方法是指在编制价格综合指数时()。A.用基期的销售量加权B.用报告期的销售量加权C.用固定某一时期的销售量加权D.选择有代表性时期的销售量加权21.指出下列指数公式中哪个是帕氏价格指数公式()。A.B.C.D.22.某地区2009年的零售价格指数为108%,这说明()。A.商品销售量增长了8%B.商品销售价格平均增长了8%C.由于价格变动使销售量增长了8%D.由于销售量变动使价格增长了8%23.对于正偏(右偏)分布,平均数、中位数和众数之间的关系是()。A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数24.指出下面的说法哪一个是正确的()。A.置信水平越大,估计的可靠性越大B.置信水平越大,估计的可靠性越小C.置信水平越小,估计的可靠性越大D.置信水平的大小与估计的可靠性无关25.在多元回归分析中,多重共线性是指模型中()。A.两个或两个以上的自变量彼此相关B.两个或两个以上的自变量彼此无关C.因变量与一个自变量相关D.因变量与两个或两个以上的自变量相关26.设,,,则()。A.事件A和B互不相容B.事件A和B对立C.事件A和B不独立D.事件A和B相互独立27.设,,记,,则()。A.对任意实数有B.C.D.只对的个别值才有28.设两个相互独立的随机变量X和Y,分别服从正态分布N(0,1)和N(1,1),则()。A.B.C.D.29.已知,=2.4,=1.44,则二项分布的参数为()。A.n=4,p=0.6B.n=6,p=0.4C.n=8,p=0.3D.n=24,p=0.130.一家计算机软件开发公司的人事部门最近做了一项调查,发现在最近两年内离职的公司员工中有40%是因为对工资不满意,有30%是因为对工作不满意,有15%是因为他们对工资和工作都不满意。则两年内离职的员工中,离职原因是因为对工资不满意、或者对工作不满意、或者两者皆有的概率为()。A.0.40B.0.30C.0.15D.0.55二、简要回答下列问题(本题包括1-6题共6个小题,每小题5分,共30分)。1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系。2.简述众数、中位数和平均数的特点和应用场合。3.简述影响抽样误差大小的因素有哪些。4.简述假设检验的基本思想。5.简述大数定理在统计研究中的方法论意义。6.正态分布的概率密度函数有两个参数和,请结合函数的几何形状说明和这两个参数的意义。三、计算与分析题(本题包括1-6题共6个小题,每小题15分,共90分)1.某公司所属三个企业生产同种产品,2009年实际产量、计划完成情况及产品优质品率资料如下:实际产量(万实际优质品率(%)企业完成计划(%)件)100150250甲乙丙12011080959698要求:(1)计算该公司产量计划完成百分比;(2)计算该公司实际的优质品率。2.现从某公司职工中随机抽取60人调查其工资收入情况,得到有关资料在下表,假定职工的月收入服从正态分布。月收入工人数80090095010001010509110081200715004679(1)以95%的置信度估计该公司工人的月平均工资所在范围;(2)以95%的置信度估计月收入在1000元及以上工人所占比重。3.为研究产品销售额和销售利润之间的关系,某公司对所属7家企业进行调查,设产品销售额为X(万元),销售利润为Y(万元)。对调查资料进行整理和计算,其结果如下:=795=72925=1065=121475=93200要求:(1)计算销售额与销售利润之间的相关系数:(2)配合销售利润对销售额的直线回归方程(3)解释回归系数b的经济意义。。4.某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者,表示对该企业产品满意的有220人。试在显著性水平0.05下,检验调查结果是否支持企业的自我声明。5.三个地区同一种商品的价格和销售量资料如下:商品价格/元销售量/万件地区基期P0报告期基期q0报告期q1代表符号甲P1992040乙101293040丙123020合计要求:(列表并写出计算公式及计算过程)(1)计算三个地区总的平均价格指数。(2)用相对数和绝对数分析说明三个地区总的平均价格变动中,各地区价格变动和销售量结构的变动的影响。6.有一大批产品,其验收方案如下,先作第一次检验:从中取10件,经检验无次品接受这批产品,次品数大于2拒收;否则作第二次检验,其做法是从中再任取5件,仅当5件中无次品时接受这批产品。若产品的次品率为10%,求:(1)这批产品经第一次检验就能接受的概率。(2)需作第二次检验的概率。(3)这批产品按第二次检验的标准被接受的概率。(4)这批产品在第一次检验未能做决定且第二次检验时被通过的概率。(5)这批产品被接受的概率。

2011年南京财经大学经济学院432统计学[专业硕士]考研真题及详解考试科目:432统计学适用专业:应用统计硕士考试时间:2011年1月16日下午2:00——5:00注意事项:所有答案必须写在答题纸上,做在试卷或草稿纸上无效;请认真阅读答题纸上的注意事项,试题随答卷一起装入试题袋中交回。注:答题过程中可能要用到的数据:u0.975=1.96,u0.95=1.65,t0.95(9)=1.833,t0.95(10)=1.812,t0.975(9)=2.262,t0.975(10)=2.228一、单项选择题(本题包括1-30题共30个小题,每小题1分,共30分。在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题纸相应的序号内)。1.从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()。A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】A【解析】简单随机抽样就是从包括总体个单位的抽样框中随机地、一个个地抽取个单位作为样本,每个单位的入样概率是相等的。分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。系统抽样是将总体中的所有单位(抽样单位)按一定的顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。整群抽样是将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。2.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他将问卷发给就餐者,填上后再收上来。他的收集数据的方法属于()。A.自填式问卷调查B.面访式问卷调查C.实验调查D.观察式调查【答案】A【解析】自填式问卷调查是指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。面访式问卷调查是指现场调查中调查员与被调查者面对面,调查员提问、被调查者回答这种调查方式。实验调查是指通过实验,在实验中控制一个或多个变量,在有控制的条件下得到观测结果。观察式调查是指调查人员通过直接观测的方法获取信息。3.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为()。A.单变量值分组B.组距分组C.等距分组D.连续分组【答案】B【解析】数据分组的方法有单变量值分组和组距分组两种。单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量值较少的情况下使用。组距分组是将全部变量值依次划分为若干个区间,并将一个区间的变量值作为一组,在连续变量或变量值较多的情况下通常采用组距分组。在组距分组时,如果各组的组距相等,则称为等距分组。如果各组的组距不相等,则称为不等距分组。4.将某企业职工的月收入依次分为2000元以下、2000元-3000元、3000元-4000元、4000元-5000元。5000元以上几个组。第一组的组中值近似为()。A.2000B.1000C.1500

D.2500【答案】C【解析】开口组的组中值的计算方法如下:本题中,邻组组距为3000-2000=1000,首组上限是2000,所以第一组的组中值为2000-1000/2=1500。5.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围内大约有()。A.68%的数据B.95%的数据C.99%的数据D.89%的数据【答案】A【解析】根据3原则,当一组数据对称分布时,经验法则表明:约有68%的数据在平均数±1个标准差的范围之内;约有95%的数据在平均数±2个标准差的范围之内;约有99%的数据在平均数±3个标准差的范围之内。6.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的()。A.标准差不同B.方差不同C.数据个数不同D.计量单位不同【答案】D【解析】方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的。7.在一家宾馆门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。如果从宾馆门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从()。A.正态分布,均值为12分钟,标准差为0.3分钟B.正态分布,均值为12分钟,标准差为3分钟C.左偏分布,均值为12分钟,标准差为3分钟D.左偏分布,均值为12分钟,标准差为0.3分钟【答案】A【解析】中心极限定理表明,在大样本情况下,样本均值的抽样分布近似服从均值为方差为的正态分布。8.一个95%的置信区间是指()。A.总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数【答案】C【解析】置信水平95%不是用来描述某个特定的区间包含总体参数真值可能性的,而是针对随机区间而言的一个特定的区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。9.从一个正态总体中随机抽取n=20的一个样本,样本均值为17.25,样本标准差为3.3。则总体均值的95%的置信区间为()。A.(15.97,18.53)B.(15.71,18.79)C.(15.14,19.36)D.(14.89,20.45)【答案】B【解析】n=20为小样本,故参数估计采用统计量。总体均值的95%的置信区间为即总体均值的95%的置信区间为。10.一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设应为()。A.B.C.D.【答案】D【解析】通常把观察现象原来固有的性质或没有充分证据不能轻易否定的命题设为原假设;原假设是指研究者想收集证据予以反对的假设。通常把该观察现象新的性质或不能轻易肯定的结论设为备择假设。原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。由题意可知原假设H0为,备择假设H1为。11.一项调查表明,5年前每个家庭每天看电视的平均时间为6.7小时。而最近对200个家庭的调查结果是:每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。在的显著性水平下,检验假设,得到的结论为()。A.拒绝B.不拒绝C.可以拒绝也可以不拒绝D.可能拒绝也可能不拒绝【答案】A【解析】为大样本,根据中心极限定理可知样本的平均数近似服从正态分布。此时可用样本标准差代替总体标准差,采用统计量,则故拒绝原假设,说明小概率事件发生了,即有充分证据表明总体均值。12.如果变量之间的关系近似地表现为一条直线,则称两个变量之间为()。A.正线性相关关系B.负线性相关关系C.线性相关关系D.非线性相关关系【答案】C【解析】相关关系的表现形态大体上可分为线性相关、非线性相关、完全相关和不相关等几种。就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图(a)和(b)所示;如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称为完全相关,如图(c)和(d)所示;如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关,如图(e)所示;如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图(f)所示。13.在一元线性回归方程中,回归系数的实际意义是()。A.当x=0时,y的期望值B.当x变动一个单位时,y的平均变动数量C.当x变动一个单位时,y增加的总数量D.当y变动一个单位时,x的平均变动数量【答案】B【解析】一元线性回归方程的形式为:其中是回归直线在轴上的截距,是当时的期望值;是直线的斜率,它表示当每变动一个单位时,的平均变动值。14.残差平方和SSE反映了y的总变差中()。A.由于x和y之间的线性关系引起的y的变化部分B.除了x对y的线性影响之外的其他因素对y变差的影响C.由于x和y之间的非线性关系引起的y的变化部分D.由于x和y之间的函数关系引起的y的变化部分【答案】B【解析】残差平方和又称误差平方和是指每一点的y值的估计值和实际值的差的平方之和,它是除了对的线性影响之外的其他因素引起的y的变化部分,是不能由回归直线来解释的变差部分,记为SSE。15.在多元线性回归分析中,如果t检验表明回归系数不显著,则意味着()。A.整个回归方程的线性关系不显著B.整个回归方程的线性关系显著C.自变量与因变量之间的线性关系不显著D.自变量与因变量之间的线性关系显著【答案】C【解析】检验是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,即不存在线性相关关系。检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,检验就能通过,但这并不一定意味着每个自变量与因变量的关系都显著。16.一家出租车公司为确定合理的管理费用,需要研究出租车司机每天的收入(元)与他的行驶时间(小时)、行驶的里程(公里)之间的关系,为此随机调查了20位出租车司机,根据每天的收入(y)、行驶时间()和行驶的里程()的有关数据进行回归,得到下面的有关结果():方程的截距=42.38截距的标准差=36.59回归平方和SSR=29882回归系数=9.16回归系数的标准差=4.78残差平方和SSE=5205回归系数=0.46回归系数的标准差=0.14根据以上结果计算的判定系数为()。A.0.9229B.1.1483C.0.3852D.0.8516【答案】D【解析】判定系数17.多重相关系数的平方根度量了()。A.个自变量之间的相关程度B.因变量同k个自变量之间的相关程度C.因变量之间的相关程度D.因变量同某个自变量之间的相关程度【答案】B【解析】多重相关系数是平方根称为多重相关系数,也称为复相关系数,它度量了因变量同个自变量的相关程度。18.时间序列在长期内呈现出来的某种持续向上或持续下降的变动称为()。A.趋势B.季节性C.周期性D.随机性【答案】A【解析】时间序列的构成要素分为4种,即趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。①趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;②季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动;③周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;④随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。19.某地区农民家庭的年平均收入2004年为1500元,2005年增长了8%,那么2005年比2004年相比,每增长1个百分点增加的收入额为()。A.7元B.8元C.15元D.40元【答案】C【解析】2005年比2004年相比,增加了(元)的收入额。则每增长1个百分点增加的收入额为15元。20.拉氏指数方法是指在编制价格综合指数时()。A.用基期的销售量加权B.用报告期的销售量加权C.用固定某一时期的销售量加权D.选择有代表性时期的销售量加权【答案】A【解析】拉氏指数在计算综合指数时将作为权数的同度量因素固定在基期。相应的计算公式为:拉氏数量指标指数拉氏质量指标指数21.指出下列指数公式中哪个是帕氏价格指数公式()。A.B.C.D.【答案】B【解析】拉氏指数在计算综合指数时将作为权数的同度量因素固定在基期。相应的计算公式为:拉氏数量指标指数拉氏质量指标指数帕氏指数在计算综合指数时将作为权数的同度量因素固定在报告期。相应的计算公式为:帕氏数量指标指数帕氏质量指标指数22.某地区2009年的零售价格指数为108%,这说明()。A.商品销售量增长了8%B.商品销售价格平均增长了8%C.由于价格变动使销售量增长了8%D.由于销售量变动使价格增长了8%【答案】B【解析】零售价格指数,是反映一定时期内商品的零售价格变动趋势和变动程度的相对数。零售价格指数=零售商品当期价格计算的价值/零售商品基期价格计算的价值。2009年零售商品价格指数108%,指2009年价格比基期平均增长8%。23.对于正偏(右偏)分布,平均数、中位数和众数之间的关系是()。A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数【答案】A【解析】对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:①如果数据的分布是对称的,众数(Mo)、中位数(Me)和平均数()必定相等,即Mo=Me=;②如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:<Me<Mo;③如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则Mo<Me<。24.指出下面的说法哪一个是正确的()。A.置信水平越大,估计的可靠性越大B.置信水平越大,估计的可靠性越小C.置信水平越小,估计的可靠性越大D.置信水平的大小与估计的可靠性无关【答案】A【解析】置信水平,也叫可靠度,或置信度、置信系数,它是指特定个体对待特定命题真实性相信的程度。置信水平大则置信区间大。置信区间范围越大,可靠性就越大,但是精确度就越低。25.在多元回归分析中,多重共线性是指模型中()。A.两个或两个以上的自变量彼此相关B.两个或两个以上的自变量彼此无关C.因变量与一个自变量相关D.因变量与两个或两个以上的自变量相关【答案】A【解析】在多元回归分析中,当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。存在多重共线性时将会产生以下问题:①变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途。②多重共线性可能对参数估计值的正负号产生影响,特别是的正负号有可能同预期的正负号相反。26.设,,,则()。A.事件A和B互不相容B.事件A和B对立C.事件A和B不独立D.事件A和B相互独立【答案】D【解析】由于,,得解得,说明事件A和B相互独立。27.设,,记,,则()。A.对任意实数有B.C.D.只对的个别值才有【答案】A【解析】由于,,则有得.28.设两个相互独立的随机变量X和Y,分别服从正态分布N(0,1)和N(1,1),则()。A.B.C.D.【答案】B【解析】因为,则。已知随机变量X与Y相互独立,所以,则,即P[X+Y≥1]=P[X+Y≤1]=1/2。29.已知,=2.4,=1.44,则二项分布的参数为()。A.n=4,p=0.6B.n=6,p=0.4C.n=8,p=0.3D.n=24,p=0.1【答案】B【解析】已知随机变量,解得,则有,。30.一家计算机软件开发公司的人事部门最近做了一项调查,发现在最近两年内离职的公司员工中有40%是因为对工资不满意,有30%是因为对工作不满意,有15%是因为他们对工资和工作都不满意。则两年内离职的员工中,离职原因是因为对工资不满意、或者对工作不满意、或者两者皆有的概率为()。A.0.40B.0.30C.0.15D.0.55【答案】D【解析】记事件A为公司员工离职的原因是对工资不满意,事件B为为公司员工离职的原因是对工作不满意。则有,,则两年内离职的员工中离职原因是因为对工资不满意、或者对工作不满意、或者两者皆有的概率为二、简要回答下列问题(本题包括1-6题共6个小题,每小题5分,共30分)。1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系。答:①总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体的每个元素称为个体。比如,要检验一批灯泡的使用寿命,这批灯泡构成的集合就是总体,每个灯泡就是一个个体。②样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。比如,从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本,100就是这个样本的样本量。③参数(parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。④统计量(statistic)是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、样本比例等。区别:总体是具有某种共同性质的多个个体组成的集合;样本是从总体中抽取的一部分个体构成的集合;参数是用来描述总体特征的概括性数字的度量;统计量是用来描述样本特征的概括性数字度量。联系:样本是从总体中抽取的一部分个体组成的集合;参数是用来描述总体的特征的;统计量是用来描述样本的特征的。2.简述众数、中位数和平均数的特点和应用场合。答:(1)众数的特点如下:①其优点是不受极端值的影响;②其

缺点是具有不惟一性。一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为分类数据的集中趋势测度值。(2)中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。(3)平均数是对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此当数据为偏态分布,特别是当偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。3.简述影响抽样误差大小的因素有哪些。答:影响抽样误差大小的因素包括:(1)抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位的数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。(2)总体被研究标志的变异程度。在其他条件不变的情况下,总体

标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示总体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。(3)抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。(4)抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。4.简述假设检验的基本思想。答:假设检验的基本思想是概率性质的反证法,主要依据的是:小概率事件原理。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,就有理由怀疑这一假设的真实性,拒绝这一假设。5.简述大数定理在统计研究中的方法论意义。答:大数定律是概率论中阐明大量随机现象平均结果的稳定性的一系列定理的总称。其中包含贝努里大数定理、车贝晓夫大数定理等。用语言来描述大数定律,即“n个随机变量的平均值Y仍为一随机变量。但随着n的增大,取值的偶然性越来越小,必然性越来越大,即大量的随机现象的平均结果呈现出稳定性。这个定律表明在观察个别现象时是连同其它个别特性来观察的,这些个别特性往往遮蔽了事物的规律性。而在大量观察中个别因素的影响将相互抵消从而使总体稳定。大数定律有两个特点:一是数据的搜集量必须大量;二是数据处理的方法是平均值。大数定律的两个特点是经济及管理统计学方法论的基础,是经济及管理统计学中最基本的方法,其它的方法可以说是在这基本方法基础上,针对不同问题而做的进一步的发展。1.大量性定律表面上似乎是杂乱无章、偶然性占统治地位的社会现象,有其内在的必然性。太数定律告诉我们如何去发现经济规律太数定律的实质含义是:一般的规律性表现在大量的事实中,它依靠大量的观察,使个别的、偶然的差异性相互抵消,显示出总体的、必然的规律性,揭示了大量随机变量的平均趋势也就是说,为了反映社会经济现象的实质,我们必须获取大量资料对总体进行综台分析,当我们获取的数据足够多的时候,能使总体单位的特征差异趋于消失,而呈现出某些同一的现象和明显的规律,而这种规律从少量、个别资料中是无法看出来的。2.平均的定律大数定律告诉我们用平均的方法来处理获得的大量数据。算术平均数(特别是加权算术平均数)的构造可将一组资料中的由于偶然因素引起的过高或过低的差异进行中和;同时算术平均数总是体现总体中数量最多(即权数最大)的那些单位的水平。而如果现象具有某种规律的话,那么这个规律必定会反映在构成这个现象的每个总体单位的特征之中。虽然我们说,每个总体单位的特征中还会夹有其它因素的影响,但如果这些因素不构成该现象的规律的话,它只会出现在少数个别单位中。通过算术平均数的中和差异的作用,可将少数个别的差异去掉,并将蕴含在

每个总体单位中现象的必然规律呈现出来。在大数定律的旗帜下,我们可以把社会经济统计和数理统计统一起来。对社会经济和经营管理统计来说,不论东方统计还是西方统计,所研究的对象是相同的社会经济现象所采用的方法是相同的:向对象搜集资料;社会经济现象的特点是相同的:个体的偶然性中包含着总体的必然性;研究的目的是相同的发现现象的规律。因此它们在方法论上,本没有本质的差别,都以大数定律为其方法论的理论基础。当然,作为西方统计的主干内容的数理统计方法,由于其直接由概率论和数理统计中的数学定理导出,所以对这些方法的原理的理解就不是很容易。如何使数理统计中抽象的数学原理通俗化,是社会经济统计和数理统计融合为一体的问题之一,这是统计理论和教育界应解决的问题。6.正态分布的概率密度函数有两个参数和,请结合函数的几何形状说明和这两个参数的意义。答:正态分布的概率密度函数是一个左右对称的钟形曲线,参数是这个曲线的对称轴,是位置参数,决定了正态曲线的中心位置,并在处达到最大值,此时,同时也是正态分布的数学期望;而参数形状参数,它的大小决定了曲线的陡峭或扁平程度,越的附近;越大,曲线越扁平。这和是正态分布的方差的直观意义一致。当小,则曲线的形状越陡峭,越集中在对称轴时,称为标准正态分布,即为。三、计算与分析题(本题包括1-6题共6个小题,每小题15分,共901.某公司所属三个企业生产同种产品,2009年实际产量、计划完分)成情况及产品优质品率资料如下:实际产量(万实际优质品率(%)企业完成计划(%)件)100150250甲乙丙12011080959698要求:(1)计算该公司产量计划完成百分比;(2)计算该公司实际的优质品率。解:(1)以实际产值为,完成计划百分比为,该公司产量计划完成百分比:(2)以实际优质品率为,以实际产量为,该公司的实际的优质品率:2.现从某公司职工中随机抽取60人调查其工资收入情况,得到有关资料在下表,假定职工的月收入服从正态分布。月收80090095010001050110012001500入工人数679109874(1)以95%的置信度估计该公司工人的月平均工资所在范围;(2)以95%的置信度估计月收入在1000元及以上工人所占比重。解:(1)由于可视为大样本,根据中心极限定理可知工人的月平均工资服从正态分布,此时可用样本方差代替总体方差,参数估计采用统计量。则95%的置信度估计该公司工人的月平均工资所在范围:即95%的置信度估计该公司工人的月平均工资所在范围为(2)则95%的置信度估计月收入在1000元及以上工人所占比重:即95%的置信度估计月收入在1000元及以上工人所占比重为3.为研究产品销售额和销售利润之间的关系,某公司对所属7家企业进行调查,设产品销售额为X(万元),销售利润为Y(万元)。对调查资料进行整理和计算,其结果如下:=795=72925=1065=121475=93200要求:(1)计算销售额与销售利润之间的相关系数:(2)配合销售利润对销售额的直线回归方程(3)解释回归系数b的经济意义。解:(1)。(2)由回归方程的最小二乘估计知:==。(3)b的经济含义:销售额每增加一个单位,平均而言,销售利润增加b个单位。4.某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者,表示对该企业产品满意的有220人。试在显著性水平0.05下,检验调查结果是否支持企业的自我声明。解:根据题意提出假设VS,,由于为大样本,根据中心极限定理可知,总体比例近似服从正态分布,所以应选用作为检验统计量。有所以拒绝原假设,接受备择假设,即认为有30%以上的消费者对其产品质量满意。5.三个地区同一种商品的价格和销售量资料如下:商品价格/元销售量/万件地区基期P0报告期基期q0报告期代表符号甲P19q1404020920乙1012930丙1230合计要求:(列表并写出计算公式及计算过程)(1)计算三个地区总的平均价格指数。(2)用相对数和绝对数分析说明三个地区总的平均价格变动中,各地区价格变动和销售量结构的变动的影响。解:计算表:甲乙9992030308040401803003608403603602409603604001012丙1220240合计1001000设:(元)(元)(元)(1)三个地区总的平均价格指数:;(元)(2)平均价格固定构成指数:;(元)(元)平均价格结构影响指数:;上述计算说明三个地区总的平均价格指数为91.4%,下降8.6%,每件商品价格减少0.9元是由于各地价格降低使平均价格降低4%,每件商品价格减少0.4元和各地区之间销售量结构变化使平均价格降低4.8%,每件商品价格减少0.5元共同影响的结果。6.有一大批产品,其验收方案如下,先作第一次检验:从中取10件,经检验无次品接受这批产品,次品数大于2拒收;否则作第二次检验,其做法是从中再任取5件,仅当5件中无次品时接受这批产品。若产品的次品率为10%,求:(1)这批产品经第一次检验就能接受的概率。(2)需作第二次检验的概率。(3)这批产品按第二次检验的标准被接受的概率。(4)这批产品在第一次检验未能做决定且第二次检验时被通过的概率。(5)这批产品被接受的概率。解:记事件为第一次检验后接受这批产品,表示第一次检验后不接受也不拒绝,,事件为第二次检验后接受这批产品。表示这批产品被接受(1)即这批产品经第一次检验就能接受的概率是0.3487.(2)即需作第二次检验的概率是0.5811.(3)即这批产品按第二次检验的标准被接受的概率是0.59049.(4)即这批产品在第一次检验未能做决定且第二次检验时被通过的概率是0.3431.(5)即这批产品被接受的概率为0.692.第二部分兄弟院校432统计学考研真题2014年首都经济贸易大学统计学院432统计学[专业硕士]考研真题2014年首都经济贸易大学统计学院432统计学[专业硕士]考研真题及详解说明:1.答题一律写在答题纸上,答在试卷上无效;2.答题请写清题号,不必抄题;3.允许使用计算器,但不得使用带有公式和带储存功能的计算器。一、名词解释(本题型共6题,每题5分,共30分)1.抽样误差答:抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。2.等距抽样答:等距抽样,也称系统抽样,是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按固定的间隔来确定其他样本单位的抽样方法。3.检验统计量答:检验统计量是用于假设检验计算的统计量。在零假设情况下,这项统计量服从一个给定的概率分布,而这在另一种假设下则不然。从而若检验统计量的值落在上述分布的临界值之外,则可认为前述零假设未必正确。4.相关系数答:相关系数是衡量两个随机变量之间线性关系强度的指标,取值范围为[-1,1]。5.KMO测度答:KMO测度用于探查变量间的偏相关性,比较各变量间的简单相关和偏相关的大小,取值范围在0~1之间。6.移动平均法答:移动平均法是通过对时间序列逐期递移求得平均数作为预测值的一种预测方法,其方法有简单移动平均法和加权移动平均法两种。二、问答题(本题型共3题,每题20分,共60分)1.一家就业机构想比较分析地方报纸招聘版中3种类型广告(大标题,直截了当和粗体印刷)的效应,从过去几周的时间里随机选择一周,并记录该周对不同广告反响的人数,下表显示了过去半年来记录的结果:试回答:(1)从计量尺度角度看,广告类型属于何种类型变量?答:分类变量。(2)对于不同类型广告的效应,上表的初步结论是什么?答:(3)如果想检验不同类型广告的效应有无显著性差异,应使用何种方法进行检验,并阐述该方法的基本原理。答:应采用方差分析的方法进行检验,即检验不同类型的广告的效应有无显著差异。设置原假设为无显著差异,而设备择假设为有显著差异。方差分析的基本原理是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。2.某市管理部门拟投资建立一家大型生猪养殖场以满足本币居民猪冈需求,为确定生猪养殖场的规模,需调查该市的猪肉人均消费量。为此,该管理部门委托当地一家调查公司进行调查。该市共有8个城

区,其中有两个城区为居民居住较为集中的区域。该调查公司通过本市派出所获得所有居民户的住址和联系方式后,从中随机抽取了1000户居民进行调查,并利用该样本信息对全市居民猪肉人均消费量进行估计。试回答:(1)该调查公司采用的是何种抽样方法?你认为这种抽样方法对于上述调查是否合适?为什么?答:①该调查公司从所有的居民户中随机抽取1000户居民进行调查,每户居民入样的概率相等,因此采用的是简单随机抽样方法。②不合适。因为该市的8个城区中,有2个城区居民居住较为集中,若采用简单随机抽样方法进行调查,则容易使得样本不具有代表性,进而影响对全市居民猪肉人均消费量的估计。(2)如果不合适,你认为最恰当的抽样方法是什么?请结合该种抽样方法的优点阐述你的理由。答:最恰当的抽样方法应是分层抽样。分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本的抽样方法。该种抽样方法保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度。将8个城区按居民居住密集度划分为较集中层和不集中层,然后分别从这两个层中独立、随机地抽取居民户,这样便能较为准确地代表总体的情况,使得估计结果较为精确。3.美国洛杉矶湖人队2000年14名球员的薪水(百万美元)如下

表:球员奥尼尔布莱恩特霍利薪水17.111.85球员哈伯格林乔治肖薪水2.121赖斯4.54.34.23.11费希尔福克斯奈特萨利芦0.80,70.3塞莱斯坦薪水茎叶图为了确定新年度球员薪水水平,球员工会与老板进行谈判。球队老板计算了14名球员的平均收入,其数值为410多万美元,老板觉得球员薪水太高了,不能再提高了。而球员工会代表主张用中位数分析球员薪水水平,并绘制了茎叶图以支持自己的说法。试回答:(1)请计算14名球员薪水的中位数。答:中位数,题目中n=14,为偶数,因此(百万美元)。(2)请说明球队老板和球员工会代表的争执原因是什么?你认为谁的主张更合理?为什么?答:争执原因是用平均收入还是中位数代表14名球员的薪水水平。球员工会代表的主张更合理。因为平均收入易受极端值影响,题中数据存在11.8和17.1两个较高的数据,因而将均值拉向更高水平;从茎叶图可以看出,数据虽然分布不对称,但整体较为集中,中位数能较好地反映球员的薪水水平。三、计算分析题(本题型共2题,每题20分,共40分)要求:(1)计算题要有必要的计算公式和计算过程;(2)计算结果一律保留两位小数。1.中秋节期间,某市饮食业协会在该市居民家庭中随机抽取了100户进行调查,在节日期间全家到饭店聚餐的家庭有25户。(1)估计该市居民家庭中秋节期间全家到饭店聚餐的比例,并在95%的置信水平下给出该比例的置信区间。答:样本量,为大样本,因此样本比例的抽样分布可用正态分布近似。根据抽样结果计算的样本比例为置信水平,则,总体比例的置信区间为,即为,因此该市居民家庭中秋节期间全家到饭店聚餐比例的95%的置信区间为16.51%~33.49%。(2)己知该市去年中秋节期间全家到饭店聚餐的家庭比例为20%,在0.05的显著性水平下,问今年该市居民家庭中秋节期间全家到饭店聚餐的比例是否比去年有所增加?(附:,)答:假设今年该市居民家庭中秋节期间全家到饭店聚餐的比例比去年增加了,为验证这一命题,原假设与备择假设应为:。已知时,,检验统计量,因为Z<1.645,故接受原假设,这说明该比例相比去年没有显著增加。2.某汽车生产商欲了解广告费用(X)对销售量的影响,收集了过去12年的有关数据。通过计算得到下面两个表的相关结果。表1方差分析表:表2回归系数表要求:(1)完成上面的方差分析表和回归系数表。答:方差分析表变自平方和均方F值差来源由度回归11602708.6040158.071602708.604015.81399.10—0910残差总计111642866.67——回归系数表中t值=系数/标准误差,因此截距和X的t值依次为5.82,19.98。(2)汽车销售量的变差中,有多少是由于广告费用的变动引起的?答:,其中SSR为回归平方和,SST为总平方和,因此,即汽车销售量的变差中,有97.56%是由于广告费用的变动引起的。(3)销售量与广告费用之间的相关系数是多少?并说明二者之间的关系。答:在一元线性回归分析中,判定系数等于相关系数的平方,即,则,0<r<1,表明销售量与广告费用之间存在正线性相关关系。(4)写出估计的回归方程并解释回归系数的实际意义。答:,回归系数表示广告费用每增加一个单位,表示在没有广告费用的情况下,汽汽车销售量增加1.42个单位;车销售量为363.69个单位。(5)检验线性关系的显著性(œ=0.05),要求写出对应的原假设和备择假设,并说明检验结果。答:线性关系的检验:,计算检验统计量F,其中p=2.17E-09<,因此拒绝原假设,即两变量之间的线性关系显著。四、证明题(本题20分)设总体x服从N(0,1),X1,X2为其简单随机样本,试求参数k,使得对于给定的a(0<a<1),有答:由题意,则,则,。由于记相互独立,则。,则,,其中因此。,查表可知的值,即可求出参数,即。2013年首都经济贸易大学统计学院432统计学[专业硕士]考研真题一、单项选择题(本题共15个小题,每小题2分,共30分)1.某企业为了了解不同客户对产品的满意度,登记了客户的性别、职业、所在地区和收入等背景资料,则上述变量中既可以设定为数值型数据,也可以设定为顺序数据的是()。A.性别B.职业C.所在地区D.收入2.为了研究北京市财政支付能力,从北京统计年鉴搜集到历年北京市财政支出额数据,则该数据为()。A.时间序列数据B.截面数据C.观察数据D.实验数据3.如果抽选10人作样本,抽选方法是从165公分及以下的人中随机抽取2人,在180公分及以上的人中随机抽取2人,在165—180公分的人中随机抽取6人,这种抽取的方法称为()。A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样4.下列各项中存在抽样误差的调查方式是()。A.方便抽样B.普查C.概率抽样D.判断抽样5.下列各项中不会影响到抽样误差大小的是()。A.总体方差B.总体均值C.抽样方式D.样本容量6.常用直方图展示其分布状况的数据是()A.分类数据B.顺序数据C.定性数据D.数值型数据

7.能够度量中位数代表性高低的统计量是()。A.方差B.四分位差C.平均差D.标准差8.对于一个确定的研究对象而言,能直接观察到,但又具有一定随机性的分布是()。A.总体分布B.样本分布C.抽样分布D.统计量的分布9.某调查公司分析员根据调查资料得到某商品销售量与居民可支配收入间的回归方程为:存在着()。,并通过统计检验。说明两变量间A.正线性相关关系B.负线性相关关系C.正非线性相关关系D.负非线性相关关系10.某研究员希望用最小平方法建立销售收入对广告投入费用的线性回归模型,并进行统计显著性检验,则下列各项中不属于关于误差项假定的是()。A.B.C.服从正态分布D.对于不同的x值,相互独立11.在时间数列中,以12个月为一个周期的变动,称为()。A.循环变动B.季节变动C.趋势变动D.不规则变动12.主成分分析中,所提取的各主成分之间的关系是()。A.相互独立B.低度相关C.高度相关D.完全相关13.若X为随机变量,A.2,则为()B.5C.10D.2014.某企业职工平均工资为2000,方差为1600,某职工工资为2048元,则该职工工资的标准分为()。A.0.03B.0.83C.1.2D.﹣1.215.在给定的显著性水平下,进行假设检验,确定拒绝域的依据是()。A.原假设为真的条件下检验统计量的概率分布B.备择假设为真的条件下检验统计量的概率分布C.原假设为真的条件下总体的概率分布D.备择假设为真的条件下总体的概率分布二、多选题(本题共5小题,每小题3分,总计15分)1.下列各项中,能够反映数据“位置”且比较稳健的有()。A.均值B.分位数

C.中位数D.标准差E.众数2.下列各项中属于概率抽样的是()。A.系统抽样B.分层抽样C.整群抽样D.多级抽样E.方便抽样3.时间数列的构成要素包括有()。A.长期趋势B.季节变动C.循环变动D.不规则波动(随机干扰)E.时间4.下列关于标准差的说法中,正确的是()。A.表明研究变量的每个取值对其平均数的平均距离B.反映研究变量的一般水平

C.反映研究变量的离散程度D.反映研究变量的集中趋势E.反映研究变量的离中趋势5.可以将复杂数据简单化,降低数据维数,并能够保留原始数据大部分信息的统计方法有()。A.回归分析B.相关分析C.主成分分析D.因子分析E.方差分析三、简要回答下列问题(本题共3个小题,每小题10分,共30分)1.何谓概率抽样?试举例说明其包括的主要抽样组织形式。2.为研究少年儿童成长发育状况,某研究所的A调查人员在某城市抽取100名7—l7岁的少年儿童作为样本,B调查人员则抽取了l000名7—17岁的少年儿童作样本,请回答以下问题,并解释。(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较高?或者这两组样本的平均身高相同。(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的身高标准差较大?或者这两组样本身高的标准差相同。(3)哪一位调查研究人员有可能得到少年儿童研究对象中的最高者或最低者?对两位研究人员来说这种机会是相同的吗?

3.某大学教授喜欢游泳,他记录了每次游2000米所用的时间(分钟)和游完泳后的脉搏次数,共记录了23次。该教授分析了时间与脉搏之间的关系,计算得二者的相关系数为﹣0.74598,脉搏对时间的线性回归方程为,他对相关系数和回归方程进行了统计检验,检验结果表明在0.05的显著性水平下均显著。要求:(1)结合上面资料,说明该教授游泳时间与脉搏次数的关系。(2)本周末该教授游2000米用时34.3分钟,请利用上面回归方程预测他游完时的脉搏次数。该教授实际上游完时的脉搏次数为152次,你的预测与实际数一致吗?应怎样理解二者的差异。四、计算分析题(本题共2个小题,每小题15分,共30分,所有计算最终结果保留两位小数)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论