统计学导论课后答案兼历年真题(1).doc_第1页
统计学导论课后答案兼历年真题(1).doc_第2页
统计学导论课后答案兼历年真题(1).doc_第3页
统计学导论课后答案兼历年真题(1).doc_第4页
统计学导论课后答案兼历年真题(1).doc_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

欣悦团队出品欣上征途知路遥,山也迢迢,水也迢迢,小舟何日过尽桥;悦逐梦想叹寂寥,风也迢迢,雨也萧萧,为伊偏执又一宵!统计学导论课后习题部分参考解答第一章一、判断题1.答:错。统计学和数学具有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。3.答:错。实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。5.答:错。描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。7.答:错。不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。二、单项选择题 1. A; 3.A。 三、分析问答题1.答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。;定序尺度的数学特征是“”或“”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。第二章一、单项选择题 1.C; 3.A。 二、多项选择题 1.A.B.C.D; 3.A.B.C三、简答题1.答:这种说法不对。从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例。3.答:这种分组方法不合适。统计分组应该遵循“互斥性原则”,本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组。四、计算题解(1)次(频)数分布和频率分布数列。居民户月消费品支出额(元)次(频)数频率(%)800以下8008508509009009509501 0001 0001 0501 0501 1001 100以上141218841228243616824合计50100.00(3)绘制直方图、折线图、曲线图和向上、向下累计图。主要操作步骤:次数和频率分布数列输入到Excel。选定分布数列所在区域,并进入图表向导,在向导第1步中选定“簇状柱形图”类型,单击“完成”,即可绘制出次数和频率的柱形图。将频率柱形图绘制在次坐标轴上,并将其改成折线图。主要操作步骤:在“直方图和折线图”基础上,将频率折线图改为“平滑线散点图”即可。主要操作步骤:将下表数据输入到Excel。组限向上累计向下累计750050800149850545900173395035151000437105047311004821150500选定所输入的数据,并进入图表向导,在向导第1步中选定“无数据点平滑线散点图”类型,单击“完成”,即可绘制出累计曲线图。第三章一、 单项选择题 1. D; 3.B; 5. A。 二、判断分析题1.答:均值。呈右偏分布。由于存在极大值,使均值高于中位数和众数,而只有较少的数据高于均值。3.答:峰度系数,属于尖顶分布。5.答:为了了解房屋价格变化的走势,宜选择住房价格的中位数来观察,因为均值受极端值影响;如果为了确定交易税率,估计相应税收总额,应利用均值,因为均值才能推算总体有关的总量。三、计算题1.解:基期总平均成本660报告期总平均成本640总平均成本下降的原因是该公司产品的生产结构发生了变化,即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。3.解:根据总体方差的计算公式可得:;全部学生成绩的方差 =2.745总体方差(208.2199)组内方差平均数(205.4749)+组间方差(2.745)5.解: 7.解:用1代表“是”(即具有某种特征),0代表“非”(即不具有某种特征)。设总次数为N,1出现次数为N1,频率(N1/N)记为P。由加权公式来不难得出:是非变量的均值=P;方差=P(1-P);标准差=。第四章一、 判断分析题 1.答:(1);(2);(3);(4);(5);(6);(7)3.答:表示没有次品;表示次品不超过一件。二、计算题1.解:设A、B、C分别表示炸弹炸中第一军火库、第二军火库、第三军火库这三个事件。于是,P(A)=0.025 P(B)=0.1 P(C)=0.1 又以D表示军火库爆炸这一事件,则有,D=A+B+C 其中A、B、C是互不相容事件(一个炸弹不会同时炸中两个或两个以上军火库)P(D)=P(A)+P(B)+P(C)=0.025 + 0.1+ 0.1=0.2253.解:设A表示这种动物活到20岁、B表示这种动物活到25岁。BA B=ABP(B|A)=0.55.解:设 B1=第一台车床的产品;B2=第二台车床的产品;A=合格品。则 P(B1)= P(B2)= P(A|B1)=1-0.03=0.97 P(A|B2)=1-0.02=0.98由全概率公式得: P(A)= P(B1)* P(A|B1)+ P(B2)* P(A|B2)=*0.97+*0.98=0.9737.解:设 B1=第一台车床的产品;B2=第二台车床的产品;A=废品。则 P(B1)= P(B2)= P(A|B1)=0.03 P(A|B2)=0.02P(B2| A)=0.259.解:(1)一次投篮投中次数的概率分布表X=xi01P(X=xi)0.70.3(2)重复投篮5次,投中次数的概率分布表X=xi012345P(X=xi)0.168070.360150.308700.132300.028350.0024311.解:P(1400X1600)=()-()=(-0.4255)-(-1.1348)=0.2044P(1600X1800)=()-()=(0.2837)-(-0.4255)= 0.2767P(200011)=0.01;当f1=5、f2=6时 P(X5)=1-0.05=0.9515.解:X=xi23456789101112P(X=xi)E(X)=2*+3*+4*+5*+6*+7*+8*+9*+10*+11*+12*=7V(X)=*+*+*+*+*+*+*+*+*+*+*=5.83317.解:+=0.0769+0.2025=0.2794三、证明题1.证: 因于是3.证: 第五章一、 单项选择题 (1)BC; (3)A; (5)AC。二、计算题1.解: 样本平均数 =425=2.1448=2.14482.1916=4.7005所求的置信区间为:425-4.7005425+4.7005,即(420.2995,429.7005)。3.解:n=600,p=0.1,n P=605,可以认为n充分大,=0.05,。 因此,一次投掷中发生1点的概率的置信区间为0.1-0.0122 Z0.025=1.96检验统计量的样本观测值落在拒绝域。拒绝原假设H0,接受H1假设,认为生产控制水平不正常。3.解:=0.05时(1)提出假设:H0 :=60H1 :60(2)构造检验统计量并计算样本观测值在H0 :=60成立条件下:Z= 2.222(3)确定临界值和拒绝域Z0.025=1.96拒绝域为 (4)做出检验决策Z =2.222 Z0.025=1.96检验统计量的样本观测值落在拒绝域。拒绝原假设H0,接受H1假设,认为该县六年级男生体重的数学期望不等于60公斤。=0.01时(1)提出假设:H0 :=60H1 :60(2)构造检验统计量并计算样本观测值在H0 :=60成立条件下:Z= 2.222(3)确定临界值和拒绝域Z0.005=2.575拒绝域为 (4)做出检验决策Z =2.222 Z0.025=1.96检验统计量的样本观测值落在拒绝域。拒绝原假设H0,接受H1假设,即能够推翻所作的猜测。7.解:(1)提出假设:H0 :1=2H1 :12(2)构造检验统计量并计算样本观测值在H0成立条件下:Z=2.209(3)确定临界值和拒绝域Z0.025=1.96拒绝域为 (4)做出检验决策Z=2.209 Z0.025=1.96检验统计量的样本观测值落在拒绝域。拒绝原假设H0,接受H1假设,即两地的教育水平有差异。9.解:(1)提出假设:H0 :1= 2H1 :1 2(2)构造检验统计量并计算样本观测值在H0成立条件下:p=(n1p1+n2p2)/(n1+n2)=(400*0.1+600*0.05)/(400+600)=0.07Z= -3.036(3)确定临界值和拒绝域Z0.05=1.645拒绝域为(4)做出检验决策=3.036Z0.05=1.645检验统计量的样本观测值落在拒绝域。拒绝原假设H0,接受H1假设,即甲乙两地居民对该电视节目的偏好有差异。11.解: (一)(1)提出假设:H0 :1=2H1 :12(2)计算离差平方和性别i成绩j男510 410 430 380 490 498 430 390 470 420 540 300310 280 410 540 560 524 520 450 390 300 460 450320 340女500 450 490 350 530 310 290 405 400 520 400 580550 570 540 310 530 540 370 320 480 410 560 320m=2 n1=26 n2=24 n=50 =11122 =10725 = 21847=4930980 =5008425 =9939405组间变差 SSR=-n=26* +24*-50*=9550383.76-9545828.18=4555.58组内变差 SSE=-=9939405-9550383.76=389021.24(3)构造检验统计量并计算样本观测值F=0.5621(4)确定临界值和拒绝域F0.05(1,48)=4.048拒绝域为:(5)做出检验决策临界值规则:F=0.5621显著水平标准,所以不能拒绝,即没有得到足以表明性别对成绩有影响的显著证据。 (二)(1)提出假设:H0 :1=2=3=4 H1 :1、2、3、4不全相等(2)计算离差平方和m=4 n1=11 n2=15 n3=12 n4=12 n=50 =5492 =6730=5070 =4555 = 21847 =2763280=3098100 =2237900 =1840125 =9939405组间变差 SSR=-n=11*+15*+12*+12*-50*=9632609.568-9545828.18 =86781.388组内变差 SSE=-=9939405-9632609.568=306795.432(3)构造检验统计量并计算样本观测值F=4.3372(4)确定临界值和拒绝域F0.05(3,46)=2.816拒绝域为:(5)做出检验决策临界值规则: F=4.3372 F0.05(3,46)=2.816检验统计量的样本观测值落在拒绝域。拒绝原假设H0,接受H1假设,即父母文化程度对孩子的学习成绩有影响。P-值规则:根据算得的检验统计量的样本值(F值)算出P-值=0.008973。由于P-值=0.008973显著水平标准,所以拒绝,接受H1,即得到足以表明父母文化程度对孩子的学习成绩有影响的显著证据。第七章一、选择题 1. B、C、D; 3. A、B、D二、判断分析题1错。应是相关关系。单位成本与产量间不存在确定的数值对应关系。3对。因果关系的判断还有赖于实质性科学的理论分析。5对。总体回归函数中的回归系数是有待估计的参数,因而是常数,样本回归函数中的回归系数的估计量的取值随抽取的样本不同而变化,因此是随机变量。7.错。由于各种原因,偏相关系数与单相关系数的符号有不一致的可能。三、证明题1. 证明:教材中已经证明是现行无偏估计量。此处只要证明它在线形无偏估计量中具有最小方差。设为的任意线性无偏估计量。也即,作为的任意线性无偏估计量,必须满足下列约束条件:;且又因为,所以: 分析此式:由于第二项是常数,所以只能通过第一项的处理使之最小化。明显,只有当 时,才可以取最小值,即:所以,是标准一元线性回归模型中总体回归系数的最优线性无偏估计量。四、计算题1. 解:(1)(2)(3)t值远大于临界值2.228,故拒绝零假设,说明在5的显著性水平下通过了显著性检验。(4)(万元) 即有: 3解:(1)回归分析的Excel操作步骤为:步骤一:首先对原先Excel数据表作适当修改,添加“滞后一期的消费”数据到表中。步骤二:进行回归分析选择“工具” “数据分析” “回归”,在该窗口中选定自变量和因变量的数据区域,最后点击“确定”完成操作:得到回归方程为:(2)从回归分析的结果可知:随机误差项的标准差估计值:S442.2165修正自由度的决定系数:Adjusted R Squares0.9994各回归系数的t统计量为:;F统计量为16484.6,远远大于临界值3.52,说明整个方程非常显著。(3)预测使用Excel进行区间估计步骤如下:步骤一:构造工作表步骤二:为方便后续步骤书写公式,定义某些单元格区域的名称步骤三:计算点预测值步骤四:计算t临界值步骤五:计算预测估计误差的估计值步骤六:计算置信区间上下限最终得出的区间预测结果:第八章一、计算题1.解:(1)提出假设:H0 : H1 :(2)构造检验统计量并计算样本观测值Z=(3)确定临界值和拒绝域Z0.005=2.575拒绝域为 (4)做出检验决策=0.577355,因此不能拒绝原假设H0,说明广告宣传没有扩大销售量。地区编号广告前销售量广告后销售量的秩次正秩负秩123456789102216153218101525171930191328171017281614+8+3-2-4-10+2+3-1-595.53.571.53.55.51.5895.53.55.53.571.51.58合计23.521.55.解:H0 :两班的组装效率无差异H1 :两班的组装效率有差异将两个样本的19个观测值合并按递增顺序排列(早班的观测值及其秩用黑体),然后赋秩,见表。顺序号12345678910观测值28333439404041414242秩12345.55.57.57.59.59.5顺序号111213141516171819观测值434445464647484952秩11121314.514.516171819由表可知,。对于,由附表知。由于介于69和111之间,可见两班的组装效率无差异。7.解:(1)提出假设:H0 :新生男婴体重服从正态分布H1 :新生男婴体重不服从正态分布(2)计算样本均值与样本标准差 =*158160= 3163.2(克)S= 465.52(克)(3)列表组号体重分组实际频数(人数)Vi标准化组限Z=概率理论频数Ei=n1234567245024502700270029502950320032003450345037003700+257121086-1.53-1.53-0.995-0.995-0.46-0.460.080.080.620.621.151.15+0.06300.09570.16410.20910.20050.14250.12513.154.7858.20510.45510.0257.1256.2550.41980.00970.17700.22830.00010.10750.0104合计n=501.0000500.9528(4)构造检验统计量并计算样本观测值=0.9528(5)确定临界值和拒绝域自由度 7-2-1=4, (4)=9.488拒绝域为:(6)做出检验决策=0.9528 Me B、Me Mo C、Mo30 D、Me3012、下列受极端值的影响最大的是( ) A、众数;B、平均数;C、几何平均数;D、中位数13、关于标准分数,下列说法错误的是( )A、 只是将原始数据进行了线性变换;B、没有改变一个数据在该组数据中的位置;C、改变了该组数据的分布; D、没有改变该组数据分布的形状。14、能够确定出估计值与总体参数的真实值接近程度的是( ) A、点估计;B、参数估计;C、区间估计;D、最小二乘估计15、 错误是指( )A、原假设为真,却被拒绝的概率; B、备择假设为真,却拒绝H的概率;C、原假设为伪,却没有被拒绝的概率; D、备择假设为伪,却没有拒绝H的概率16、假设检验中的P值不取决于( ) A、样本数据与原假设值之间的差异;B、样本容量;C、被假设参数的总体分布;D、值的大小。17、已知y关于x的一元线性回归方程为y=0.780.81x,经计算得SSR160,SST326.53,则由此可知y与x的相关系数为: A、0.81; B、0.9;C、0.7;D、0.918、已知1981年、1982年国家财政用于农业的支出分别为110.21亿和120.49亿元,若1998年和1999年该数据分别为1154.76亿和1085.76亿元。则19811999年年平均增长率为: A、13.55; B、12.80; C、14.12; D、12.1319、按计算形式不同,指数可分为( )A、 个体指数和综合指数; B、简单指数和加权指数;C、数量指数和质量指数 D、时间性指数和区域性指数20、某企业职工人数与去年同期相比减少2,全员劳动生产率与去年同期相比则超出5,则该企业总产值增长了( )A、 3; B、10; C、2.9; D、7二、简答题(每小题10分,共30分)1、二手资料与一手资料有何不同?使用二手资料时应注意哪些问题? 2、什么是参数最小二乘估计? 3、试述“小概率原理”在假设检验中的作用?三、计算与分析题(第1、2各15分,第3题8分,第4题12分, 共50分)1、某地区为了了解在校大学生生活消费支出的情况,从该地区高校中随机抽取了100名学生进行调查,调查结果如下:按月生活费支出分组(元)人数 200以下200300300400400500500600600以上102030201010合计100要求:(1)对该地区全体在校大学生人均月生活费支出进行点估计;(5分) (2)在95的置信水平下,对该地区全体在校大学生人均月生活费支出额进行区间估计。(7分) (3)如果生活费支出边际误差为25元,问进行95的置信区间估计时,该100名样本容量是否合适?(已知t0.025(99)=1.96,Z0.05=1.645, Z0.025=1.96)(3分)2、根据甲企业2004年每月的产品销售额Y与广告费支出X数据(单位:元),计算出其估计的回归方程为=31.98+1.68X,估计结果中R20.923,F230.78,自变量系数的t检验值为3.587;另有一企业乙也进行了同样情况的分析,已知X=50, Y=110.8, X2=294, Y2=1465.0, XY=654.9,要求:(1)确定乙企业产品销售额Y与广告费支出X的线性回归方程,并说明的含义;(7分) (2)若已知乙企业的回归结果中R20.847,F302.5,自变量系数的t检验值为1.7689,试根据所学知识对甲、乙两企业所建立的线性回归方程的优劣进行综合分析。(已知2)(8分)3、已知一企业过去15个月的营业额数据(万元)为:时间(月)123456789101112131415营业额272933342936374443484847475361要求:(1)用5期简单移动平均法预测第16个月的营业额;(2分)(2)试问该预测方法主要适合什么样的时序数列?(1分)应用该法时的关键是什么?(2分)(3)假设用5期移动平均得到的预测误差平方和为397.65,与用3期得到的预测误差平方和483.79进行比较,看用哪一个移动步长进行预测更合适?(3分)4、设某企业生产三种产品的有关资料如下表: 产品单位总成本(万元)个体成本指数kp(p1/p0)个体产量指数kq(q1/q0)2003年(p0q0)2004年(p1q1)甲乙丙件台箱2005012022050150X11.021.20.965X2X3 要求:(1)、补上上表中个体指数栏所缺数据,即求、X1 、X2、X3 。(3分) (2)、利用加权平均指数体系从相对数和绝对数两方面,对产品成本的变动进行因素分析。(9分)广 东 商 学 院 试 题 纸(B)2004-2005 学年第 二 学期课程名称 统计学原理 课程代码 0420010 课程班代码 共 3 页-一、选择题(每小题1分,共20分)1、 下列哪一个是变量: A、二等品; B、初中; C、20万元; D、产品的质量等级2、按照统计数据的收集方法,可以将其分为: A、观测数据和实验数据; B、时序数据和截面数据; C、分类数据、顺序数据和数值型数据; D、离散数据和连续数据3、( )主要研究如何根据样本信息来推断总体的特征。A、描述统计;B、推断统计;C、统计工作;D、理论统计 4、抽样的目的就是要根据( )去估计总体参数。 A、样本数据;B、样本统计量;C、抽样分布;D、抽样理论5、调查员在街头、公园、商店等公共场所进行随机拦截式的调查行为属( ) A、判断抽样;B、随机抽样;C、方便抽样;D、简单随机抽样6、下列哪一个误差大小与样本量大小和总体的变异性有关: A、抽样误差;B、非抽样误差;C、抽样框误差;D、测量误差7、在某城市中随机抽取10个家庭,每个家庭的人均月收入数据为:1500,1090,790,750,700,950,850,2100,1250,1630,则中位数为( ): A、1090;B、950;C、1020;D、8508、一位投资者持有一种股票,在2000年、2001年、2002年、2003年和2004年收益率分别为4.2、2、20、15、6,则该投资者在这五年的平均收益率为: A、9.44; B、9.23; C、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论