统计学复习题1_第1页
统计学复习题1_第2页
统计学复习题1_第3页
统计学复习题1_第4页
统计学复习题1_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论一、填空1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。2、由一组频数2,5,6,7得到的一组频率依次是0.1、0.25、0。3和0.35,如果这组频数各增加20%,则所得到的频率 不变。3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620.4、如果各组相应的累积频率依次为0。2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为—20 5 35 15 25。5、中位数可反映总体的集中趋势,四分位差可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是5。5,众数为5.6、假如各组变量值都扩大2倍,而频数都减少为原来的1/3,那么算术平均数扩大为原来的2倍。四、计算题1、某班的经济学成绩如下表所示:435556565960676973757777787980818283838384868788888990909597(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?(3)上四分位数和下四分位数所在区间?4、对成年组和青少年组共500人身高资料分组,分组资料列表如下:成年组 青少年组按身高分组(cm)人数(人)按身高分组(cm)人数(人)150〜1552270~7526155〜16010875〜8083160〜1659580〜8539

要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数.(2)说明成年组和青少年组平均身高的代表性哪个大?为什么?6、设甲、乙两单位职工的工资资料如下:甲单位乙单位月工资(元)职工人数(人)月工资(元)职工人数(人)600以下2600以下1600—7004600—7002700—80010700—8004800—9007800—90012900—10006900—100061000—110041000—11005合计30合计30要求:试比较哪个单位的职工工资差异程度小。8、一家公司在招收职员时,首先要通过两项能力测试.在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想?KEY:1、(1)77,80.5,68。5,87.25(2)83,18。75,0.173(3)中位数,是数据分布明显左偏又是顺序数据。(4)左偏身高(cm)频数组中值xyyfyA2(yA2)f150〜15522152。5-2-44488155〜160108157.5-1-1081108160〜16595162.50000165〜17043167。5143143170以上32172.52644128合计300-45367令标准差:标准差变异系数:成人组的平均身高为161。75cm,标准差为5。4784cm,标准差系数为0。03387。青少年组身高(cm)频率组中值yyfyA2(yA2)f70〜752672。5—2-52410475〜808377。5-1—8318380〜853982。5000085〜902887。512812890以上2492.5248496合计200-59311令标准差:标准差变异系数:成人组的平均身高为81。025cm,标准差为6.058cm,标准差系数为0。074767。(2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。6、解:第二章统计量及其分布习题一、填空题1、简单随机抽样样本均值的方差取决于样本量和总体方差,要使的标准差降低到原来的50%,则样本容量需要扩大到原来的 4倍。2、设是总体的样本,是样本方差,若,则32。(注:,,,)3、若,则服从F(1,5) 分布.4、已知,则等于 0。21。5、中心极限定理是说:如果总体存在有限的方差,那么,随着样本量的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于正态分布.四、计算题1、从正态总体中随机抽取容量为36的样本,要求:(1)求样本均值的分布;(2)求落在区间(50.8,53。8)内的概率;(3)若要以99%的概率保证,试问样本量至少应取多少?这个简答题,我到时候发照片给你们吧!第三章参数估计习题一、填空题1、无偏性、有效性和一致性是对估计量最基本的要求。2、总体,是来自乂的一个容量为3的样本,三个的无偏估计量中,最有效的一个是_。3、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为(0。088,0。232)。4、若总体X的一个样本观测值为0,0,1,1,0,1,则总体均值的矩估计值为0.5,总体方差的矩估计值为0。25 。5、小样本,方差未知总体均值的区间估计为。四、计算题1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取64株,测得苗高并求得其均值62厘米,标准差为8.2厘米。请确定该苗圃中树苗平均高度的置信区间,置信水平95%.1、解:该苗圃中树苗平均高度的置信水平为95%的置信区间为(59.99,64。01)厘米。第四章假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章)一、填空1、在做假设检验时容易犯的两类错误是拒真错误和纳伪错误2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为双侧检验,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为单侧检验3、假设检验有两类错误,分别是拒真错误也叫第一类错误,它是指原假设H0是真实的,却由于样本缘故做出了拒绝H0的错误;和纳伪错误叫第二类错误,它是指原假设H0是假的,却由于样本缘故做出接受H0的错误.4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值a,则a称为显著性水平。5、假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为小概率原理。6、从一批零件中抽取100个测其直径,测得平均直径为5。2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径5cm,在显著性水平a下,否定域为下面有答案 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为HG1000H:t<1000(用H0,H1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为,犯第二类错误的概率为,若减少,则增大9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0。05的要求下,问该工厂的职工的工作效率 有(有,没有)达到该标准。6、1.25>二、计算1、下面是某个随机选取20只部件的装配时间(单位:分)9.8 10.410。69。69。79。910。911.19.6 10.210.39.6 9。911。210.69.810.510。110。59。7设装配时间的总体服从正态分布,参数均未知,可否认为装配时间的均值为10?2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。一直这种原件的寿命服从正态分布,标准差为100小时。试求在显著性水平为0。05下,确定厂家的声明是否可信?4、在一批产品中抽40件进行调查,发现次品有6件,试按显著水平为0。05来判断该批产品的次品率是否高于10%.KEY:1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所问进行区分。由题设知总体,均未知,要求在水平下检验假设(1)因未知,采用t检验,取检验统计量为:(2)由于n=20,=10。2,s=0.51,,(3)绝对域为:(4)经计算即检验统计量不落在拒绝域内,故在水平下接受原假设H0,即认为装配时间均值可认为是10。2、解:HO:1000cmH1:<1000cm代入数值,得到z==-2.5在显著性水平=0。05时,Z=1.96>Z,拒绝原假设H。。结论:该厂家的声称不可信.4、解:提出假设:H0:p<10%H1:p>10%建立检验统计量:P=6/40=0。15n=40・・・Z=1。05对于显著性水平0.05,查正态分布表得1.65,故接受原假设,可以认为该批产品的次品率不高于18%一、填空1、现象之间普遍存在的相互关系可以概括为两类:一类是函数关系,另一类是相关关系。2、在简单回归分析中,因变量y的总离差可以分解为回归平方和和残差平方和

3、若相关系数为r=0。92,表示两变量之间.呈强正关系。4、线性回归方程中,截矩的意义是当x=0时,y的期望值为10.5、线性回归方程中,斜率的意义是X每增加一个单位,y平均下降0。8个单位四、计算1、下表是一小卖部某6天卖出热珍珠奶茶的杯数与当天气温的对比表.气温(℃)261813104-1杯数202434385064现在的问题是:如果某天的气温是-5℃,这天小卖部大概要准备多少杯热珍珠奶茶比较好一些?2、某种商品的需求量y(斤)和商品价格x(元)有关,现取得10对观测数据经计算得如下数据:,要求:(1)计算相关系数;(2)求y对x的线性回归方程(3)解释的意义。3、某地区某企业近8年产品产量与生产费用的相关情况如下表所示:年份产品产量(千吨)生产费用(万元)19971.26219982。08619993.18020003。811020015。011520026。113220037。213520048。0160要求:(1)分析产品产量与生产费用的相关关系;参考答案:四、计算题。1、解:为求回归方程,先计算有关数据:序号X.iyi126206764005202182432457643231334169115644241038100144438054501625002006—16414096—64Z702301286101721910由表中数据得:=11.67 =38。33=469.33=-773.33将以上数据代入,于是可得-1.6557。56于是得到回归方程57。56—1。65如果某天的气温是-5℃,这天小卖部大概要准备珍珠奶茶=57.56—1。65X(—5)=66杯2。某种商品的需求量y(斤)和商品价格x(元)有关,现取得10对观测数据经计算得如下数据:,3、答案:(1)相关系数=—0.9325;(2)回归方程;(3)该商品价格每增加1元,需求量平均减少10斤。125、解:(1)计算相关系数因此可判断出产品产量与生产费用是正相关的。(2)建立一元回归模型:一元线性回归模型为:第七章时间序列分析一、填空1、下表为两个地区的财政收入数据:年份A地区财政收入(亿元)B地区财政收入(亿元)199740719986011则A地区财政收入的增长速度是50%,B地区财政收入的增长速度是57。14%,A地区财政收入的增长1%的绝对值为0.4,B地区财政收入的增长1%的绝对值为0.07 。2、已知环比增长速度为7.1%、3.4%、3。6%、5。3%,则定基增长速度是 20。81% .3、年劳动生产率r(千元)和职工工资(元)之间的回归方程为,这意味着年劳动生产率每提高1千元时,职工工资平均 增加110元。4、拉氏价格或销售量指数的同度量因素都是选基期,而派许指数的同度量因素则选期。5、动态数列的变动一般可以分解为四部分,即趋势变动、季节变动、 循环变动和不规则变动.四、计算题1、以下为某高校某专业15年报考考生人数的历史数据:年份19911992199319941995199619971998报考人数(人)11111145114611831213124412821282年份1999200020012002200320042005报考人数(人)1290130613231358138814021432要求:用一次线性模型预测该学校2006年报考人数。

2、已知某化肥厂近年生产情况,请填入表中空缺的指标值并计算年平均增长量、年平均发展速度年份产量(吨)累计增长量(吨)定基发展速度(%)环比发展速度(%)199810019992020001252001120200213020031001、解:(1)画散点图。可以看出,数据大致成线性模型.(2)对数据运用线性模型进行拟合:得到最终拟合方程为:其中,调整的,,则方程通过显著性检验,拟合效果很好。标准误差为9.19。(3)将拟合模型进行预测分析。当2006年时,,代入方程:得,即2006年预测考生人数将达到1449.6人.2、解:年份产量(吨)累计增长量(吨)定基发展速度(%)环比发展速度(%)19981001001999120201201202000125251251042001150501501202002195951951302003200100200103平均增长量=100/5=20吨平均发展速度=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论