应用统计学习题及答案【最新】_第1页
应用统计学习题及答案【最新】_第2页
应用统计学习题及答案【最新】_第3页
应用统计学习题及答案【最新】_第4页
应用统计学习题及答案【最新】_第5页
免费预览已结束,剩余9页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、应用统计学习题及答案简答题1.简述普查和抽样调查的特点。答:普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点:(1)普查通常具有周期性。(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。(3)普查的数据一般比较准确,规划程度也较高。(4)普查的使用范围比较窄。抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。它具有以下几个特点:(1)经济性。这是抽样调查最显著的一个特点。(2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。(3)适应面广。它适用于对各个领域、各种问

2、题的调查。(4)准确性高。2.为什么要计算离散系数?答:离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。word文档可自由复制编辑3、加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。答:加权算术平均数受各组平均数喝次数结构(

3、权数)两因素的影响。若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。4 .解释相关关系的含义,说明相关关系的特点。答:变量之间存在的不确定的数量关系为相关关系。相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发

4、现变量之间存在一定的客观规律。5 .解释抽样推断的含义。答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。6 .回归分析与相关分析的区别是什么?答:(1)相关分析所研究的两个变量是对等关系,而回归分析所研究的两个变量不是对等关系;(2)对于两个变量X和Y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,而回归分析可分别建立两个不同的回归方程;(3)相关分析对资料的要求是,两word文档可自由复制编辑个变量都必须是随机的,而回归分析对资料的要求是自变量是给定的,

5、因变量是随机的。7 .什么是方差分析?答:方差分析是通过对误差的分析,检验多个总体均值是否相等的一种统计方法。它分为单因素方差分析和双因素方差分析。8,简述相关分析与回归分析的联系。答:相关分析是用于判断两个变量之间相关关系的密切程度,进而对这种判断的可靠程度加以检验的统计方法;而回归分析是分析研究变量之间相关关系的一种统计分析方法,考察一个变量随其余变量变化而变化的情况。相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。计算题1.下面是20个长途电话通话时间的频数分布,计算该数据的平均数通话时间/分钟频数通话时间/分钟频数4-7420-2318-11524-27112-157合

6、计2016-192答案:由题意:通话时间/Xifi通话时间/Xifiword文档可自由复制编辑分钟分钟4-75.5420-2321,518-119.5524-2725,5112-1513,57合计2016-1917,526_VXifi平均数=4=12.32,拥有工前理学位的大学毕业生每年年薪的标准差大约为2000美元,假定希望估计每年年薪底薪的95建信区间,当边际误差分别500美元时,样本容量应该为多大?答:%=1.96)一2.nu:/2212"2.-2=61.47=623.某一汽车装配操作线完成时间的计划均值为2.2分钟。由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操

7、作线的生产,所以保持2.2分钟的标准是很重要的。一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。J%=1.96答案:根据题意,此题为双侧假设检验问题(1)原假设H。:卜=2.2;备择假设H1:N*2.2(2)构造统计量:(3)由于口=0.05,U=弓,得U=2竿=6,373s/.n0.2八45则查表得:U:./2=U0.025=1.96word文档可自由复制编辑(4)6,373>1,96,U>U决,所以拒绝原假设,即在0.05的显著水平下没有达到2.2分钟的标准。4,下表中的数据是

8、主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。总评分月薪/美元总评分月薪/美元2.628003.230003.431003.534003.635002.93100n6('Xi)2i119.219.262.18=581.08解:XiYXi2XiYiY22.628006.76728078400003.4310011.561054096100003.6350012.9612600122500003.2300010.24960090000003.5340012.2511900115600002.931008.41899096

9、100006XXi=19.2im6ZYi=id189006XXi2=id62.186XXiYi=iT609105987000066eXi)(Z丫)Xi1i119.21890060910-word文档iU自由复制编辑nbo=Y-biX=18900/6-581.08*19.2/6=1290.54于是Y=1290.54581.08X5.设总体X的概生蜜厚函数为e2x0f(x,)=、2,x0其中N为未知参数,X1XX20,.,Xn是来自X的样本。(1)试求g(N)=3N十1的极大似然估计量?(N);(2)试验证?(N)是g(的无偏估计量。解:(1)当Xi>0时,似然函数为:11(lnXi、L(X

10、1,X2,,Xn;N1n;-e2Xin=0令c1nL仅1,x2,.,XnWLoi,即gjn1ni1解得:?=“1nxin-g(N)=3N+1是N的单调函数,所以n(lnrx昔2dx困%K%ln0x)黑g(N)的极大似然估计量§)=-Hlnx1(tJ2.:t31n丁£国籍)21£2E(dl()X71=3E(lnX)+1=3+1=g(R),故g(R)是g?)的无偏估计量。6、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%勺概率满足需要?解:设每月

11、每户至少准备X0P(x<X0)=95%P(x0工一°户95%二/,n当n_30时,sX0-10IS/富人_招7'100)查表得,至二10=1.6453/10=95%x0-10.44kg若供应10000户,则需要准备104400kg。7.糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随word文档可自由复制编辑机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%试求:(1)平均每包重量的置信区间,若总体标准差为5克;(2)平均每包重量的置信区间,若总体标准差未知

12、;t0.025,9=2.2622,10.025,10=2.2281,t0.05,9=1.8331枭。5,10=1.8125);解:n=10,为小样本t二nn-1(1上点差已知,由x±2,Vn,一i1x=(494+495+503+506+492+493+498+507+502+490/10,n-5t=t计算可得平均每包重量的置信区间为(由x士泊乐+50n1ys0.025,9-10494.9,501.1)2+493+498+507+502+490/10,t0.025,9预n(2卜3未知,x=凡1ns即样本方差,t二S-二t2,n-17n计算可得,平均每包重量的置信区间为(493.63,5

13、02.37)8.假定某化工原料在处理前和处理后取样得到的含脂率如下表:处理前0.1400.1380.1430.1420.1440.137处理后0.1350.1400.1420.1360.1380.140假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。解:根据题中数据可得:x=0.141X2=0.139,S=0.002&&=0.0027,n1=5=6由于=出=6<30,且总体方差未知,所以先用F检验两总体方差是否存在差异。word文档可自由复制编辑(1)设H0:仃i2=仃2;Hi:仃;。仃:则F=S2S;田ni="=1.108=6,查F分

14、布得F0.025(5,5)=7.15,F0.975(5,5)=0.14F<F;2(5,5).接受H。,即处理前后两总体方差相同。(2)设心:匕=匕,乩:“艮222则丁二x1-X2s_J,(n1-1)S1+(n21)S211'°n11-2T=1.2S<t%(10n2=2.2281二接受H。,即处理前后含脂率无显著差异。9.根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。5101520fy1200081018140343010fx34111028解:设x为自变量,y为因变量,一元线性回归b1=nb0=y】bXX(7.142)9b1xyi_-10001

15、乂2=一1.5386501.53815=150.213,回归方程为y=150.213-1.538xword文档可自由复制编辑10.以下为16种零食的卡路里含量:110120120164430192175236429318249281160147210120。试计算均值和中位数。解:现把16个变量值由小到大排序如下:110120120120147160164175192210236249281318429430(1)中位数的位次为(n+1)/2=8.9,所以中位数计算如下:Me175192=183.50(2)均值计算如下:_73461x=i216.32n1611 .某企业2005年第三季度各月末

16、的职工人数资料见下表:时间(月末)789职工人数(人)209020602131又知2005年6底的职工人数为2030人,试计算第三季度的平均职工人数。解:依题意,计算妣如2131_-220902060-_6230,5Y4-1=2076.83(人)95%的概率估计该批产品合格率的置信区n=200,np=170>5,n(1-p)=30>5,当12 .某集团公司对生产的一批A产品进行抽样调查,随机抽取的200件中有170件合格。试以间。解:已知p=85%=0.85,200word文档可自由复制编辑a=0.05时,查表Za/2=1.96,于是有:(Pp(1-p):P(1-P)pp-Zd2Y-n-,pz&2y-)n0.85(1-0.85)“I,«0.85(1-0.85)、=(0.851.96J匕,0.85+1.96J)200200=(0.8005,0.8995),即这批产品合格率的置信区间为80.05%89.95%。13 .某电子产品的质量标准是平均使用寿命不得低于1000小时。已知该电子产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论