R语言 实验6 参数估计111_第1页
R语言 实验6 参数估计111_第2页
R语言 实验6 参数估计111_第3页
R语言 实验6 参数估计111_第4页
R语言 实验6 参数估计111_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验6参数估计一、实验目的:掌握矩法估计与极大似然估计的求法;了解估计量的优良性准则:无偏性、有效性、相合性(一致性);学会利用R软件完成一个正态总体均值和两个正态总体均值差的区间估计;学会利用R软件完成一个总体比例和两个总体比例差的区间估计;掌握大样本数据关于单个总体均值和总体比例的样本容量的确定方法。实验内容:练习:要求:完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文 字的字体颜色设为红色(包括后面的思考及小结),回答思考题,简要书写实验小结。 修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,.。 如文件名为“1305543109张立

2、1”,表示学号为1305543109的张立同学的第1次实验,注 意文件名中没有空格及任何其它字符。最后连同数据文件、源程序文件等(如果有的话, 本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。截图方法:法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最 前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常 印有“印屏幕”或“Pr Scrn”等字符),即完成截图。再粘贴到word文档的相应位置即 可。法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)自行完成教材中相应的例题。(

3、习题5.1)下表列出50个抽取自二项分布总体B(n, p)的数据(数据存放在 binom . data件中),试用矩估计方法估计参数n和p。来自二项分布总体的数据1516141516111515121414141214121514141214151718101312151716181712101513121416161615111315161714111617解:若将n作为未知参数,则需要同时考虑一阶矩和二阶矩。总体的一阶矩和二阶矩分别为:a1 =E(X)= np,a2 =E(X 2)= var(X)+(E(x)2 = np(1-p)+(np)2,根据矩估计的基本思想,a1 = %,a2 =

4、A2,(其中1 =LEx, = X,A广 p X;)即有I np(1 一 p) + (np)2 = A、2.一 A -解上述方程组,可得p = 1 + A1 , n = A1/p。1以下请根据上式完成R程序,计算出参数n和p的矩估计量的值(参考 n = 20.0284, p = 0.713986)源代码:x-scan(file.choose()Read 50 itemsyac-nean(x)b-niean(y)p/a1 0.71395)n=a/pn1 20.0284(习题5.2)设总体X的分布密度函数为f (x;a)=(a +1) x a00 x 1, 其他,从总体X抽取的样本为:0.1 0.

5、2 0.9 0.8 0.7 0.7 0.6 0.5求参数a的极大似然估计量&。解:设X,X2,,Xn为其样本,只需要考虑xe(0, 1)部分。依题意,此分布的似然函数为L(a ; x) = Hf (x ;a) = (a+1)n (Hx )aiii=1i=1相应的对数似然函数为ln L(a; x) = n ln(a +1)+ a In H x TOC o 1-5 h z *d In L(以;x)n令 =顽+或x =0i=1解此似然方程得到a =+ -1, lnHxii=1 HYPERLINK l bookmark28 o Current Document 、n 或写为a =- 1。zL ln x

6、i容易验证d 2 In L 八 da 2 ,从而a使得L达到极大,即参数a的极大似然估计量i=1a=r -1。L ln Xi i=1以下请根据上式完成R程序,计算出参数a的极大似然估计量a的值。 源代码:x-c(01,02,09,08,07,07,06,05)fv-function(x) 8/(x+1)+sum(log(x)uniroot(f,c(0,1)运行结果或截图:x-c (0.1,3.20.90.8,0.7,0.7,0.6.0.5f-f miction (x 8/ (x+1) d-sum flog (x wiizoot(f,c(0f1 $root|1 0.0003573701$f ro

7、ot|1 0.05956635$iter1 13$lniL 1e1 NA$estini.pTec|1 0.0001125295补充:求参数a的矩估计量a。由于只有一个参数,因此只需要考虑a1 = 41,即E(X)= X。-8而由 E(X)的定义有:E(X)= fx - f (x)dx = jx - (a+1)xadx =兰1 xa+2 |1 = _5i! a + 2 o a + 20,a +11-因此=X ,解得a= f - 2。以下请根据上式完成R程序,计算出参数(!的矩估计量a的值,并与其极大似然估计 量的值进行比较。源代码:a a运行结果或截图:(习题5.4)为研究新生儿出生时的体重,随

8、机地选取了某妇产医院的100个新生 儿,其样本均值为3338g,样本标准差为629g。试计算新生儿平均体重的置信水 平为95%的置信区间。提示:参考例5.6解:源代码及运行结果:(源代码复制到此处,不需要截图)x_bar-3338s-629n-100alpha-0.05z-qnorm(1-alpha/2)c(x_bar-s/sqrt(n)*z,x_bar+s/sqrt(n)*z)1 3214.718 3461.282结论:新生儿平均体重的置信水平为95%的置信区间为3214.718,3461.282。(习题5.5)某妇产医院有意估计产妇在该医院住院的平均天数,在过去的年份中 随机抽取了 36位

9、孕妇,每位孕妇住院天数取整后如下表所示(数据存放在 hospital.data文件中)。使用这些数据构建95%的置信区间,估计在该医院生小 孩的所有孕妇的平均住院天数。提示:参考例5.10。由于此题是小样本数据,也可以直接使用此$给函数。解:源代码及运行结果:(源代码复制到此处,不需要截图)x-scan(file.choose()Read 36 itemsx_bar-mean(x)s-sd(x)n-length(x)alpha-0.05t-qt(1-alpha/2,df=n-1)c(x_bar-s/sqrt(n)*t,x_bar+s/sqrt(n)*t) 1 2.910812 3.700299

10、结论:在该医院生小孩的所有孕妇的平均住院天数在2.910812 3.700299天之间。(习题5.8 )已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽 取10只,测得其寿命(单位:小时)为1067 919 1196 785 1126 936 918 1156 920 948求灯泡寿命平均值的置信度为0.95的单侧置信下限。提示:此题是一个正态总体的区间估计问题,且由于总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。参考例5.11,单侧置信下限,t.test()函数中的参数 alternative=greater o解:源代码及运行结果:(源代码复制到此处,不需

11、要截图)x-c(1067,919,1196,785,1126,936,918,1156,920,948)t.test(x,alternative=greater)One Sample t-testdata: xt = 23.969, df = 9, p-value = 9.148e-10alternative hypothesis: true mean is greater than 095 percent confidence interval:920.8443 Infsample estimates:mean of x997.1结论:灯泡寿命平均值的置信度为095的单侧置信下限为920.8

12、443(习题5.11)某调查公司对902名高尔夫女选手进行了一项调查,以了解女选手 怎样看待自己在比赛中的安排。调查结果显示397名女选手对下午茶的时间感到 满意。(1)试计算所有女选手对下午茶的时间感到满意的置信区间,这里取置信水 平为0.95; 如果使用binom. test ()函数精确计算两者相差多少?提示:参考例5.12 o解:源代码及运行结果:(源代码复制到此处,不需要截图)m-397n-902p-m/nq-1-palpha-0.05z-qnorm(1-alpha/2)c(p-z*sqrt(p*q/n),p+z*sqrt(p*q/n)1 0.4077379 0.4725281bin

13、om.test(x=397,n=902)Exact binomial testdata: 397 and 902number of successes = 397, number of trials = 902, p-value =0.0003617alternative hypothesis: true probability of success is not equal to 0.595 percent confidence interval:0.4074246 0.4732337sample estimates:probability of success0.440133结论:所有女选

14、手对下午茶的时间感到满意的置信区间为0.4077379 ,0.4725281(续习题5.12)如果希望新生儿的平均体重与总体均值的边际误差不超过100, 应从该妇产医院随机地选取多少名新生儿?提示:例5.13 o解:源代码及运行结果:(源代码复制到此处,不需要截图)s-344.80e-100alpha-0.05z-qnorm(1-alpha/2)(n-zA2*sA2/eA2)1 45.66997结论:应从该妇产医院随机地选取46名新生儿(习题5.13)某汽车营销公司计划估计某地区拥有小汽车家庭所占的比重,要求 边际误差不超过5%,置信水平取90%,问应抽取多少样本?公司调查人员认为, 拥有小汽

15、车家庭的实际比重不会超过20%,如果这一结论成立,应抽取多少样 本?提示:例5.14 o解:源代码及运行结果:(源代码复制到此处,不需要截图)p-0.5e-0.1alpha-0.1z-qnorm(1-alpha/2)(n-zA2*p*(1-p)/eA2)1 67.63859结论:要求边际误差不超过5%,置信水平取90%,问应抽取68个样本。(习题5.16 )甲、乙两种稻种分别播种在10块试验田中,每块试验田甲、乙稻种 各种一半。假设两稻种产量X, Y均服从正态分布,且方差相等。收获后10块试验 田的产量如下所示(单位:千克)。甲 种140137136140145148140135144141乙

16、种135118115140128131130115131125求出两稻种产量的期望差冉-*的置信区间(a =005)。提示:此题是两个正态总体的区间估计问题,且由于两总体方差未知,因此可以直接 使用R语言中t.test()函数进行分析。ttest()可做两正态样本均值差的估计。注意此例 中两样本方差相等。参考教材P185倒数第四行开始至P186。解:源代码及运行结果:(源代码复制到此处,不需要截图)x-c(140,137,136,140,145,148,140,135,144,141)y-c(135,118,115,140,128,131,130,115,131,125)xbarv-mean(

17、x)s1v-sd(x)n1v-length(x)ybarv-mean(y)s2v-sd(y)n2v-length(y)sw2v-(n1-1)*s1A2+(n2-1)*s2A2)/(n1+n2-2)s-sqrt(sw2*(1/n1+1/n2)alphav-0.05t=30,去掉总体服从正态分布这一 假设T统计量:小样本数据的区间估计,总体方差未知对于单个总体比例的区间估计,涉及到是其实是二项分布。但当满足_ np=5和nq=5(q=1-p) 条件时,可以近似使用正态分布来计算。对于单个总体比例的区间估计,涉及的是二项分布。因此在R语言中,可以使用binom.test(涵数进行区间估计,它是精确检验函数,通常用于小样本数据;当处 理大样本数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论