数理统计第一次试验报告_第1页
数理统计第一次试验报告_第2页
数理统计第一次试验报告_第3页
数理统计第一次试验报告_第4页
数理统计第一次试验报告_第5页
已阅读5页,还剩15页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一.实验题目实验1:经验分布函数(1)取5及2=1, n=l00,产生n个服从N , 2分布的随机数作为取自正态总体N, 2的样本值Xi,L ,Xn,在同一坐标下画出它的经验分布函数,并与总体分布函数进行比较。(2)改变n,重做实验(1),体会格列文科定理的内涵。实验2:直方图假定某班60个男生身高(单位:cm),数据如下:166,169,181,173,165,169,170,163,175,164,171,162,156,159,173,168,1 67,165,172,170,180,177,161,170,164,163,172,167,157,165,168,174,165,16 8

2、,162,163,159,163,167,173,161,160,165,160,173,164,166,152,163,164,176 ,160,164,167,158,172,167,168,167,170现在希望通过这些数据来确定该班身高的分布。解:基本步骤:第一步:找出数据的最大值181,最小值152,极差R=181-152=29;第二步:分组定组距。分组没有通用原则,通常数据个数n 50时,分成10组以上,当n 50时,一般5组左右。分组数m确定后,可按E d 上来确m m 1 定组距do第三步:定分点,定区间:取起点a=151.5,终点181.5,从而作图区间为151.5,181.

3、5(取各组的边 界值比身高多一位小数,为的是使每个身高都落在一个组的内部)。第四步:列出样本值落入各组的频数和频率。第五步:做频率直方图。直方图是最常用的一种表现数据的方法,它通常把值域分成若干相等的区 问,于是数据就按区间分成若干组,每组做成一个矩形,其高和该组中数据的多 少成比例,其底为所属区间,这些矩形就是直方图,它给数据的分布一个直观的 形象。直方图以组距为底,以频率为高作矩形。可以想象,若得到的数据很多,这时,直方图的分组增多,组距变得很小,画出的直方图顶端阶梯形近似一条曲线,于是可以用这条曲线近似描述该组数据 的分布规律。(2)改变实验(1)中的组距,将得到的图形与(1)得到的图形

4、比较,你能得到什么结论?实验3:设样本Xi,L Xn取自总体U (a,b) ,a,b为未知参数,试求a, b的矩估计和极大似然估计。由计算可以得出a, b的矩估计量分别为:$1X3 n Xi2X , $1极大似然估计分别为:$2X1 , $2X卜面进行模拟:(1)取 a=0,b=1, N=50,产生N个服从U(a,b)分布的随机数当做样本,分别代入式中计算a, b的估计值,并与理论值 0,1比较;(2)将(1)重复10次,用10次估计值的平均值作为 a, b的估计,并与(1)的结果比较,体会其中包含的概率思想。实验4:设总体X服从正态分布 N ,1 ,取 0,从总体抽取10组容量为20的样本,

5、分别以X和X1作为总体均值的估计量,计算10组估计值并描在图上。(将点描在坐标轴上) 从中你可以得到什么结论?图1 :以X作为估计量10.5. r . t-0.3-0.2-0.1-0.5-1图2:以Xi作为估计量i .0.5'-2-1.5-1-0.5-0.511.5-0.5:-1 实验5:已知X1,L ,Xn来自正态总体N , 2 ,其中 1,取 0.01,求置信度为0.99的置信区间。.分析与解答实验1:经验分布函数首先产生100个服从N(5,1)分布的随机数作为样本值X1,X2.X100.rnorm(100,mean=5,sd=1)114,83BS430工5.酶第"S.3

6、911T34.2«S4504.翦箝?。4.020857箱514.1MS234.41M44I.376C91UNJ45.7B3B9O5,1475503.27Q6Z5lB 1634173,日日464T5.9Q045146/717J10-4,5(61922144403016.2030923B3E7£094.441773.37£66B5,fil767a4,7(HtnS4/3314225.MH0B5.eeBl 3B134)5.152456M9Em曾父”5.345443«.&610414643083. JOD054 ,5255S.J231543 549502,

7、肥破”45 4.603230 4.72412S1*52719 «d<6C493 3.D12794 2322 营,.白3电号】5.70110 4.472104 3-505773:555C4H”札 5曲鸵.97111?£. 5223"4.5384094 gM髀5.250575.3W78IS;340S9«5*右”23P-59QIM67fi,577M64PQ'OB0636a1573D75,399156=.S0231ZS.L424L27 r 091104T7OB1S50260105.241655d,lB6C2D(7BJ1.5?2L96«.2

8、101734.0«LS633.27295«5.120409i5.&305304.062«6S5,316107石。口含0*35-Y4.051( 30iG9)4, l&SSei2u4«51Ci«1.9C200B5.4K253S.g4702Q3BM374ll5.AM7075.5822205.3324%4B«5l«0d100 4.533643根据产生的数据画出正态分布的经验分布函数:w<-(rnorm(100, mean = 5, sd = 1)curve(pnorm(X,mean(w),sd(w),Xlim=

9、c(0,20),col="blue",lwd=3)与总体正态分布函数进行比较:x <- seq(0,20,length.out=100)lines(x,pnorm(x,5,1),col="red")legend("bottomright",legend=paste("m=",c(5,5),"sd=",c(1,1),lwd=1,col=c("red","blue")m= 5 sd= 1m= 5 sd= 1101520当取n的值为200 :w=(rnor

10、m(200, mean = 5, sd = 1)curve(pnorm(x,mean(w),sd(w),xlim=c(0,20),col="blue",lwd=3)x <- seq(0,20Jength.out=200)lines(x,pnorm(x,5,1),col="green")legend("bottomright",legend=paste("m=",c(5,5),"sd=",c(1,1),lwd=1,col=c("green","blue"

11、;)oa o<0OCMft om= 5 sd= 1m= 5 sd= 1101520当取n的值为300:w=(rnorm(300, mean = 5, sd = 1)curve(pnorm(x,mean(w),sd(w),xlim=c(0,20),col="blue",lwd=3)x <- seq(0,20Jength.out=300)lines(x,pnorm(x,5,1),col="orange")legend("bottomright",legend=paste("m=",c(5,5),"

12、sd=",c(1,1),lwd=1,col=c("blue","orange")设X1,X2,,Xn是取自总体X的随机样本,Fn(x)是总体X的经验分布函数,当 n8时由 格列汶科定理知:P(lim sup |Fn(x) F(x)| 0) 1n x L该定理当样本容量 n充分大时,经验分布函数Fn(x)可以作为总体分布函数 F(x)的一个良好的 近似。实验二:直方图基本步骤:第一步:找出数据的最大值181,最小值152,极差R=181-152=29;第二步:分组定组距。分组没有通用原则,通常数据个数n 50时,分成10组以上,当n 50时,一般

13、5组左右。分组数m确定后,可按旦d 上来确 m m 1定组距do第三步:定分点,定区间:取起点a=151.5,终点181.5,从而作图区间为151.5,181.5(取各组的边界值比身高多一位小数,为的是使每个身高都落在一个组的内部)第四步:列出样本值落入各组的频数和频率。第五步:做频率直方图。直方图是最常用的一种表现数据的方法,它通常把值域分成若干相等的区间, 于是数据就按区间分成若干组,每组做成一个矩形,其高和该组中数据的多少成比例,其底为所属区间, 这些矩形就是直方图,它给数据的分布一个直观的形象。直方图以组距为底,以频率为高作矩形。可以想象,若得到的数据很多,这时,直方图的分组增多,组距

14、变得很小,画出的直方图顶端阶梯形近似一条曲线,于是可以用这条曲线近似描述该组数据的分布规律。【实验步骤】? 第一步 自定义绘制频数直方图的函数HIST <- function(data,m)res <- 1:m; lable<- 1:m;A <- min(data)-1;B <- max(data)+1;dis <- (max(data)-min(data)%/%m + 1;for(j in 1:m)for(i in 1:length(data)if( datai>A+(j-1)*dis && datai <= B-(m-j)*d

15、is ) resj=resj+1;lablej=paste(as.character(A+(j-1)*dis),"",as.character(B-(m-j)*dis) ;barplot(res,width=1,names.arg=lable);变量data用于存放数据,变量 m表示分组数? 第二步 改变分组个数,多次试验m=5 的结果:IO151 -158 157- 164 163 T70 169-176 175 T82M=10的结果:oCMID151 - 155 157- 161 163- 167 169'173 175-179M=15的结果:151 - 154

16、 157 - 100 163 - 166 169 - 172 175- 178【实验结论】组距越小,分组越细,对数据分布的刻画就越精确,相反的,如果采用较大的组 距,更方便从整体上反应数据的大致分布情况。实验三:(1)首先产生50个服从U (0,1 )分布的随机数 runif(50,min=0,max=1):1 0,023519307J 0.8966914613 0.7记46955 19 0,12731124 25 0.499777 311 0,46248172 37 0.4e540742 43 0*45964103 491 0.346016480.952132260.11568770.026

17、305675 499 航 1300.119239S0.23504411,右REER42口0.89813197口.990958240.0970161 0,99887672 O.C6990C64 0.458必 44 0.15322103 0.05211966 D,140913 0.45155079 0.02913507 0.25459420 0.64256306 0.26965629 0.73552727 0.88507155 0 P 7450955 0.9C500D15 0,00520253 0.84722507 0.532451 0.59571119 0-75585151 0.340宛专庆 ,

18、0173S MB0 0.10123293 0,05256054 0.239002y8 0.2107155 0.9S295603 0.2£93际0 0.43623904 口 , 4f9S77r9 0.45822gg6矩估计:根据公式$1 X I- n Xi X 2首先计算出均值和方差:x1<-mean(x)x2<-var(x)将计算的结果带入求取a的估计值:a1<-(x1-sqrt(3*x2)> runif (50f ir.in=O,max=l)> 父Iv-klu之ri (x)> print(kI)(1J> x2<-ver(«)

19、> print(x2)(11 0.07873117> al<-(xl-sqrt(3*x2)> print (al)1 -0.000300461同理根据公式$1X 3 Xi X 2可求出b的估计量:,;n i 1> bl<-(xl+sqrt(3*x2)> print(bl)LU 0.971t)31将运算重复10次,用10次估计值的平均值作为a, b的矩估计值a<-vector(mode="numeric",length=0)for(i in 1:10)ai<-ia2=0;for(i in 1:10)x<-runif(

20、50,min=0,max=1)x1<-mean(x)x2<-var(x)ai<-(x1-sqrt(3*x2)a2=a2+aia2/10> a2/:01 0,00393320同理将10次计算的结果求出平均值作为b的估计值a<-vector(mode="numeric",length=0)for(i in 1:10)ai<-ib2=0;for(i in 1:10)x<-runif(50,min=0,max=1)x1<-mean(x)x2<-var(x)ai<-(x1+sqrt(3*x2)b2=b2+aib2/10>

21、; b2/101J 1.004076极大似然估计:x<-runif(50,min=0,max=1)b1=min(x)b2=max(x)> b:1 G .01153014> DZ1 0,9S3S321将运算重复10次,用10次估计值的平均值作为a, b的极大似然估计值a<-vector(mode="numeric",length=0)for(i in 1:10)ai<-i bi<-ib1=0b2=0for(i in 1:10)x<-runif(50,min=0,max=1)ai=min(x)bi=max(x)b1=b1+aib2=b2

22、+bi> bl/LO1 0.007297444> b2/101 D . 97CJ7 62SI实验结论:矩估计法生成的结果是0.003933, 1.004076极大似然估计法生成的结果是0.007297, 0.9797615从而可得出,两种结果都还是比较接近理论值的,在此情况下,极大似然估计的估计效果比矩估计效果更理想实验4:【实验步骤】在R中输入以下代码:r<-matrix(rnorm(10*20),10,20)#抽取 10 组容量为 20 的样本MEAN<-1:10MIN<-1:10#计算每一组样本的均值和最小值plot(0,ylim=c(-5,2),col="white");for(i in 1:10)MEANi=mean(ri,);points(MEANi,pch=1,col="blue");MINi=min(ri,);points(MINi,pch=0,col="green");# 在同一坐标轴上画出图像,蓝色表小均值,绿色表小最小值【实验结论】o 河 _ OT -UO 0.60.81.01.21.4Index若取每次试验的样本容量为200,结论如下图:o0.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论