概率统计实验.doc_第1页
概率统计实验.doc_第2页
概率统计实验.doc_第3页
概率统计实验.doc_第4页
概率统计实验.doc_第5页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

13.6 概率统计实验学习目标1 会用Mathematica求概率、均值与方差;2 能进行常用分布的计算;3 会用Mathematica进行期望和方差的区间估计;4 会用Mathematica进行回归分析。 概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍Mathematica自带的统计程序包,其中有实现常用统计计算的各种外部函数。一、 样本的数字特征1. 一元的情况Mathematica的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的Statistic程序包子集中,位于目录D:Mathematica4.0AddOnsStandardPackagesStatistics下。通过查看Help,可以找到包含所需外部函数的程序文件名。在程序文件DescriptiveStatistics.m中,含有实现一元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差(最大数减最小数)。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。StandardDeviationMLEdata 求标准差。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例1 给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。 解:In1:= Statistics DescriptiveStatistics In2:= data = 6.5,3.8,6.6,5.7,6.0,6.4,5.3; In3:=Lengthdata Out3=7 In4:=Mindata Out4= 3.8 In5:=Maxdata Out5= 6.6 In6:=SampleRangedata Out6= 2.8 In7:=Mediandata Out7= 6. In8:=Meandata Out8= 5.75714 In9:=Variancedata Out9= 0.962857 In10:=StandardDeviationdata Out10= 0.981253 In11:=VarianceMLEdata Out11= 0.825306 In12:= StandardDeviationMLEdata Out12= 0.908464 说明:在上例中,In1首先调入程序文件,求数据个数、最大值和最小值使用内部函数。2. 多元的情况 在程序文件MultiDescriptiveStatistics.m中,含有实现多元数理统计基本计算的函数,常用的有: SampleRangedata 求表data中数据的极差。 Mediandata 求中值。 Meandata 求平均值。 Variancedata 求方差(无偏估计)。 StandardDeviationdata 求标准差(无偏估计)。 VarianceMLEdata 求方差。 StandardDeviationMLEdata 求标准差。 Covariancexlist,ylist 求x,y的协方差(无偏估计)。 CovarianceMLExlist,ylist 求x,y的协方差。Correlationxlist,ylist 求x,y的相关系数。实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过Help浏览。例2 给出4个样本值:1.1,2.0,3.2,1.3,2.2,3.1,1.15,2.05,3.35,1.22,2.31,3.33,计算样本个数、均值、方差、标准差等。 解:In1:= Statistics MultiDescriptiveStatistics In2:= data = 1.1,2.0,3.2,1.3,2.2,3.1, 1.15,2.05,3.35,1.22,2.31,3.33; Lengthdata Out3=4 In4:=SampleRangedata Out4= 0.2,0.31,0.25 In5:=Mediandata Out5= 1.185,2.125,3.265 In6:=Meandata Out6= 1.1925,2.14,3.245 In7:=Variancedata Out7= 0.00755833,0.0200667,0.0137667 In8:=VarianceMLEdata Out8= 0.00566875,0.01505,0.010325 In9:=CentralMomentdata,2 Out9= 0.00566875,0.01505,0.010325 In10:=x=dataAll,1;y=dataAll,2; z=dataAll,3; In11:=Covariancex,y Out11=0.0093 In12:=Covariancez,z Out12=0.0137667 In13:=CovarianceMLEy,y Out13=0.01505 In14:=Correlationy,z Out14=0.0521435 In15:=Correlationx,x Out15=1.二、 常用分布的计算 在计算机出现以前,统计计算总是依赖一堆函数表。使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。1. 离散分布 程序文件DiscreteDistributions.m中,含有用于离散分布计算的函数。其中常用的离散分布有: BernoulliDistributionp 贝努利分布。 BinomialDistributionn,p 二项分布。 GeometricDistributionp 几何分布。 HypergeometricDistributionn,M,N 超几何分布。 PoissonDistribution 泊松分布。 DiscreteUniformDistributionn 离散的均匀分布。 NegativeBinomialDistributionn,p 负二项分布。 以上函数中的参数,既可以是数值的,也可以是符号的。使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。真正进行计算的是下面的求值函数,它们使用以上的分布表达式作为一个参数。 常用的求值函数有: Domaindist 求dist的定义域。 PDFdist,x 求点x处的分布dist的密度值。 CDFdist,x 求点x处的分布函数值。 Quantiledist,q 求x,使CDFdist,x达到q。Meandist 求分布dist的期望。 Variancedist 求方差。 StandardDeviationdist 求标准差。 ExpectedValuef,dist,x 求Ef(x)。 CharacteristicFunctiondist,t 求特征函数(t)。 Randomdist 求具有分布dist的伪随机数。 RandomArraydist,dims 求维数为dims的伪随机数的数组。例3 观察下面二项分布的各种基本计算。 In1:= Statistics DiscreteDistributions In2:= b=BinomialDistributionn,p Out2=BinomialDistributionn,p In3:=Meanb Out3=np In4:=Varianceb Out4= n(1-p)p In5:=CharacteristicFunctionb,t Out5= (1-p+e it p)n In6:=b=BinomialDistribution10,0.3 Out6= BinomialDistribution10,0.3 In7:=Domainb Out7= 0,1,2,3,4,5,6,7,8,9,10 In8:=PDFb,4 Out8= 0.200121 In9:=CDFb,3.9 Out9= 0.649611 In10:=CDFb,4 Out10= 0.849732 In11:=Varianceb Out11= 2.1说明:在上例中,首先调入程序文件。In2用b表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。In3In5进行的是符号运算,可以得到期望、方差等的一般公式。这是本程序与一般统计软件的不同之处,充分体现了Mathematica的特色。接下来给出具体的参数值,进行数值计算,这些计算取代了查表。以下是一些更广泛、深入的例子。例4 观察下面离散分布的各种计算。 In1:= Statistics DiscreteDistributions In2:= h=HypergeometricDistributionn,M,N; Meanh Out3= In4:=Varianceh Out4= In5:= p=PoissonDistribution5; PDFp,2 Out6= In7:=N% Out7=0.0842243 In8:=PDFp,20 /N Out8=2.6412110-7 In9:=NCDFp,20,20 Out9=0.99999991890749540112 In10:=ExpectedValuex2,p,x Out10=30 In11:=RandomArrayp,2,10 Out11=3,4,6,10,2,5,7,2,5,5, 4,3,2,11,5,4,2,2,4,6说明:在上例中表明,超几何分布的参数按我国教科书的习惯来表示,这里求出的期望和方差公式就与教科书上的相同了。In5中给出的参数是准确数5,Mathematica在下面进行的仍是符号计算,得到准确结果。如果参数改为5.0 ,则计算结果就都是近似值了。In10是求E2,ExpectedValue是一个很有用的函数,务必注意。除了以上介绍的内容外,还有些不常用的函数本书没有列出,有兴趣的读者可以浏览Help。2. 连续分布 程序文件ContinuousDistributions.m 中,含有用于连续分布计算的函数。其中常见的连续分布有: NormalDistribution, 正态分布。 UniformDistributionmin,max 均匀分布。 ExponentialDistribution 指数分布。 StudentTDistributionn t分布。ChiSquareDistributionn 2分布。 常用的求值函数与离散分布相同,这里不再列出。例5 计算:(1)N(0,1),求:P(1.96),P( -1.96),P(-12)。(2)N(8,0.5),求:P(10),P(79)。 解:In1:= Statistics ContinuousDistributions In2:= n=NormalDistribution0,1; In3:=CDFn,1.96 Out3=0.975002 In4:=CDFn,-1.96 Out4=0.0249979 In5:=CDFn,2.- CDFn,-1. Out5= 0.818595 In6:= n=NormalDistribution8,0.5; In7:=CDFn,10 Out7=0.999968 In8:=CDFn,9- CDFn,7 Out8=0.9545 说明:在上例中,由于In2没有使用小数点,这时在In5中需要使用小数点才能得到近似值,否则得到符号解。反之,由于In6使用了小数点,后面的计算则不必再使用小数点了。如果使用人工查表的方法求In7,还需要首先转换成标准正态分布,这里就显得方便了。例6 绘制2分布在n分别为1,5,15时的分布密度函数图。 解:In1:= Statistics ContinuousDistributions In2:=PlotPDFChiSquareDistribution1,x, PDFChiSquareDistribution5,x, PDFChiSquareDistribution15,x,x,0,30, PlotRange0,0.2得到如图13-46所示的函数图形。图13-46 2分布的分布密度图 说明:上例中的绘图语句使用了函数嵌套,其中的函数名较长,最好自制统计函数模板。 因为这些统计计算都可以是符号的,所以能用于查询各种公式。以下是一个实例: In1:= Statistics ContinuousDistributions In2:=PDFNormalDistribution0,1,x Out2= In3:= n=NormalDistribution,; Meann Out4= In5:=Variancen Out5= 2 In6:= e=ExponentialDistribution; Meane Out7= In8:=Variancee Out8= In9:=ExpectedValuex2,e,x Out9= 三、 区间估计1. 总体数学期望的区间估计 程序文件ConfidenceIntervals.m 中,含有用于总体参数区间估计的函数。其中用于总体数学期望的区间估计的函数是: MeanCIdata,KnownVariancevar 已知方差var,由数据表data求总体数学期望的置信区间(基于正态分布)。 MeanCIdata 由数据表data求总体数学期望的置信区间(方差未知、基于t分布)。 其中参数KnownVariance也可以改为 KnownStandardDeviation,即已知标准差。 以上两个函数由样本数据表data直接求置信区间。但有时已知的是样本平均值,这时改用以下函数: NormalCImean,sd 标准差已知,且sd=,由样本平均值mean求总体数学期望的置信区间(基于正态分布)。 StudentTCImean,se,dof 用于方差未知,由样本平均值mean求总体数学期望的置信区间(基于t分布),其中,se =,而dof是自由度(等于n - 1)。以上函数都有可选参数:ConfidenceLevel 置信度,默认值为0.95。例7 已知某炼铁厂的铁水含碳量(%)服从正态分布,现测得5炉铁水的含碳量分别是:4.28,4.4,4.42,4.35,4.37。如果已知标准差为=0.108,求铁水平均含碳量的置信区间(置信度为0.95)。 解:In1:= Statistics ConfidenceIntervals In2:= data=4.28,4.4,4.42,4.35,4.37; MeanCIdata,KnownVariance 0.1082 Out3=4.26934,4.45866 例8 假定新生男婴的体重服从正态分布,随机抽取12名男婴,测得体重分别是(单位:g):3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。试求新生男婴平均体重的置信区间(置信度为0.95)。解:In4:= data=3100,2520,3000,3000,3600,3160,3560,3320, 2880,2600,3400,2540; MeanCIdata Out5=2818.2,3295.13 例9 在例7中如果改为已知测得9炉铁水的含碳量的平均值是4.484,其余条件不变,再求铁水平均含碳量的置信区间(置信度为0.95)。 解:In6:=NormalCI4.484,0.108 / Out6=4.41344,4.55456 例10 铅的比重测量值服从正态分布,测量16次算出=2.705,S=0.029。试求铅的比重的置信区间(置信度为0.95)。 解:In7:=StudentTCI2.705,0.029/Sqrt16,15 Out7=2.68955,2.72045 当调入程序文件ConfidenceIntervals.m时,为了计算各种统计量,这个程序会自动调入程序文件DescriptiveStatistics.m。因此,也可以首先由数据计算函数StudentTCI的各个参数,如下所示: In1:= Statistics ConfidenceIntervals In2:= data=2.1,1.2,0.7,1.0,1.1,3.2,3.2,3.3,2.1,0.3; m=Meandata Out3=1.82 In4:= se=StandardErrorOfSampleMeandata Out4=0.354275 In5:=StudentTCIm,se,Lengthdata-1,ConfidenceLevel0.9 Out5=1.17057,2.46943 说明:上例中,In4利用数据直接求出se,而不是像教科书上先求S,In5示范了设置置信度为0.9的方法。2. 总体方差的区间估计 对总体的方差进行区间估计的函数是: VarianceCIdata 由数据表data求总体方差的置信区间(基于2 分布)。 ChiSquareCIvariance,dof 由无偏估计样本方差variance,求总体方差的置信区间,其中dof是自由度(等于n - 1)。例11 试求例8的新生男婴体重方差的置信区间(置信度为0.95)。 解:In1:= Statistics ConfidenceIntervals In2:= VarianceCI3100,2520,3000,3000,3600,3160,3560, 3320,2880,2600,3400,2540 Out2=70687.2,406072. 例12 设炮弹速度服从正态分布,取9发炮弹测得无偏估计样本方差S2=11(m/s)2,求炮弹速度方差的置信区间(置信度为0.9)。 解:In3:= ChiSquareCI11,8,ConfidenceLevel0.9 Out3=5.67474,32.2033 四、 回归分析 对于线性回归,如果只想得到回归方程,只要使用函数Fit就行了。例13 已知某种商品的价格与日销售量的数据: 价格(元) 1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5 销量(斤) 5.0 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2 试求线性回归方程,再求价格为4时的日销售量。 解:In1:=data1.0,5.0,2.0,3.5,2.0,3.0,2.3,2.7, 2.5,2.4, 2.6,2.5,2.8,2.0,3.0,1.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论