版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 13.6概率统计实验学习目标1 会用 mathematica 求概率、均值与方差;2 能进行常用分布的计算;3 会用 mathematica 进行期望和方差的区间估计;4 会用 mathematica 进行回归分析。概率统计是最需要使用计算机的领域,过去依靠计算器进行统计计算,由于计算机的普及得以升级换代。本节介绍 mathematica 自带的统计程序包,其中有实现常用统计计算的各种外部函数。一、 样本的数字特征1. 一元的情况mathematica 的内部没有数理统计方面的功能,但是带有功能强大的数理统计外部程序,由多个程序文件组成。它们在标准扩展程序包集的 statistic 程序包子
2、集中,位于目录d:mathematica4.0addonsstandardpackagesstatistics下。通过查看 help,可以找到包含所需外部函数的程序文件名。在程序文件 descriptivestatistics.m 中,含有实现一元数理统计基本计算的函数,常用的有:samplerangedatamediandata求表 data 中数据的极差(最大数减最小数)。求中值。1 nnmeandata求平均值x 。ii=11 nvariancedata求方差(无偏估计)(x - x) 。2n -1ii=11 nstandarddeviationdatavariancemledata求标
3、准差(无偏估计)(x - x) 。2n -1ii=11 nn求方差(x - x) 。2ii=11 nnstandarddeviationmledata求标准差(x - x) 。2ii=1实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过 help浏览。例1给出一组样本值:6.5,3.8,6.6,5.7,6.0,6.4,5.3,计算样本个数、最大值、最小值、均值、方差、标准差等。精品文档 解:in1:= statistics descriptivestatisticsin2:= data = 6.5,3.8,6.6,5.7,6.0,6.4,5.3;in3:=lengthd
4、ataout3=7in4:=mindataout4= 3.8in5:=maxdataout5= 6.6in6:=samplerangedataout6= 2.8in7:=mediandataout7= 6.in8:=meandataout8= 5.75714in9:=variancedataout9= 0.962857in10:=standarddeviationdataout10= 0.981253in11:=variancemledataout11= 0.825306in12:= standarddeviationmledataout12= 0.908464说明:在上例中,in1首先调入程
5、序文件,求数据个数、最大值和最小值使用内部函数。2. 多元的情况在程序文件 multidescriptivestatistics.m 中,含有实现多元数理统计基本计算的函数,常用的有:samplerangedata求表 data 中数据的极差。求中值。mediandatameandata求平均值。variancedata求方差(无偏估计)。求标准差(无偏估计)。求方差。standarddeviationdatavariancemledatastandarddeviationmledatacovariancexlist,ylist求标准差。求 x,y 的协方差(无偏估计)精品文档 1 n(x -
6、 x)(y - y) 。n -1iii=1covariancemlexlist , ylist求 x , y 的 协 方 差求 x,y 的相关系数1 n(x - x)(y - y)。niii=1correlationxlist,ylist(x - x)2 (y - y) 。nnn(x - x)(y - y) /2iiiii=1i=1i=1实际上程序文件中的函数很多,这里只列出了最常用的函数,其它计算函数可以通过 help浏览。例2给出 4 个样本值:1.1,2.0,3.2,1.3,2.2,3.1,1.15,2.05,3.35,1.22,2.31,3.33,计算样本个数、均值、方差、标准差等。解
7、:in1:= statistics multidescriptivestatistics in2:= data = 1.1,2.0,3.2,1.3,2.2,3.1,1.15,2.05,3.35,1.22,2.31,3.33;lengthdataout3=4in4:=samplerangedataout4= 0.2,0.31,0.25in5:=mediandataout5= 1.185,2.125,3.265in6:=meandataout6= 1.1925,2.14,3.245in7:=variancedataout7= 0.00755833,0.0200667,0.0137667in8:=v
8、ariancemledataout8= 0.00566875,0.01505,0.010325in9:=centralmomentdata,2out9= 0.00566875,0.01505,0.010325in10:=x=dataall,1;y=dataall,2;z=dataall,3;in11:=covariancex,yout11=0.0093in12:=covariancez,z精品文档 out12=0.0137667in13:=covariancemley,yout13=0.01505in14:=correlationy,zout14=0.0521435in15:=correlat
9、ionx,xout15=1.二、 常用分布的计算在计算机出现以前,统计计算总是依赖一堆函数表。使用本节介绍的函数可以取代查表,为实现各种统计计算的自动化做好了底层准备工作。1. 离散分布程序文件 discretedistributions.m 中,含有用于离散分布计算的函数。其中常用的离散分布有:bernoullidistributionp贝努利分布。二项分布。binomialdistributionn,pgeometricdistributionp几何分布。hypergeometricdistributionn,m,npoissondistribution超几何分布。泊松分布。discret
10、euniformdistributionnnegativebinomialdistributionn,p离散的均匀分布。负二项分布。以上函数中的参数,既可以是数值的,也可以是符号的。使用这些函数只能按用户给出的参数建立一个表达式,并不能返回任何其它结果。真正进行计算的是下面的求值函数,它们使用以上的分布表达式作为一个参数。常用的求值函数有:domaindist求 dist 的定义域。pdfdist,x求点 x 处的分布 dist 的密度值。求点 x 处的分布函数值。求 x,使 cdfdist,x达到 q。求分布 dist 的期望。求方差。cdfdist,xquantiledist,qmeand
11、istvariancediststandarddeviationdistexpectedvaluef,dist,xcharacteristicfunctiondist,trandomdist求标准差。求 ef(x)。求特征函数(t)。求具有分布 dist 的伪随机数。精品文档 randomarraydist,dims求维数为 dims 的伪随机数的数组。例3 观察下面二项分布的各种基本计算。in1:= statistics discretedistributionsin2:= b=binomialdistributionn,pout2=binomialdistributionn,pin3:=m
12、eanbout3=npin4:=variancebout4= n(1-p)pin5:=characteristicfunctionb,tout5= (1-p+e p)nitin6:=b=binomialdistribution10,0.3out6= binomialdistribution10,0.3in7:=domainbout7= 0,1,2,3,4,5,6,7,8,9,10in8:=pdfb,4out8= 0.200121in9:=cdfb,3.9out9= 0.649611in10:=cdfb,4out10= 0.849732in11:=variancebout11= 2.1说明:在上
13、例中,首先调入程序文件。in2用 b 表示具有符号参数的二项分布,这一步只是为了后面输入时方便,并非必需的,也可以使用嵌套省略这一步。in3in5进行的是符号运算,可以得到期望、方差等的一般公式。这是本程序与一般统计软件的不同之处,充分体现了 mathematica 的特色。接下来给出具体的参数值,进行数值计算,这些计算取代了查表。以下是一些更广泛、深入的例子。例4 观察下面离散分布的各种计算。in1:= statistics discretedistributionsin2:= h=hypergeometricdistributionn,m,n;meanhmnout3=n精品文档 in4:=
14、variancehmmn(1- )(-n + n)nout4=(-1+ n)nin5:= p=poissondistribution5;pdfp,225out6=2e5in7:=n%out7=0.0842243in8:=pdfp,20 /nout8=2.6412110-7in9:=ncdfp,20,20out9=0.99999991890749540112in10:=expectedvaluex2,p,xout10=30in11:=randomarrayp,2,10out11=3,4,6,10,2,5,7,2,5,5,4,3,2,11,5,4,2,2,4,6说明:在上例中表明,超几何分布的参数
15、按我国教科书的习惯来表示,这里求出的期望和方差公式就与教科书上的相同了。in5中给出的参数是准确数 5,mathematica 在下面进行的仍是符号计算,得到准确结果。如果参数改为 5.0 ,则计算结果就都是近似值了。 in10是求 e ,expectedvalue 是一个很有用的函数,务必注意。2除了以上介绍的内容外,还有些不常用的函数本书没有列出,有兴趣的读者可以浏览help。2. 连续分布程序文件 continuousdistributions.m 中,含有用于连续分布计算的函数。其中常见的连续分布有:normaldistribution,uniformdistributionmin,m
16、axexponentialdistributionstudenttdistributionn正态分布。均匀分布。指数分布。t 分布。chisquaredistributionn 分布。2常用的求值函数与离散分布相同,这里不再列出。精品文档 ( , ),求: ( 例5 计算:(1)n 0 1p 1.96), ( p -1.96), ( )。p -1 2(2)n 8 0.5( , ),求: ( ), ( )。p 10 p 7 9解:in1:= statistics continuousdistributionsin2:= n=normaldistribution0,1;in3:=cdfn,1.96
17、out3=0.975002in4:=cdfn,-1.96out4=0.0249979in5:=cdfn,2.- cdfn,-1.out5= 0.818595in6:= n=normaldistribution8,0.5;in7:=cdfn,10out7=0.999968in8:=cdfn,9- cdfn,7out8=0.9545说明:在上例中,由于in2没有使用小数点,这时在 in5中需要使用小数点才能得到近似值,否则得到符号解。反之,由于 in6使用了小数点,后面的计算则不必再使用小数点了。如果使用人工查表的方法求 in7,还需要首先转换成标准正态分布,这里就显得方便了。例6 绘制 分布在
18、分别为 , , 时的分布密度函数图。n1 5 152解:in1:= statistics continuousdistributionsin2:=plotpdfchisquaredistribution1,x,pdfchisquaredistribution5,x,pdfchisquaredistribution15,x,x,0,30,plotrange0,0.2得到如图 13-46 所示的函数图形。图 13-46分布的分布密度图2说明:上例中的绘图语句使用了函数嵌套,其中的函数名较长,最好自制统计函数模板。因为这些统计计算都可以是符号的,所以能用于查询各种公式。以下是一个实例:精品文档 in
19、1:= statistics continuousdistributionsin2:=pdfnormaldistribution0,1,xx2e-2out2=2pin3:= n=normaldistribution,;meannout4= in5:=variancenout5= 2in6:= e=exponentialdistribution;meane1out7=lin8:=variancee1out8=l2in9:=expectedvaluex2,e,x2out9=l2三、 区间估计1. 总体数学期望的区间估计程序文件 confidenceintervals.m 中,含有用于总体参数区间估
20、计的函数。其中用于总体数学期望的区间估计的函数是:meancidata,knownvariancevar学期望的置信区间(基于正态分布)。meancidata已知方差 var,由数据表 data 求总体数由数据表 data 求总体数学期望的置信区间(方差未知、基于 t 分布)。其中参数 knownvariance 也可以改为 knownstandarddeviation,即已知标准差。以上两个函数由样本数据表 data 直接求置信区间。但有时已知的是样本平均值 ,这时x改用以下函数:snormalcimean,sd标准差已知,且 sd=,由样本平n均值 mean 求总体数学期望的置信区间(基于
21、正态分布)。精品文档 studenttcimean,se,dof用于方差未知,由样本平均值 means求总体数学期望的置信区间(基于 t 分布),其中,se =,而 dof 是自由度(等于 n - 1)。n以上函数都有可选参数:confidencelevel置信度,默认值为 0.95。例7 已知某炼铁厂的铁水含碳量(%)服从正态分布,现测得 5 炉铁水的含碳量分别是:4.28,4.4,4.42,4.35,4.37。如果已知标准差为 =0.108,求铁水平均含碳量的置信区间(置信度为 0.95)。解:in1:= statistics confidenceintervalsin2:= data=4
22、.28,4.4,4.42,4.35,4.37;meancidata,knownvariance 0.1082out3=4.26934,4.45866例8假定新生男婴的体重服从正态分布,随机抽取 12 名男婴,测得体重分别是(单位:g):3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。试求新生男婴平均体重的置信区间(置信度为 0.95)。解:in4:= data=3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540;meancidataout5=2818.2,
23、3295.13例9在例 7 中如果改为已知测得 9 炉铁水的含碳量的平均值是 4.484,其余条件不变,再求铁水平均含碳量的置信区间(置信度为 0.95)。解:in6:=normalci4.484,0.108 / 9 out6=4.41344,4.55456例10 铅的比重测量值服从正态分布,测量 16 次算出 x =2.705,s=0.029。试求铅的比重的置信区间(置信度为 0.95)。解:in7:=studenttci2.705,0.029/sqrt16,15out7=2.68955,2.72045当调入程序文件 confidenceintervals.m 时,为了计算各种统计量,这个程
24、序会自动调入程序文件 descriptivestatistics.m。因此,也可以首先由数据计算函数 studenttci 的各个参数,如下所示:in1:= statistics confidenceintervalsin2:= data=2.1,1.2,0.7,1.0,1.1,3.2,3.2,3.3,2.1,0.3;m=meandataout3=1.82精品文档 in4:= se=standarderrorofsamplemeandataout4=0.354275in5:=studenttcim,se,lengthdata-1,confidencelevel0.9out5=1.17057,2
25、.46943说明:上例中,in4利用数据直接求出 se,而不是像教科书上先求 s,in5示范了设置置信度为 0.9 的方法。2. 总体方差的区间估计对总体的方差进行区间估计的函数是:variancecidata分布)。由数据表 data 求总体方差的置信区间(基于由无偏估计样本方差 variance,求总体方差的2chisquarecivariance,dof置信区间,其中 dof 是自由度(等于 n - 1)。例11 试求例 8 的新生男婴体重方差的置信区间(置信度为 0.95)。解:in1:= statistics confidenceintervalsin2:= varianceci31
26、00,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540out2=70687.2,406072.例12 设炮弹速度服从正态分布,取 9 发炮弹测得无偏估计样本方差 s =11(m/s) ,22求炮弹速度方差的置信区间(置信度为 0.9)。解:in3:= chisquareci11,8,confidencelevel0.9out3=5.67474,32.2033四、 回归分析对于线性回归,如果只想得到回归方程,只要使用函数 fit 就行了。例13 已知某种商品的价格与日销售量的数据:价格(元) 1.0 2.0 2.0 2.3 2.5 2.6 2.8 3.0 3.3 3.5销量(斤) 5.0 3.5 3.0 2.7 2.4 2.5 2.0 1.5 1.2 1.2试求线性回归方程,再求价格为 4 时的日销售量。解:in1:=data1.0,5.0,2.0,3.5,2.0,3.0,2.3,2.7,2.5,2.4, 2.6,2.5,2.8,2.0,3.0,1.5,3.3,1.2,3.5,1.2;f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026一年级下新课标图形想象创造力培养
- 2026 三年级上册 《总复习(数与计算)》 课件
- 华山医院工作制度
- 单元房东制度规范要求标准
- 卫生站诊工作制度
- 卫生院员工岗位责任制度
- 印刷业务团队管理制度
- 历史博物馆卫生管理制度
- 反洗钱内部控制工作制度
- 口腔科院感奖惩制度
- 消防安全志愿者协议书
- (高清版)JTGT 3364-02-2019 公路钢桥面铺装设计与施工技术规范
- 形而上学与辩证法
- 高考数学中的向量与坐标几何的应用研究
- 入户申请审批表(正反面,可直接打印)
- 机器设备安装调试费率
- 天象仪演示系统的演进与具体应用,天文学论文
- GB/T 9065.1-2015液压软管接头第1部分:O形圈端面密封软管接头
- GB/T 18998.2-2022工业用氯化聚氯乙烯(PVC-C)管道系统第2部分:管材
- GB/T 15874-1995集群移动通信系统设备通用规范
- GA/T 1674-2019法庭科学痕迹检验形态特征比对方法确认规范
评论
0/150
提交评论