




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、从2009国赛B题 眼科病床的合理安排说起。从从1500到到1931年的年的432年间,每年爆发战争的年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这次数可以看作一个随机变量,椐统计,这432年间共爆发了年间共爆发了299次战争,具体数据如下次战争,具体数据如下:战争次数战争次数X01234 22314248154 发生发生 X次战争的年数次战争的年数 在概率论中,大家对泊松分布产生的一在概率论中,大家对泊松分布产生的一般条件已有所了解,容易想到,每年爆发战般条件已有所了解,容易想到,每年爆发战争的次数,可以用一个泊松随机变量来近似争的次数,可以用一个泊松随机变量来近似描述描述 . 也
2、就是说,我们可以假设每年爆发战也就是说,我们可以假设每年爆发战争次数分布争次数分布X近似泊松分布近似泊松分布.现在的问题是:现在的问题是:上面的数据能否证实上面的数据能否证实X 具有具有泊松分布的假设是正确的?泊松分布的假设是正确的?又如,某钟表厂对生产的钟进行精确性检又如,某钟表厂对生产的钟进行精确性检查,抽取查,抽取100个钟作试验,拨准后隔个钟作试验,拨准后隔24小时小时以后进行检查,将每个钟的误差(快或慢)以后进行检查,将每个钟的误差(快或慢)按秒记录下来按秒记录下来.问该厂生产的钟的误差是否服从正态问该厂生产的钟的误差是否服从正态分布?分布?再如,某工厂制造一批骰子,再如,某工厂制造
3、一批骰子,声称它是均匀的声称它是均匀的. 为检验骰子是否均匀为检验骰子是否均匀, 要把骰子实地投掷要把骰子实地投掷若干次,统计各点出现的频率与若干次,统计各点出现的频率与1/6的差距的差距.也就是说,在投掷中,出也就是说,在投掷中,出现现1点,点,2点,点,6点的概点的概率都应是率都应是1/6.得到的数据能否说明得到的数据能否说明“骰子均匀骰子均匀”的假设是可信的?的假设是可信的?问题是:问题是:q 现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。q 本专题的主要目的是:熟悉本专题的主要目的是:熟悉
4、Matlab相关命令;熟悉相关命令;熟悉各种常见分布的概率密度函数及其曲线,会利用数据各种常见分布的概率密度函数及其曲线,会利用数据分布的形态猜测其分布类型;能够对密度函数进行参分布的形态猜测其分布类型;能够对密度函数进行参数估计;进行简单的假设检验(以正态检验为主)。数估计;进行简单的假设检验(以正态检验为主)。内容提纲1.Matlab相关命令介绍2.常见概率分布3.频数直方图与频数表4.参数估计5.假设检验Matlab相关命令 最值:最值:max(x), min(x) (1) max(X):返回向量返回向量X的最大值,如果的最大值,如果X中包含复数元素,中包含复数元素,则按模取最大值。则按
5、模取最大值。 (2) max(A):返回一个行向量,向量的第返回一个行向量,向量的第i个元素是矩阵个元素是矩阵A的第的第i列上的最大值。列上的最大值。 (3) Y,U=max(A):返回行向量返回行向量Y和和U,Y向量记录向量记录A的每列的每列的最大值,的最大值,U向量记录每列最大值的行号。向量记录每列最大值的行号。 (4) max(A,dim):dim取取1或或2。dim取取1时,该函数和时,该函数和max(A)完全相同;完全相同;dim取取2时,该函数返回一个列向量,其时,该函数返回一个列向量,其第第i个元素是个元素是A矩阵的第矩阵的第i行上的最大值。行上的最大值。q 数据统计处理基本命令
6、数据统计处理基本命令Matlab相关命令 求和:求和: (1) sum(X),返回向量返回向量X各元素的和。各元素的和。 (2) sum(A) ,返回一个行向量,其第返回一个行向量,其第i个元素是个元素是 A的第的第i列的元素和。列的元素和。 (3)sum(A,dim) ,当当dim为为1时,该函数等同于时,该函数等同于sum(A);当;当dim为为2时,返回一个列向量,其第时,返回一个列向量,其第i个元素是个元素是A的第的第i行的各元素之和。行的各元素之和。 乘积乘积: (1) prod(X) ,返回向量返回向量X各元素的乘积。各元素的乘积。 (2) prod (A) , 返回一个行向量,其
7、第返回一个行向量,其第i个元素是个元素是A的第的第i列元素的乘列元素的乘积。积。 (3) prod(A,dim) ,当当dim为为1时,该函数等同于时,该函数等同于prod(A);当;当dim为为2时,返回一个列向量,其第时,返回一个列向量,其第i个元素是个元素是A的第的第i行的各元素之乘积。行的各元素之乘积。q数据统计处理基本命令数据统计处理基本命令Matlab相关命令 累加和与累乘积累加和与累乘积 在在MATLABMATLAB中,使用中,使用cumsumcumsum和和cumprodcumprod函数能方便地求得向量和矩函数能方便地求得向量和矩阵元素的累加和与累乘积向量,函数的调用格式为:
8、阵元素的累加和与累乘积向量,函数的调用格式为: cumsum(X):返回向量:返回向量X累加和向量。累加和向量。 cumprod(X):返回向量:返回向量X累乘积向量。累乘积向量。 cumsum(A):返回一个矩阵,其第:返回一个矩阵,其第i列是列是A的第的第i列的累加和向量。列的累加和向量。 cumprod(A):返回一个矩阵,其第:返回一个矩阵,其第i列是列是A的第的第i列的累乘积向量。列的累乘积向量。 cumsum(A,dim):当:当dim为为1时,该函数等同于时,该函数等同于cumsum(A);当;当dim为为2时,返回一个矩阵,其第时,返回一个矩阵,其第i行是行是A的第的第i行的累
9、加和向量。行的累加和向量。 cumprod(A,dim):当:当dim为为1时,该函数等同于时,该函数等同于cumprod(A);当;当dim为为2时,返回一个向量,其第时,返回一个向量,其第i行是行是A的第的第i行的累乘积向量。行的累乘积向量。q数据统计处理基本命令数据统计处理基本命令Matlab相关命令 相关系数相关系数 MATLABMATLAB提供了提供了corrcoefcorrcoef函数,可以求出数据的相关系数矩阵。函数,可以求出数据的相关系数矩阵。corrcoefcorrcoef函数的调用格式为:函数的调用格式为: corrcoef(X):返回从矩阵:返回从矩阵X形成的一个相关系数
10、矩阵。此相关系数矩形成的一个相关系数矩阵。此相关系数矩阵的大小与矩阵阵的大小与矩阵X一样。它把矩阵一样。它把矩阵X的每列作为一个变量,然后求它的每列作为一个变量,然后求它们的相关系数。们的相关系数。 corrcoef(X,Y):在这里,:在这里,X,Y是向量,它们与是向量,它们与corrcoef(X,Y)的作用一的作用一样。样。q数据统计处理基本命令数据统计处理基本命令Matlab相关命令 排序排序 MATLABMATLAB中对向量中对向量X X是排序函数是是排序函数是sort(X)sort(X),函数返回一个对,函数返回一个对X X中的元素中的元素按升序排列的新向量。按升序排列的新向量。 s
11、ort函数也可以对矩阵函数也可以对矩阵A的各列或各行重新排序,其调用的各列或各行重新排序,其调用格式为:格式为: Y,I=sort(A,dim) 其中其中dim指明对指明对A的列还是行进行排序。若的列还是行进行排序。若dim=1,则按列排;若,则按列排;若dim=2,则按行排。则按行排。Y是排序后的矩阵,而是排序后的矩阵,而I记录记录Y中的元素在中的元素在A中位置。中位置。 q数据统计处理基本命令数据统计处理基本命令Matlab相关命令类似的用法,请自己借助类似的用法,请自己借助matlab在线帮在线帮助功能自己了解:助功能自己了解: 中位数:中位数:median(x) 标准差:标准差:std
12、(x) 方差:方差:var(x) 偏度:偏度:skewness(x) 峰度:峰度:kurtosis(x)q数据统计处理基本命令数据统计处理基本命令偏度和峰度的说明Matlab相关命令 例 生成满足正态分布的生成满足正态分布的10000100005 5随机矩阵,然后求各列元随机矩阵,然后求各列元素的均值和标准方差,再求这素的均值和标准方差,再求这5 5列随机数据的相关系数矩阵。列随机数据的相关系数矩阵。命令如下:命令如下:X=sqrt(3)*randn(10000,5)+4;M=mean(X)D=std(X)R=corrcoef(X)q数据统计处理基本命令数据统计处理基本命令Matlab相关命令
13、介绍q pdf 概率密度函数概率密度函数y=pdf(name,x,A)y=pdf(name,x,A,B) 或或 y=pdf(name,x,A,B,C)l 返回由返回由 name 指定的单参数分布的概率密度,指定的单参数分布的概率密度,x为样本数据为样本数据n name 用来指定分布类型,其取值可以是:用来指定分布类型,其取值可以是: beta、bino、chi2、exp、ev、f 、 gam、gev、gp、geo、hyge、logn、 nbin、ncf、nct、ncx2、norm、 poiss、rayl、t、unif、unid、wbl。l 返回由返回由 name 指定的双参数或三参数分布的概率
14、密度指定的双参数或三参数分布的概率密度常见的概率分布二项式分布二项式分布Binomialbino卡方分布卡方分布Chisquarechi2指数分布指数分布ExponentialexpF分布分布Ff几何分布几何分布Geometricgeo正态分布正态分布Normalnorm泊松分布泊松分布PoissonpoissT分布分布Tt均匀分布均匀分布Uniformunif离散均匀分布离散均匀分布Discrete UniformunidMatlab相关命令介绍例:例:x=-8:0.1:8;y=pdf(norm,x,0,1);y1=pdf(norm,x,1,2);plot(x,y,x,y1,:)n 注:注:
15、 y=pdf(norm,x,0,1) y=normpdf(x,0,1)相类似地,相类似地, y=pdf(beta,x,A,B) y=betapdf(x,A,B) y=pdf(bino,x,N,p) y=binopdf(x,N,p) 概率密度函数【例】绘制卡方分布密度函数在自【例】绘制卡方分布密度函数在自由度分别为由度分别为1 1、5 5、1515的图形的图形x=0:0.1:30;x=0:0.1:30;y1=chi2pdf(x,1); y1=chi2pdf(x,1); plot(x,y1,:)plot(x,y1,:)hold on hold on 【例】【例】 绘制标准正态分布的概率绘制标准正态
16、分布的概率密度图密度图. .x=-4:0.1:4;x=-4:0.1:4;y=normpdf(x,0,1);y=normpdf(x,0,1);plot(x,y)plot(x,y)title(N(0,1)title(N(0,1)的概率密度曲线图的概率密度曲线图)累积分布函数(cdf)【例】【例】 求服从标准正态分布的随机变量落在区间求服从标准正态分布的随机变量落在区间 2, 22, 2上的概率上的概率. . P=normcdf (-2, 2) P=normcdf (-2, 2)ans = 0.0228 0.9772ans = 0.0228 0.9772 P(2)-P(1) P(2)-P(1)ans
17、 = 0.9545 ans = 0.9545 累积分布函数(cdf) u_alpha=norminv(0.9,0,1) u_alpha=norminv(0.9,0,1) u_alpha = 1.2816u_alpha = 1.2816 t_alpha=tinv(0.25,4) t_alpha=tinv(0.25,4) t_alpha = -0.7407t_alpha = -0.7407 F_alpha=finv(0.1,14,10) F_alpha=finv(0.1,14,10) F_alpha = 0.4772F_alpha = 0.4772 X2_alpha=chi2inv(0.025,5
18、0) X2_alpha=chi2inv(0.025,50) X2_alpha = 32.3574X2_alpha = 32.3574累积分布函数(cdf)连续分布:正态分布q 正态分布正态分布(连续分布)(连续分布)l 如果随机变量如果随机变量 X 的密度函数为:的密度函数为:22X 2e()2(1)f x 0,x 则称则称 X 服从正态分布。记做:服从正态分布。记做:2( ,)XN l 标准正态分布:标准正态分布:N (0, 1)l 正态分布也称高斯分布,是概率论中最重要的一个分布。正态分布也称高斯分布,是概率论中最重要的一个分布。l 如果如果一个变量是大量微小、独立的随机因素的叠加,那么一
19、个变量是大量微小、独立的随机因素的叠加,那么它一定满足正态分布。如测量误差、产品质量、月降雨量等它一定满足正态分布。如测量误差、产品质量、月降雨量等正态分布举例x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,:)例:例:标准正态分布和非标准正态分布密度函数图形标准正态分布和非标准正态分布密度函数图形-8-6-4-20246800.050.10.150.20.250.30.350.4连续分布:均匀分布q 均匀分布均匀分布(连续分布)(连续分布)l 如果随机变量如果随机变量 X 的密度函数为:的密度函数为:则称则称 X 服从均
20、匀分布。记做:服从均匀分布。记做: , XU a bl 均匀分布在实际中经常使用,譬如一个半径为均匀分布在实际中经常使用,譬如一个半径为 r 的汽车轮的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置轮胎圆周接触地面的位置 X 是服从是服从 0,2 r 上的均匀分布。上的均匀分布。 1)0,(, axbf xba 其其他他连续分布:指数分布q 指数分布指数分布(连续分布)(连续分布)l 如果随机变量如果随机变量 X 的密度函数为:的密度函数为:则称则称 X 服从参数为服从参数为 的指数分布。记做:的指数分布。记
21、做: Exp( )X l 在实际应用问题中,等待某特定事物发生所需要的时间往在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布。如某些元件的寿命;随机服务系统中的服往服从指数分布。如某些元件的寿命;随机服务系统中的服务时间;动物的寿命等都常常假定服从指数分布。务时间;动物的寿命等都常常假定服从指数分布。 ,00,0( )xf xexx 0 l 指数分布具有无记忆性:指数分布具有无记忆性:|P Xst XsP Xt 指数分布举例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:例: =4 时的指数分布密度函数图时的指数分布密度函数图离散分布:几何分布q 几何分
22、布几何分布是一种常见的是一种常见的离散分布离散分布l 在贝努里实验中,每次试验成功的概率为在贝努里实验中,每次试验成功的概率为 p,设试验进行,设试验进行到第到第 次才出现成功,则次才出现成功,则 的分布满足:的分布满足:其右端项是几何级数其右端项是几何级数 的一般项,于是人们称它为的一般项,于是人们称它为几何分布。几何分布。11kkpq 1()1,2,kpqPkk x=0:30; y=geopdf(x,0.5); plot(x,y)例:例: p=0.5 时的几何分布密度函数图时的几何分布密度函数图离散分布:二项式分布q 二项式分布二项式分布属于离散分布属于离散分布l 如果随机变量如果随机变量
23、 X 的分布列为:的分布列为:则称这种分布为二项式分布。记做:则称这种分布为二项式分布。记做: ( ,)Xb n p (1()0,1,)kn knppP Xkkkn x=0:50;y=binopdf(x,500,0.05);plot(x,y)例:例: n=500,p=0.05 时的二项式分布密度函数图时的二项式分布密度函数图离散分布: Poisson 分布q 泊松分布泊松分布也属于离散分布,是也属于离散分布,是1837年由发个数年由发个数学家学家 Poisson 首次提出,其概率分布列为:首次提出,其概率分布列为:记做:记做:( )XP !()0, 1, 2,0kPekkXk l 泊松分布是一
24、种常用的离散分布,它与单位时间(或单泊松分布是一种常用的离散分布,它与单位时间(或单位面积、单位产品等)上的计数过程相联系。如:单位时位面积、单位产品等)上的计数过程相联系。如:单位时间内,电话总机接到用户呼唤次数;间内,电话总机接到用户呼唤次数;1 平方米内,玻璃上的平方米内,玻璃上的气泡数等。气泡数等。Poisson 分布举例x=0:50;y=poisspdf(x,25);plot(x,y)例:例: =25 时的泊松分布密度函数图时的泊松分布密度函数图离散分布:均匀分布q 如果随机变量如果随机变量 X 的分布列为:的分布列为: 2 1()1,P Xkknn则称这种分布为则称这种分布为离散均
25、匀分布离散均匀分布。记做:。记做: 1,2, XUnn=20;x=1:n;y=unidpdf(x,n);plot(x,y,o-)例:例: n=20 时的离散均匀分布密度函数图时的离散均匀分布密度函数图抽样分布: 2分布q 设随机变量设随机变量 X1, X2, , Xn 相互独立,且同服从正态相互独立,且同服从正态分布分布 N(0,1),则称随机变量,则称随机变量 n2= X12+X22+ +Xn2服从服从自由度为自由度为 n 的的 2 分布,记作分布,记作 ,亦称随,亦称随机变量机变量 n2 为为 2 变量。变量。22( )nn x=0:0.1:20; y=chi2pdf(x,4); plot
26、(x,y)例:例: n=4 和和 n=10 时的时的 2 分布密度函数图分布密度函数图x=0:0.1:20; y=chi2pdf(x,10); plot(x,y)抽样分布: F 分布q 设随机变量设随机变量 ,且,且 X 与与 Y 相相互独立,则称随机变量互独立,则称随机变量 22(),( )XmYnx=0.01:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:例: F(4,10) 的分布密度函数图的分布密度函数图/FX mY n 为服从自由度为服从自由度 (m, n) 的的 F 分布。记做:分布。记做:(, )FF m n抽样分布: t 分布q 设随机变量设随机变量 ,
27、且,且 X 与与 Y 相相互独立,则称随机变量互独立,则称随机变量 2(0,1),( )XNYn x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:例: t (4) 的分布密度函数图的分布密度函数图/TXY n 为服从自由度为服从自由度 n 的的 t 分布。记做:分布。记做: ( )Tt n频数直方图或频数表q 对于给定的数据集,假设它们满足以上十种分布之对于给定的数据集,假设它们满足以上十种分布之一,如何确定属于哪种分布?一,如何确定属于哪种分布?x=load(data1.txt); x=x(:);hist(x)例例 1:某次笔试的分数见某次笔试的分数见 data1.tx
28、t,试画出频数直方图,试画出频数直方图绘制频数直方图,或列出频数表绘制频数直方图,或列出频数表n 从图形上看,笔试成绩较为接近正态分布从图形上看,笔试成绩较为接近正态分布q hist 绘制给定数据的直方图绘制给定数据的直方图hist(x,m)xlsread(e:book1,sheet1)Textread(频数直方图或频数表x=load(data2.txt); x=x(:);hist(x)例例 2:某次上机考试的分数见某次上机考试的分数见 data2.txt,试画出频数直方图,试画出频数直方图n 从图形上看,上机考试成绩较为接近离散均匀分布从图形上看,上机考试成绩较为接近离散均匀分布x=load
29、(data3.txt); x=x(:);hist(x)例例 3:上海上海1998年来的月降雨量的数据见年来的月降雨量的数据见 data3.txt , 试画出频数直方图试画出频数直方图n 从图形上看,月降雨量较为接近从图形上看,月降雨量较为接近 2 分布分布频数直方图或频数表q 在重复数据较多的情况下,我们也可以利用在重复数据较多的情况下,我们也可以利用Matlab自带的自带的 tabulate 函数生成频数表,并以频数表的形函数生成频数表,并以频数表的形式来发掘数据分布的规律。式来发掘数据分布的规律。x=load(data4.txt); x=x(:);tabulate(x)hist(x)频数直
30、方图或频数表面列出了面列出了84个伊特拉斯坎(个伊特拉斯坎(Etruscan)人男子的头颅的最大宽度)人男子的头颅的最大宽度(mm),试检验这些数据是否来自正态总体),试检验这些数据是否来自正态总体(取取=0.1). 141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143
31、 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142140 137 152 145 x=load(data4.txt); x=x(:); tabulate(x) hist(x)频数直方图或频数表学生的身高和体重:学校随机抽取100名学生, 测量他们的身高和体重,所得数据如表身高体重 身高 体重 身高 体重 身高 体重 身高 体重172 75 169 55 169 64 171 65 167 4
32、7171 62 168 67 165 52 169 62 168 65166 62 168 65 164 59 170 58 165 64160 55 175 67 173 74 172 64 168 57155 57 176 64 172 69 169 58 176 57173 58 168 50 169 52 167 72 170 57166 55 161 49 173 57 175 76 158 51170 63 169 63 173 61 164 59 165 62167 53 171 61 166 70 166 63 172 53173 60 178 64 163 57 169 54
33、 169 66178 60 177 66 170 56 167 54 169 58173 73 170 58 160 65 179 62 172 50163 47 173 67 165 58 176 63 162 52165 66 172 59 177 66 182 69 175 75170 60 170 62 169 63 186 77 174 66163 50 172 59 176 60 166 76 167 63172 57 177 58 177 67 169 72 166 50182 63 176 68 172 56 173 59 174 64171 59 175 68 165 56
34、169 65 168 62177 64 184 70 166 49 171 71 170 59频数直方图或频数表 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下,试观察该刀具出现故障时完成的零件数属于哪种分布?459 362 624 542 509 584 433 748 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 42
35、8 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 577 496 468 499 544 645764 558 378 765 666 763 217 715 310 851频数直方图或频数表x=loa
36、d(data5.txt); x=x(:);hist(x)fiugrehistfit(x) % 加入较接近的正态分布密度曲线加入较接近的正态分布密度曲线试画出其直方图。试画出其直方图。 n 从图形上看,较为接近正态分布从图形上看,较为接近正态分布频数直方图或频数表q 也可以用也可以用 bar 函数。函数。qbar(x,y)绘制分别以绘制分别以x和和y为横纵坐标的二维条形图为横纵坐标的二维条形图qcdfplot(x) 绘制样本绘制样本x的经验分布函数图的经验分布函数图qFn,x0=ecdf(x) 得到样本得到样本x的经验分布函数值的经验分布函数值Fn, 当当x中有中有m个不个不同的数同的数 (记为
37、向量记为向量x0) 时时, 则则Fn的个数为的个数为m+1个个 x = 6 4 5 3 6 8 6 7 3 4; Fn,x0=ecdf(x)Fn = 0 0.2000 0.4000 0.5000 0.8000 0.9000 1.0000 x0 = 3 3 4 5 6 7 8 cdfplot(x)例例 累积分布函数(cdf)参数估计q 当我们可以基本确定数据集当我们可以基本确定数据集 X 符合某种分布后,我符合某种分布后,我们还需要确定这个分布的参数。们还需要确定这个分布的参数。q 由于正态分布情况发生的比较多,故我们主要考由于正态分布情况发生的比较多,故我们主要考虑正态分布的情形。虑正态分布的
38、情形。q 对于未知参数的估计,可分两种情况:对于未知参数的估计,可分两种情况:l 点估计点估计l 区间估计区间估计参数估计:点估计q 构造样本构造样本 X 与某个统计量有关的一个函数,作为与某个统计量有关的一个函数,作为该统计量的一个估计,称为该统计量的一个估计,称为点估计点估计。q Matlab 统计工具箱中,一般采用最大似然估计法统计工具箱中,一般采用最大似然估计法给出参数的点估计。给出参数的点估计。n 泊松分布泊松分布 P ( ) 的的 最大似然估计是最大似然估计是X n 指数分布指数分布 Exp ( ) 的的 最大似然估计是最大似然估计是1X 点估计举例n 正态分布正态分布 N ( ,
39、 2) 中,中, 最大似然估计是最大似然估计是 , 2 的最大似然估计是的最大似然估计是X 2211niiXXn x=load(data1.txt);x=x(:);mu,sigma=normfit(x)例例 6:已知例已知例 1 中的数据服从正态分布中的数据服从正态分布 N ( , 2) ,试求其参,试求其参数数 和和 的值。的值。使用使用 normfit 函数函数参数估计:区间估计q 构造样本构造样本 X 与某个统计量有关的两个函数,作为与某个统计量有关的两个函数,作为该统计量的下限估计与上限估计,下限与上限构成该统计量的下限估计与上限估计,下限与上限构成一个区间,这个区间作为该统计量的估计
40、,称为一个区间,这个区间作为该统计量的估计,称为区区间估计间估计。区间估计举例x=load(data6.txt); x=x(:);mu,sigma,muci,sigmaci=normfit(x,0.01)例例 8:从自动机床加工的同类零件中抽取从自动机床加工的同类零件中抽取16件,测得长度值件,测得长度值见见 data6.txt,已知零件长度服从正态分布,已知零件长度服从正态分布 N ( , 2) ,试求零,试求零件长度均值件长度均值 和标准差和标准差 的置信度为的置信度为 99% 的置信区间。的置信区间。Matlab相关命令介绍q normfit 正态分布中的参数估计正态分布中的参数估计mu
41、hat,sigmahat,muci,sigmaci=normfit(x,alpha)l 对样本数据对样本数据 x 进行参数估计,并计算置信度为进行参数估计,并计算置信度为 1-alpha 的置信区间的置信区间l alpha 可以省略,缺省值为可以省略,缺省值为 0.05,即置信度为,即置信度为 95%Matlab相关命令介绍q 其它其它分布中的参数估计分布中的参数估计Matlab相关命令介绍l说明说明: l(1) unifit和normfit的格式与其它函数均不同, 此二者要求左边的输出变量必须将参数或分别列出.l(2) binofit (x,n,alpha)根据试验成功的次数x和总的试验次数
42、n, 对中的p进行最大似然估计, 同时返回置信度为100(1-alpha)%的置信区间pci. phat,pci=binofit(4,100,0.05)phat = 0.0400pci = 0.0110 0.0993由于置信区间的上限超出了规定指标由于置信区间的上限超出了规定指标(不合格率在不合格率在5%以下以下), 因此不因此不能出厂能出厂 例例 对一批产品, 欲通过抽样检查其合格率. 若产品不合格率在5%以下, 则该批产品可出厂. 检验时要求结果具有0.95的置信水平. 今抽取产品100件, 发现不合格品有4件, 问这批产品能否出厂? 假设检验q 对总体的分布律或分布参数作某种假设,根据抽
43、取对总体的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,这就假设是否正确,从而决定接受假设或拒绝假设,这就是是假设检验假设检验问题。问题。q 以正态假设检验为例,来说明假设检验的基本过程。以正态假设检验为例,来说明假设检验的基本过程。正态假设检验q 正态假设检验的一般过程:正态假设检验的一般过程:l 假设检验:利用假设检验:利用 Matlab 统计工具箱给出的常用的假设检验统计工具箱给出的常用的假设检验方法的函数方法的函数 ttest,进行显著性水平为,进行显著性水平为
44、alpha 的的 t 假设检验,假设检验,以检验正态分布样本以检验正态分布样本 x(标准差未知)的均值是否为(标准差未知)的均值是否为 m。运行。运行结果中,当结果中,当 h=1 时,表示拒绝零假设;当时,表示拒绝零假设;当 h=0 时,表示不能时,表示不能拒绝零假设。拒绝零假设。l 对比正态分布的概率密度函数分布图,判断某统计量的对比正态分布的概率密度函数分布图,判断某统计量的分布可能服从正态分布分布可能服从正态分布l 利用统计绘图函数利用统计绘图函数 normplot 进行正态分布检验进行正态分布检验Matlab相关命令介绍normplot(x)l 统计绘图函数,进行正态分布检验。研究表明
45、:统计绘图函数,进行正态分布检验。研究表明:如果数据如果数据是来自一个正态分布,则该线为一直线形态;如果它是来自是来自一个正态分布,则该线为一直线形态;如果它是来自其他分布,则为曲线形态。其他分布,则为曲线形态。wblplot(x)l 统计绘图函数,进行统计绘图函数,进行 Weibull 分布检验。分布检验。正态假设检验举例x=load(data5.txt); x=x(:);normplot(x)例例 9:试说明例试说明例 5 中的刀具使用寿命服从正态分布,并且说中的刀具使用寿命服从正态分布,并且说明在方差未知的情况下其均值明在方差未知的情况下其均值 m 取为取为 597 是否合理。是否合理。
46、 (1) 对比刀具使用寿命分布图与正态分布的概率密度分对比刀具使用寿命分布图与正态分布的概率密度分布函数图,得初步结论:该批刀具的使用寿命可能服从正态布函数图,得初步结论:该批刀具的使用寿命可能服从正态分布。分布。解:解:(2) 利用统计绘图函数利用统计绘图函数 normplot 进行分布的正态性检验进行分布的正态性检验结果显示:这结果显示:这 100 个离散点非常靠近倾斜直线段,即图形为线个离散点非常靠近倾斜直线段,即图形为线性的,因此可得结论:该批刀具的使用寿命近似服从正态分布。性的,因此可得结论:该批刀具的使用寿命近似服从正态分布。总体方差总体方差sigma2未知时,总体均值的检验使用未
47、知时,总体均值的检验使用t-检验检验 h,sig,ci = ttest(x,m,alpha,tail)检验数据 x 的关于均值的某一假设是否成立,其中alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:tail = 0,检验假设“x 的均值等于 m ”tail = 1,检验假设“x 的均值大于 m ”tail =-1,检验假设“x 的均值小于 m ”tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h=1 表示可以拒绝假设,h=0 表示不可以拒绝假设,sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间.ttest说明正态假设检
48、验举例x=load(data5.txt); x=x(:);h=ttest(x,597,0.05)(3) 利用函数利用函数 ttest 进行显著性水平为进行显著性水平为 alpha 的的 t 假设检验假设检验检验结果:检验结果:h=0。表示不拒绝零假设,说明所提出的假设。表示不拒绝零假设,说明所提出的假设 “寿命均值为寿命均值为 597” 是合理的是合理的 例例 Matlab统计工具箱中的数据文件gas.mat.中提供了美国1993年一月份和二月份的汽油平均价格(price1,price2分别是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份油价的标准偏差未知,试检验一月份油价
49、的均值是否等于115.解解 作假设:m = 115.首先取出数据,用以下命令: load gas然后用以下命令检验 h,sig,ci = ttest( price2 ,115)返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.检验结果: 1. 布尔变量h=1, 表示拒绝零假设. 说明提出的假设油价均值115是不合理的. 2. 95%的置信区间为116.8 120.2, 它不包括115, 故不能接受假设. 3. sig-值为4.9517e-004, 远小于0.5, 不能接受零假设. ttest举例Matlab中假设检验相关命令例例 由十台电机组成的机组进行工作由十台电机组成的机组进行工作, 在在2000小时中有五台发生故障小时中有五台发生故障, 其故障发生的时间其故障发生的时间为为1350, 965, 427, 1753, 665试问这些电机在试问
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 寰枕融合的临床护理
- 《2025知识产权许可协议技术合同》
- 《临床护理操作技术》课件
- 生地会考试卷及答案万维
- 上海高一期中试卷及答案
- 山东期中考试试卷及答案
- 深海打捞装备的作业效能评估体系考核试卷
- 硬盘分区与数据恢复考核试卷
- 玩具工厂智能化升级考核试卷
- 玩具设计中的创意原型制作考核试卷
- 云南省烟草专卖局(公司)2025年上半年高校毕业生招聘(第二批)易考易错模拟试题(共500题)试卷后附参考答案
- 工作室股东合同协议
- 关于市中小学“校园餐”突出问题专项整治情况的报告
- SZDB-Z 173-2016 物业绿化养护管理规范
- 艺考全真乐理试题及答案
- 摄影人像知识篇课件
- 急救知识培训课件下载
- 酒店培训技巧
- 锅炉安装安全管理制度
- 2025年北京市海淀区高三一模政治试卷(含答案)
- 液压安全知识培训课件
评论
0/150
提交评论