版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021-7-131 第四章第四章 非参数非参数 假设检验假设检验 正态分布正态分布 的拟合检验的拟合检验 一般分布一般分布 的拟合检验的拟合检验 两个总体两个总体 的相同性的相同性 检验检验 两个总体两个总体 的独立性的独立性 检验检验 正态正态 概率概率 纸法纸法 峰度峰度 偏度偏度 检验法检验法 卡方卡方 拟合拟合 检验法检验法 K-S 检验法检验法 秩和秩和 检验法检验法 符号符号 检验法检验法 卡方卡方 检验法检验法 No Image Mathematical Statistics 2021-7-132 4.1 正态分布的拟合检验 一、正态概率纸检验法一、正态概率纸检验法 Norma
2、l Probability Plot Test Normal Probability Plot Test 二、峰度偏度检验法二、峰度偏度检验法 Skewness and Turtosis Test Skewness and Turtosis Test Mathematical Statistics 2021-7-133 1、概率纸、概率纸 概率纸是一类依特定的概 概率纸是一类依特定的概 率分布而制作的坐标纸。率分布而制作的坐标纸。对于 每个连续的分布函数,都可以 设计一种坐标纸,使该分布函 数在其上的图形呈一条直线。 因 此,概率纸常依概率分布 来命名,例如正态概率纸、对 数正态概率纸,威布尔
3、概率纸 和伽玛概率纸等。利用概率纸, 可根据样本对总体分布 的类 型进行检验,对分布参数进行 估计,以及进行其他简便快速 的统计推断。 概率纸的作用概率纸的作用: 设F(x)是总体X的分布函数,则 点集(x,F(X))在概率纸上是 一条直线。 你会制作概 率纸吗? 一、正态概率纸检验法一、正态概率纸检验法 Mathematical Statistics 2021-7-134 一、正态概率纸法一、正态概率纸法 例如纵轴上,原坐标为1处的刻度为(1) =0.84,原坐标为2处的刻度为(2)=0.977, 原坐标为-1处的刻度为(-1)=0.1687,但习 惯上,在正态概率纸上的纵坐标轴上标明的 数
4、字是换算出的刻度的100倍,又由于是在取 值,概率不可能为0,也不可能为1,故一般 概率纸的纵轴的刻度都是从0.0199.99。 2、正态概率纸的构造 正态概率纸是一张刻有直角坐标的图纸,正态概率纸是一张刻有直角坐标的图纸, 它的横坐标轴的刻度是均匀的,表示观察值。它的横坐标轴的刻度是均匀的,表示观察值。 纵坐标轴的刻度是不均匀的,表示概率,具纵坐标轴的刻度是不均匀的,表示概率,具 体的刻度是通过标准正态分布的分布函数体的刻度是通过标准正态分布的分布函数 y=(x)换算出来的,即在普通的直角坐标系换算出来的,即在普通的直角坐标系 的纵坐标轴(的纵坐标轴(y轴)上原坐标为轴)上原坐标为t的点刻度
5、为的点刻度为 (t) . Mathematical Statistics 2021-7-135 一、正态概率纸法一、正态概率纸法 3、检验步骤、检验步骤 情形一:样本容量情形一:样本容量n较小较小 ,. )()2()1(n xxx 第一步:求经验分布函数第一步:求经验分布函数 将样本由小到大重新排列,记为 1 0 )( )( )1()( (1) xx xxx n i xx xF n iin 令Fn(x)为 第二步:描点第二步:描点 在正态概率纸上,将点(x(i),Fn(x(i)) 描到概率纸上。 第三步:检验第三步:检验 若点(x(i),Fn(x(i))基本在一条直 线上,则认为X服从正态分布
6、, 否则拒绝之。 主要看中间的大部分点,主要看中间的大部分点, 两边的点允许有些偏差,两边的点允许有些偏差, 但不能太大,若有太大但不能太大,若有太大 的弯曲,可能不是正态的弯曲,可能不是正态 分布。分布。 Mathematical Statistics 2021-7-136 一、正态概率纸法一、正态概率纸法 第四步:求正态总体中的参数第四步:求正态总体中的参数 在正态概率纸上找概率等于 0.5所对应的横坐标 ,这点就 是总体数学期望的估计值 的估计值可以通过概 率为15.9%所对应的点寻找 , x 为什么? 在正态概率纸上找概率等于0.5 所对应的横坐标 ,这点就是总 体数学期望的估计值 。
7、的 估计值可以通过概率为15.9% 所对应的点寻找,因为 其中x就是概率为15.9%所对应 的点,这时=-x.除此之外, 还可以用概率等于8.13%对应 的点来计算. )( nS Mathematical Statistics 2021-7-137 一、正态概率纸法一、正态概率纸法 【例1】自动车床加工中轴,从成品中抽取11个,并测量它们的直径如下: 10.5210.4110.3210.1810.6410.7710.8210.6710.5910.3810.49 试检验这批零件的直径是否服从正态分布? 解解先将所测得的数据有小到大排列 10.1810.3210.3810.4110.49 10.5
8、210.5910.6410.6710.7710.82 然后按),( )( n i x i 在正态概率纸上点图. %,50p,52.10 由估计出 由估计出x=10.73,进而得. 23. 052. 1075. 10 x Mathematical Statistics 2021-7-138 一、正态概率纸法一、正态概率纸法 4、Matlab实现实现 0, 2exp) 1 (lim 2 2 k k n n k n DP NORMPLOT Displays a normal probability plot. H = NORMPLOT(X) makes a normal probability pl
9、ot of the data in X. For matrix, X, ORMPLOT displays a plot for each column. H is a handle to the plotted lines. The purpose of a normal probability plot is to graphically assess whether the data in X could come from a normal distribution. If the data are normal the plot will be linear. Other distri
10、bution types will introduce curvature in the plot. Mathematical Statistics 2021-7-139 一、正态概率纸法一、正态概率纸法 输入: 输出: x=10.52 10.41 10.32 10.18 10.64 10.77 10.82 10.67 10.59 10.38 10.49 ; normplot(x) 例1的matlab 实现: 2 ) 1 2 ( 2 ) 1 ( , 2 ) 1 2 ( 2 ) 1 ( 21 mn n R n n n mm R mm Mathematical Statistics 2021-7-
11、1310 一、正态概率纸法一、正态概率纸法 情形二:样本容量情形二:样本容量n较大较大 当n很大时,用上述作法点太多画不过来,这时可把数据分组,先找 出数据中最大值与最小值,决定组数,当数据大于50个时根据经验以分 1016组为宜,然后决定分点并数出数据落在每个组内的个数ni,称为 频数频数,再计算累积频数,将累积频数除以n得累积频率,以每组上限为横 坐标,累积频率为纵坐标在正态概率纸上点图,然后进行参数估计,第 一区间的下限可以记为-,最后一个区间的上限可以记为+,目的是整 个概率值为1。 是否与画直方图类似? ) ( 0 ) 1 ( ) ( 0 ) (i i ni i n x Fx Fx
12、F x F 和 Mathematical Statistics 2021-7-1311 一、正态概率纸法一、正态概率纸法 【例2】在20天内,从维尼纶正常生产时生产报表上看到的维尼纤度的情况, 有如下100个数据: 1.361.491.431.411.371.401.321.42 1.471.391.411.361.401.341.421.42 1.451.351.421.391.441.421.391.42 1.421.301.341.421.371.361.371.34 1.371.371.441.451.321.481.401.45 1.391.461.391.531.361.481.4
13、01.39 1.381.401.361.451.501.431.381.43 1.411.481.391.451.371.371.391.45 1.311.411.441.441.421.471.351.36 1.401.381.351.421.431.421.421.42 1.401.411.371.461.361.371.271.37 1.381.421.341.431.421.411.411.44 1.481.551.371.39 试判断纤维度是否服从正态分布。 Mathematical Statistics 2021-7-1312 区 间频数频率累积频率 一、正态概率纸法一、正态概率纸
14、法 解:计算结果如下表 1 1 6 10 25 23 22 7 4 1 01. 0 01. 0 06. 0 10. 0 25. 0 23. 0 22. 0 07. 0 04. 0 01. 0 00. 1 99. 0 98. 0 92. 0 82. 0 57. 0 34. 0 12. 0 05. 0 01. 0 %13. 84 p Mathematical Statistics 2021-7-1313 ri, , 1 以小区间的右端点为横 坐标,对应的累积频率 为纵坐标在正态概率纸 上描点。 n m p i i 横坐标为 ,maxmax ) (0) 1() (0) ( 1 0iiniin n i
15、 n x n x Fx Fx Fx Fx Fx FD 的横坐标为 13.58 ) 2 () ) 3( 4 1 ( 6 22 2 2 1 gg n Jb 一、正态概率纸法一、正态概率纸法 Mathematical Statistics 2021-7-1314 总体X偏度: ), 1 6 3() )5)(3()1( )3)(2(24 , 1 6 3( ), 0() )3)(1( )2(6 , 0( 2 2 2 2 2 11 n N nnn nnn n Ng N nn n Ng 记为 记为 3,0 21 总体X峰度: 样本偏度: 样本峰度: 记k阶样本中心距为: 2 2 4 2 B B g n i
16、k ik XX n B 1 )( 1 ) ( 0 ) 1 ( ) ( 0 ) (i i ni i n x Fx Fx F x F 和 样本偏度和 峰度分别描 述总体的什 么特性? 二、峰度偏度检验法二、峰度偏度检验法 Mathematical Statistics 2021-7-1315 二、峰度偏度检验法二、峰度偏度检验法 Theorem:若总体若总体X服从正态分布,则服从正态分布,则 535.1 535.1505.1 505.1475.1 475.1445.1 445.1415.1 415.1385.1 385.1355.1 355.1325.1 325.1295.1 295.1 且当样本
17、容量且当样本容量n充分大时,近似地有充分大时,近似地有 2/3 2 3 1 B B g 注意:样本容量不能太小。注意:样本容量不能太小。 Mathematical Statistics 2021-7-1316 二、峰度偏度检验法二、峰度偏度检验法 检验方法之一:检验方法之一: 检验假设 或 4/124/11 | uUuUW 检验统计量: ) , (: ), ( : 2 21 2 20 NXHNXH不服从 拒绝域: ) 2 ( ) ) 3( 4 1 ( 6 22 2 2 1 gg n Jb Mathematical Statistics 2021-7-1317 二、峰度偏度检验法二、峰度偏度检验
18、法 Theorem:在正态性假定下,当在正态性假定下,当n充分大时,统计量充分大时,统计量 2/32 3 3 1 )( )( )( )( XEXE XEXE XD XEX E Mathematical Statistics 2021-7-1318 二、峰度偏度检验法二、峰度偏度检验法 检验方法之二:检验方法之二: 检验假设 或 4/124/11 | uUuUW ),( 2 N 检验统计量: 拒绝域: 05.0 Mathematical Statistics 2021-7-1319 二、峰度偏度检验法二、峰度偏度检验法 4、Matlab实现(针对检验方法二)实现(针对检验方法二) 0, 2exp
19、) 1 (lim 2 2 k k n n k n DP 函数函数: jbtest 格式格式: H = jbtest(X) %对输入向量X进行Jarque-Bera测 试,显著性水平为0.05. H = jbtest(X,alpha) %在水平alpha而非5%下施行 Jarque-Bera 测试,alpha在0和1之间. H,P,JBSTAT,CV = jbtest(X,alpha) %P为接受假设 的概率值,P越接近于0,则可以拒绝是正态分布的原 假设;JBSTAT为测试统计量的值,CV为是否拒绝原 假设的临界值. 说明说明 H为测试结果,若H=0,则可以认为X是服从正 态分布的;若X=1,
20、则可以否定X服从正态分布.X为 大样本,对于小样本用lillietest函数. Mathematical Statistics 2021-7-1320 二、峰度偏度检验法二、峰度偏度检验法 【例3】某厂生产一种白炽灯泡,其光通亮(单位:明流)用X表示, 先从总体X中抽取容量为n=120的样本,得观察值如下。 216203197208206209206208202203 206213218207208202194203213211 193213208208204206204206208209 213203206207196201208207213208 210208211211214220211
21、203216224 211209218214219211208221211218 218190219211208199214207207214 206217214201212213211212216206 210216204221208209214214199204 211201216211209208209202211207 202205206216206213206207200198 200202203208216206222213209219 ) 2 ( 2 1 JbW问X是否服从正态分布 348 , 88 , 36 , 48 , 520 22211211 nnnnn Mathemati
22、cal Statistics 2021-7-1321 二、峰度偏度检验法二、峰度偏度检验法 解:h,p,jb,cv=jbtest(x(:) h=0%不拒绝原假设 p= 0.50 jb= 0.71%统计量的值 cv= 5.51%临界值 服从正态分布。不拒绝原假设,即承认X 51. 571. 0 cvJb Q Mathematical Statistics 2021-7-1322 m i i ii np npn 1 2 2 )( Mathematical Statistics 2021-7-1323 4.2一般分布的拟合检验一般分布的拟合检验 二、二、K-SK-S检验法检验法 Kolmogorov
23、-Smirnov goodness-of-fit testKolmogorov-Smirnov goodness-of-fit test 一、卡方拟合检验法一、卡方拟合检验法 Chi-square goodness-of-fit test Chi-square goodness-of-fit test Mathematical Statistics 2021-7-1324 卡尔卡尔皮尔逊(皮尔逊(KarlPearson),1857- 1936提出卡方(2)检验。皮尔逊认为,不 管理论分布造反得如何好,它与实际分布之 间总存在着或多或少的差异。这些差异是由 于观察次数不充分、随机误差太大引进的呢
24、? 还是由于所选配的理论分布本身就与实际分 布有实质性差异?还需要用一种方法来检验。 1900年,皮尔逊发表了一个著名的统计量, 称之为卡方( 2 ),用来检验实际值的分布 数列与理论数列是否在合理范围内相符合, 即用以测定观察值与期望值之间的差异显著 性。“卡方检验法” 提出后得到了广泛的 应用,在现代统计理论中占有重要地位。 (KarlPearson,1857- 1936)英国生物学家 和统计学家,旧数理学 派和描述统计学派的代 表人物,现代统计科学 的创立者 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1325 ), 2 1 , (
25、 ), 2 1 , ( n Bnn Bn Ronald Aylmer Fisher Fisher, Ronald Aylmer(1890.2.171962.7.29),生于伦敦, 卒于 Adleaide(澳洲)。英国统计与遗传学家,现代统计科学 的奠基人之一,并对达尔文演化论作了基础澄清的工作。 Fisher 以天文学学士毕业于剑桥大学,也因对天文观测误差的 分析,使他开始探讨统计的问题。毕业后几年,他曾到加拿大 务农,工作于投资公司,也当过私立学校的老师。并在1915, 1918发表两篇重要文章,前者探讨相关系数的分布;后者证明 遗传上的连续变异,可用许多遵守孟德尔律的基因变异所叠加 来解释
26、。他一生在统计和生物的研究兴趣与才华,已经清楚地 表现出来。 1919年他拒绝在 K. Pearson 下工作,任职于 Rothamsted 农 业实验场。他在 Rothamsted 的工作结晶,发表了天择的遗传 理论(1930)。这本著作将统计分析的方法带入演化论的研究。 为解释现代生物学的核心理论打下坚实的基础。也因这本着作, Fisher 1933年获得伦敦大学的职位,从事 RH 血型的研究。 1943至1957年他回剑桥大学任教,1952年受封爵士,1956年出 版统计方法与科学推理,最后三年,则在澳洲为国协科技 研究组织 (CSTRO) 工作,并卒于任上。 Mathematical
27、Statistics 2021-7-1326 用极大似然估计法求出 的估计值) , , , ( 210r xF) , , ( 21r 第一步 拟合总体分布形式 如果事先没有任何关于总体分布的经验或依据,对连续 型总体,一般先把抽样所获得的数据进行整理,然后作出样 本分组频数分布直方图. 由此确定总体分布函数形式 1 2 1 2 rm 其中是未知参数 ),(),( 2110210ririi aFaFp 从而猜测总体的分布函数为 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1327 ) , ,()(: 101k xFxFH m aaaa 21
28、0 第二步 拟合好坏的检验 设总体的真实分布为F(x),给定显著水平及样本观测 值x1,x2,xn,检验假设 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1328 1样本频率分布直方图 设总体X为连续型,下面利用样本数值来拟合总 体分布密度函数f(x) 根据样本值的情况,将其分为m组,各组范围为 n n f i i 其中 记 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1329 m mm nnn aaaaaa , ,( , (, ( 21 12110 i i a a i dxxfp
29、1 )( mi,2, 1 ni=落在ai-1,ai)内的样本数,则事件Ai发生的频率为 Ai发生的概率为 作表 此表称为样本分组频数分布表 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1330 1 ii i aa f i i a a ii dxx fpf 1 ) (在每个区间(ai-1,ai上,以此区间为底,以 为高作一矩形(i=1,2,m),这样的图形称为样本组频率分 布直方图,见图 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1331 ,(,( ,( 12110mm aaaaaa
30、 因而每个小区间上的小矩形的面积接近于概率密度曲线之下 该区间之上的曲边梯形的面积。 一般来说,n越大且分组越细,则直方图的外廓曲线越接近 于总体的概率密度曲线。 对离散型总体,虽然不能画样本分组频率直方图,但仍可 给出样本分组频数分布表。 第i个小区上矩形的面积为fi,由大数定律可知,当n很大 时,频率接近于概率 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1332 2拟合优度检验 要检验假设H0,必须利用样本建立用以衡量F(x)与F0(x)差 异的统计量,这种统计量有多种选择,下面介绍皮尔逊 (Person) 2检验法 在H0为真的前
31、提下,事件Ai的概率为 npi称为事件Ai的理论频数,作表 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1333 ) , , ()(: 100k xFxFH 此表称为分组理论频数分布表 它与样本分组频数分布表的差异反映了F(x)与F0(x)的差异 用统计量 ) , , , () , , , ( 10110ririi xFxFp 来衡量 皮尔逊证明了以下定理 显然,H0的拒绝域形式为),( 10r xF (k待定) 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1334 一、卡方拟合检验
32、法一、卡方拟合检验法 (2) Pearson 定理:定理: 则当n时 Theorem(K.Pearson-Fisher):设 为总体的真 实分布,其中 为r个未知参数.在 中用 极大似然估计量 代替得 ,令 m mm npnpnp aaaaaa , ),),), 21 12110 r , 1 ) , , ,( 210r xF r , 1 ),( 210r xF ),( 21r ),( 21r Mathematical Statistics 2021-7-1335 一、卡方拟合检验法一、卡方拟合检验法 2、离散型随机变量的分布拟合检验、离散型随机变量的分布拟合检验 基本步骤基本步骤: (2) 给
33、出检验假设:给出检验假设: H0: pi=pi (i=1,m), H1: pipi 至少对某个至少对某个i 成立。成立。 (1) 分组:将分组:将X的值域分成互不相交的的值域分成互不相交的m组:组:I1,Im,记,记 P xIi=pi, i=1,m . (3) 构造检验统计量:构造检验统计量:ni 表示落入表示落入Ii 内的观测值的个数,内的观测值的个数, 记记 r , 1 Mathematical Statistics 2021-7-1336 一、卡方拟合检验法一、卡方拟合检验法 (4) 进行进行2检验:取右侧拒绝域检验:取右侧拒绝域W. 1、分组的原则、分组的原则: npi5 )()(:
34、210 yFxFH 2、样本容量、样本容量n50 Mathematical Statistics 2021-7-1337 一、卡方拟合检验法一、卡方拟合检验法 【例例5】 某电话交换台,在某电话交换台,在100分钟内记录了每分钟被呼叫次数分钟内记录了每分钟被呼叫次数xi , 整理后结果如下整理后结果如下 (ni 是出现是出现xi 值的次数值的次数) 问:是否可以认为问:是否可以认为X 服从服从 Poisson 分布?分布? Mathematical Statistics 2021-7-1338 解: 先求poisson分布的未知参数的极大似然估计值 59. 12) 118 (13. 9 2 9
35、5. 0 2 一、卡方拟合检验法一、卡方拟合检验法 计算理论频率pi和理论频数npi,具体数据见下表 由于第1,2列和第9,10列ni不足5,所以合并,见下表 Mathematical Statistics 2021-7-1339 9.130.290.740.027.090.800.080.100.02 110.7.006.0013.0030.0017.0018.0012.007.00ni 110.8.578.5113.5718.5421.1119.2313.147.35npi 1.000.080.080.120.170.190.170.120.07pi 求和776543201xi i ii
36、np npn 2 )( 一、卡方拟合检验法一、卡方拟合检验法 由于)1( 2 m 所以,可以认为X 服从 Poisson 分布 Mathematical Statistics 2021-7-1340 附:matlab程序 一、卡方拟合检验法一、卡方拟合检验法 clear,clc x=0 1 2 3 4 5 6 7 8 9 0 7 12 18 17 30 13 6 3 4; xi=x(1,:); ni=x(2,:); n=sum(x(2,:); lamda=sum(xi.*ni)/n; pi1=poisspdf(0:8,lamda); pi1(10)=1-sum(pi1); pi=1-sum(p
37、i1(3:10),pi1(3:8),pi1(9)+pi1(10); npi=n*pi; ni=ni(1)+ni(2),ni(3:8),ni(9)+ni(10); chii=(ni-npi).2./npi; chi2=sum(ni-npi).2./npi) xi=xi(1)+xi(2),xi(3:8),xi(9)+xi(10); table=xi;pi;npi;ni;chii; table=table,sum(table,2); chi2ci=chi2inv(0.95,length(ni)-2) if chi2chi2ci h=拒绝原假设 end Mathematical Statistics
38、2021-7-1341 一、卡方拟合检验法一、卡方拟合检验法 3、连续型分布的拟合检验、连续型分布的拟合检验 基本思想:基本思想:为了检验随机变量为了检验随机变量X是否服从连续型分布是否服从连续型分布F0(x),可将,可将X 的取值范围分割为若干个区间,并在每个区间上算出相应的理论概的取值范围分割为若干个区间,并在每个区间上算出相应的理论概 率率pi。通过这样的处理,就把连续型问题转化为离散型问题了。通过这样的处理,就把连续型问题转化为离散型问题了。 具体步骤:具体步骤: 1)分组:)分组: 将将F0(x)的自变量划分成的自变量划分成k(5k16)组)组 (b0, b1, (b1, b2, ,
39、(bm-1, bm. 2)求各组上的理论概率)求各组上的理论概率pi0及理论频数及理论频数npi0: pi=Pbi-1Xbi=F0(bi)-F0(bi-1) 3)计算统计量:)计算统计量: m i i ii np npn 1 2 2 0 0 Mathematical Statistics 2021-7-1342 4)判断:若)判断:若 ,则拒绝,则拒绝H0:F(x)=F0(x).)1( 2 1 2 rmW 注:若注:若F0(x)中有中有r个待估个待估 参数,则首先估计参数。参数,则首先估计参数。 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7
40、-1343 【例例6】 测量了测量了100 根人造纤维的长度(毫米),所得的数据如下表:根人造纤维的长度(毫米),所得的数据如下表: 问:能认为人造纤维的长度服从正态分布吗?问:能认为人造纤维的长度服从正态分布吗? 一、卡方拟合检验法一、卡方拟合检验法 解:将组中值作为样本值,估计正态总体中的未知参数和 39. 4 x Mathematical Statistics 2021-7-1344 0.110.100.150.180.170.140.090.07 pi 10.8010.3615.0417.8117.2113.568.876.51 npi 0.000.010.060.820.000.87
41、0.840.95 i ii np npn2)( 由于)1( 2 rm 所以,可以认为X 服从正态分布 一、卡方拟合检验法一、卡方拟合检验法 Mathematical Statistics 2021-7-1345 一、卡方拟合检验法一、卡方拟合检验法 Matlab 程序为: clear,clc xxi=5.75:0.5:11; ni=2 7 6 17 17 14 16 10 7 3 1; miu=sum(ni.*xxi)/sum(ni); sigma=(sum(xxi-miu).2).*ni)/sum(ni)(1/2); x=5.5:0.5:9.5; pi=diff(normcdf(x,miu,
42、sigma); pi(1)=pi(1)+pi(2); pi(2)=; pi(length(pi)+1)=1-sum(pi); ni=9 6 17 17 1416 10 11; n=sum(ni); npi=n*pi; chii=(ni-npi).2./npi; chi2=sum(chii) chi2ci=chi2inv(0.95,length(ni)-2-1) if chi2chi2ci h=拒绝原假设 end Mathematical Statistics 2021-7-1346 Matlab实现:(matlab1010版) 405. 1 一、卡方拟合检验法一、卡方拟合检验法 CHI2GOF
43、 Chi-square goodness-of-fit test. CHI2GOF performs a chi-square goodness-of-fit test for discrete or continuous distributions. The test is performed by grouping the data into bins, calculating the observed and expected counts for those bins, and computing the chi-square test statistic SUM(O-E).2./E)
44、, where O is the observed counts and E is the expected counts. This test statistic has an approximate chi-square distribution when the counts are sufficiently large. H,P,STATS = CHI2GOF(X,NAME1,VALUE1,NAME2,VALUE2,.) also returns a STATS structure with the following fields: chi2stat Chi-square stati
45、stic df Degrees of freedom edges Vector of bin edges after pooling O Observed count in each bin E Expected count in each bin Mathematical Statistics 2021-7-1347 一、卡方拟合检验法一、卡方拟合检验法 点评:点评: 1、适用范围广,总体连续和离散均可; 2、样本容量不应少于50; 3、统计量的值太依赖于区间的划分,检验的实际上是落 在区间上的概率是否相等,而不是总体是否相等。 Mathematical Statistics 2021-7-
46、1348 柯尔莫可洛夫 (Andrey Nikolaevich Kolmogorov, 1903.4.25-1987.10.20) 是苏联最伟大的数学家之一,也是20世 纪最伟大的数学家之一,在实分析,泛 函分析,概率论,动力系统等很多领域 都有着开创性的贡献,而且培养出了一 大批优秀的数学家。 二十年代的莫斯科大学,一个学生 被要求在十四个不同的数学分支参加十 四门考试;但是考试可以用相应领域的 一项独立研究代替。所以,Kolmogorov 从来没有参加一门考试,他写了十四个 不同方向的有新意的文章。Kolmogorov 后来说,竟然有一篇文章是错的,不过 那时考试已经通过了。 Andrey
47、Nikolaevich Kolmogorov 二、二、K-S检验法检验法 Mathematical Statistics 2021-7-1349 二、二、K-S检验法检验法 检验未知的连续总体X的分布函数F(x)是否是F0(x)? 当样本容量n很大时,经验分布Fn(x)是总体分布函数F(x)的很 好近似, 二者的偏差不应太大。 047.0 ,358.1 统计量:统计量: 目的目的: 原理:原理: 定理:定理: 设总体的分布函数F(x)连续,(X1,X2, ,Xn)为总体X的一个样本,则 当H0:F(x)=F0(x)为真时,有 xFxFD n x n0 max Mathematical Stat
48、istics 2021-7-1350 二、二、K-S检验法检验法 1、Kolmogorov检验法步骤检验法步骤 1)原假设)原假设: H0: F(x)=F0(x) 2)检验统计量:)检验统计量: 10.1/)( 09.8/)( 11 1 11 1 2 11 1 11 1 i i i ii i i i ii nxnS nxnx 3)对于给定的检验水平)对于给定的检验水平和样本容量和样本容量n,查查Kolmogorov分布的分位数分布的分位数 表,得临界值表,得临界值Dn,1-,使得,使得 P Dn Dn,1- =1- 4)判断:若)判断:若Dn Dn,1-,则接受原假设;否则拒绝原假设,则接受原
49、假设;否则拒绝原假设. 求出经验分布函数Fn(x)和统计量Dn 其中规定:Fn(x(n+1)=1 Mathematical Statistics 2021-7-1351 (1) 当数据量较大时,可通过分组计算降低计算量,但分组当数据量较大时,可通过分组计算降低计算量,但分组 要细,以减少误差。要细,以减少误差。 (2)原假设的分布的参数值原则上应是已知的原假设的分布的参数值原则上应是已知的. 当用于正态性检当用于正态性检 验时只能做验时只能做标准正态检验标准正态检验,即,即H0:总体服从标准正态分布,:总体服从标准正态分布, 但在参数为未知时但在参数为未知时,近年来有人对某些总体分布如正态分布
50、和近年来有人对某些总体分布如正态分布和 指数分布用下列两种方法估计指数分布用下列两种方法估计.(1)可用另一个大容量子样来估可用另一个大容量子样来估 计未知参数计未知参数,(2)如果原来子样容量很大如果原来子样容量很大,也可用来估计未知参数也可用来估计未知参数 .不过此不过此-检验是近似的检验是近似的.在检验时以取较大的显著性水平为宜在检验时以取较大的显著性水平为宜, 一般取一般取=0.10-0.12. 二、二、K-S检验法检验法 (3)总体分布必须为总体分布必须为连续型连续型的分布。的分布。 Mathematical Statistics 2021-7-1352 二、二、K-S检验法检验法
51、【例例7】 自动车床加工中轴,从成品中抽出自动车床加工中轴,从成品中抽出11根,测量它们根,测量它们 的直径(毫米)数据如下:的直径(毫米)数据如下: 10.52, 10.41, 10.32, 10.18, 10.64, 10.77, 10.82, 10.67, 10.59, 10.38, 10.49, 问这批零件的直径是否服从正态分布问这批零件的直径是否服从正态分布N(10.53,0.22),=0.1。 解:(1)对样本进行重新排序; (2)求出经验分布Fn(xi); (3)利用 求出理论分布值; 22 4 4 2 )( )( )( )( XEXE XEXE XD XEX E (4)分别计算
52、 )1( 2 1 2 2 rm np npn m i i ii (5) 由于最大值为0.1769yi时,取“+”号;当xi S0.05(9) 故接受H0 即认为播放音乐对生产率没有显著影响 二、二、符号检验法符号检验法 Mathematical Statistics 2021-7-1372 二、符号检验法二、符号检验法 matlab实现 函数:signtest 格式:p,h,stats=signtest(x,y,alpha) P = SIGNTEST(X,Y,ALPHA) returns the significance a test of the null hypothesis that t
53、he median difference between two matched samples, X and Y, is zero. X and Y must be vectors of equal length. Y may also be a scalar. In this case, SIGNTEST computes the probability that the median of X is different from the constant, Y. ALPHA is the desired level of significance. It must be a scalar
54、 between zero and one, and its default value is 0.05. P is the probability of observing a result equally or more extreme than the one using the data (X and Y) if the null hypothesis is true. If P is near zero, this casts doubt on this hypothesis. P,H,STATS = SIGNTEST(X,Y,ALPHA) also returns STATS, a
55、 tructure with one or two fields. The field signedrank contains the value of the signed rank statistic. If the sample size is large, then P is calculated using a normal approximation and the field zval contains the value of the normal (Z) statistic. Mathematical Statistics 2021-7-1373 二、符号检验法二、符号检验法
56、 例9的Matlab实现: 输入: x=90 80 92 84 88 87 82 85 70 79; y=99 85 97 83 81 94 72 85 8289; p,h,stats = signtest(x,y,0.05) 输出: p = 0.51 h = 0 stats = sign: 3.00 Mathematical Statistics 2021-7-1374 Have a Rest m i i ii np npn 1 2 2 m i i ii np npn 1 2 2 Mathematical Statistics 2021-7-1375 4.4 4.4 两个总体独立性检验两个总
57、体独立性检验 在研究随机量的概率性质时,我们常假设两个随机 变量独立;在对两个正态总体的参数作有关假设检验时, 我们也常假定它们独立. 这种假设是否合理呢? 独立性有时从直观上容易判断,但有时很难从直观上 判断.如地下水位的变化是否与地震的发生独立,某种疾 病是否与性别有关等,需要根据实际观测结果来检验独 立性是否成立。 Mathematical Statistics 2021-7-1376 4.4 两个总体独立性检验两个总体独立性检验 ), ( jiij BY AX Pp 设有两个总体X,Y,给定显著水平 检验非参数假设 H0:X,Y相互独立 将X的所有可能取值分为r个不同组 将Y的所有可能取值分为s个不同组 A1,A2,Ar B1,B2,Bs 对(X,Y)进行n次独立观测 s j iiji AXPpp 1 )(分别记录事件( )出现的频数 sr jiijij pp nnpM 将所得结果列成 格联列
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论