




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分布检验和拟合优度检验 第八章第八章 分布检验和拟合优度分布检验和拟合优度2检验检验 分布检验和拟合优度分布检验和拟合优度检验检验 第八章 分布检验和拟合优度2检验 Kolmogorov-Smirnov 单样本检验及一些正态性检验单样本检验及一些正态性检验 1 2 3 5 Kolmogorov-Smirnov 两样本分布检验两样本分布检验 Pearson 2 拟合优度检验拟合优度检验 分布检验和拟合优度分布检验和拟合优度检验检验 第一节第一节 KS单样本分布检验单样本分布检验 v一、适用范围一、适用范围 vKolmogorov-Smirnov检验常译为柯尔莫哥洛夫检验常译为柯尔莫哥洛夫-斯斯
2、米尔诺夫检验,简写为米尔诺夫检验,简写为K-S检验,亦称检验,亦称D检验法,也检验法,也 是一种拟合优度检验法。是一种拟合优度检验法。K-S单样本检验主要用来检单样本检验主要用来检 验一组样本数据的实际分布是否与某一指定的理论验一组样本数据的实际分布是否与某一指定的理论 分布相符合。分布相符合。 v二、基本原理和方法二、基本原理和方法 v1、基本原理:、基本原理: v这种检验主要是将理论分布下的累计频数分布与观这种检验主要是将理论分布下的累计频数分布与观 察到的累计频数分布相比较,找出它们间最大的差察到的累计频数分布相比较,找出它们间最大的差 异点,并参照抽样分布,定出这样大的差异是否处异点,
3、并参照抽样分布,定出这样大的差异是否处 于偶然。于偶然。 分布检验和拟合优度分布检验和拟合优度检验检验 2、方法、方法 v用用 Fn(x)表示样本量为表示样本量为n的随机样本观察值的的随机样本观察值的 累计分布函数,且累计分布函数,且Fn(x) =i/n(i是等于或小于是等于或小于x 的所有观察结果的数目,的所有观察结果的数目,i=1,2,n)。)。 F(x)表示理论分布的累计概率分布函数。表示理论分布的累计概率分布函数。K-S 单样本检验通过样本的累计分布函数单样本检验通过样本的累计分布函数Fn(x)和理和理 论分布函数论分布函数F(x)的比较来做拟合优度检验。检的比较来做拟合优度检验。检
4、验统计量是验统计量是F(x)与与Fn(x)间的最大偏差间的最大偏差Dn: v若对每一个若对每一个x值来说,值来说,Fn(x)与与F(x)都十分接近,则表都十分接近,则表 明实际样本的分布函数与理论分布函数的拟合程度很明实际样本的分布函数与理论分布函数的拟合程度很 高。高。 )()(maxDxFxF nn 分布检验和拟合优度分布检验和拟合优度检验检验 三、检验步骤三、检验步骤 v1.建立假设组:建立假设组: vH0:Fn(x)=F(x) vH1:Fn(x)F(x) v2.计算样本累计频率与理论分布累计概率的计算样本累计频率与理论分布累计概率的 绝对差,令最大的绝对差为绝对差,令最大的绝对差为Dn
5、; v3.用样本容量用样本容量n和显著水平和显著水平a在附表在附表11中查出中查出 临界值临界值Dna; v4.通过通过Dn与与Dna的比较做出判断,若的比较做出判断,若DnDna, 则认为拟合是满意的。则认为拟合是满意的。 )()(maxDxFxF nn 分布检验和拟合优度分布检验和拟合优度检验检验 四、实例四、实例 v例例8.1:正态拟合。:正态拟合。 v某织布厂工人执行的生产定额(织机每小时生产织某织布厂工人执行的生产定额(织机每小时生产织 物的米物)情况如表物的米物)情况如表8-1,试检验这些样本数据能,试检验这些样本数据能 否作正态拟合?否作正态拟合? v表表8-1 工人执行生产定额
6、情况分组表工人执行生产定额情况分组表 按定额执行情况分组工人数 3.753.754.252020 4.254.254.75372372 4.754.755.25498498 5.255.255.75103103 5.755.756.257 7 10001000 分布检验和拟合优度分布检验和拟合优度检验检验 例例8.1 正态拟合正态拟合 v解:首先,由于做正态拟合的均值、标准差解:首先,由于做正态拟合的均值、标准差 未知,因此,先计算样本均值和标准差,再未知,因此,先计算样本均值和标准差,再 做正态拟合。通过对样本资料的计算得:做正态拟合。通过对样本资料的计算得: =4.85;s=0.352,分
7、别作为分别作为和和的估计值,的估计值, 建立假设:建立假设: vH0:样本数据服从均值为:样本数据服从均值为4.85,标准差为,标准差为 0.352的正态分布的正态分布 vH1:样本数据不服从均值为:样本数据不服从均值为4.85,标准差为,标准差为 0.352的正态分布的正态分布 v计算资料列如表计算资料列如表8-2: x 分布检验和拟合优度分布检验和拟合优度检验检验 表表8-2 v表表8-2 正态拟合计算表正态拟合计算表 X的组限 标 准 化 标准正 态概率 累计概 率 ( 理 论概率) 累计 工人 数 实 际 累 计 频 率 (2)-(4) 的绝 对 值 甲甲乙乙(1)(2)(3)(4)(
8、5) 不足不足4.25-1.70 0.0450.0450.0450.04520200.0200.0200.0250.025 4.25-4.75-1.70-0.28 0.3450.3900.3903923920.3920.3920.0020.002 4.75-5.25-0.281.14 0.4830.4830.8730.8738908900.8900.8900.0170.017 5.25-5.751.142.56 0.1220.1220.9950.9959939930.9930.9930.0020.002 5.75-6.252.56-+ 0.0050.0051.0001.000100010001
9、.0001.0000.0000.000 合合 计计1.0001.000 - 分布检验和拟合优度分布检验和拟合优度检验检验 例例8.1 v根据表根据表8-2中第中第(5)列数据,取最大绝对差数列数据,取最大绝对差数 1ooo =0.025作为检验统计量。若取作为检验统计量。若取a=0.05, n=1000,从临界值表中查得:,从临界值表中查得: v 。 v因为因为1ooo0.043,故认为样本数据所提供的信息,故认为样本数据所提供的信息 无法拒绝无法拒绝H0,即接受,即接受H0,认为可做正态分布的拟合。,认为可做正态分布的拟合。 v检验法是一种精确分布的方法,不受观察次检验法是一种精确分布的方法
10、,不受观察次 数多少的限制。这个方法可应用于分组或不分组的数多少的限制。这个方法可应用于分组或不分组的 情形。检验量情形。检验量Dn也可用于检验随机样本是否抽自某也可用于检验随机样本是否抽自某 特定的总体的问题。特定的总体的问题。 (1000,0.05) 1.36 D0.043 1000 分布检验和拟合优度分布检验和拟合优度检验检验 第二节第二节 K-S双样本分布检验双样本分布检验 v一、适用范围一、适用范围 vK-S双样本检验主要用来检验两个独立样本是否来自双样本检验主要用来检验两个独立样本是否来自 同一总体(或两样本的总体分布是否相同)。其单同一总体(或两样本的总体分布是否相同)。其单 尾
11、检验主要用来检验某一样本的总体值是否随机地尾检验主要用来检验某一样本的总体值是否随机地 大于(或小于)另一样本的总体值。大于(或小于)另一样本的总体值。 v二、理论依据和方法二、理论依据和方法 v1、理论依据:、理论依据: v与与K-S单样本检验相似,单样本检验相似,K-S双样本检验是通过两个双样本检验是通过两个 样本的累计频数分布是否相当接近来判断样本的累计频数分布是否相当接近来判断Ho是否为是否为 真。如果两个样本间的累计概率分布的离差很大,真。如果两个样本间的累计概率分布的离差很大, 这就意味着两样本来自不这就意味着两样本来自不同的总体,就应拒绝同的总体,就应拒绝Ho。 分布检验和拟合优
12、度分布检验和拟合优度检验检验 2、方法、方法 v如果令如果令S1(x)表示第一个样本观察值)表示第一个样本观察值 的累计概率分布函数,的累计概率分布函数,S2(x)表示另)表示另 一个样本观察值的累计概率分布函数,一个样本观察值的累计概率分布函数, 那么那么K-S双样本的单尾检验统计量为:双样本的单尾检验统计量为: vK-S双样本的双尾检验统计量为:双样本的双尾检验统计量为: )()(maxD 21 xSxS )()(max 21 xSxSD 分布检验和拟合优度分布检验和拟合优度检验检验 三、检验步骤三、检验步骤 v1、双尾检验假设:、双尾检验假设:H0:S1(x)=S2(x) v H1:S1
13、(x)S2(x) v 单尾检验假设:单尾检验假设: vH0:S1(x)=S2(x)或或H0:S1(x)=S2(x) vH1:S1(x)S2(x) H1:S1(x)S2(x) v 2、把两组样本分别排成累计频数分布(对两、把两组样本分别排成累计频数分布(对两 个分布用相同的间隔或分类,并利用尽可能多个分布用相同的间隔或分类,并利用尽可能多 的间隔。的间隔。 v3、计算检验统计量、计算检验统计量D值,如是单尾检验,应值,如是单尾检验,应 按按H1的方向计算的方向计算D值。值。 分布检验和拟合优度分布检验和拟合优度检验检验 三、检验步骤三、检验步骤 v4、显著性检验:、显著性检验: v小样本情况下,
14、及小样本情况下,及n1= n2=n,n30,用附,用附 表表12。对于单尾检验和双尾检验,该表列出。对于单尾检验和双尾检验,该表列出 了不同显著性水平下的临界值。了不同显著性水平下的临界值。 v大样本情况下,大样本情况下,n1不一定等于不一定等于n2,但都小,但都小 于于40的双尾检验,可用附表的双尾检验,可用附表12续表中的公式续表中的公式 算出算出D的临界值。的临界值。 v当当 n1和和n2都较大,但又是单尾检验时,用都较大,但又是单尾检验时,用 算式算式 222 12 n(2) 12 4 n n D nn 分布检验和拟合优度分布检验和拟合优度检验检验 四、实例四、实例 v例例8.2(小样
15、本)检验两矿的金属含量率是否(小样本)检验两矿的金属含量率是否 相同。在甲、乙两矿坑中各抽取相同。在甲、乙两矿坑中各抽取10个矿石样个矿石样 本,矿石中含有某种金属含量率(本,矿石中含有某种金属含量率(%)的资料)的资料 如表如表8-3所示:所示: v表表7-3 v解:这是一个双样本的解:这是一个双样本的K-S检验,根据题意,检验,根据题意, 建立双侧检验假设组:建立双侧检验假设组: v )()(H )()(H 1 0 xFxF xFxF 乙甲 乙甲 : : 甲 矿 3.1 1.2 2.9 3.0 0.6 2.8 1.6 1.7 3.2 1.7 乙乙 矿矿 3.8 2.1 3.2 7.2 2.
16、3 3.5 3.0 4.6 3.1 3.2 分布检验和拟合优度分布检验和拟合优度检验检验 四、实例四、实例 v1、列等距分组表,计算各组次数、列等距分组表,计算各组次数f甲 甲、 、f乙 乙 ,累计次 ,累计次 数数F甲 甲、 、F乙 乙,累计频率 ,累计频率 、 及其差额。计算及其差额。计算 结果列如表结果列如表8-4所示。所示。 v表表7-4 例例7.2的计算表的计算表 v 乙 乙 n F 甲 甲 n F 金属含 量率 (%) 次数累计次数累计频率F甲 /10- F 乙/10 f甲 甲 f乙 乙 F甲 甲 F乙 乙 F甲 甲/10 F乙 乙/10 0.00.910101/1001/10 1
17、.01.940505/1005/10 2.02.922727/102/105/10 3.03.93610810/108/102/10 4.04.90110910/109/101/10 5.05.90010910/109/101/10 6.06.90010910/109/101/10 7.07.901101010/1010/100 分布检验和拟合优度分布检验和拟合优度检验检验 四、实例四、实例 v2、确定检验统计量:、确定检验统计量: v本例本例 D=5/10 v3、检验与判断。由于、检验与判断。由于n1=n2=10,属小样本,查附表,属小样本,查附表 12得临界值得临界值0.05=7/10,因
18、为,因为D=5/10C,故在,故在5%的显著性水平下拒绝的显著性水平下拒绝Ho,即,即 高分组的学生智力显著高于低分组的学生。高分组的学生智力显著高于低分组的学生。 986.15 4454 4454 )406. 0(4D4 2 21 21 22 nn nn 分布检验和拟合优度分布检验和拟合优度检验检验 第三节 卡方卡方(2)拟合优度检验拟合优度检验 v一、什么是卡方(2)拟合优度检验 v人们通常关心随机变量的概率分布,如:人们通常关心随机变量的概率分布,如:“随机变随机变 量服从参数为量服从参数为n=10和和p=2的二项分布的二项分布”,这样的命,这样的命 题假设可以用题假设可以用“拟合优度检
19、验拟合优度检验”来检验。即设计一来检验。即设计一 个检验来比较从假设的分布中抽取的样本,看所假个检验来比较从假设的分布中抽取的样本,看所假 设的分布函数与样本数据是否设的分布函数与样本数据是否“拟合拟合”。 v所以,拟合检验就是检验抽取样本的总体分布与某所以,拟合检验就是检验抽取样本的总体分布与某 种特定分布的符合程度,也就是检验观察值与理论种特定分布的符合程度,也就是检验观察值与理论 数之间的紧密程度。以数之间的紧密程度。以2分布为依据的这种检验,分布为依据的这种检验, 称为称为2拟合优度检验拟合优度检验 分布检验和拟合优度分布检验和拟合优度检验检验 v英国统计学家英国统计学家Pearson
20、(皮尔逊皮尔逊)于于1900年首先年首先 提出了卡方统计量。提出了卡方统计量。 v1 1、数据:由随机变量、数据:由随机变量X X的的N N个观测组成。这个观测组成。这N N个个 观测可划分为观测可划分为k k类,即类,即把把X的样本空间的样本空间S划分成划分成k 个互不相交的部分个互不相交的部分S1,S2,Sk,且,且Si与与Sj 相互独立。即相互独立。即 vSiSj=,(ij), v记记Oi为类为类i中的观测数,中的观测数,i=1,2,k.则则 k 1i ssi k i N 1i O 第三节 卡方卡方(2)拟合优度检验拟合优度检验 分布检验和拟合优度分布检验和拟合优度检验检验 v2 2、假
21、设条件、假设条件 1.1.样本是随机的样本是随机的 2. 2.度量尺度至少是名义的度量尺度至少是名义的 3 3、检验统计量、检验统计量 在零假设为真的条件下,令在零假设为真的条件下,令X X的一个随机观测的一个随机观测 落入类落入类i i的概率为的概率为p pi 。定义。定义E Ei为为H H0为真时观测值落为真时观测值落 入类入类i i的期望观测数,即的期望观测数,即E Ei= =piN, i=1,2,k.给出给出 如下卡方检验统计量:如下卡方检验统计量: N )( 1i 2 2 n 1i 2 2 n k i i k i ii E O E EO ,该式也等价于 第三节 卡方卡方(2)拟合优度
22、检验拟合优度检验 分布检验和拟合优度分布检验和拟合优度检验检验 4 4、零分布:由于、零分布:由于 的精确分布难以求得,所的精确分布难以求得,所 以我们用自由度为以我们用自由度为k-1的卡方的卡方 分布来近似。分布来近似。 5、假设组:、假设组: H0: : pi =p ( (i=1,2,k.) H1: : pi p (对某个 (对某个i.) 若若 (自由度为自由度为k-1的卡方分布的的卡方分布的 1-a分位数),则拒绝分位数),则拒绝H 0, ,p-值近似等于值近似等于 p(X2(c-1)Q),这个概率可由附表,这个概率可由附表10获得。获得。 2 1)-k ( 2 1 2 n 2 n 第三
23、节 卡方卡方(2)拟合优度检验拟合优度检验 分布检验和拟合优度分布检验和拟合优度检验检验 三、2检验的具体步骤 v1 1. .数据分组数据分组. .根据样本观测值的范围划分为根据样本观测值的范围划分为 组;组; v2.2.求落在各组的频数求落在各组的频数i和频率和频率Yi/ n 。 v3.3.求理论概率求理论概率i。当。当0成立时成立时,出现在出现在(bi- 1,bi )内的概率 内的概率i v4.计算检验统计量计算检验统计量2。 v5. .求出拒绝域求出拒绝域.根据给定的显著性水平根据给定的显著性水平和自和自 由度由度k-r-1查查2分布表(附表分布表(附表10),可得临界),可得临界 值值
24、C,统计量,统计量2的拒绝域为的拒绝域为2C。 v6. .作出判断作出判断.若若2C则拒绝则拒绝0,否则接受,否则接受 0。 分布检验和拟合优度分布检验和拟合优度检验检验 实例实例 单样本拟合检验单样本拟合检验 v一、检验某固定比率的假设一、检验某固定比率的假设 v例例8.4:据标准规定,某批:据标准规定,某批工业产品中不良品的比例工业产品中不良品的比例 为为10%,则可检验如下假设:,则可检验如下假设:0:P=0.1; v 1:P0.1。 v为此,我们在产品批中抽出为此,我们在产品批中抽出100个作为样本,发现不个作为样本,发现不 合格品数(合格品数(Y1)为)为16,则合格品数,则合格品数
25、Y2=100-16=84。 v当当0成立时,不合格品的期望数应为成立时,不合格品的期望数应为nP1=10个,相个,相 应地,合格品的期望数应地,合格品的期望数n(1-P1)=90。则:。则: vk=,自由度为,自由度为k-1=1,显著水平,显著水平a0.05,查表,查表10得得 临界值为临界值为3.841。由于。由于n2a2,所以,所以拒绝拒绝o假设。假设。 4 90 )9086( 10 )1016()( 22 1 2 2 n k i i ii np npy 分布检验和拟合优度分布检验和拟合优度检验检验 二、检验某固定比率的假设二、检验某固定比率的假设 v例例8.5:检验随机变量在检验随机变量
26、在(,) 区间是否为均匀分区间是否为均匀分 布。假设如下:布。假设如下: v0:在(:在(0,1)区间为均匀分布(假设分)区间为均匀分布(假设分10类,类, pi=1/10);); v1:在(:在(0,1)区间不是均匀分布)区间不是均匀分布(pip1/10); v从未知总体中抽取从未知总体中抽取50个样本。为了检验,我们可以个样本。为了检验,我们可以 将(将(0,1)区间分为)区间分为10等份,即等份,即00.1,0.1 0.2,0.91.0。如果。如果o为真,那么任何观察值为真,那么任何观察值 落入类落入类i的概率为的概率为1/10,任何小区间的期望观测数为,任何小区间的期望观测数为 (1/
27、10)50=5。 实例实例 单样本拟合检验单样本拟合检验 分布检验和拟合优度分布检验和拟合优度检验检验 例例8.5 v实际实际50个样本落入类个样本落入类i的观察如下:的观察如下: v区间区间 0- -0.1 0.1- -0.2 0.2-0.3 0.3- -0.4 0.4- -0.5 0.5-0.6 v观测数观测数 6 4 5 6 7 4 v区间区间 0.6- -0.7 0.7-0.8 0.8-0.9 0.9- -1.0 v观测数观测数 6 5 3 4 v检验统计量检验统计量 v查查2分布表,自由度为,显著水平分布表,自由度为,显著水平a=0.05时,时, 查得查得a2=16.92,因,因2=
28、2.80a2 ,所以接受,所以接受 o假设,即观察值取自均匀分布。假设,即观察值取自均匀分布。 8 . 2 5 54 5 ) 56()( 22 10 1 2 2 )( i i ii n np npy 分布检验和拟合优度分布检验和拟合优度检验检验 三、检验多面体无偏性的假设、检验多面体无偏性的假设 v例例8.6:以六面体的骰子为例。如果将一颗骰子抛:以六面体的骰子为例。如果将一颗骰子抛 掷掷120次,其结果如表次,其结果如表8-4-4所示:所示: v表表8-48-4 v根据题意,检验假设如下:根据题意,检验假设如下: vo:这颗骰子是无偏的:这颗骰子是无偏的(pi=1/6); v1:这颗骰子是有
29、偏的:这颗骰子是有偏的(pi1/6); v如果零假设为真,各点出现的期望次数如果零假设为真,各点出现的期望次数 v nP1=1/6120=20 点数123456合计 观测次数观测次数132816103221120 实例实例 单样本拟合检验单样本拟合检验 分布检验和拟合优度分布检验和拟合优度检验检验 三、检验多面体无偏性的假设三、检验多面体无偏性的假设 v例例8.6: v检验统计量为:检验统计量为: v查查2分布表,自由度分布表,自由度k-1=6-1=5,取,取a=0.05,查得,查得 a2=11.07因因20.052,故应拒绝,故应拒绝o假设,认为假设,认为 这颗骰子是有偏的。这颗骰子是有偏的
30、。 7 .18 20 )2021( 20 )2013()( 22 6 1 2 2 n i i ii np npy 分布检验和拟合优度分布检验和拟合优度检验检验 实例实例 总体分布拟合检验总体分布拟合检验 v一、正态分布拟合一、正态分布拟合 v例例8.7:一家钟表厂把检验钟表的精确度作为质量控:一家钟表厂把检验钟表的精确度作为质量控 制的一部分。该厂将制的一部分。该厂将700只手表效准后使之走只手表效准后使之走24小时,小时, 然后记下每只表走快或走慢的秒数然后记下每只表走快或走慢的秒数( (数据见表数据见表5- -3)。 这些数据是否提供了充分的证据,说明观察值并非这些数据是否提供了充分的证据
31、,说明观察值并非 来自正态总体。来自正态总体。 v解:假设:解:假设:0:样本数据来自正态总体分布;样本数据来自正态总体分布; v1:样本数据并非来自正态总体分布。样本数据并非来自正态总体分布。 v表表8- -3中,中,K=11=11,实际观察频数,实际观察频数Oi已知,预期频数已知,预期频数Ei 则尚需确定。则尚需确定。 分布检验和拟合优度分布检验和拟合优度检验检验 表53 700只手表时间误差的频数分布 2424小时内走快或走慢的秒数小时内走快或走慢的秒数表的数目表的数目O Oi 0 09.999.993838 101019.9919.995151 202029.9929.996262 3
32、03039.9939.997474 404049.9949.998383 505059.9959.999191 606069.9969.998181 707079.9979.997272 808089.9989.996161 909099.9999.995252 100100109.99109.993535 合计合计700700 分布检验和拟合优度分布检验和拟合优度检验检验 一、正态分布拟合一、正态分布拟合 v1.1.预期频数预期频数Ei的计算的计算 v根据概率分布原理,我们可以通过求正态分布曲根据概率分布原理,我们可以通过求正态分布曲 线下的面积来确定理论预期频数。为了计算正态线下的面积来确
33、定理论预期频数。为了计算正态 分布曲线下的面积,利用公式分布曲线下的面积,利用公式Zo=(Xo-u)u)/将将Xo 标准化,求标准正态表上相应的面积(即频率)。标准化,求标准正态表上相应的面积(即频率)。 v因为零假设中并没指定总体分布的均值因为零假设中并没指定总体分布的均值(u)(u)和标和标 准差准差()()。所以只有将样本均值。所以只有将样本均值 =54.71和标准差和标准差 S=27.61分别作为分别作为u和和的估计值。的估计值。 v如在区间如在区间10-19.99内的预期频数,可按如下步内的预期频数,可按如下步 骤计算:骤计算: 分布检验和拟合优度分布检验和拟合优度检验检验 v1.
34、.预期频数预期频数Ei的计算的计算 v(1)(1)分别对分别对x=10和和x=20标准化:标准化:Z=(=(10- 54.71)/27.61=-1.62和和Z=(=(20-54.71) )/27.61=-1.26。 其余类推。其余类推。 v(2)(2)查标准正态分布表,介于查标准正态分布表,介于0和和-1.62之间的面积之间的面积 (概率)为(概率)为0.4474,介于,介于0和和-1.26之间的面积为之间的面积为 0.3962,所以介于,所以介于-1.62和和-1.26之间的面积等于之间的面积等于 0.4474-0.3962=0.0512。其余类推。其余类推。 v(3)(3)于是落在于是落在
35、10与与20之间的预期频数为之间的预期频数为 0.0512700=35.84。其余类推。其余类推。 一、正态分布拟合一、正态分布拟合 分布检验和拟合优度分布检验和拟合优度检验检验 v2.2.约束条件约束条件r r的确定的确定 v预期频数之和必等于预期频数之和必等于700,即等于样本容量,即等于样本容量, 这就构成一个约束;这就构成一个约束; v又由于我们必须通过样本来估计又由于我们必须通过样本来估计u和和,所以,所以 对数据还须增加两个约束。于是对数据还须增加两个约束。于是=3,自由度,自由度k- =11-3=8。 v注意:如果注意:如果u和和在零假设中已被指定,那就不在零假设中已被指定,那就
36、不 必再用样本数据来估计,这时必再用样本数据来估计,这时=1。 v检验统计量检验统计量X2= (Oi-i) )2/i=20.3558,2的临的临 界值为界值为15.507。由于。由于2的计算值大于临界值,所的计算值大于临界值,所 以否定零假设,样本数据并非来自正态分布。以否定零假设,样本数据并非来自正态分布。 一、正态分布拟合一、正态分布拟合 分布检验和拟合优度分布检验和拟合优度检验检验 小预期频数小预期频数 v在应用卡方检验时,有可能遇到预期频数很小的情在应用卡方检验时,有可能遇到预期频数很小的情 形,这时将随机分布取作卡方的近似分布并不完全形,这时将随机分布取作卡方的近似分布并不完全 正确
37、。正确。 v对于什么样的预期频数才算小预期频数,学者们的对于什么样的预期频数才算小预期频数,学者们的 意见并不一致。较保守的学者一般要求预期频数至意见并不一致。较保守的学者一般要求预期频数至 少应大于等于少应大于等于5。而科库兰。而科库兰ochran( (1952,1954) ) 主张预期频数小于主张预期频数小于1的就算小预期频数,很多学者同的就算小预期频数,很多学者同 意这种意见。本教材也采用了这一观点。意这种意见。本教材也采用了这一观点。 v对小预期频数的处理一般采用的科克兰的法则。如对小预期频数的处理一般采用的科克兰的法则。如 将相邻类目的频数合并(前提是不破坏其分类意将相邻类目的频数合
38、并(前提是不破坏其分类意 义),以达到所要求的最小频数。合并后的类数应义),以达到所要求的最小频数。合并后的类数应 相应地减小。相应地减小。 分布检验和拟合优度分布检验和拟合优度检验检验 二、二项分布拟合二、二项分布拟合 v例例8.88.8: 一个市场分析员想研究食品店的顾客对待一个市场分析员想研究食品店的顾客对待 信用卡付款方式的态度。研究员从信用卡付款方式的态度。研究员从100家超级市家超级市 场各抽选了场各抽选了25名经常性顾客作为随机样本,并对名经常性顾客作为随机样本,并对 其中每一个进行访问以确定此人是否喜欢除信用其中每一个进行访问以确定此人是否喜欢除信用 卡付款方式以外的别的某种付
39、款方式。调查结果卡付款方式以外的别的某种付款方式。调查结果 列于表列于表8-5: v解:这个分析员应先提出如下假设:解:这个分析员应先提出如下假设: v 0:在这些容量为:在这些容量为25的样本中,喜欢另外某的样本中,喜欢另外某 种付款方式的顾客数服从二项分布;种付款方式的顾客数服从二项分布; v 1:不服从二项分布。(取:不服从二项分布。(取a=0.05) 分布检验和拟合优度分布检验和拟合优度检验检验 表5-5 例5.5中的抽样结果 喜欢另外某一种付款方式的 顾客数 商店数 0 04 4 1 15 5 2 28 8 3 31010 4 41414 5 51515 6 61212 7 7161
40、6 8 81010 9 96 6 1010或更多或更多0 0 合计合计100100 二、二项分布拟合二、二项分布拟合 分布检验和拟合优度分布检验和拟合优度检验检验 v首先求得首先求得P的估计值如下:的估计值如下: P=4(0)+5(1)+8(2)+6(9)/2500=0.20。 v由于二项分布的参数由于二项分布的参数P没有指定,必须通过没有指定,必须通过 样本数据对它作出估计,因此要损失一个自样本数据对它作出估计,因此要损失一个自 由度。由度。 v1.1.预期频数预期频数i v通过计算函数通过计算函数f(x)=C25x(0.2)x(0.8)25-x(其中其中x 为某一特定商店中喜欢另外某种付款
41、方式的为某一特定商店中喜欢另外某种付款方式的 顾客数顾客数,x=0,1,2,25)或查的或查的二项分二项分 布表布表,可以得到所需的相对预期频数。,可以得到所需的相对预期频数。 二、二项分布拟合二、二项分布拟合 分布检验和拟合优度分布检验和拟合优度检验检验 v2.2.自由度的确定自由度的确定 v合并后的类目数合并后的类目数10,但由于预期频数之和,但由于预期频数之和 必须与观察频数之和一致,这个自由度应必须与观察频数之和一致,这个自由度应 减去,又由于必须通过样本数据来估减去,又由于必须通过样本数据来估 计,自由度再减。于是真正的自由度应计,自由度再减。于是真正的自由度应 为为10-2=8。 v检验统计量检验统计量=28.1=28.1 v显著性水平显著性水平a=0.05和自由度和自由度8相对应的相对应的2 的临界值为的临界值为15.507。因为。因为2的计算值大于的计算值大于 的临界值,所以否定零假设,从而得出这的临界值,所以否定零假设,从而得出这 些数据并非来自二项分布总体的结论(些数据并非来自二项分布总体的结论(P 0.05)。)。 二、二项分布拟合二、二项分布拟合 分布检验和拟合优度分布检验和拟合优度检验检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年虚拟现实设计师考试试题及答案
- 2025年心理健康教育与咨询专业知识考试试题及答案
- 2025年刑法学考试试题及答案分析
- 2025年物理学专业研究生入学考试题及答案
- 2025年数据分析师考试模拟题及答案
- 2025年社区服务管理师考试试卷及答案
- 2025年软件工程专业考试题及答案
- 2025年会计电算化考试真题及答案
- 2025年健康管理与健康教育课程考试试题及答案
- 2025年古典文学专业研究生入学考试试卷及答案
- 2024全国职业院校技能大赛ZZ051电子产品设计与应用赛项规程+赛题
- 浅析工程中混凝土裂缝原因与预防
- 井下支护安全操作规程
- 《爆破基础知识》课件
- 四川省成都市锦江区2024届生物七年级第二学期期末综合测试试题含解析
- 化学品安全员工职业安全卫生培训课件
- 2024年1月浙江首考高考选考历史试卷试题真题(含答案)
- 人教版中考英语听力-听后回答+课件
- 新生儿肺动脉高压的护理查房课件
- 医院培训课件:《产科危急重症的早期识别》
- 声学设计施工方案
评论
0/150
提交评论