应用统计学-第10章:卡方检验和非参数检验ppt课件_第1页
应用统计学-第10章:卡方检验和非参数检验ppt课件_第2页
应用统计学-第10章:卡方检验和非参数检验ppt课件_第3页
应用统计学-第10章:卡方检验和非参数检验ppt课件_第4页
应用统计学-第10章:卡方检验和非参数检验ppt课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第10章章 卡方检验和非参数检验卡方检验和非参数检验本章教学内容:本章教学内容:总体分布的卡方检验;总体分布的卡方检验;两个比例差别的卡方检验独立样本;两个比例差别的卡方检验独立样本;两个以上比例差别的卡方检验独立样本;两个以上比例差别的卡方检验独立样本;独立性的卡方检验;独立性的卡方检验;两个比例差别的两个比例差别的McNEMAR检验相关样本;检验相关样本;两个独立总体的非参数检验两个独立总体的非参数检验Wilcoxon秩和检验;秩和检验;单要素方差分析的非参数检验单要素方差分析的非参数检验Kruskal-Wallis秩检秩检验验 在总体分布方式知条件下未知参数检验问题。但实践问题中总体的

2、分布方式往往是未知的,虽然根据中心极限定理可以有相当的把握以为大多数经济变量服从或近似服从正态分布,但有时为了使所做的统计推断更具压服力,就需求对总体的分布方式进展检验。 非参数检验概述非参数检验概述检验的根本原理:检验的根本原理:(1) 设设x1, x2, , xn为总体为总体X的一组样本察看值,的一组样本察看值,F(x)为某一知分布的分布函数,为某一知分布的分布函数,1, 2, , r是是F(x)的的r个待定参数,分别是个待定参数,分别是r个参数的点估计,以分个参数的点估计,以分别替代别替代1, 2, ,r ,作原假设,作原假设 H0:总体:总体X的分布函数为的分布函数为F(x) (2)

3、将将F(x)的定义域划分为的定义域划分为k个互不相交的区间个互不相交的区间 (ai , ai+1,i =1,2, k;记;记fi为样本察看值为样本察看值x1, x2, , xn落在第个区间落在第个区间(ai ,ai+1 内的频数,并记内的频数,并记 Pi=Pai X ai+1= F(ai+1)-F(ai ) 210.1 总体分布的总体分布的 检验检验 为以F(x)为分布函数的随机变量在区间 (ai, ai+1 上取值的概率,i =1,2, k。那么当H0为真时,由贝努里定理,当n充分大时,n次独立反复实验结果的实践频率 与其概率Pi之间的差别并不显著,于是显然可以用统计量来描写它们间总的差别的

4、大小。其中nPi为实际频数。其中nPi为实际频数。当H0为真时,下式的值就该当较小 nfi221()kiiiifnPnP (3) 可以证明,当n充分大时(n50),假设H0为真,那么统计量 近似服从(k -r -1)分布。其中r为分布F(x)中待定参数的个数。于是在给定显著性程度下,假设 就回绝H0,阐明总体X的真实分布函数与F(x)间存在显著差别;否那么接受H0,即可以以为两者在程度下并无显著差别。221()kiiiifnPnP22(1)k r 某厂有一台经常需求维修的设备,该设备中有一个易损坏某厂有一台经常需求维修的设备,该设备中有一个易损坏的重负荷轴承,设备缺点的主要缘由是轴承损坏。为了

5、制的重负荷轴承,设备缺点的主要缘由是轴承损坏。为了制定该设备的维修方案和维修预算,需求了解该轴承的寿命定该设备的维修方案和维修预算,需求了解该轴承的寿命分布。下表给出了分布。下表给出了100个轴承寿命的察看数据,问:该轴个轴承寿命的察看数据,问:该轴承寿命能否服从正态分布?承寿命能否服从正态分布?107 155 105 148 49 143 120 115 142 87 103 141 118 168 123 105 80 107 172 122 89 69 97 135 92 31 68 88 95 146 99 121 104 63 12 57 120 139 107 156 167 13

6、6 173 136 179 129 88 75 144 105 192 149 128 111 127 91 103 145 113 114 123 136 8 190 181 121 158 83 223 93 72 120 130 103 144 89 113 60 76 176 94 190 139 140 151 145 142 118 185 140 59 118 212 117 52 128 168 174 155 116 解:由表中数据,用Excel可求得 =120.95, S2=40.582 ,故可作原假设 H0:X N (120,402) 将实轴划分为如下7个互不相交的区间。

7、用Excel的FREQUENCY函数计算数据落在各区间内的频数,用NORMDIST函数求出各实际频数nPi ,统计量的计算如表所示。x区 间 fi nPi iiinPnPf2)( (- , 70 11 10.56 0.0183 (70, 90 10 12.10 0.3645 (90, 110 18 17.47 0.0161 (110, 130 21 19.74 0.0804 (130, 150 19 17.47 0.1340 (150, 170 10 12.10 0.3645 (170, +) 11 10.56 0.0183 合计 100 100 0.9961 取显著性程度 = 0.25 (由

8、于原假设H0是我们希望得到的结果,为使检验结论更具压服力,控制的重点应是与原假设H0不真而接受H0的概率,故 应取的稍大些)。本例中k = 7,r = 2,k r -1 = 4。 故在程度 = 0.25下接受原假设H0,即可以为该轴承的运用寿命服从N (120,402)分布。220.250.9961(4)5.38510.2 比例差别的比例差别的 检验独立样本检验独立样本 1. 两个比例差别的检验 前面,我们研讨了两个比例的Z检验。这部分从不同角度检验数据。假设检验过程运用近似卡方( )分布的检验数据。假设想要比较两个独立样本组的分类变量,可以做两维的列联表,显示每组的第1类正向类,如“胜利,“

9、是等和第2类反向类,如“失败,“否等出现的频数,如表所示 22为了检验组一样本有关类1的比例能否等于第二组样本有关类1的比例,即假设检验为:原假设为两比例之间无显著差别: 备择假设为两比例之间有差别: 运用卡方( )检验的根本思绪为:(1) 确定统计量为 其中 为列联表中特定单元的观测频数, 为列联表中特定单元的期望频数,因此这里的统计量 是观测频数和期望频数差的平方除以每单元的期望频数,并对表中的一切单元格取和求得;012:Hpp112:Hpp222()oeefff表 格 中 所 有 元ofef2(2) 可以证明上述统计量 近似服从自在度为1的 分布,因此在显著性程度下,决策规那么为:假设

10、,回绝 否那么,接受 。为了计算恣意单元期望频数,必需知道假设原假设为真,那么两项比例 和 是一样的,但要计算的每组样本比例有能够不同。每组的样本比例都可以作为参数 和 的估计值。将两个独立比例参数估计组合起来的统计量比各自独立的比例参数估计提供更多的信息。用 表示两组组合样本属于前面表中类1比例的估计值,那么 就是两组组合样本中属于类2比例的估计值。运用该表中的符号, 的定义如下式所示。 2222(1)0H0H1212xxXpnnn1p2p1p2ppp1p 这样,为了计算属于类 1(即列联表中第一行)的期望频数ef,用p乘以组一(或组二)的样本容量1n(或2n)即可得到;类似的,为了计算属于

11、类 2(即列联表中第二行)的期望频数ef,用1p乘以组一(或组二)的样本容量1n(或2n)即可得到,如表 10.4 所示。 如下表所示:运用案例运用案例 有两家酒店,为了确定效力质量,要求顾客分开时做称心度调查,顾客能够会再次入住;根据调查数据得到的列联表如下表所示。问在显著性程度的情况下,顾客会回到酒店一和酒店二的比例能否一样。 酒店 是否再次入住 酒店一 酒店二 总计 类 1(是) 163 154 317 类 2(否) 64 108 172 总计 227 262 489 2.2.两个以上比例差别的检验两个以上比例差别的检验 统计量是观测频数和期望频数差的平方除以每单元的期望频数,并对表中的

12、2c个一切单元格取和求得 统计量 的自在度为 2(1)c因此在显著性水平下,两个以上源自独立样本的比例差异假设检验的决策规则为: 如果22(1)c,拒绝cpppH.:210 否则,接受0H。 nXnnnxxxpcc2121此时,运用案例运用案例 假设有四家酒店,根据调查数据得到的列联表如下表所示。问在显著性程度的情况下,顾客会回到这四家酒店的比例能否一样。独立性检验独立性检验 假设在上面例子中的酒店顾客称心度的调查中,向阐明不会再次入住酒店的顾客问第二个问题。即不会再次入住的缘由是什么,包括价钱、位置、客房效力和其他等。调查结果的列联表如下表所示。试问在显著性程度的情况下,不会再次入住理由与酒

13、店之间能否有联络?10.3 两个相关样本比例差别检验两个相关样本比例差别检验 上述几节用2检验来检验比例差异时都要求独立性条件。 然而, 有时检验比例间差异的数据来自重复度量或配对取样,因此样本相关。譬如,当希望确定在一段时期态度、比例、或行为是否发生变化时,这样的情况经常发生。 运用案例运用案例10.4 两个独立总体的非参数分析:两个独立总体的非参数分析:Wilcoxon秩和检验秩和检验 假设样本容量很小,并且无法确定样本数据能否来自正态分布总体,此时可以选择以下两种方法来分析两独立总体均值间的区别:1用不依赖于正态总体假设的Wilcoxon秩和检验;2对于数据进展正态转换后运用合并方差的t检验。 秩 设X为一总体,将一容量为n的样本观察值按从小到大的次序编号排列成 (1)(2)( )nXXX,称( ) iX的足标i为( ) iX的秩,1,2,in。当其中几个数据相等时,那么这几个数据的秩取平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论