管理统计学课件真齐了2014autumn 8非参数检验_第1页
管理统计学课件真齐了2014autumn 8非参数检验_第2页
管理统计学课件真齐了2014autumn 8非参数检验_第3页
管理统计学课件真齐了2014autumn 8非参数检验_第4页
管理统计学课件真齐了2014autumn 8非参数检验_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学—非参数检验曹平Email:什么是非参数检验上一章的参数假设检验,都是假定总体分布类型已知,针对总体的未知参数所提的假设检验但有时分布类型是未知的χ2检验的应用拟合优度检验:检验数据总体是否来自于某个已知分布列联表的独立性检验:检验两种属性是否有关联χ2分布设一组相互独立的随机变量Xi都服从标准正态分布,则服从自由度为k的χ2分布,记为χ2k例子1观察一个硬币是否均匀。把它掷n次,结果正面出现n1次,反面出现n2次。若以{X=0}和{X=1}分别表示每次出现反面和正面这两个事件,则硬币均匀等价于P(X=0)=P(X=1)=1/2可提出如下的假设检验问题:H0:P(X=0)=P(X=1)=1/2↔H1:P(X=1)≠1/2例子2工厂生产为三班制,本月出了15次事故,其中早班、中班和晚班分别发生了6次、3次和6次,问事故是否与班次有关?α=0.05假定事故与班次无关,定义随机变量X:{X=i}表示第i班次出事故,其中i=1,2,3分别表示早班、中班和晚班可提出如下假设检验问题:H0:P(X=i)=1/3(i=1,2,3)↔H1:存在i,P(X=i)≠1/3例子3为了解吸烟是否与患肺癌有关,一份调查报告如下:分别定义随机变量X,Y如下:X=0,1分别表示不吸烟和吸烟,Y=0,1分别表示无肺癌和患肺癌假设检验问题:在水平α=0.001下,吸烟与否是否与患肺癌有关原假设:H0:P(X=i,Y=j)=P(X=i)P(Y=j)(i=0,1,j=0,1)不吸烟吸烟无肺癌339725855982患肺癌31518340026006000例子4

调查户主居住的房屋类型与每周去邮局次数有无关系每周去邮局次数房屋类型复式结构公寓平房其他行和<1/周30541401/周11080822002/周51033250>2/周55000列和150100455300例子4(续)假设居住房子的式样与去邮局次数无关,分别定义随机变量X和Y如下X=1,2,3,4表示去邮局的4种频率Y=1,2,3,4表示房子的4种类型假设检验问题:在水平α下检验H0:P(X=i,Y=j)=P(X=i)P(Y=j)(i=1,2,3,4,j=1,2,3,4)H1:两件事有关联例子5在过去的一年里,公司A,B,C的市场份额分别稳定在30%,50%和20%。最近公司C开发了一种新产品。判断新产品是否使市场份额发生变化对200个顾客进行调查,询问对各个公司的购买偏好,分别是48,98,54H0:pA=0.3,pB=0.5,pC=0.2H1:总体比例不是pA=0.3,pB=0.5,pC=0.2χ2检验拟合优度检验:例1,2列联表独立性检验:例3,4构造χ2统计量当n充分大时χ2近似服从自由度为f的χ2分布,记为χ2f分组数据:f=k-1列联表:f=(行数-1)(列数-1)Oi是实际频数,Ei是理论频数,要求每组理论频数≥5检验规则:时拒绝H0例子2(分析)理论值Ei=npi=15×1/3=5χ2统计量接受H0:没有足够的证据证明事故与班次有关若样本大小为75,早班、中班和晚班事故的比例不变,为30:15:30,理论值Ei=npi=25则χ2统计量拒绝H0列联表检验第(i,j)格的理论频数Eij由下式定义例子3(分析)拒绝H0不吸烟吸烟无肺癌3397(3389.8)2585(2592.2)5982患肺癌3(10.2)15(7.8)18340026006000例子4(分析)将理论频数<5的方格合并,使得合并后每小格的理论频数≥5每周去邮局次数房屋类型复式结构公寓平房其他行和<1/周30(20)5(13.33)4(6)1(0.67)401/周110(100)80(66.67)8(30)2(3.33)2002/周5(25)10(16.67)33(7.5)2(0.83)50>2/周5(5)5(3.33)0(1.5)0(0.17)0列和150100455300例子4(分析续)拒绝H0每周去邮局次数房屋类型复式结构公寓平房和其他行和<1/周30(20)5(13.33)5(6.67)401/周110(100)80(66.67)10(33.33)200≥2/周10(30)10(20.0)35(10.0)50列子5(分析)理论值EA=npA=200×0.3=60,EB=100,EC=40χ2统计量拒绝H0:市场份额发生变化关于χ2拟合优度检验的一般问题研究的总体分布F未知,希望由样本来检验这个总体分布F是否等于给定的分布F0H0:F(x)=F0(x)↔H1:F(x)≠F0(x)F0(x)为已知的分布函数离散:均匀分布,二项分布,泊松分布连续:正态分布,指数分布有些参数未知需要估计如果用样本估计了r个参数,那么当n充分大时χ2近似服从自由度为k-r-1的χ2分布,其中k是分组数要求每组中的理论频数≥5例子1某生产线生产某种零件,检查100天的次品数结果如下试检验每天的次品数是否服从二项分布?(α=0.01)次品数012345天数1262627128例子1(续1)以X记每天的次品数,如果次品数服从二项分布B(5,p),即H0:H1:X分布不是正态分布样本均值

例子1(续2)理论频数表合并得次品数012345O1262627128E3.3216.1931.6230.8715.072.94O-E-2.329.81-5.61-3.87-3.075.06次品数≤123≥4O27262720E19.5131.6230.8718.01O-E7.49-5.61-3.871.99例子1(续3)接受H0例子2珠宝商希望对每天销售的珠宝数建模,他记录了100天的销售结果,如下问是否可用泊松分布来拟合?(α=0.05)销售珠宝数0123456天数71726221792例子2(续1)设X为每天销售珠宝数,则原假设为H0:售出珠宝数0123456O71726221792E7.4319.3125.1021.7614.147.364.90O-E-0.43-2.310.900.242.861.64-2.9例子2(续2)接受H0

售出珠宝数01234≥5O71726221711E7.4319.3125.1021.7614.1412.26O-E-0.43-2.310.900.242.86-1.26例子3调查745人的收入(元),结果如下能否用正态分布来拟合?(α=0.001)用X表示收入H0:X~N(μ,σ2)H1:X不服从正态分布每月收入≤300(300,500](500,700](700,1000](1000,1500]>1500人数1502002201005025例子3(续)拒绝H0≤300(300,500](500,700](700,1000](1000,1500]>1500理论概率0.23790.18140.20090.23770.13260.0095理论频数177.24135.14149.67177.0998.797.08实际频数1502002201005025O-E-27.2464.8670.33-77.09-48.7917.92例子4Chemline公司每年为其遍布美国的4家工厂招聘大约400名新雇员。人事部主管想知道求职者的能力测试分数总体是否服从正态分布随机抽取50名求职者,分数如下:71,66,61,65,54,93,60,86,70,70,73,73,55,63,56,62,76,54,82,79,76,68,53,58,85,80,56,61,61,64,65,62,90,69,76,79,77,54,64,74,65,65,61,56,63,80,56,71,79,84例子4(续)样本均值68.42,样本标准差10.41假设:H0:测试分数总体服从均值是68.42和标准差是10.41的正态分布H1:测试分数总体不服从均值是68.42和标准差是10.41的正态分布例子4(续)利用测验分数的区间定义类别每一类的理论频数至少为5:将正态分布划分为10个等概率区间例子4(续)测验分数区间观察频数期望频数55.10以下5555.10~5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论