统计学分布及假设检验.ppt_第1页
统计学分布及假设检验.ppt_第2页
统计学分布及假设检验.ppt_第3页
统计学分布及假设检验.ppt_第4页
统计学分布及假设检验.ppt_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

二项分布,共同特征(抛硬币) 1.每次试验只有两个结果. 2.试验具有重复性和独立性. 以x表示在n次试验中事件A出现的次数,x是一个离散型随机变量,它的所有取值为0,1,2,n,其概率分布函数为 (q=1-p) 称P(x)为随机变量x的二项分布,记作B(n,p),正态分布,正态分布是最常见最重要的一种分布,例如 测量误差; 人的生理特征尺寸如身高、体重等 ; 正常情况下生产的产品尺寸:直径、长度、重量 高度等都近似服从正态分布.,正态分布的应用与背景,记为,定义: 设 相互独立,都服从正态分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布.,一般,其中,,在x 0时收敛,称为函数,t 分布 (Student 分布),定义,则称 T 服从自由度为 n 的t 分布.记为 其密度函数为,t 分布,t 分布的性质,1f n(t)是偶函数,性质,t 分布的图形(红色的是标准正态分布),F 分布,定义 若X2(n1),Y2(n2) ,X,Y相互独立,则称随机变量,为第一自由度为n1 ,第二自由度为n2的F分布(或自由度为 ),其概率密度为,第 1章 假设检验,1.1 假设检验的基本问题 1.2 一个正态总体参数的检验,学习目标,了解假设检验的基本思想 掌握假设检验的步骤 对实际问题作假设检验,根据样本的信息检验关于总体的某个命题是否正确. 有参数假设检验和非参数假设检验,这类问题称作假设检验问题 .,基本概念,1.1 假设检验的基本问题,假设检验的步骤 提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,提出原假设和备择假设, 什么是原假设?(null hypothesis) 待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 3. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克),为什么叫0假设?, 什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设总是有不等号: , 或 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克),提出原假设和备择假设, 什么是检验统计量? 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平 (significant level), 什么显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 得出拒绝或不拒绝原假设的结论,双侧检验与单侧检验 (假设的形式),单侧检验 (原假设与备择假设的确定),将研究者想收集证据予以支持的假设作为备择假设H1 例如,一个研究者总是想证明自己的研究结论是正确的 一个销售商总是想证明供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致 将研究者想收集证据证明其不正确的假设作为原假设H0 先确立备择假设H1,单侧检验 (原假设与备择假设的确定),一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立 研究者总是想证明自己的研究结论(寿命延长)是正确的 备择假设的方向为“”(寿命延长) 建立的原假设与备择假设应为 H0: 1500 H1: 1500,双侧检验 (显著性水平与拒绝域),左侧检验 (显著性水平与拒绝域),右侧检验 (显著性水平与拒绝域),1.2 一个正态总体参数的检验,1. 总体均值的检验 2. 总体比例的检验 3. 总体方差的检验,一个总体参数的检验,总体均值的检验 (检验统计量),总体 是否已知?,总体均值的检验 (2 已知或2未知大样本),1. 假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 使用Z-统计量 2 已知: 2 未知:,2 已知均值的检验 (例题分析),【例】已知某种玉米平均穗重u0=300g,标准差 =9.5g。喷施某种植物生长调节剂后,随机抽取9个果穗,重量分别308,305,311,298,315,300,321,294,320 (g)。问这种调节剂对果穗重量是否有影响?(0.05),2 已知均值的检验 (例题分析),H0: = 300g H1: 300g = 0.05 n = 9 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,认为喷施调节剂能够显著增加玉米果穗的重量,2 未知大样本均值的检验 (例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,2 未知大样本均值的检验 (例题分析),H0: 1200 H1: 1200 = 0.05 n = 100 临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,总体均值的检验 (2未知小样本),1. 假定条件 总体为正态分布 2未知,且小样本 2. 使用t 统计量,2 未知小样本均值的检验 (例题分析),【例】某鱼塘水中的含氧量多年平均为4.5mg/L。现在该鱼塘设10个点采集水样,测定水中含氧量分别为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)。试检验该次抽样测定的水中含氧量与多年平均值有无显著差别?,双侧检验,2 未知小样本均值的检验 (例题分析),H0: = 4.5 H1: 4.5 = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,认为该次抽样测定的含氧量与多年平均含氧量没有显著差别。,决策:,结论:,在R软件中,函数t.test()提供了t检验的功能,使用格式如下: t.test(x,y=NULL,alternative=c(“two.sided“,“less“,“greater“),mu=0,paired=FALSE,var.equal=FALSE,conf.level=1-) 其中x,y是由数据构成的向量(如果只提供x,则作单个正态总体的均值检验,否则作两个总体的均值检验);alternative表示备择假设,less表示单边检验(H1:uu0);mu表示原假设u0;var.equal=FALSE表示认为两总体方差不同,conf.level是置信水平,通常是0.95,即 =0.05,总体比例的检验 (Z 检验),一个总体比例检验,假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 Z 统计量,p0为假设的总体比例,一个总体比例的检验 (例题分析),【例】有一批蔬菜种子的平均发芽率p0=0.85。现随机抽取500粒种子,用种衣剂进行浸种处理,结果445粒发芽。试检验种衣剂对种子发芽有无效果?,双侧检验,一个总体比例的检验 (例题分析),H0: p= 0.85 H1: p 0.85 = 0.05 n = 500 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,种衣剂对种子发芽率有显著提高的效果(0.890.85),决策:,结论:,方差的卡方 (2) 检验,检验一个总体的方差或标准差 假设总体近似服从正态分布 检验统计量,方差的卡方 (2) 检验 (例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05),双侧检验,方差的卡方 (2) 检验 (例题分析),H0: 2 = 1 H1: 2 1 = 0.05 df = 25 - 1 = 24 临界值(s):,统计量:,在 = 0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,1.3 两个正态总体参数的检验,检验统计量的确定 两个总体均值之差的检验 两个总体比例之差的检验 两个总体方差比的检验 检验中的匹配样本,两个正态总体参数的检验,独立样本总体均值之差的检验,两个独立样本之差的抽样分布,两个总体均值之差的检验 (12、 22 已知),1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 检验统计量为,两个总体均值之差的检验 (假设的形式),两个总体均值之差的检验 (例题分析),【例】现用甲、乙两种发酵法生产青霉素,其产品收率的方差分别为 =0.46(g/L)2, =0.37(g/L)2。现甲方法测得25个数据, =3.71g/L;乙方法测得30个数据, =3.46g/L。问甲、乙两种方法的收率是否相同?( = 0.05),两个总体均值之差的检验 (例题分析),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 25,n2 = 30 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上接受H0,甲、乙两种方法的收率相同,没有显著差异,两个总体均值之差的检验 (12、 22 未知且相等,小样本),检验具有不等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且相等12 =22 检验统计量,其中:,两个总体均值之差的检验 (12、 22 未知但不相等,小样本),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但不相等12 = 22 检验统计量(n1n2,用近似的t检验),当n1=n2=n时,仍可用t检验法,其计算也与两个总体方差相等的情况一样,只是自由度df=n-1 当n1n2时,其自由度df计算方式如下:,两个总体均值之差的检验 (例题分析),【例】用高蛋白和低蛋白两种饲料饲料1月龄大白鼠,在3个月时,测定两组大白鼠的增重量(g), 两组数据如下: 高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123 低蛋白组: 70,118,101,85,107,132,94 试问两种饲料饲养的大白鼠增重量是否有差别?,两个总体均值之差的检验 (该题由后面的F检验可以得出两总体方差相等),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 12,n2 = 7 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上接受H0,认为两种饲料饲养的大白鼠增重量没有显著差别,两个总体均值之差的检验 (匹配样本的 t 检验),1. 检验两个总体的均值 配对或匹配 重复测量 (前/后) 2. 假定条件 两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 ),匹配样本的 t 检验 (假设的形式),注:Di = X1i - X2i ,对第 i 对观察值,匹配样本的 t 检验 (数据形式),匹配样本的 t 检验 (检验统计量),样本差值均值,样本差值标准差,自由度df nD - 1,统计量,D0:假设的差值,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,匹配样本的 t 检验 (例题分析),在 = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,单侧检验,配对样本的 t 检验 (例题分析),配对样本的 t 检验 (例题分析),差值均值,差值标准差,H0: m1 m2 8.5 H1: m1 m2 8.5 a = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上不拒绝H0,不能认为该俱乐部的宣称不可信,配对样本的 t 检验 (例题分析),两个总体比例之差的检验,1. 假定条件 两个总体是独立的 两个总体都服从二项分布 可以用正态分布来近似 检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验 (假设的形式),两个总体比例之差的Z检验 (例题分析),【例】现研究地势对小麦锈病发病率的影响。调查低洼地麦田378株,其中锈病株342株;调查高坡地麦田396株,其中锈病株313株。比较两块地麦田锈病发病率是否有显著性差异?,两个总体比例之差的Z检验 (例题分析),H0: P1- P2 =0 H1: P1- P2 0 = 0.05 n1 = 378,n2 = 396 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,低洼地麦田锈病发病率显著高于高坡地麦田,两个总体方差比的检验 (F 检验),假定条件 两个总体都服从正态分布 两个独立的随机样本 假定形式 H0:s12 = s22 或 H0:s12 s22 (或 ) H1:s12 s22 H1:s12 ) 检验统计量 F = S12 /S22F(n1 1 , n2 1),两个总体均值之差的检验 (例题分析),【例】用高蛋白和低蛋白两种饲料饲料1月龄大白鼠,在3个月时,测定两组大白鼠的增重量(g), 两组数据如下: 高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123 低蛋白组: 70,118,101,85,107,132,94 试问这两个总体的方差是否有显著差异?,两个总体方差的 F 检验 (例题分析),H0: 12 = 22 H1: 12 22 = 0.05 n1 = 12,n2 = 7 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上接受H0,认为这两个总体的方差没有显著差异,在R软件中,var.test()函数提供了作方差比的检验,该函数使用格式如下: va

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论