




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章假设检验,假设检验在统计方法中的地位,学习内容,6.1假设检验的基本问题6.2一个总体参数的检验6.3两个总体参数的检验,学习目标,假设检验的基本思想和原理假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验,6.1假设检验的基本问题,6.1.1假设的陈述6.1.2两类错误与显著性水平6.1.3统计量与拒绝域6.1.4利用P值进行决策,假设的陈述,什么是假设?(hypothesis),对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必须陈述,我认为这种新药的疗效比原有的药物更有效!,什么是假设检验?(hypothesistest)
2、,先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理,假设检验的基本思想,.因此我们拒绝假设=50,样本均值,m,=50,抽样分布,H0,假设检验的过程,原假设与备择假设,原假设(nullhypothesis),研究者想收集证据予以反对的假设又称“0假设”总是有符号,或4.表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm,null,为什么叫0假设?,之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字
3、母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等,也称“研究假设”总是有符号,或表示为H1研究者想收集证据予以支持的假设H1:某一数值,或某一数值例如,H1:临界值,拒绝H0左侧检验:统计量临界值,拒绝H0,利用P值进行决策,什么是P值?(P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值,拒绝H0,双侧检验的P值,左
4、侧检验的P值,右侧检验的P值,原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么?如果拒绝H0而肯定H1,就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本),多大的P值合适?,显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定,有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提供了更多的信息,它让我们
5、可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设,固定显著性水平是否有意义,用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝
6、域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P值决策与统计量的比较,拒绝H0,P值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1值,统计量2,P2值,拒绝H0,临界值,与其人为地把显著性水平固定按某一水平上,不如干脆选取检验统计量的P值与其大致知道犯第错误的概率,不如干脆知道一个确切的犯第类错误的概率(P值)与其为选取“适当的”的而苦恼,不如干脆
7、把真正的(P值)算出来,P值决策与统计量的比较(结论),样本容量对检验结果的影响,投掷硬币1000次、4040次和10000次时出现正面样本比例的抽样分布,0.5,0.507,这个结果出乎预料吗?,假设检验结论的表述,假设检验结论的表述(“显著”与“不显著”),当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的,假设检验结论的表述(“接受”与“不拒绝”),假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采
8、用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确,假设检验结论的表述(为什么不说“接受”),【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明=10是正确的。如果我们将原假设改为
9、H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道,假设检验结论的表述(为什么不说“接受”),表述为“接受”一个原假设,应该注意到另一个原假设也可能同样地与数据相符。因此,我们宁愿说“不拒绝”当然,在实际检验中,针对一个具体问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所适从比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接受”原假设,但这并不等于说你“
10、确实接受”它,假设检验步骤的总结,陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策,6.2一个总体参数的检验,6.2.1总体均值的检验6.2.2总体比例的检验6.2.3总体方差的检验,一个总体参数的检验,总体均值的检验,总体均值的检验(作出判断),样本容量n,总体均值的检验(大样本),总体均值的检验(大样本),1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计
11、量2已知:2未知:,总体均值的检验(2已知)(例题分析),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验(2已知)(例题分析),H0:=255H1:255=0.05n=40临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法,总体均值的检验(z检验)(P值的计算与应用),第1步:进入Excel表
12、格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为0.843752345P值=2(1-0.843752345)=0.312495P值远远大于,故不拒绝H0,总体均值的检验(2未知)(例题分析),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?
13、(=0.01),左侧检验,总体均值的检验(2未知)(例题分析),H0:1.35H1:1.35=0.01n=50临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,总体均值的检验(z检验)(P值的计算与应用),第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【ZTEST】,然后【确定】第3步:在所出现的对话框【Array】框中,输入原始数据所在区域;在【X】后输入参数的某一假定值(这里为1.35);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使
14、用样本标准差代替)第4步:用1减去得到的函数值0.995421023即为P值P值=1-0.995421023=0.004579P值5200=0.05n=36临界值(c):,检验统计量:,拒绝H0(P=0.000088=0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验)(P值的图示),总体均值的检验(大样本检验方法的总结),总体均值的检验(小样本),总体均值的检验(小样本),1.假定条件总体服从正态分布小样本(n=0.05,故不拒绝H0,总体比例的检验,适用的数据类型,总体比例检验,假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量,0为假设的总体
15、比例,总体比例的检验(检验方法的总结),总体比例的检验(例题分析),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?,双侧检验,总体比例的检验(例题分析),H0:=80%H1:80%=0.05n=200临界值(c):,检验统计量:,拒绝H0(P=0.013328=0.01),样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法,决策:,结论:,总体方差的检验
16、(2检验),总体方差的检验(2检验),检验一个总体的方差或标准差假设总体近似服从正态分布使用2分布检验统计量,总体方差的检验(检验方法的总结),总体方差的检验(例题分析),【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填
17、量的标准差是否符合要求?,总体方差的检验(例题分析),H0:2=42H1:242=0.10df=10-1=9临界值(s):,统计量:,不拒绝H0,样本提供的证据还不足以推翻“装填量的标准差不符合要求”的看法,决策:,结论:,6.3两个总体参数的检验,6.3.1两个总体均值之差的检验6.3.2两个总体比例之差的检验6.3.3两个总体方差比的检验,两个总体参数的检验,两个总体均值之差的检验(独立大样本),两个总体均值之差的检验(独立大样本),1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)2.检验统计量12,22已知:12,22未知:,两个总体均值之差的检验(大
18、样本检验方法的总结),两个总体均值之差的检验(例题分析),【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?,两个总体均值之差的检验(例题分析),H0:1-2=0H1:1-20=0.05n1=44,n2=32临界值(c):,检验统计量:,决策:,结论:,拒绝H0,该公司男女职员的平均小时工资之间存在显著差异,两个总体均值之差的检验(独立小样本),两个总体均值之差的检验(12,22已知),假定条件两个独立的小样本两个总体
19、都是正态分布12,22已知检验统计量,两个总体均值之差的检验(12,22未知但12=22),假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22检验统计量,其中:,自由度:,两个总体均值之差的检验(12,22未知且不相等1222),假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量相等,即n1=n2=n检验统计量,自由度:,两个总体均值之差的检验(12,22未知且不相等1222),假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量,自由度:,两个总体均值之差的检验(例题分析),【例】甲、乙两台机床同时
20、加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有12=22。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在=0.05的显著性水平下,样本数据是否提供证据支持“两台机床加工的零件直径不一致”的看法?,两个总体均值之差的检验(例题分析),H0:1-2=0H1:1-20=0.05n1=8,n2=7临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据还不足以推翻“两台机床加工的零件直径不一致”的看法,两个总体均值之差的检验(用Excel进行检验),第1步:将原始数据输入到
21、Excel工作表格中第2步:选择【工具】下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择【t-检验:双样本等方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05)在【输出选项】选择计算结果的输出位置,然后【确定】,两个总体均值之差的检验(例题分析),【例】为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间(单位:min)下如表。假定两种方法组装产品的
22、时间服从正态分布,但方差未知且不相等。取显著性水平0.05,能否认为方法1组装产品的平均时间明显地高于方法2?,两个总体均值之差的检验(用Excel进行检验),第1步:将原始数据输入到Excel工作表格中第2步:选择“工具”下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择【t-检验:双样本异方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05)在【输出选项】选择计算结果的输出位置,然后【确定】,两个总体均值之差的
23、检验(匹配样本),两个总体均值之差的检验(匹配样本),假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的数据配对或匹配(重复测量(前/后)检验统计量,样本差值均值,样本差值标准差,匹配样本(数据形式),两个总体均值之差的检验(匹配样本检验方法的总结),两个总体均值之差的检验(例题分析),【例】某饮料公司开发研制出一新产品,为比较消费者对新老产品口感的满意程度,该公司随机抽选一组消费者(8人),每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别进行评分(0分10分),评分结果如下表。取显著性水平=0.05,该公司是
24、否有证据认为消费者对两种饮料的评分存在显著差异?,两个总体均值之差的检验(用Excel进行检验),第1步:选择“工具”下拉菜单,并选择【数据分析】选项第3步:在分析工具中选择【t检验:平均值成对二样本分析】第4步:当出现对话框后在【变量1的区域】方框内输入变量1的数据区域在【变量2的区域】方框内输入变量2的数据区域在【假设平均差】方框内输入假设的差值(这里为0)在【】框内输入给定的显著性水平,然后【确定】,两个总体均值检验方法总结,两个总体比例之差的检验,1.假定条件两个总体都服从二项分布可以用正态分布来近似2.检验统计量检验H0:1-2=0检验H0:1-2=d0,两个总体比例之差的检验,两个总体比例之差的检验(检验方法的总结),两个总体比例之差的检验(例题分析),【例】一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存在差异,分别抽取了200名男学生和200名女学生进行调查,其中的一个问题是:“你是否赞成采取上网收费的措施?”其中男学生表示赞成的比例为27%,女学生表示赞成的比例为35%。调查者认为,男学生中表示赞成的比例显著低于女学生。取显著性水平=0.05,样本提供的证据是否支持
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国OPP标签数据监测报告
- 2025年中国GPS一体机数据监测研究报告
- 2025年中国CNC高速单座模切机数据监测研究报告
- 2025年中国3.0mm束状二芯光缆数据监测报告
- 2025至2030年中国食品级特丁基对苯二酚市场分析及竞争策略研究报告
- 2025至2030年中国蓝宝石晶体市场分析及竞争策略研究报告
- 2025至2030年中国磁疗床垫市场分析及竞争策略研究报告
- 2025至2030年中国电容式料位控制器市场分析及竞争策略研究报告
- 2025至2030年中国烟雾燃气报警器市场分析及竞争策略研究报告
- 2025至2030年中国汽车顶隔音垫市场分析及竞争策略研究报告
- 学校电工聘用合同
- 2025年一年级下册语文期末教学工作总结(2篇)
- 2024年司法考试完整真题及答案
- 2025年职业教育专业岗位技能资格知识考试题库与答案
- 公安案件汇报
- 防洪防汛桌面演练
- 肌少症获奖课件
- 2024年执业药师继续教育专业答案
- 学校食堂食品原材料采购投标书
- DB13-T 3035-2023 建筑消防设施维护保养技术规范
- 汽车 4S 店防汛应急预案
评论
0/150
提交评论