版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 假设检验,6.1 假设检验的基本问题 一、假设检验的陈述 在自然科学和社会科学研究中,经常要提出一些假设,然后要判断或检验这些假设是否正确。例如我们在用反证法证明数学命题或题目时,需要做一个假设,然后利用已有的知识和命题的条件推导出矛盾来,从而否定所做的假设,证明了原命题的正确性。 在用统计学研究问题时,也经常根据实际问题提出假设,然后利用样本统计量判断 假设是否正确的过程,这就是假设检验。为了讲清楚这个内容,我们先介绍假设检验的有关知识。 1、小概率事件不发生原理 小概率事件(发生概率小于0.1 的事件)发生的概率很小,在一次试验中认为它不发生。例如我们知道人们乘车都有发生交通事故的
2、可能,但是人们依据小概率事件在一,次试验中不发生原理,照样乘车、乘飞机等。 2、假设检验问题的提出 在用统计学研究自然科学和社会科学问题时,有时提出一个假设,这个假设称为原假设,然后依据小概率事件在一次试验中不发生原理,检验这个假设正确与否。 例1 某超市从厂家进货,双方达成协议,如果次品率超过1% ,则超市拒收货物,今有一批货物,随机抽取200件检查,发现有次品3件,在显著性水平 下,试问超市是否要接受这批货物? 作为超市来说,可以提出一个假设:次品率小于或等于1%,再抽取样本,检验这个假设对不对, 若假设成立,就允许这批货物进入超市,相反,若假设不成立,就拒绝这批货物进入超市。现在问题的关
3、键在于如何判断这批货物的次品率是否超过1%,有些同学可能会说可以抽一部分,货物进行检测一下,看看这部货物次品率是否超过1%,由于你抽取的货物是随机的,因此所抽查货物的次品率也是随机的。为此,我们假定前面的假设是正确的,在这基础上计算题目中的事件A:“随机抽取产品中次品率不超过1%”发生的概率。 (1) 在(1)式中,z 正好是统计量,并且其分布是标准正态,分布,计算结果及示意图是 y 0.0044 2.61 x 从(1)的计算结果可以看出,在超市提出的假设成立的情况下,随机抽取的200件产品中,有6件是次品的概率为0.0044,显然这是一个小概率事件,认为在一次抽查中不应该发生,现在它发生了,
4、我们怀疑超市提出的假设不应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设,通过抽样获得样本数,据和统计量的分布,计算出这个假设成立的概率很小,是小概率事件,再根据小概率事件在一次试验中不发生原理,拒绝了产品进入超市。这个过程就是统计学中重要内容假设检验。 3、原假设和备择假设 原假设(null hypothesis):指研究者想收集证据予以反驳的假设。通常用 表示。 备择假设(alternative hypothesis):指研究者想收集证据予以支持的假设。通常用 表示。 例如 在例1中,“次品率小于或等于1%”是超市想反驳的假设,是原假设。它的对立面 “次品率大于1% ”
5、是超市想支持的假设,是备择假设。 4、两类错误和显著性水平 第一类错误: 原假设是真的,但在检验中被错误地拒绝了。 第二类错误:原假设是假时,没有拒绝而错误地被接受了。,这两类错误之间的关系是:在样本容量一定时,犯第一类错误概率较大时,犯第二类错误地概率较小;反之,犯第一类错误概率较小时,犯第二类错误概率较大。要想两类错误的概率都减小,只有增加样本容量。 5、显著性水平 显著性水平:是指人们犯第一类错误概率的最大允许值。 注意:显著性水平是人们根据自己所研究的问题来确定,在经济学和其他社会科学中,常用选择的显著性水平是5%,或者10%,在卫生和医药统计中,常用选择的显著性水平是1%。在我们经济
6、学中,除非特别声明,一般都以5% 作为显著性水平。 6、临界值和拒绝域 拒绝域:拒绝域就是由显著性水平 所围城的区域。 临界值:由给定的显著性水平确定的拒绝域的边界值,称为临界值。实际上临界值就是 分位点所对应的值。,例2 某地区小麦的一般生产水平是亩产250公斤,其标准差是6公斤。现在经过品种改良试验,从25个小区抽样,结果为小麦平均亩产比原来提高20公斤。对检验假设 , 的问题,求 时,不犯第二类错误的概率。假设小麦亩产服从正态分布 ( )。 解:该地区小麦的一般生产水平是亩产250公斤,标准差是6公斤,可以认为该地区小麦产量在品种改良前是服从 正态分布 。现在经过品种改良后,从25个 样
7、本数据来看,亩产比原来提高了20公斤,现在的问题是这提高了的20公斤偶然的还是必然的(如果是偶然的,意味着品种改良没有提高小麦的产量,如果是必然的意味着 品种改良的确提高了小麦的产量)。为此,我们用假设检方法来解决此问验题。,方法来解决此问验题。 根据上述分析,提出原假设和备择假设是: 构造检验统计量 在原假设成立时 ,它服从标准正态分布,其分布密度函数图形是 1.65,在原假设成立时,检验统计量z的值超过1.65概率小于或者等于0.05,这是一个小概率事件,在一次试验中不应该发生,如果发生,我们就有只够的理由否定原假设了。下面我们来计算一下检验统计量z 的值是多少。根据题意,z=270-25
8、0/6=3.331.65,因此我们要拒绝原假设:小麦改良后亩产仍然是250公斤。也就是说,认为小麦经过改良后亩产已经超过250公斤。0.05就称为显著性水平。 Z1.65的区域称为拒绝域。Z=1.65称为临界值。 下面我们来计算不犯第二类错误的概率,为此 先算出犯第二错误的概率。根据第二类错误的定义,原假设是错误的,备择假设是对的,但是我们错误地 接受了原假设(错误地没有拒绝原假设)。备择假设是 ,有无数多个,为计算犯第二类错误,必须选择其中一个,本例选择的是 ,其计算过程及有关图形如下:,在上图中, 是在检验时,检验统计量临界值所对应的在原分布中的值,其计算过程是:,所以有 因此犯第二类错误
9、的概率是 所以不犯第二类错误的概率是 10.0465=0.9535,7、单边检验和双边检验 (1)单边检验 在假设检验中,如果拒绝域在检验统计量分布密度函数一侧的检验,称为 单边检验。例如 1),2),注意:在单边检验中,若原假设是 形式 拒绝域在右侧;反之,若原假设是 形式 拒绝域在左侧。 (2)双边检验 拒绝域在两边的假设检验,称为双边检验。 例如 检验,例3 在20世纪60年代,美国货币主义学派代表人物著名 经济学家弗理德曼提出了一种“负收入税” ,对低收入者进行补助,而不是向他们收税。这项福利计划造成受益人不工作吗?在新泽西州的三个城市做了一项实验来寻求答 案。总体是由这些城市一万个低
10、收入家庭组成。从中选出 225个家庭实施负收入税,400个家庭作为对照。假定这400个家庭不会因为别人获得补助而对自身产生影响。对这625个家庭跟踪3年。 (1)对照家庭在3年平均受雇工作7000小时,标准差是 3900小时,获益家庭平均受雇工作6200小时,标准差是 3400小时。问获益家庭平均工作时间是否少于对照家庭? (2)对照家庭中,有88%的户主受雇,而实施负收入税的家庭,有82%的户主受雇。问实施负收入税的家庭户主受雇率是否低于对照组家庭的户主?,解:假设 分别表示获益家庭和对照家庭在3年内 的平均工作时间。 根据题意,作如下检验: 设 , 分别表示获益家庭和对照家庭 样本的平均工
11、作时间和户数, 分别是两组家 庭工作时间的方差。构造检验统计量,在原假设成立的情况下,检验统计量 服从标准正态分布。 1.65,所以,我们不能拒绝原假设,也就是说接受原假设。即认 为实施负收入税的家庭工作时间比没有实施负收入税的家 庭的平均工作时间要少些。 2)设 表示实施负收入税家庭和没有实施负收 入税家庭的户主受雇比例, 分别表示这两类 样本家庭受雇的比例。检验如下: 构造如下检验统计量:,在原假设成立时,上述检验统计量服从标准正态分布。其 检验如下: 1.65,从上式可以看出,检验统计量的值小于临界值,我们不能 拒绝原假设,即接受原假设,认为实施负收入税,会影响 户主受雇率。 综上所述,
12、可以看出,实施负收入税确实会导致一部分家庭或个人不愿意工作。正因为如此,美国也没有实施负收入税。 二、用P值进行检验 P值是指在假设检验中,当原假设成立时,检验统计量取 样本数据的值时的概率。例如 在下列检验中,其P值是,p值= 当P值小于显著性水平时,表明检验统计量的值落在拒接 域,我们拒绝原假设;反之,当P值大于显著性水平时, 表明 检验统计量的值落在接受域 内,我们应该接受原假 设。,值,案例分析题 : 新饲料养牛计划的有效性检验 一家饲料开发公司研究出一种新饲料,据称该饲料能有效增加牛的体重,同时还能有助于牲畜抵抗某些疾病。 饲料开发公司在一家养牛厂的协作下,对新饲料的功效进行了检测。
13、这家养牛厂的主人从2月1日到5月20日(含首尾两日)使用新饲料喂养一群牛。该群牛的有关数据如下表所示。 饲料开发公司还得到了这家养牛厂去年一月15日到五月5日(含首尾两日)一群牛的喂养数据。这群牛使用的是该饲料公司生产的标准饲料。这批数据记录如下: 1、初期平均体重=178公斤;标准差=25公斤(N=43) 2、期末平均体重=251公斤;标准差=61公斤(N=41) 3、平均每天体重增加0.91公斤;标准差=0.2公斤(N=41) 4、病牛头数(含两头 已死亡的)=12头,初始体重/公斤,期末体重/ 公斤,是否染病,77 64 89 71 68 76 89 90 93 62 85 91 74
14、90 93 72 80 83 78 92 65 74 76 73 67 70 78 62,114 103 149 93 101 115 145 119 153 89 133 142 124 142 152 135 151 127 102 149 127 123 132 132 122 126 147,1 1 1 0 1 1 1 0 1 0 1 1 1 1 0 1 1 0 0 1 1 1 1 1 1 1 1 1,讨论题 1、检验食用新饲料和标准饲料的两群牛的初期体重均值没 有显著差异。 2、检验这两群牛的日平均增重相同。 3、检验这两群牛的患病率相同。 4、讨论检验中所使用的显著性水平对检验结果的影响。 5、给出检验的P值,并指出它的实际意义。 解:1)设 分别表示食用新饲料和标准饲料的两 群牛的初期体重,根据题意,检验的假设是 因此,我们构造的检验统计量是:,(1),计算出使用新饲料喂养的牛群的均值和方差是 所以,在原假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026北京公交集团校园招聘备考题库(考试直接用)附答案详解
- 2026国家统计局拉萨调查队招聘2人备考题库含答案详解【a卷】
- 2026广东佛山南海区丹灶镇仙湖幼儿园招聘备考题库及参考答案详解【培优b卷】
- 2026北京大学深圳研究生院新材料学院分析测试中心工程师招聘备考题库(广东)含完整答案详解(有一套)
- 2026天津市勘察设计院集团有限公司招聘4人备考题库及完整答案详解(夺冠系列)
- 2026河南郑外集团郑开学校附中教师招聘1人备考题库及参考答案详解【综合卷】
- 2026江苏南京师范大学专业技术人员招聘10人备考题库及答案详解【有一套】
- 2026广西桂林信息工程职业学院人才招聘备考题库含完整答案详解(历年真题)
- 未来五年新形势下儿童袜子批发行业顺势崛起战略制定与实施分析研究报告
- 未来五年祛湿注射液市场需求变化趋势与商业创新机遇分析研究报告
- 2026年上饶职业技术学院单招职业适应性测试题库及答案详解(历年真题)
- 2026石嘴山市能达建设发展有限公司招聘3人考试参考题库及答案解析
- 2026陕煤集团榆林化学有限责任公司招聘(162人)考试参考试题及答案解析
- 口腔正畸考核制度
- 挂篮使用说明书
- 员工合规意识培训
- 大学艺术教学中跨学科融合的创新实践教学研究课题报告
- 2026年鄂尔多斯职业学院单招职业倾向性测试题库附答案解析
- 涵洞施工技术培训课件
- 水产养殖安全知识培训课件
- 综合管理部自查自纠存在问题及整改措施
评论
0/150
提交评论