假设检验(完整版)_第1页
假设检验(完整版)_第2页
假设检验(完整版)_第3页
假设检验(完整版)_第4页
假设检验(完整版)_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.统计假设检验、假设检验、第1节、假设检验的概要第2节、全体平均的假设检验(z,t )第3节、全体比率的假设检验(p )第4节、全体方差的假设检验(凯方,f ).第1节假设检验的概要、1、假设检验的基本思想2、假设检验的步骤3、2种错误和假设检验的规则、ronalder 他在采样分布理论、相关回归分析、多变量统计分析、最大似然估计理论、方差分析和假设检验方面有很多建筑树。 女性喝茶,20世纪20年代后半期在英国剑桥夏天下午,一群大学绅士和夫人和来访者坐在室外的桌子旁享受着午后的奶茶。 奶茶一般是牛奶和茶混合而成的,调制时可以泡茶倒牛奶,也可以泡牛奶倒茶。 这时,一位女性说,可以区别这两种不同的做法调制的奶茶。 如何验证这位女士的话? 为此,Fisher进行了研究,提出了假说验证的思想。 1、推进素质教育后,教育效果提高了吗? (教育统计) 2、某种新胃药比以前有效吗? (卫生统计) 3、酒后驾驶是否认定刑事犯罪后交通事故减少? (司法统计) 4、如何测定某种发芽率? (农业统计) 5、海关人员如何判定某产品可以报关? (海关统计) 6,红楼梦后40次作者的鉴定(文学统计)。 7、民间贷款利率是多少(金融统计) 8、兴奋剂检验(体育统计)、假设检验的应用、1、假设检验的基本思想是研究某山区成年男性的脉搏数是否高于一般成年男性的脉搏数,有医生在山区随机抽取25名健康成年男性,脉搏数x为74.2次/分,标准偏差为6.0次/分许多调查显示,一般健康成年男性的脉搏数为72次/分钟,这个山区的成年人的脉搏数被认为高于一般成年男性的脉搏数0问题1:这25个男性的脉搏数高于一般男性的原因是什么?问题2,如何解决这些原因当x和0相近时,其差异可以用采样误差来说明,x从0来的x和0的差异很大,不应该用采样误差来说明其差异时,可以怀疑x不是0。 以、资料已知的样本平均数与总体平均数之所以不同,有两个原因: (1)两者的不同是由于地理气候等因素,也就是说高山成人脉搏较普通人高;(2)两者是同一总体,也就是说两者的不同是由于采样误差。 验证原本假定:高山成人脉搏与普通人脉搏无差异:=0假定:高山成人脉搏与普通人脉搏有差异:0, 假设验证的基本概念是预先对整体参数或分布形式作出某些假设,利用样本信息以一定概率来判断原始假设是否成立参数检验和非参数检验(第8章的内容)的作用,一般来说是检查有差异的数据,差异是否有意义(概率) 如果检查通过,说明不能拒绝原来的假设,没有明显的差异,其差异是由抽样引起的,如果检验不合格,拒绝原来的假设的说明有明显的差异,这个差异是由于系统的误差.证据假设不真实.第一节假设检验的概要,1,假设检验假设检验的步骤3,2种错误和假设检验的规则,2,假设检验的步骤,1,根据具体的问题,制作原来的假设和假设2,构筑适当的统计量,其抽样分布(平均检验) 3,计算给出的显着性水平和阈值。 显着性水平通常取0.1、0.05或0.01 . 确定显着性水平后,可以根据统计量的分布,确定发现接受区域和排斥区域的阈值。 4 .根据样本值计算并确定统计量的数值。如果统计量的值进入拒绝区域,则检查不合格,显示有显着差异,拒绝原来的假设。 如果统计量的值在接受范围内,假设检查合格的话,这个差异是由于抽样,这个样本不能拒绝原来的假设。 1、元假说和替代假说,元假说(nullhypothesis ) :一般研究者收集证据反对的假说。 H0替代假说(alternativehypothesis ) :一般研究者想收集证据并支持的假说。 H1表示在假设验证中只有在发生小概率事件的情况下才会拒绝原来的假设,因此在假设验证的过程中保护原来的假设。 有三种形式: (1)采用双侧检验H0:=0,H1:0 (不均匀,有差异) (2)左侧检验h0 :0,H1:0 (提高,增加)哪种形式取决于实际问题。 某饮料罐装瓶的标准容量为335毫升,为了控制生产过程,质量监控人员定期检查某工厂,确认该工厂生产的罐装是否符合标准。 罐子的平均容量大于或小于335毫升,表明生产过程不正常。 阐述了验证生产过程是否正常的原假说和预备假说,研究者想收集证据证明的假说应该是“生产过程不正常”。 确立的原假设和预备假设是h0:335mlh1:335ml,消费者协会受到消费者的投诉,诉说品牌纸包装饮料的容量不足,有欺骗消费者的嫌疑。 包装上标明的容量为250毫升。 消费者协会从市场上随机抽取这个品牌的50箱纸包装饮料进行了假设检查。 请叙述一下这个假设检查中的原来的假设和替代假设。 解:消费者协会的意图倾向于证明饮料工厂的包装饮料不足250ml。 确立的原假设和初步假设是H0:250mlH1:255,拒绝决策: H0,结论:样品提供的证据显示当天生产的饮料与标准有显着差异,认为工人更换后的容量增加了。有效水平和拒绝区域(右侧检验)、有效水平和拒绝区域(右侧检验)、第1节假设检验的概要、1、假设检验的基本思想2、假设检验的步骤3、2种错误和假设检验的规则、3、2种错误和假设检验的规则1 .假设第I类错误(舍弃真正的错误)为真时, 将拒绝原假设第I类错误的概率称为显着水平2 .假设第ii类错误(取得假错误)为假的情况下,将不拒绝原假设第ii类错误的概率称为(), 假设H0:无罪,检定中的2种错误,如检定为审判过程,统计检定过程,H0:药品为真药,假设检定中的2种错误关系,则不会误杀3千人,H0:面试是一个好机会,错误与错误的关系是、和只能增加样本容量。 和的关系大而大而小,四是根据信赖区间和假设检验的关系1、信赖度1-构筑信赖区间,如果统计量进入信赖区间,则接受原来的假设,如果不进入信赖区间,则拒绝原来的假设。 2、根据有效性水平,能够构筑置信度为1-的置信区间。、一个总体检查, 第二节全体平均的检验一、一个全体平均的检验(ZT )二、两个全体平均的检验(等方差、异方差)三、两个非正规全体平均的差异的检验(配对检验)、决定一个正规全体平均的检验统计量的主要因素是: 1、采样容量的大小2、全体分布形状3、全体方差(6种) 的正规总体(方差未知且小样本,一类)的正规总体(方差已知,小样本,一类)的大样本(无论总体是否正规,方差是否已知,4类)的假设检验形式(两侧,左侧和右侧);和(1)总体平均检验(小样本) 正态方差已知),1 .假设条件总体上遵循正态分布较小的样品(n1020,决策:0.05水平拒绝H0,结论:样品提供的证据显示当天生产的饮料与标准有显着差异,试用寿命提高。全体平均的检验(z检验) (p值的计算和应用),第1步:进入Excel表界面,第2步:在函数分类中点击“统计”,在函数名称的菜单中选择“NORMSDIST”,第3步:将z的绝对值登录到2.4 因为0.9918P值=1-0.9918=0.0082P值以下,所以H0、整体平均的检查(z检查) (p值的图示)、【例3】罐装饮料是在自动生产线上生产的,一罐的容量是255ml,标准偏差是5ml,遵循正态分布。 调换部分工人后,质检人员在某日生产的饮料中随机抽取16罐进行检测,测定每罐平均容量为252.8ml。 取显着性水平=0. 05,验证当天生产的饮料容量是否减少,左侧检验,H0:255h1:255,决策:水平0.05拒绝h0,结论:样品提供的证据显示当天生产的饮料与标准有显着性差异,认为工人更换后的容量减少.全体平均检验(z检验) (p值的计算和应用),第1步:进入Excel表界面,第2步:在函数分类中点击“统计”,从函数名称的菜单中选择“NORMSDIST”, 第三步骤:由于通过输入z的绝对值-1.76而获得的函数值小于0.039204P值=0.039204P值,因此H0、整体平均检验(z检验) (p值的图示)、整体平均检验规则(正常、小样本、方差已知)、练习1、(2)整体平均检验(小样本、正常、方差已知) 1 )假设整个条件符合正态分布小样本(n5,决定:拒绝H0,结论:肥皂平均厚度高。 另外,因为p值=0.031972=0.05,所以H0、(3)总体平均检验(大样本);1 .假定使用z检验统计量2来得知总体条件或总体非正规样本(n 30 ):2未知:总体平均检验规则(大样本的情况)、或大学生参加每日运动的时间现在学校为了调查学生是否达到运动标准,从该校的学生中随机抽出100人,调查他们每天参加运动的时间为24分钟,标准为5分钟。 以5%的显着水平对该校学生每天的运动时间是否达到规定进行了验证。右侧检定. H0:25、H1:25、=0.05、n=100、决策: h0、结论:样本提供的证据表明学生运动时间未达到规定。全体平均检验(z检验) (p值的计算和应用),第1步:进入Excel表接口,第2步:在函数分类中点击“统计”,在函数名称的菜单中选择“NORMSDIST”,第3步:可输入z的绝对值2 因为0.9925P值=(1-0. 9925 )=远小于0.0075 p值,H0、【例】罐装饮料是自动生产线生产的,每罐容量为255ml,标准偏差为5ml。 为了检测每罐容量是否满足要求,质检人员在某日生产的饮料中随机抽取40罐进行检测,测定每罐平均容量为255.8ml。取显着性水平=0. 05,验证当天生产的饮料容量是否满足标准,双侧检验. H0:=255,h 13360255,=0. 05,n=40,决策:不拒绝H0,结论:样品提供的证据表明当天生产的饮料满足标准要求综合平均检查(z检查) (p值的计算和应用),第1步:进入Excel表接口的“f(x )”(粘贴函数)步骤2 :在函数分类中单击“统计”,从函数名称的菜单中选择“NORMSDIST”,步骤3 :输入z的绝对值1.01,输入函数由于0.8437-1=0.6874P,因此H0、整体平均的检查(大样本)、【例】机床加工的部件尺寸的绝对平均误差为1.35mm。 制造商现在为了进一步降低误差,正在使用新的机床进行加工。 为了检查新机床加工零件的平均误差与旧机床相比是否显着下降,从某日生产的零件中随机抽取50个进行检查。 利用这些样本数据验证新机床加工零件尺寸的平均误差与旧机床相比是否显着降低(=0.01 )、左侧检验、整体平均检验(大样本)(例题分析)、H0:1.35h1:1.35=0.01n=50阈值(c): 检定统计量:决定:拒绝h0,结论:新机床加工的零件尺寸的平均误差与旧机床相比显着降低.进入整体平均检定(z检定) (p值的计算和应用)步骤Excel表界面,直接点击 f(x ) 步骤2 :在函数分类中点击统计, 从函数名称菜单中选择 ZTEST ,步骤3 :在显示的对话框的Array框中输入原始数据所在的区域,在x之后输入带参数的假设值(在此为1.35 ),在Sigma之后输入已知的总体标准偏差(如果总体标准偏差未知则忽略,如果总体标准偏差未知则忽略) 步骤4 :从1中减去的函数值0.995421023是p值p值=1-0.995421023=0.004579P值5200=0.05n=36阈值(c):检查统计值3360。h0(p=0. 0000885,nq5,采样比率近似为正态分布检定的z统计量,0是假定的总体比率,总体比率的检定规则,总体比率的检定,【例】是以休闲和娱乐为主题的杂志,主张读者的80%是女性。 为了验证这是否真实,某研究部门抽取了由200人组成的随机样本,发现有146名女性经常阅读该杂志。 分别取显着性水平0.05和0.01,验证该杂志读者群中女性的比例是否为80%,各值分别为多少,H0:=80%,H1:80%,=0. 05,H0(P=0.013328=0.01 )拒绝同志的主张是事实1 .假设条件双方都遵循两个分布,则检验统计量检验h0:1-2=0检验H0:1-2=d0、2、能够用正态分布近似两个总体比率之差的检验规则、两个总体比率之差的检验(例题分析), 【例】某大学计划采取学生在宿舍收网费的措施,为了了解男女学生的意见是否存在差异,分别抽取200名男生和200名女生进行了调查,一个问题是“是否赞成收网费的措施”。 男生表示赞成的比率为27%,女生表示赞成的比率为35%。 调查者认为,男生中表示赞成的比率明显低于女生。 显着性水平=0.05,样品提供的证据支持调查者的意见吗?两个整体比率之差的检定(例题分析)、h0:1-2=0h1:1-20=0.05n1=200、n2=200阈值(c):检定统计量:决定3360、结论:拒绝H0(P=0.041837=0.05 ), 样品提供证据支持调查人员意见的两种总体比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论