版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验设计及数据分析2011-09-20第二章试验设计基础教学目的与要求了解试验设计的基本术语;掌握试验设计的基本原则;熟悉试验的误差及来源;了解试验数据的特征数;熟悉统计假设检验;掌握试验设计的基本程序。第五节统计假设检验一、预备知识统计推断的结论可靠要求满足三个条件代表性科学的抽样方法:随机抽样正确的统计方法1.二项式分布2.正态分布3.t分布4.F分布二、统计检验的原理和基本思想(一)t检验(二)F检验1.二项式分布
(一)贝努里试验及其概率公式贝努里试验:对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与之一,在每次试验中出现A的概率是常数p(0<p<1),因而出现对立事件的概率是1-p=q,则称这一串重复的独立试验为n重贝努里试验,简称贝努里试验(Bernoullitrials)。重要的离散型分布只有两种可能结果的随机试验称为贝努里试验。食品抽样中,产品合格或不合格,种子发芽或不发芽,施药后害虫死或活等等。贝努里试验的概率公式在贝努里试验中,事件A可能发生,也可能不发生,用随机变量x表示贝努里试验的两种结果,记A发生时取1,A不发生时取0。那么,贝努里试验的概率公式可以表示为:P(x=1)=pP(x=0)=q其中x=1,A事件发生,成功0,A事件未发生,失败在n重贝努里试验中,事件A可能发生0,1,2,…,n次,现在我们来求事件A
恰好发生k(0≤k≤n)次的概率Pn(k)。事件A在n次试验中正好发生k次共有种情况。由贝努里试验的独立性可知,A在k次实验中发生,而在其余n-k次试验中不发生的概率为(二)二项分布的定义及其特点一般,在n重贝努里试验中,事件A恰好发生k(0≤k≤n)次的概率为若把上式与二项展开式相比较就可以发现,在n重贝努里试验中,事件A发生k次的概率恰好等于展开式中的第k+1项,所以也把上式称作二项概率公式。二项分布的定义
设随机变量x所有可能取的值为零和正整数:0,1,2,…,n,且有
其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的二项分布
(binomialdistribution),记为
x~B(n,p)。二项分布是一种离散型随机变量的概率分布。参数n称为离散参数,只能取正整数;p是连续参数,它能取0与1之间的任何数值(q由p确定,故不是另一个独立参数)。图2-1n值不同的二项分布比较图2-2p值不同的二项分布比较2.正态分布(normaldistribution)
正态分布是一种很重要的连续型随机变量的概率分布。自然现象中有许多变量是服从或近似服从正态分布的。如食品中各种成分的含量、有害物质残留量、瓶装食品的重量、分析测定过程中的随机误差等等。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中,均占有十分重要的地位。
正态分布是统计推断中最重要的一种连续型分布,如果随机变量x的概率密度函数是:则称x服从正态分布,记作x~N(μ,σ2),其中μ为随机变量x的均值,σ为随机变量x的标准差,它们是正态分布的两个参数。正态曲线(normalcurve)图形特点:单峰、钟型、左右对称;x=μ最高处对应于x轴的值就是均数μ拐点f(x)是非负函数,以x轴为渐近线两个参数:μ是位置参数σ是形状参数曲线下面积为1xf(x)m
μ决定曲线的位置,σ决定曲线的“胖瘦”图2-3σ相同而μ不同的3个正态分布图2-4μ相同而σ不同的3个正态分布t分布是由W.S.Gosset发现的。它的概率分布密度函数如下:式中,df=n-1为自由度,t的取值范围是(-∞,+∞)t分布的平均数和标准差为:μt=0(假定df>2)(假定df>1)3.t
分布(t-distribution)t分布密度曲线如图2-5所示图2-5不同自由度的t分布(1)t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。(2)t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。(3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n>30时,t分布与标准正态分布的区别很小;n>100时,t分布基本与标准正态分布相同;n→∞时,t
分布与标准正态分布完全一致。t分布的特点:
t分布的概率分布函数为:因而t在区间(t1,+∞)取值的概率—右尾概率为1-Ft(df)。由于t分布左右对称,t在区间(-∞,-t1)取值的概率也为1-Ft(df)。
于是t分布曲线下由-∞到-t1和由t1到+∞两个相等的概率之和—两尾概率为2(1-Ft(df))。对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表1,即t值表(p219)。
例如,当df=15时,查附表1得两尾概率等于0.05的临界t值为=2.131,其意义是:
P(-∞<t<-2.131)=P(2.131<t<+∞)=0.025;
P(-∞<t<-2.131)+
(2.131<t<+∞)=0.05。
由附表1可知,当df一定时,概率P越大,临界t值越小;概率P越小,临界t值越大。当概率P一定时,随着df的增加,临界t值在减小,当df=∞时,临界t值与标准正态分布的临界u值相等。在一个平均数为μ、方差为σ2的正态总体中,随机抽取容量为n1和n2的两个样本,则这两个样本方差为S12与S22
之比值定义为统计量F,即4.F分布(Fdistribution)服从第一自由度为df1=n1-1,第二自由度为df2=n2-1的F分布。记为F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图2-6所示,其临界值制成表2(p221,单尾)。图2-6不同自由度的F分布方差齐性检验时可能用双侧检验,此时查的是α/2的临界值。二、统计检验的原理和基本思想(一)t检验单个样本均值t检验两个均值差t检验成组数据成对数据(二)F检验(方差齐性检验)总体样本参数统计量S方差S2标准差平均数R极差抽样估计、检验为了了解总体分布、特征构造……CV,S假设检验的基本原理:小概率原理概率很小的事件,在一次试验中是不可能发生的,这一原理称为小概率原理。比如有人说,某厂生产的1000个产品中只有一个是次品,即次品率为1/1000,现从中随机抽取一个,结果恰好是次品,此时我们会怀疑此人的说法,认为次品率不是1/1000。所以,假设检验的基本思想可以概括成一句话:“是某种带有概率性质的反证法”!二、统计检验的原理和基本思想假设检验的步骤(一)提出假设(二)确定显著水平(三)计算统计量(四)推断并做出结论二、统计检验的原理和基本思想第一步:提出无效假设H0(又称零假设)和备择假设HA
。
H0:样本与总体或样本与样本间的差异是由抽样误差引起的。
HA:样本与总体或样本与样本间存在本质差异。二、统计检验的原理和基本思想假设的形式(以单个样本检验为例):
H0——无效假设,HA——备择假设双尾检验:H0:μ=μ0
,
HA:μ≠μ0单尾检验:H0:μ≥μ0
,HA:μ<μ0H0:μ≤μ0
,
HA:μ>μ0假设检验就是根据样本观察结果对无效假设(H0)进行检验,接受H0,就否定HA;拒绝H0,就接受HA。第二步:确定检验的显著水平。预先设定的显著水平或概率水平为0.05或0.01,即α=0.05或α=0.01。二、统计检验的原理和基本思想第三步:计算统计量。选定统计方法,计算出统计量的大小。根据资料的类型和特点,可分别选用t检验,u检验,F检验和卡方检验等。根据统计量的大小及其分布确定检验假设成立的可能性p的大小。二、统计检验的原理和基本思想第四步:推断并做出结论。根据小概率原理作判断。若p≤0.05或0.01,则H0成立的可能性小,即拒绝H0。若p>0.05,则H0成立的可能性还不小,还不能拒绝H0,即接受H0。二、统计检验的原理和基本思想p>0.05,这时称“差异不显著”,记为“ns”或不标记;接受。0.01<p≤0.05,这时称“差异显著”,记为“*”;接受。p≤0.01,这时称“差异极显著”,记为“**”;接受。二、统计检验的原理和基本思想双尾检验与单尾检验
(一)双尾检验
(two-tailedtest)
在假设检验中,无效假设为,备择假设为。此时备择假设包括了或两种可能。这个假设的目的在于判断有无差异,而不考虑谁大谁小。此时,在α水平上否定域为(-∞,-)和(,+∞),对称地分配在正态分布曲线的两侧尾部,每尾的概率为α/2,如图所示。这种利用两尾概率进行的检验叫双尾检验,
为双尾检验的临界u值。单尾检验
双尾检验图A图B
(二)单尾检验(one-tailedtest)
但在有些情况下,双尾检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。若进行新技术与常规技术的比较试验,无效假设应为,即假设新技术的实施没有提高产蛋量,备择假设应为,即新配套技术的实施使产蛋量有所提高。
检验目的在于推断实施新技术是否提高了产蛋量,这时的否定域在分布曲线的右尾。在α水平上,的否定域为(,+∞),右尾的概率为α,如图A所示。若无效假设为,备择假设为,此时的否定域在t分布曲线的左尾。在α水平上,的否定域为(-∞,-),左尾的概率为α。如图B所示。这种利用一尾概率进行的检验叫单尾检验。此时为单尾检验的临界u值。接受或拒绝H0,都可能犯错误假设检验中的两类错误
第一类错误——弃真错误,发生的概率为α第二类错误——取伪错误,发生的概率为β二、统计检验的原理和基本思想表2-1统计假设检验结果的4种情况检验结果客观存在正确错误否定Ⅰ型错误(α)推断正确(1-β)接受推断正确(1-α)Ⅱ型错误(β)t检验单个样本均值t检验例2.1为了鉴定一个分析方法的准确度,取质量为100mg的基准物进行10次测定,所得数据为100.3,99.2,99.4,100.0,99.7,99.9,99.4,100.1,99.4,99.6,试对这组数据进行评价。Excel、spss解:(1)提出假设
H0:μ=μ0=100(mg);即认为这组数据与标准值无显著差异。
HA:μ≠μ0(2)选取显著水平α=0.05(3)计算统计量(4)推断并做出结论查表1,得双尾t0.05(9)=2.262,|t|>t0.05(9)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高炉炼铁工操作知识水平考核试卷含答案
- 布鞋制作工岗前理论模拟考核试卷含答案
- 鼓类乐器制作工安全宣教测试考核试卷含答案
- 摊铺机操作工安全管理水平考核试卷含答案
- 煤制气工班组建设水平考核试卷含答案
- 摩托车成车装调工操作技能考核试卷含答案
- 北京海淀区卫生健康委所属事业单位招聘考试真题2025
- 2025年份遵义市习水县招聘城镇公益性岗位人员真题
- 四年级数学物体观察-教学讲稿
- 现代酒店服务质量管理与客户满意度提升
- 铜选矿数据采集技术要求
- 2025至2030中国变压器拆卸和回收服务行业市场深度研究与战略咨询分析报告
- 2025至2030中国水晶首饰行业供需趋势及投资风险报告
- 法律合规重点难点保障措施
- ktv安保制度管理制度
- 公司和个人转账协议书
- 消防防排烟劳务合同协议
- 《康复技术》课件-腘绳肌拉伤康复
- 困境儿童关爱保护工作汇报
- 精神科安全护理业务学习
- 断绝父母协议书范本
评论
0/150
提交评论