




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章χ2检验第六章第一节、χ2检验的基础知识第二节、χ2检验的原理与计算第三节、适合性检验第四节、独立性检验二、
χ2检验与连续型资料假设检验的区别一、
χ2检验的定义三、
χ2检验的用途第一节:
χ2检验基础知识χ2
检验(Chi-squaretest)
对样本的频数分布所来自的总体分布是否服从某种理论分布所作的假设检验,即根据样本的频数分布来推断总体的分布。一、χ2检验的定义χ2检验与测量数据假设检验的区别(1)
测量数据的假设检验,其数据属于连续变量,而χ2检验的数据属于点计而来的间断变量。
测量数据所来自的总体要求呈正态分布,而χ2检验的数据所来自的总体分布是未知的。χ2检验与测量数据假设检验的区别(2)
测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验,而χ2
检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。χ2检验与测量数据假设检验的区别(3)二、χ2检验与连续型资料假设检验的区别对总体参数或几个总体参数之差不是对总体参数的检验,而是对总体分布的假设检验正态分布总体分布是未知的连续型资料离散型资料检验对象总体数据资料连续型资料假设检验χ2
检验三、χ2检验的用途适合性检验独立性检验同质性检验适合性检验
是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。独立性检验在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2
检验。同质性检验第二节:χ2检验的原理与方法χ2检验的基本原理χ2检验统计量的基本形式χ2检验的基本步骤χ2检验的注意事项
χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时,χ2值就为0,表明理论值完全符合。原理理论值观测值ⅠⅡχ2检验统计量的基本形式χ2=∑(Oi-Ei)2
EiO--实际观察的频数(observationalfrequency)E--无效假设下的期望频数(expectationfrequency)性别观察值(O)理论值(E)O-E公母428448438438-10+10合计8768760876只羔羊性别调察抽样误差?实质性变化?
判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。性别观察值(O)理论值(E)O-E公母428448438438-10+10合计876876羔羊性别观察值与理论值
由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。0为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算:∑(O-E)2O--实际观察的频数E--无效假设下的期望频数羔羊性别观测值与理论值性别观测值(O)理论值(E)O-E(O-E)2
公母428448438438-10+10100100合计8768760
值越大,观测值与理论值相差也就越大,反之越小。200元70元奖学金一等三等10元10元实际得到190元实际得到60元谁的贡献大?5%14%这两组观测值与理论值的偏离程度是不相同的两组差数虽然相同,但其差数占理论值的比重不同。等级观测值(O)理论(E)O-E(O-E)2一等三等1906020070-10-10100100
为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2
的比重,最后将各组求和,这个总和就是χ2
。羔羊性别观测值与理论值性别观测值(O)理论值(E)O-E(O-E)2/E公母428448438438-10+100.22830.2283合计87687600.4566χ2=∑(Oi-Ei)2
Ei
χ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。χ2值的特点可加性非负值随O和E而变化χ2=∑(Oi-Ei)2
Ei
χ2值与概率P成反比,χ2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致;
χ2越大,P值越小,说明两者之差越大,样本分布与假设理论分布越不一致。观测值与理论值的差异由抽样误差引起,即观测值=理论值。同时给出相就的备择假设HA
:观测值与理论值的差值不等于0,即观测值≠理论值一般确定为0.05或0.011.提出无效假设H0基本步骤2.确定显著水平α3.计算样本的χ2值4.进行统计推断χ2
<χ2αP>αχ2
>χ2αP<αH0HAH0HA1、任何一组的理论次数Ei都必须大于5,如果Ei≤5,则需要合并理论组或增大样本容量以满足Ei
>52、在自由度=1时,需进行连续性矫正,其矫正的χ2c为:χ2=∑(Oi-Ei-
0.5
)2
Eiχ2检验的注意事项χ2分布是连续型变量的分布,每个不同的自由度都有一个相应的χ2分布曲线,所以其分布是一组曲线。
由于检验的对象——次数资料是间断性的,而χ2分布是连续型的,检验计算所得的χ2值只是近似地服从χ2分布,所以应用连续型的χ2分布的概率检验间断性资料所得的χ2值就有一定的偏差。
由次数资料算得的χ2均有偏大的趋势,即概率偏低。当df=1,尤其是小样本时,必须作连续性矫正。χ2c
=∑(Oi-Ei-
0.5
)2
Ei比较观测数与理论数是否相符合的假设检验。适合性检验定义第三节:适合性检验用途遗传学中用以检验实际结果是否符合遗传规律样本的分布与理论分布是否相等自由组合定律
适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束,故df=n-1孟德尔分离规律体色青灰色红色总数F2观测尾数1503991602鲤鱼遗传试验F2观测结果(1)
H0:鲤鱼体色F2分离符合3:1比率;
HA:鲤鱼体色F2分离不符合3:1比率;
(2)取显著水平α=0.05(3)计算统计数χ2
:df=k-1=2-1=1在无效假设H0正确的前提下,青灰色的理论数为:Ei
=1602×3/4=1201.5红色理论数为:
Ei
=1602×1/4=400.5需要连续性校正χ2=∑(Oi-Ei-
0.5
)2
Eii=12=+(1503-1201.5
-
0.5
)2
1201.5(99-400.5
-
0.5
)2
400.5=75.41+226.22=301.63(4)查χ2值表,当df=1时,χ20.05
=3.84。现实得χ2c
=301.63>χ20.05
,故应否定H0
,接受HA
,即认为鲤鱼体色F2分离不符合3:1比率。
在遗传学中,有许多显、隐性比率可以划分为两组的资料,如欲测其与某种理论比率的适合性,则χ2值可用下表中的简式进行计算:χ2计算公式理论比率(显性:隐性)检验两组资料与某种理论比率符合度的χ2值公式1:12:13:1r:m大豆花色遗传试验F2观测结果28981208F2观测株数总数花色例(1)H0
:大豆花色F2分离符合3:1比率;
HA
:大豆花色F2分离不符合3:1比率;(2)取显著水平α
=0.05(3)计算统计数χ2值:χ2<χ20.05(4)查值表,进行推断接受H0
,即大豆花色F2分离符合3:1比率df=1P>0.05
对于资料组数多于两组的值,还可以通过下面简式进行计算:Oi
-第i组的实际观测数
pi
-第i组的理论比率
n-总次数
F2代,共556粒31510110832豌豆?此结果是否符合自由组合规律根据自由组合规律,理论分离比为:豌豆杂交实验F2分离结果黄圆黄皱绿圆绿皱实际观测数O理论频数P理论数EO-E(O-E)2/E
3159/16312.752.250.0161013/16104.25-3.250.1011083/16104.253.750.135321/1634.75-2.750.218方法一(1)H0
:豌豆F2分离符合9:3:3:1的自由组合规律;
HA
:豌豆F2分离不符合9:3:3:1的自由组合规律;(2)取显著水平α
=0.05(3)计算统计数χ2值:χ2
=0.016+0.101+0.135+0.218=0.470(4)查值表,进行推断:df=4-1=3χ2<χ20.05P>0.05接受H0
,即豌豆F2分离符合9:3:3:1的自由组合规律。方法二31510110832χ2
=0.016+0.101+0.135+0.218=0.470第四节:独立性检验独立性检验的定义2×2列联表的独立性检验2×c列联表的独立性检验独立性检验(independencetest)又叫列联表(contigencytable)χ2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。(一)2×2列联表的独立性检验
设A,B是一个随机试验中的两个事件,其中A可能出现r1
、r2个结果,B可能出现c1、c2个结果,两因子相互作用形成4格数,分别以O11
、O12、O21
、O22表示,下表是2×2列联表的一般形式
行列c1c2总和r1r2O11O21O12O22R1=O11+O12R2=O21+O22总和C1=O11+O21C2=O12+O22T2×2列联表的一般形式有无关系?——直观判断
独立性检验患病未患病合计吸烟37183220不吸烟21274295合计58457515患病未患病合计(n)吸烟16.82%83.18%100%(220)不吸烟7.12%92.88%100%(295)结论:吸烟者与不吸烟者患病的可能性存在差异检验步骤1.提出无效假设H0
:事件A和事件B无关,同时给出HA
:事件A和事件B有关联关系;2.给出显著水平α3.依据H0
,可以推算出理论数,计算χ2值4.确定自由度,df=(r-1)(c-1),进行推断。H0HAH0HAχ2
>χ2αP<αP>αχ2
<χ2α给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表1.H0
:给药方式与给药效果相互独立。HA
:给药方式与给药效果有关联。2.给出显著水平α=0.053.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B)口服与有效同时出现的理论频率=口服频率×有效频率,即P(AB)=P(A)P(B)=98/193×122/193理论频数Ei=理论频率×总数=(98/193×122/193)×193=(98×122)/193=61.95即Eij=Ri×Cj/T=行总数×列总数/总数E11=R1×C1/T=61.95E12=R1×C2/T=36.05E21=R2×C1/T=60.05E22=R2×C2/T=34.95给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正:给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)4.查χ2表,当df=1时,χ20.05
=3.841,而χ2c=0.863<χ20.05
,P>0.05,应接受H0
,拒绝HA
,说明给药方式与给药效果相互独立.2×2列联表的χ2检验可利用以下简式而不必计算理论次数:T/2-为矫正数给药方式有效无效总数口服注射5864403198(R1)95(R2)总数122(C1)71(C2)193(T)(二)2×c列联表的独立性检验(选学)
行列12C合计12O11O21O12O
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省泉州市惠安科山中学2026届八年级物理第一学期期末调研模拟试题含解析
- 2026届山东省峄城区底阁镇中学物理八上期末质量跟踪监视模拟试题含解析
- 2026届四川省绵阳富乐园际学校八年级物理第一学期期末预测试题含解析
- 2026届广东省湛江市名校物理八上期末经典模拟试题含解析
- 2026届山东省济宁市济宁院附属中学物理八上期末联考模拟试题含解析
- 内蒙古包头市、巴彦淖尔市2026届物理八上期末预测试题含解析
- 智能调度系统在VIP接送机中的应用与效益分析报告
- 机场智能分拨与物流行业融合案例分析报告
- 精准播种者2025年农业科技园区产业政策创新研究报告
- 2026届四川营山化育中学八年级物理第一学期期末学业水平测试试题含解析
- 2025年成人高考政治试题及答案
- 2025上海市食品药品包装材料测试所公开招聘笔试参考题库附答案解析
- Unit 1 What's he like Part B Read and write英语教学课件
- 湘少版(三起)(2024)三年级上册英语全册教案
- 小屁孩日记阅读课件
- 医务人员职业道德准则(2025年版)全文培训课件
- 2025年新生儿误吸(呛奶)应急预案演练脚本
- 2025年职业指导师中级专业能力试卷:就业指导实务操作技能
- 产业园区建设汇报
- 《老年人生活能力康复训练》养老服务与管理专业全套教学课件
- 2025-2030中国间二硝基苯行业现状态势及前景趋势预测报告
评论
0/150
提交评论