独立性检验课件_第1页
独立性检验课件_第2页
独立性检验课件_第3页
独立性检验课件_第4页
独立性检验课件_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1上节学习了回归分析的基本方法线性回归模型上节学习了回归分析的基本方法线性回归模型ybxae不同于一次函数不同于一次函数ybxa,含有,含有_,其中,其中x为为_,y为为_.随机误差随机误差e解释变量解释变量预报变量预报变量样本点的中心样本点的中心残差平方和残差平方和222121,:1.niiiniiyyRRyy相关指数来刻画回归的效果 公式是数学选修数学选修1-21-2(第一课时)(第一课时)学习目标学习目标 1.会列会列22列联表,会画等高条形图列联表,会画等高条形图2.会从会从22列联表,等高条形图中直观列联表,等高条形图中直观的判断出两个分类变量之间是否有关?的判断出两个分类变量之间是

2、否有关?3.了解独立性检验的基本思想和步骤了解独立性检验的基本思想和步骤研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。定量变量:体重、身高、温度、考试成绩等等。变量 分类变量:性别、是否吸烟、是否患肺癌、变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。宗教信仰、国籍等等。两种变量:独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量的之间是否有关系分类变量的之间是否有关系2 2定量变量回归分析(画散点图、相关系数r、定量变量回归分析(画散点图、相关系数r、变量 相关指数R 、残差分析)变

3、量 相关指数R 、残差分析)分类变量分类变量独立性检验独立性检验2 2定量变量回归分析(画散点图、相关系数r、定量变量回归分析(画散点图、相关系数r、变量 相关指数R 、残差分析)变量 相关指数R 、残差分析)分类变量分类变量独立性检验独立性检验 某医疗机构为了了解呼吸道疾病与吸某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调烟是否有关,进行了一次抽样调查,共调查了查了515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不人,不吸烟者吸烟者295295人,调查结果是:吸烟的人,调查结果是:吸烟的220220人人中中3737人患人患病病, 183183人不患人

4、不患病病;不吸烟的;不吸烟的295295人中人中2121人患人患病病, 274274人不患人不患病病。 根据这些数据能否断定:患根据这些数据能否断定:患病病与与吸烟有关吗?吸烟有关吗?患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 7.12%7.12%16.82%16.82% 上述结论能说明吸烟与患病有关吗?上

5、述结论能说明吸烟与患病有关吗?列列2 22 2列列联表联表不患病不患病比例比例患病患病比例比例吸烟者与不吸烟者患病的可能性存在差异。吸烟者与不吸烟者患病的可能性存在差异。例例1:随着:随着新还珠格格新还珠格格的热播,又掀起了一的热播,又掀起了一场场“还珠热还珠热”。为了了解喜爱看。为了了解喜爱看新还珠格格新还珠格格是是否与性别有关,小欣随机抽查了否与性别有关,小欣随机抽查了140名男性和名男性和160名女性,调查发现,男性和女性中分别有名女性,调查发现,男性和女性中分别有80人和人和120人喜爱看,其余人不喜爱看。人喜爱看,其余人不喜爱看。(2)利用图形判断性别与是否喜爱看)利用图形判断性别与

6、是否喜爱看新新 还珠格格还珠格格有关?有关?(1)根据以上数据建立一个)根据以上数据建立一个22的列联表;的列联表; 有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。笛卡尔能否用数量来刻画能否用数量来刻画“有关有关”程度程度患病不患病总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d 独立性检验第一步:第一步:H H0 0: 吸烟吸烟和和患病患病之间没有关系之间没有关系 患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二

7、步:列出2 22 2列联表列联表 第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量 22na db cKabcdacbd第四步:查对临界值表第四步:查对临界值表( (教材教材P13),P13),作出判断。作出判断。 利利用独立性检验来考察两个分类变量是否有关系,用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度能较精确地给出这种判断的可靠程度. .具体作法是:具体作法是:(1 1)根据实际问题需要的可信程度确定临界值)根据实际问题需要的可信程度确定临界值k k0 0;(2)由观测数据计算得到随机变量)由观测数据计算得到随机变量K2的观测值的观测值

8、k;(3)如果)如果k6.635,就以,就以 1-P(K26.635)100%的的把握认为把握认为“X与与Y有关系有关系”;否则就说样本观测数据没;否则就说样本观测数据没有提供有提供“X与与Y有关系有关系”的充分证据的充分证据.10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.502()P Kk(1 1)如果)如果k10.828k10.828,就有,就有99.9%99.9%的把握认为的把握认为“X X与与Y Y有关系有关系”;(2 2)如果)如果k7.879

9、k7.879,就有,就有99.5%99.5%的把握认为的把握认为“X X与与Y Y有关系有关系”;(3 3)如果)如果k6.635k6.635,就有,就有99%99%的把握认为的把握认为“X X与与Y Y有关系有关系”;(4 4)如果)如果k5.024k5.024,就有,就有97.5%97.5%的把握认为的把握认为“X X与与Y Y有关系有关系”;(5 5)如果)如果k3.841k3.841,就有,就有95%95%的把握认为的把握认为“X X与与Y Y有关系有关系”;(6 6)如果)如果k2.706k2.706,就有,就有90%90%的把握认为的把握认为“X X与与Y Y有关系有关系”;(7

10、7)如果)如果k=2.706k=2.706,就认为没有充分的证据显示,就认为没有充分的证据显示 “ “X X与与Y Y有关系有关系”. .临界值临界值例例2 在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665名男性病人中,有名男性病人中,有214人秃顶;而另外人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有名不是因为患心脏病而住院的男性病人中有175人秃顶。利用独立性检验方法判断秃顶与患心脏病是否有关人秃顶。利用独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:解:根据题目所

11、给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 根据列联表的数据,得到根据列联表的数据,得到221437 (214 597 175 451)16.3736.635.389 1048 665 772K所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”。 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计72228300解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下K2应该很小,并且例3.性别与喜欢数学课 由表中数据计算K2的观测值k 4.513。在多大程度上可以认为高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论