已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1上节学习了回归分析的基本方法线性回归模型ybxae不同于一次函数ybxa,含有_,其中x为_,y为_.,随机误差e,解释变量,预报变量,样本点的中心,残差平方和,1、两个相关的概念,对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量,它们的取值一定是离散的,而且不同的取值仅表示个体所属的类别。,(1) 分类变量:,定量变量的取值一定是实数,它们的取值大小有特定的含义,不同取值之间的运算也有特定的含义。,(2)定量变量:,例如身高、体重、考试成绩等,张明的身高是180cm,李立的身高是175cm,说明张明比李立高180-175=5(cm)。,本节研究的是两个分类变量的独立性检验问题。,在日常生活中,我们常常关心分类变量的之间是否有关系,独立性检验,二.问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了 9965人,得到如下结果(单位:人),22列联表,思考:根据以上表格。能否断定吸烟对患肺癌有影响? 判断的标准是什么? 吸烟与不吸烟,患病的可能性的大小是否有差异?,吸烟与患肺癌列联表(列出两个分类变量的频数表):,0.54%,2.28%,根据统计分析的思想,用频率估计概率可知,吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大,方法1.用频率估计概率,方法2.通过图形直观判断,等高条形图,患肺癌比例,不患肺癌比例,由上述图形显然可以得到结论是:吸烟与患肺癌有关,思考:这种判断可靠吗?你能有多大把握认为“患病与吸烟有关”呢?,假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即,k大小的标准是什么呢?,独立性检验首先,假设结论不成立,即 H :两个分类变量没有关系 (在这种假设下k应该很小)其次,由观测数据计算K 的观测值k, (如果k很大,则在一定可信程度上说明H 不成 立,即两个分类变量之间有关系)最后,根据k的值判断假设是否成立,2,卡方临界值表:,(1)如果k10.828,就有99.9%的把握认为“X与Y有关系”;,(2)如果k7.879,就有99.5%的把握认为“X与Y有关系”;,(3)如果k6.635,就有99%的把握认为“X与Y有关系”;,(4)如果k5.024,就有97.5%的把握认为“X与Y有关系”;,(5)如果k3.841,就有95%的把握认为“X与Y有关系”;,(6)如果k2.706,就有90%的把握认为“X与Y有关系”;,(7)如果k=2.706,就认为没有充分的证据显示 “X与Y有关系”.,临界表,注:1)这种判断可能会犯错误,但是犯错误的概率不会超过0.001,这是个小概率事件,即我们有99.9的把握认为“吸 烟与患癌症有关系”,2)利用随机变量 来判断“两个分类变量有关系”的 方法称为这两个分类变量的独立性检验。,反证法原理与独立性检验原理,反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。,独立性检验原理: 在一个已知假设下,如果推出一个小概率事件发生,则推断这个假设不成立的可能性很大。,在判断两变量相关时,若K2的观测值k56.632,则P(K26.635)0.01和P(K210.828)0.001,哪种说法是正确的?提示:两种说法均正确P(K26.635)0.01的含义是:在犯错误的概率不超过0.01的前提下,认为两变量相关;而P(K210.828)0.001的含义是:在犯错误的概率不超过0.001的前提下,认为两变量相关,在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患肺病B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C、若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误D、以上三种说法都不对,c,在某医院,因为患心脏病而住院的665名病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。利用图形判断秃顶与患心脏病是否有关系。能够以99%的把握认为秃顶与患心脏病有关系吗?为什么?,例1,(1)等高条形图,从图中可以看出,秃顶样本中患心脏病的频率明显高于不秃顶样本中患心脏病的频率,因此可直观地认为秃顶与患心脏病有关系。,因此,在犯错误的概率不超过0.010的前提下认为“秃顶与患心脏病有关”,即有99%的把握认为“秃顶与患心脏病有关”。,(2)独立性检验法,独立性检验的一般步骤:(1)根据样本数据制成22列联表;(2)根据公式K2= 计算K2 的值;(3)查表比较K2与临界值的大小关系,作统计判断,例2如果K2的观测值k为8.654,可推断“X与Y有关”犯错误的概率不超过_答案0.005解析k8.6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广东医科大学附属医院第二批专业技术人员招聘133人笔试参考题库及答案解析
- 2026广东佛山市高明区选聘公办职业技术学校(含技工院校)正职1人考试备考题库及答案解析
- 2026年宣城北京师范大学宣城实验学校春季教师招聘笔试参考试题及答案解析
- 2026山东青岛平度市卫生健康系统“平选计划”校园选聘38人笔试参考题库及答案解析
- 2026年戒烟药物纳入医保目录可行性分析
- 2026年起重机司机(限桥式起重机)证模拟测试题及答案
- 2026江苏苏州市生物医药产业集团有限公司招聘2人考试备考题库及答案解析
- 2026年小学教师资格题库《综合素质》模拟试卷
- 法律职业资格复习题主观题测试复习题及详细答案
- 月护理质量监控体系构建
- 痫病中医护理方案
- 2026届山东省菏泽市曹县九年级数学第一学期期末综合测试试题含解析
- 实施指南(2025)《HG-T 4987-2016工业燃气 天然气为原料的增效燃气》
- 绿色农产品生产供应基地建设项目规划设计方案
- 亿纬锂能安全培训课件
- 收费站票款安全培训课件
- 2025年社会工作专业题库- 社会工作专业的博士研究生招生政策
- 《汽车拆装与调整》-项目12离合器片的更换-学生工单
- 2025年通城县事业单位招聘工作人员(330人)笔试备考试题及答案详解(考点梳理)
- 分子标记辅助育种优化
- 高原冷水鱼养殖可行性研究报告
评论
0/150
提交评论