




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 某医疗机构为了了解呼吸道疾病与吸某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调烟是否有关,进行了一次抽样调查,共调查了查了515515个成年人,其中吸烟者个成年人,其中吸烟者220220人,不人,不吸烟者吸烟者295295人,调查结果是:吸烟的人,调查结果是:吸烟的220220人人中中3737人患人患病病, 183183人不患人不患病病;不吸烟的;不吸烟的295295人中人中2121人患人患病病, 274274人不患人不患病病。 根据这些数据能否断定:患病与根据这些数据能否断定:患病与吸烟有关吗?吸烟有关吗?患病患病不患病不患病总计总计吸烟吸烟3737183183220
2、220不吸烟不吸烟2121274274295295总计总计5858457457515515为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:2 22 2列联表列联表注:什么叫列联表?注:什么叫列联表?列联表列联表:列出两个分类变量的频数统计表列出两个分类变量的频数统计表分类变量:变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量.注:分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别如性别变量,只取男、女两个值,商品的等级变量只取一级、二级,等等. 性别有两种:性别变量,只取男、女两个值男、女患病患病不患病不患病总计总计吸烟吸烟37
3、37183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515为了研究这个问题,我们将上述问题用下表表示:为了研究这个问题,我们将上述问题用下表表示:2 22 2列联表列联表在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 21/295 7.12%21/295 7.12%37/22016.82%37/22016.82%上述结论能说明吸烟与患病有关吗?能有多大把上述结论能说明吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?握认为吸烟与患病有关呢?不患病患病1)通过图形直观判断通过图形直观判断三维柱
4、三维柱状图状图不患病患病2) 通过图形直观判断通过图形直观判断二维条二维条形图形图问题1:吸烟与不吸烟,患病的可能性的大小是否有差异? 吸烟者和不吸烟者患吸烟者和不吸烟者患呼吸道疾病呼吸道疾病的可能性存在差的可能性存在差异,吸烟者患呼吸道疾病的可能性大异,吸烟者患呼吸道疾病的可能性大问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?问题3:能否用数量刻画出“有关”的程度?初步结论:初步结论: 有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。笛卡尔能否用数量来刻画能否用数量来刻画“有关有关”程度程度患病患病不患病不患病总计总计吸烟吸烟不吸烟不吸烟总
5、计总计如果“吸烟与患病没有关系”,则在吸烟者中患病的比例应该与不吸烟者中相应的比例差不多,即0aca cdc abadbcabcd因此|越小,说明吸烟与患病之间关系越弱; | 越大,说明吸烟与患病之间关系越强.为便于研究,用字母代替数据,得为便于研究,用字母代替数据,得22列联表列联表患病患病不患病不患病总计总计吸烟吸烟不吸烟不吸烟总计总计列出列出2 22 2列联表列联表 我们不妨作出相反的假设,我们不妨作出相反的假设,H H0 0:吸烟和患病之间没有关系:吸烟和患病之间没有关系 即即H H0 0:P(AB)P(AB)P(A)P(B) P(A)P(B) 其中其中A A为某人吸烟,为某人吸烟,B
6、 B为某人患病为某人患病 设设n na ab bc cd d 为为样本量样本量 则则P(A) P(A) nba P(B) P(B) nca 故故P(AB) P(AB) ncanba吸烟且患病人数吸烟且患病人数ncanbanABPn)(吸烟但未患病人数吸烟但未患病人数ndbnbanBAPn)(不吸烟但患病人数不吸烟但患病人数ncandcnBAPn)(不吸烟且未患病人数不吸烟且未患病人数ndbndcnBAPn)(怎样描述实际观测值与预期值的差异呢?怎样描述实际观测值与预期值的差异呢?统计学中,为度量观测值与预期值的差值统计学中,为度量观测值与预期值的差值皮尔逊(皮尔逊(K.Pearson)引进卡方
7、统计量)引进卡方统计量ncanbanncanbanaK22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)()()()()(22dcbadbcabcadnK化简得2( 2 2观观测测值值预预期期值值) )用用卡卡方方统统计计量量: :K K预预期期值值来来刻刻画画实实际际观观测测值值与与估估计计值值的的差差异异. .即即卡尔.皮尔逊英国著名的应用数学家 、生物统计学家、优生学家和科学哲学家.若H0成立,即“吸烟与患病没有关系”,则 应很小2K 独立性检验通过公式计算通过公式计算863.114575829522018321274375
8、1522KH H0 0: 吸烟吸烟和和患病患病之间没有关系之间没有关系解解:这个值是不是很大呢?在H0成立的情况下,统计学家估算出如下的概率: H0成立可能性只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为“吸烟与患病有关系”01. 0)635. 6(2KP 即在H0成立的情况下, 的值大于6.635的概率非常小,近似于0.01.2KP( k0) 0.50 0.400.250.150.100.050.025 0.010 0.005 0.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.8282K 独立性
9、检验的思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立. 在该假设下我们构造的随机变量 应该很小,如果由观测数据计算得到的 的观测值很大,则在一定程度上说明假设不合理.2K2K 独立性检验第一步:第一步:H H0 0: 吸烟吸烟和和患病患病之间没有关系之间没有关系 通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患病有关吸烟与患病有关结论的可靠结论的可靠程度如何?程度如何? 患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+
10、db+da+b+c+da+b+c+d第二步:列出第二步:列出2 22 2列联表列联表 用用K K2 2统计量研究这统计量研究这类问题的方法类问题的方法步骤步骤第三步:引入一个随机变量:第三步:引入一个随机变量:卡方统计量卡方统计量第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。dcban其中 22na db cKabcdacbdP( k0) 0.50 0.400.250.150.100.050.025 0.010 0.005 0.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.8282KP( k0) 0.
11、50 0.400.250.150.100.050.025 0.010 0.0050.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828828.102K635. 62K706. 22K706. 22K0.1%0.1%把握认把握认为为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认为为A A与与B B有关有关99%99%把握认把握认为为A A与与B B有关有关90%90%把握认把握认为为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有
12、充分的依据显示没有充分的依据显示A A与与B B有关,有关,但也不能显示但也不能显示A A与与B B无关无关例如例如:2K反证法原理与假设检验原理反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665名男性病人名男性病人中,有中,有214人秃顶,而另外人秃顶,而另外772名不是因为患心脏病名不是因为患心脏病而住院的男性病人中有而住院的男性病人中有175人秃顶。利用图形判断人秃顶。利用图形判断秃顶与患心脏病是否有关系。能
13、够以秃顶与患心脏病是否有关系。能够以99%的把握认的把握认为秃顶与患心脏病有关系吗?为什么?为秃顶与患心脏病有关系吗?为什么?例1患心脏病患心脏病换其他病换其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 底面副对角线上两个柱体高度的乘积要大一些,因底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为此可以在某种程度上认为“秃顶与患心脏病有关秃顶与患心脏病有关”21437 (214 597 175 451)16.3736.635389 1048 665 772k所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心
14、脏病有关”因为这组数据来因为这组数据来自被调查的医院,自被调查的医院,因此此结论只是因此此结论只是用于该医院住院用于该医院住院的病人群体的病人群体例例2 为了考察高中生的性别与是否喜欢数学课为了考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随即程之间的关系,在某城市的某校高中生中随即抽取抽取300名学生,得到如下列联表:名学生,得到如下列联表:由表中数据计算得到由表中数据计算得到 的观值的观值 。能。能够以够以95%的把握认为高中生的性别与是否喜欢数的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?学课程之间有关系吗?为什么?喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计722283002K4.514k 222(3.841)0.054.5143.841P KKk解:在假设“性别与是否喜欢数学之间没有关系”的前提下,K 应该很小,并且 而 的观测值超过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第14课 光荣的少先队 课件-2024-2025学年道德与法治一年级下册统编版
- 酒店培训感想心得体会模版
- 医院庭院绿化的生态效益与社会价值
- 周围型肺癌的临床护理
- 黄绿卡通动物交通安全模板
- 医疗大数据与健康保险的联动发展
- 婴儿脐疝的临床护理
- 区块链技术助力文字作品版权保护
- 健身房加设施合同范例
- 安全管理知识培训
- 高端定制店面管理制度
- 多模态自适应技术应用于钢材表面缺陷检测的研究与分析
- 无人机配送技术发展-全面剖析
- 广东省江门市2025届高三下学期一模化学试题(原卷版+解析版)
- 2025年上半年广州市海珠区海幢街道招考康园工疗站工作人员易考易错模拟试题(共500题)试卷后附参考答案
- 预设理论在人工智能中的应用-深度研究
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿
- CNAS-CL01:2018 检测和校准实验室能力认可准则
- 人教PEP版英语五年级下册Recycle 1单元教学设计(2课时教案)
- 中国产教融合行业市场发展现状及前景趋势与投资分析研究报告(2024-2030版)
- 2025年山西焦煤集团有限责任公司招聘笔试参考题库含答案解析
评论
0/150
提交评论