




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章,统计案例,1.2独立性检验的基本思想及其初步应用,学习目标 1.了解独立性检验的基本思想、方法及其简单应用. 2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.,1,预习导学 挑战自我,点点落实,2,课堂讲义 重点难点,个个击破,3,当堂检测 当堂训练,体验成功,知识链接 1.举例说明什么是分类变量? 答变量的不同“值”表示个体所属的不同类别的变量称为分类变量,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.,2.什么是列联表?怎样从列联表判断两个分类变量有无关系? 答
2、一般地,假设两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,列出两个变量的频数表,称为列联表(如下图),|adbc|越小,说明两个分类变量x,y之间的关系越弱; |adbc|越大,说明两个分类变量x,y之间的关系越强.,预习导引 1.分类变量和列联表 (1)分类变量:变量的不同“值”表示个体所属的,像这样的变量称为分类变量. (2)列联表 定义:列出的两个分类变量的 称为列联表.,不同类别,频数表,22列联表 一般地,假设两个分类变量X和Y,它们的取值分别为 和 ,其样本频数列联表(也称为22列联表)为下表.,x1,x2,y1,y2,相互影响,频率特征,有关系,3.独立性检验 (1
3、)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.,(3)独立性检验的具体做法 根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定 k0.,临界值,利用公式计算随机变量K2的 k. 如果 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在 不超过的前提下不能推断“X与Y有关系”,或者在样本数据中 支持结论“X与Y有关系”.,观测值,kk0,犯错误的概率,没有,发现足够证据,要点一有关“相关的检验” 例1某校对学生课外活动进行调查,结果整理成下表: 用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“
4、喜欢体育还是文娱与性别有关系”?,解判断方法如下: 假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则K2应该很小. a21,b23,c6,d29,n79,,且P(K27.879)0.005即我们得到的K2的观测值k8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.,跟踪演练1为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,能在犯错误的概率不超过0.001的前提
5、下认为人的性别与患色盲有关系吗? 解由题意列出22列联表:,因为P(K210.828)0.001,且28.22510.828, 所以在犯错误的概率不超过0.001的前提下认为患色盲与人的性别有关系,男性患色盲的概率要比女性大得多.,要点二有关“无关的检验” 例2为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?,解列出22列联表,1.8711042.706, 可以认为学生选报文、理科与对外语的兴趣无关.,规律方法
6、运用独立性检验的方法: (1)列出22列联表,根据公式计算K2的观测值k. (2)比较k与k0的大小作出结论.,跟踪演练2在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕机的情况如下表所示,根据此资料是否能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机?,P(K23.841)0.05,且3.6893.841, 不能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机.,要点三独立性检验的基本思想 例3某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500
7、件,量其内径尺寸,结果如下表: 甲厂,乙厂,(1)试分别估计两个分厂生产的零件的优质品率; 解甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为 72%; 乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为 64%.,(2)由以上统计数据填下面22列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.,解,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.,跟踪演练3某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与
8、物理、化学、总分成绩优秀有关系?,注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.,解列出数学成绩与物理成绩的22列联表如下:,列出数学成绩与化学成绩的22列联表如下:,列出数学成绩与总分成绩的22列联表如下:,由上面的分析知,K2的观测值都大于10.828,说明在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀都有关系.,1.观察下列各图,其中两个分类变量x,y之间关系最强的是(),1,2,3,4,1,2,3,4,答案D,2.下面是一个22列联表:,1,2,3,4,则表中a,b处的值分别为() A.94,96 B.52,50 C.52,60
9、D.54,52 解析a2173,a52,ba852860.,1,2,3,4,C,1,2,3,4,3.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k3.841时,我们() A.在犯错误的概率不超过0.05的前提下可认为X与Y有关 B.在犯错误的概率不超过0.05的前提下可认为X与Y无关 C.在犯错误的概率不超过0.01的前提下可认为X与Y有关 D.没有充分理由说明事件X与Y有关系,A,4.根据下表计算:,1,2,3,4,1,2,3,4,K2的观测值k_(保留3位小数).,4.514,课堂小结 1.列联表与等高条形图 列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年重庆北碚区遴选教师笔试真题含答案
- 小学生树立目标班会课件
- 2025年7月施行《上市公司信息披露管理办法》
- 博弈论与企业管理课件
- 超声科疑难病例随访质量提升PDCA实践
- 新编现代教育技术基础
- 进入化工装置区安全培训
- 电子生物反馈与超声技术操作规范
- 2025年呼伦贝尔危化品资格证考试试题
- 2025年西藏出租车从业资格考什么
- 机床备件采购管理办法
- 建筑大厦工程技术难题与解决方案
- 汽车车身涂胶设计规范
- 2025年危险化学品安全作业特种作业操作证考试试卷备考攻略
- 2025年人工智能教育应用专业考试试题及答案
- 计算机网络学习基础教案课程
- MEMS扭转微镜力学特性的多维度剖析与前沿洞察
- 卷烟消费者行为分析及市场定位研究-洞察阐释
- 重庆市十八中学2025届七下数学期末教学质量检测模拟试题含解析
- 2025年会计职业入门会计基础知识深度解析与要点梳理
- 重症医学科健康宣教手册
评论
0/150
提交评论