版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 人教版高中数学 独立性检验与回归分析_1.了解变量间的相关关系,能根据给出的线性回归方程系数建立线性回归方程.2.了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用.3.了解回归分析的基本思想、方法及其简单应用1.独立性检验c(1)概念:用 2 统计量研究独立性问题的检验的方法称为独立性检验.(2)mn 列联表指有 m 行 n 列的列联表n(ad - bc)2(3)必备公式c =2(a + c)(b + d)(a + b)(c + d)c2. 2 统计量中的四个临界值c经过对 2 统计量分布的研究,已经得到了四个经常用到的临界值:2.706、3.841、6.635、10.82
2、8.cc由 22 列联表计算出 2 ,然后与相应的临界值进行比较,当 2 2.706 时,有 90%的把握说事cc件 a 与 b 有关.当 2 3.841 时,有 95%的把握说事件 a 与 b 有关.当 2 6.635 时,有 99%的把握说cc事件 a 与 b 有关.当 2 10.828 时 ,有 99.9%的把握说事件 a 与 b 有关.当 2 2.706 时,认为事件a与 b 是无关的.3.回归分析= a + bx +(1)线性回归模型是指方程 ye ,其中a bx 称为确定性函数,e 称为随机误差.1 = +(2)线性回归方程是指直线方程 y a bx ,其中回归截距a 、回归系数b
3、 公式如下:nx y - nx yii, a - bx= y .b =i=1nx - n(x)22ii=1n(x - x)( y - y)ii(3)参数 r 检验线性相关的程度,计算公式为 r=,i=1 nn(x - x)2 (y - y)2iii=1i=1nx y - nx yxy - x yii即 r=;化简后 r=,其中 s 表示数据 y (i=1,2,i=1s sxyinn( x - n(x) )( y - n(y) )2222yiii=1i=1n)的标准差,这个 r 称为 y 与 x 的样本相关系数,简称相关系数,其中-1r1.若 r0,则 x 与 y 是正相关,若 r 3.841,
4、c272228122178所以我们可以拒绝 h .从而有 95%的把握认为性别与是否喜欢数学课程有关系.0练习 1:为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟237子女吸烟子女不吸烟合计8367852260512001520915用独立性检验方法判断父母吸烟对子女是否吸烟有影响.2 解析 提出假设:父母吸烟对子女是否吸烟没有影响,由列联表中的数据得到:h01520(237522 -83678)29156053201200= 32.52 10.828.c2所以有 99.9%的把握认为:父母吸烟对子女是否吸烟有影响.类型二.变量间的相关关系及线性回归方程例
5、2:下列关系中,是带有随机性相关关系的是_.正方形的边长与面积之间的关系;水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;降雪量与交通事故的发生率之间的关系.答案 解析 两变量之间的关系有两种:函数关系与带有随机性的相关关系.正方形的边长与面积之间的关系是函数关系.水稻产量与施肥量之间不是严格的函数关系,但是具有相关性,因而是相关关系.人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具有相关关系.降雪量与交通事故的发生率之间具有相关关系.例 3:某工业部门进行一项研究,分析该部门的产量与生产费用的关系,从这个工业部门内随机
6、抽选了 10 个企业作样本,资料如下表:40424855657988100165120190140185生产费用 (y 千克) 150 140 160 170 150 162根据表格求出回归直线方程.18577710165710= 77.7, y =165.7,解析 x101010x = 70903, y =277119, x y =132938,22iiiii=1i=1i=1132938-1077.7165.770903-1077.72b = 0.398, a =165.7-0.39777.7 134.8.= 0.398x +134.8.回归直线方程为 y练习 1:下列两个变量之间的关系哪个
7、不是函数关系()(a)角度和它的余弦值(b)正方形边长和面积(c)正 n 边形的边数和顶点角度之和(d)人的年龄和身高答案 d解析 人的身高与年龄只具有相关性类型三.相关检验与回归分析例 3:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系.从这个工业部门内随机抽选了 10 个企业作样本,有如下资料:产量 x(千克)生产费用 y(千 150 140 160 170 150克)完成下列问题:40424855657988100165120190140185162 1853 (1)计算 x 与 y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验; = + a .(3)设线性
8、回归方程为 y bx , 求系数a,b777165710= 77.7,y =165.7,解析 由表可计算得: x10101010x = 70903, y =277119, x y =132938.22iiiii=1i=1i=110x y -10xyii= 0.808.(1) ri=121010( x -10(x) )( y -10(y) )222iii=1i=1r =0.632,所以认为 x 与 y 之间具有线性相关关系 .(3)代入公式得 b 0.05(2)因为 0.808 0.398,a 134.8.练习 1:某运动员训练次数与运动成绩之间的数据关系如下:次数(x) 30成绩(y) 303
9、334353737393942444646485051试预测该运动员训练 47 次以及 55 次的成绩.888= 39.25, y = 40.875, x =12656, y = 13731, x y =13180,解析 (1)可求得 x22iiiii=1i=1i=188(x - x)(y - y)x y -8xyiiiib =1.0415,所以i=1i=188(x - x)2x -8(x)22iii=1i=1 = - = -0.00386,a y bx =所以回归直线方程为 y 1.0415x 0.00386.-(2)计算相关系数8x y -8xyii=,r =0.707,0.05将上述数据
10、代入 r得 r0.992704,查表可知i=1288( x -8(x) )( y -8(y) )222iii=1i=1 r ,0.05而 r故 y 与 x 之间存在显著的线性相关关系. =(3)作出预报:由上述分析可知,我们可用回归方程y 1.0415x-0.00386 作为该运动员成绩的预 测值,将 x=47 和 x=55 分别代入该方程得 y 49 和 y 57.故预测该运动员训练 47 次和 55 次成绩4 分别为 49 和 57.1.在调查中学生近视情况中,某校男生 150 名中有 80 名近视,女生 140 名中有 70 名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有
11、说服力()a.期望与方差答案 cb.排列与组合c.独立性检验d.概率c统计量的研究,得到了若干临界值,当c2.706 时,我们认为事件 a 与 b(2.通过对)22a.有 90%的把握认为 a 与 b 有关系b.有 95%的把握认为 a 与 b 有关系c.没有充分理由说明事件 a 与 b 有关系d.不能确定答案 cc3.下列关于 的说法中正确的是()2c 在任何相互独立问题中都可以用来检验有关还是无关a.2cb. 的值越大,两个事件的相关性就越大2cc. 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合2n(ad -bc)cc=cd. 的观测值 的计算公式为 222(a +
12、b)(c + d)(a + c)(b + d)答案 c4.下列两个变量之间的关系是相关关系的是()a.角度和它的余弦值c.正 n 边形的边数和顶点数答案 db.正方形边长和面积d.人的年龄和身高 = +a5.由一组样本数据 (x , y ),(x , y ), ,( x , y ) 得到的回归方程为 y bx , 下面说法不正确的1122nn是() = + aa.直线 y bx必经过点(x, y) = + ab.直线 y bx至少经过点(x , y ),( x , y ), ,( x , y )中的一个点n1122nnx y - nxyii = + ac.直线 y bx的斜率为i=1nx -
13、n(x)22ii=1n = + a2) 是该坐,( x , y ) 的偏差平方和 y - (bx + ad.直线 y bx和各点 (x , y ),( x , y ),2112nniii=15 标平面上所有直线与这些点的偏差平方和中最小的直线答案 b6.有甲、乙两个班级进行数学考试,按照大于等于85 分为优秀,85 分以下非优秀统计成绩,得到如下所示的列联表:优秀10非优秀总计甲班乙班合计bc3027已知在全部 105 人中随机抽取 1 人,成绩优秀的概率为 ,则下列说法正确的是()a列联表中 c 的值为 30,b 的值为 35b列联表中 c 的值为 15,b 的值为 50c根据列联表中的数据
14、,若按 97.5%的可靠性要求,能认为“成绩与班级有关系”d根据列联表中的数据,若按 97.5%的可靠性要求,不能认为“成绩与班级有关系”答案 c7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50 名学生,得到如下 22列联表:理科13男女720已知 p(k23.841)0.05,p(k25.024)0.025.50(1320107)2根据表中数据,得到 k24.844.23272030则认为选修文科与性别有关系出错的可能性为_答案 5%8.某数学老师身高 176cm,他爷爷、父亲和儿子的身高分别是 173cm、170cm 和 182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.答案 185_6 基础巩固1.(2014 重庆卷)已知变量 x 与 y 正相关,且由观测数据算得样本平均数x3,y3.5,则由该观测数据算得的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合肥市医疗器械检验检测中心有限公司2025年下半年第二批社会招聘备考题库及答案详解(夺冠系列)
- 2025年这个区所属事业单位公开招聘90人备考题库附答案详解
- 中海物业集团2026届管培生校园招聘备考题库有完整答案详解
- 2025年绵阳市事业单位公开选调工作人员25人备考题库及完整答案详解
- 2025年河北定向选调生招录683人备考题库(华东师范大学)及完整答案详解一套
- 国药东风总医院2026年招聘备考题库有完整答案详解
- 2025年台州学院编制外合同工招聘备考题库有答案详解
- 2025年西南计算机有限责任公司招聘18人备考题库及一套完整答案详解
- 2025年成都市投资促进中心公开招聘备考题库完整参考答案详解
- 2025年毕节市“优师备考题库”毕业生专项招聘306人备考题库及完整答案详解一套
- 机电安装安全施工方案
- 2025年郑州铁路职业技术学院单招职业技能考试题库含答案
- 宁德时代心理测试题及答案
- 电力调度数据网施工方案
- CNC夹具知识培训课件
- T-CPFIA 0015-2025 新型肥料命名与分类管理规范
- 新媒体文案写作教程(第二版)课件 项目四 微信公众号文案写作 课件
- 2025年中烟机械考试真题及答案
- 2.1地形导学案-八年级地理上学期人教版
- 结晶重结晶技术培训
- 2025年中国内地和香港特别行政区年度建造成本手册
评论
0/150
提交评论