版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1本章知识大串烧一、独立性检验(一)基础概念的梳理与理解71分类变量:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种像这样的变量的不同“值”表示个体所属的不同类别的变量称为分类变量例如性别变量其取值为男和女两种,吸烟变量其取值为吸烟与不吸烟两种2两个分类变量:是否吸烟与是否患肺癌,性别男和女与是否喜欢数学课程等等,这些关系是我们所关心的32×2列联表:列出的两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2的样本频数表称为2×2列联表(如下表)y1y2总计x1Ababx2Cdcd总计acbdabcd(二)独立性检验的基本思想通过分析数据与图形,得出的估计是粗
2、略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法1基本思想与图形的联系假设两个分类变量是无关的,可知如下的比应差不多,即:|adbc|0.构造随机变量2(其中nabcd)(此公式如何记忆,其特点是什么?结合2×2列联表理解)显然所构造的随机变量与|adbc|的大小具有一致性2独立性检验的思想方法如果2的值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两分类变量是有关系的(称小概率事件发生);如果2的值较小,此时接受假设,说明两分
3、类变量是无关系的其思想方法类似于数学上的反证法3得到2的值常与以下几个临界值加以比较:如果2>2.706,就有90%的把握认为两分类变量X和Y有关系;如果2>3.841,就有95%的把握认为两分类变量X和Y有关系;如果2>6.635,就有99%的把握认为两分类变量X和Y有关系;如果2>10.828,就有99.9%的把握认为两分类变量X和Y有关;如果22.706,就认为没有充分的证据说明变量X和Y有关系像这种利用随机变量2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验二、回归分析1线性回归方程 x ,其中: , .(注: 主要方便计算,
4、其中(xi,yi)为样本数据,(,)为样本点的中心)公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势2样本相关系数的具体计算公式:r公式作用:反映两个变量之间线性相关关系的强弱当r的绝对值接近1时,表明两个变量的线性相关性越强;当r的绝对值接近0时,表明两个变量之间几乎不存在线性相关关系规定当|r|>r0.05时,认为两个变量有很强的线性相关关系公式联系:(1)由于分子与回归方程中的斜率 的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r>0时,两个变量正相关;当r<0时,两个变量负相关(2)常配合散点图判
5、断两个随机变量是否线性相关散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况相关系数r是从数上反映了两个随机变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据点的分布情况,准确可靠.2回归分析题目击破1基本概念函数关系是一种确定关系,而相关关系是一种非确定关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法例1下列变量之间的关系是相关关系的是_(1)正方形的边长与面积之间的关系;(2)水稻产量与施肥量之间的关系;(3)人的身高与年龄之间的关系;(4)降雪量与交通事故发生率
6、之间的关系分析两变量之间的关系有两种:函数关系和带有随机性的相关关系解析(1)是函数关系;(2)不是严格的函数关系,但是具有相关性,因而是相关关系;(3)既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;(4)降雪量与交通事故发生率之间具有相关关系答案(2)(4)点评该例主要考查对变量相关关系概念的掌握2线性回归方程设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,这条直线就叫做线性回归直线例2假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456维修费用y2.
7、23.85.56.57.0若由资料知y对x呈线性相关关系,试求:(1)线性回归方程 x;(2)估计使用年限10年时,维修费用是多少?分析因为y对x呈线性相关关系,所以可以用线性相关的方法解决问题解(1)制表i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x49162536904,5,x90,xiyi112.3于是有 1.23, 51.23×40.08.线性回归方程为 1.23x0.08.(2)当x10时, 1.23×100.0812.38(万元),即估计使用10年时维修费用约是12.38万元点评
8、已知y对x呈线性相关关系,无须进行相关性检验,否则,应首先进行相关性检验3非线性回归问题分析非线性回归问题的具体做法是:(1)若问题中已给出经验公式,这时可以将解释变量进行变换(换元),将变量的非线性关系转化为线性关系,将问题化为线性回归分析问题来解决(2)若问题中没有给出经验公式,需要我们画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图象作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决下面举例说明非线性回归分析问题的解法例3某地区对本地的企业进行了一次抽样调查,表中是这次抽查中所得到的各企业的人均资本x(单位:万元
9、)与人均产值y(单位:万元)的数据:人均资本x/万元345.56.578910.511.514人均产值y/万元4.124.678.6811.0113.0414.4317.5025.4626.6645.20(1)设y与x之间具有近似关系yaxb (a,b为常数),试根据表中数据估计a和b的值;(2)估计企业人均资本为16万元时的人均产值(精确到0.01)解(1)在yaxb的两边取常用对数,可得lg ylg ablg x,设lg yz,lg aA,lg xX,则zAbX.相关数据计算如下表所示.人均资本x/万元345.56.57人均产出y/万元4.124.678.6811.0113.04Xlg x
10、0.477 120.602 060.740 360.812 910.845 1zlg y0.614 90.669 320.938 521.041 791.115 28人均资本x/万元8910.511.514人均产出y/万元14.4317.5025.4626.6645.20Xlg x0.903 090.954 241.021 191.060 71.146 13zlg y1.159 271.243 041.405 861.425 861.655 14由公式(1)可得由lg 0.215 5,得 0.608 8,即a,b的估计值分别为0.608 8和1.567 7.(2)由(1)知 0.608 8x1
11、.567 7.样本数据及回归曲线的图形如图所示当x16时, 0.608 8×161.567 747.01(万元),故当企业人均资本为16万元时,人均产值约为47.01万元.3独立性检验思想的应用在日常生活中,经常会面临一些需要推断的问题在对这些问题作出推断时,我们不能仅凭主观臆断作出结论,需要通过试验来收集数据,并依据独立性检验思想做出合理的推断所谓独立性检验,就是根据采集样本的数据,利用公式计算2的值,比较与临界值的大小关系来判定事件X与Y是否有关的问题其基本步骤如下:(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量;(2)根据样本数据制作列联表;(3)计算统计量
12、2,并查表分析当2很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系下面举例说明独立性检验思想在解决实际问题中的应用例1水果富含各种维生素,不但有益于人体健康,还可起到养颜护肤的功效下表是一次调查所得的数据,试问:适量吃水果与皮肤好有关系吗?有多大的把握认为你的结论成立?皮肤好皮肤不好合计适量吃水果30224254不吃水果241 3551 379合计541 5791 633解假设“适量吃水果与皮肤好没有关系”,由题意可知:a30,b224,c24,d1 355,ab254,cd1 379,ac54,bd1 579,n1 633代入得到:268.033>10.828.
13、我们有99.9%的把握认为吃水果与皮肤好有关系点评该例我们有较大的把握认为结论成立,但我们所说的“吃水果与皮肤好有关系”指的都是统计上的关系,不要误认为里面存在因果关系,具体到某一个适量吃水果的人,并不能说明他一定有好的皮肤例2某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?分析首先由已知条件确定a、b、c、d、n的数值,再利用公式求出2的值,最后根据2的值分析结果解由题
14、目中表的数据可知:210.759.因为10.759>7.879,所以有99.5%的把握说员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的点评在列联表中注意事件的对应及有关值的确定,避免混乱;把计算出的2的值与临界值作比较,确定出“X与Y有关系”的把握例3为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,统计结果为:患慢性气管炎共有56人,患慢性气管炎且吸烟的有43人,未患慢性气管炎但吸烟的有162人根据调查统计结果,分析患慢性气管炎与吸烟在多大程度上有关系?解根据所给样本数据得到如下2×2列联表:患慢性气
15、管炎未患慢性气管炎总计吸烟43162205不吸烟13121134总计56283339由列联表可以粗略估计出:有吸烟者中,有20.98%的患慢性气管炎;在不吸烟者中,有9.70%的患慢性气管炎两个比例的值相差较大,所以结论“患慢性气管炎与吸烟有关”成立的可能性较大根据列联表中的数据,得到27.469>6.635.所以有99%的把握认为“患慢性气管炎与吸烟有关”点评对列联表的比例进行分析,可粗略地判断两个分类变量是否有关系通过计算随机变量2,可以比较精确地给出这种判断的可靠程度先收集数据,然后通过一些统计方法对数据进行科学的分析,这是我们用统计方法解决实际问题的基本策略.4巧解非线性回归问题
16、如果题目所给样本点的分布不呈带状分布,即两个变量不呈线性关系,那么,就不能直接利用线性回归方程建立两个变量之间的关系,这时我们可以把散点图和已经学过的各种函数,如幂函数、指数函数、对数函数、二次函数等作比较,挑选出与这些散点拟合最好的函数,然后利用变量置换,把非线性回归方程问题转化为线性回归方程的问题来解决,这是解决此类问题的通法,体现了转化思想1案例分析例一个昆虫的某项指标和温度有关,现收集了7组数据如下表:温度x/2345678某项指标y5.7906.8108.19910.00112.19014.79017.801试建立某项指标y关于温度x的回归模型,并判断你所建立的回归模型的拟合效果分析
17、根据表中的数据画出散点图,再由图设出相应的回归模型解画出散点图如图所示,样本点并没有分布在某个带状区域内,而是分布在某一条二次函数曲线yBx2A的周围令Xx2,则变换后的样本点应该分布在ybXa(bB,aA)的周围由已知数据可得变换后的样本数据表:X491625364964某项指标y5.7906.8108.19910.00112.19014.79017.801计算得到线性回归方程为 0.199 94X4.999 03.用x2替换X,得某项指标y关于温度x的回归方程 0.199 94x24.999 03.计算得r0.999 997,几乎为1,说明回归模型的拟合效果非常好点评本题是非线性回归分析问题,解决这类问题应该先画出散点图,把它与我们所学过的函数图像相对照,选择一种跟这些样本点拟合的最好的函数,然后采用适当的变量变换转化为线性回归分析问题,使之得以解决2知识拓展常见的非线性函数转换方法:(1)幂型函数yaxm(a为正数,x,y取正值)解决方案:对yaxm两边取常用对数,有lg ylg amlg x,令ulg y,vlg x,则原式可变为umvlg a,其中m,lg a为常数,该式表示u,v的线性函数(2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 蔬果创意活动方案策划(3篇)
- 计重施工方案(3篇)
- 迪庆火锅营销方案(3篇)
- 酒店消毒施工方案(3篇)
- 铝塑板圆形施工方案(3篇)
- 防滑处理施工方案(3篇)
- 2026山东德州市宁津县招聘教师23人备考题库(能力提升)附答案详解
- 飞天酒吧营销方案(3篇)
- 高端贴砖施工方案(3篇)
- 2026浙江杭州上城区城市建设投资集团有限公司下属子公司招聘工作人员2人备考题库含答案详解(模拟题)
- 基于血流动力学的冠状动脉搭桥手术精准规划研究
- 建筑施工现场消防培训
- 消防工程竣工验收流程及注意事项
- 广西事业单位e类考试真题及答案
- 2025及未来5年中国葛根提取物市场分析及竞争策略研究报告
- 2025山西晋城高平市选聘司法协理员12人笔试考试备考试题及答案解析
- project2024项目管理教程入门篇
- 2025年北京诚通证券股份有限公司社会招聘70人笔试题库历年考点版附带答案详解
- 社区篮球训练活动方案
- 绝缘电阻测量方法
- 脚手架工程监理实施细则(盘扣式脚手架)
评论
0/150
提交评论