




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
在学生就要走出校门的时候,班级工作仍要坚持德育先行,继续重视对学生进行爱国主义教育、集体主义教育、行为规范等的教育,认真落实学校、学工处的各项工作要求高中数学 第三章 统计案例整合学案 北师大版选修2-3知识建构综合应用专题一确定回归直线方程的策略准确确定回归直线方程,有利于进一步加强数学应用意识,培养运用所学知识解决实际问题的能力,正确地求出回归直线方程是本节的重点,现介绍求回归直线方程的三种方法.一、利用回归直线过定点确定回归直线方程 回归直线方程y=a+bx经过样本的中心(x,y)点,(x,y)称为样本点的中心,回归直线一定过此点.【例1】观察两个相关变量的如下数据:x-1-2-3-4-554321y-0.9-2-3.1-3.9-5.154.12.92.10.9则两个变量间的回归直线为( )A.y=0.5x-1 B.y=x C.y=2x+0.3 D.y=x+1答案:B二、利用公式求a,b,确定回归直线方程利用公式求回归直线方程时应注意以下几点:求b时利用公式b=,先求出=(x1+x2+x3+xn),=(y1+y2+y3+yn).再由a=-b求a的值,并写出回归直线方程.线性回归方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预报结果的偏差.回归直线方程y=a+bx中的b表示x每增加1个单位时y的变化量,而a表示y不随x的变化而变化的量.可以利用回归直线方程y=a+bx预报在x取某一个值时y的估计值.【例2】某5名学生的数学和化学成绩如下表:学科学生ABCDE数学成绩(x)8876736663化学成绩(y)7865716461(1)画出散点图;(2)求化学成绩y对数学成绩x的回归直线方程.解:(1)散点图略.(2) =(88+76+73+66+63)=73.2,=(78+65+71+64+61)=67.8.所以b=0.625.a=-b=67.8-0.62573.2=22.05.所以y对x的回归直线方程为y=0.625x+22.05.三、先判定相关性,再求回归直线方程 利用样本相关系数r来判断两个变量之间是否有线性相关关系时,可以依据若|r|0.75,我们认为有很强的线性相关关系,可以求回归直线方程,并可用求得的回归直线方程来预报变量的取值;若|r|0.75,则认为两个变量之间的线性相关关系并不强,这时求回归直线方程没有太大的实际价值.【例3】10名同学在高一和高二的数学成绩如下表:x74717268767367706574y76757170767965776272其中x为高一数学成绩,y为高二数学成绩.(1)y与x是否具有相关关系;(2)如果y与x具有线性相关关系,求回归直线方程.解:(1)由已知表格中的数据,求得=71,=72.3,r=0.78.由于0.780.75,所以y与x之间具有很强的线性相关关系.(2)y与x具有线性相关关系,设回归直线方程为:y=a+bx,则有b=1.22,a=-b=72.3-1.2271=-14.32.所以y关于x的回归直线方程为y=1.22x-14.32.专题二可线性化的回归分析一、曲线线性化的意义 曲线的线性化是曲线拟合的重要手段之一,对于某些非线性的资料可以通过简单的变量替换使之线性化,这样就可以按最小二乘法原理求出变换后变量的线性回归方程,在实际工作中常利用该线性回归方程绘制资料的标准工作曲线,同时根据需要可将此线性回归方程还原成曲线回归方程,实现对曲线的拟合.二、常用的非线性函数(一)指数函数y=aebx (1)对(1)式的两边取对数,得lny=lna+bx当b0时,y随着x的增大而增大;当b0时,y随着x的增大而减小.当以lny和x绘制的散点图呈直线趋势时,可考虑采用指数函数来描述y与x间的非线性关系,lna和b分别为截距与斜率.更一般的指数函数是y=aebx+k,式中的k为一常量,往往未知,应用时可试用不同的值.(二)对数函数y=a+blnx(x0)当b0时,y随着x的增大而增大,先快后慢;当b0时,y随着x的增大而减小,先快后慢,当以y和lnx绘制的散点图呈直线趋势时,可考虑采用对数函数描述y与x间的非线性关系,式中a和b分别为截距与斜率.更一般的对数函数是y=a+bln(x+k),式中的k为一常量,往往未知.(三)幂函数y=axb(a0,x0) (2)当b0时,y随着x的增大而增大;b0时,y随着x的增大而减小.对(2)式的两边取对数,得lny=lna+blnx,当以lny和lnx绘制的散点图呈直线趋势时,可考虑采用对数函数描述y与x间的非线性关系,式中lna和b分别为截距与斜率.更一般的幂函数是y=axb+k,式中的k为一常量,往往未知.以上三种模型是我们在日常生活中常遇到的曲线模型,掌握这三种模型,有利于我们研究更多的曲线拟合与回归分析的问题.三、利用线性回归拟合曲线的一般步骤(一)绘制散点图一般根据资料性质结合专业知识便可确定资料的曲线类型,不能确定时,可在方格坐标纸上绘制散点图,根据散点的分布,选择接近的、合适的曲线类型.(二)进行变量替换y=f(y),x=g(x)使变换后的两个变量呈线性相关关系.(三)按最小二乘法原理求线性回归方程及进行方差分析.(四)将线性化方程转换为关于原始变量x,y的回归方程.【例1】经过调查得到8个厂家同种类型的产品年新增加投资额和年利润额的数据资料,如表(1)所示.表(1) 八个厂家年新增投资额与年利润额数据资料厂家12345678年新增投资额X(万元)46101115171820年利润额Y(万元)6791017242326lnY1.79 1.95 2.20 2.30 2.83 3.18 3.14 3.26 图(2)给出了年利润额Y与年新增加投资额x的散点图,从图中可以清楚地看出来,随着x的增大Y也有明显的增加的趋势,因此两者之间存在着相关关系,但是这种相关关系与其用一条直线来描述倒不如用曲线描述更加合适,因此Y与x之间更加倾向于被认为是一种非线性关系.回归方程也需要用一些非线性函数来刻画,比如图(2) 年新增加投资额与年利润额数据的散点图图3 经过对数变换后的散点图Y=0e1x; 或者Y=0+1x2 等等.图(3)给出的是变量lnY与变量x的散点图,从中可以看出这些点基本上是围绕一条直线波动,说明变量lnY与x之间近似是一种线性关系,从而也印证了回归方程取形式的合理性. 同时,图(3)也提示我们一种求解回归方程的思路,即通过求解变量lnY对x的线性回归方程即可得到相应的式所表示的Y和x的回归方程,即在图(3)中的回归直线同图(2)中的曲线()是一致的.具体来说,首先对样本数据(xi,Yi),i=1,2,n作对数变换Zi=lnYi,i=1,2,n; 然后利用最小二乘法求出变量Z对x的回归方程Z=a0+a1x; 即图(3)中的直线方程,则相应的形如式的Y对x的回归方程是Y=ez=ea0ea1x; 即0=ea0,1=a1.利用表(1)中给出的数据,可以得到lnY对x的线性回归方程是Z=1.314+0.100x由此可得Y对x的回归方程是Y=3.720 5e0.100x; 如果采用形如式的抛物线型回归方程,容易看出,令=x2,式就是表示了变量Y对的线性回归方程:Y=0+1; 所以,对样本数据做变换i=xi2(i=1,2,n),利用(i,Yi)(i=1,2,n)求解出中的系数估计值0、1代入式即得到Y对x的回归方程.对表(1)中的数据计算结果为Y=4.413+0.057x2; 专题三独立性检验的基本方法判断结论成立的可能性的一般步骤:(1)假设两个分类变量X和Y没有关系;(2)给定一个显著水平,查表给出临界值;(3)计算2=(4)若2大于临界值,则认为x与y有关系,否则没有充分的理由说明这个结论不成立Y1Y2总计X1aba+bX2cdc+d总计a+cb+da+b+c+d【例1】某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取189名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189 对于人力资源部的研究项目,根据上述数据能得出什么结论? 分析:首先由已知条件确定a,b,c,d,n的数值,再利用公式求出2的观测值,最后与临界值比较再下结论.解:由题目中表的数据可知:a=54,b=40,c=32,d=63,a+b=94,c+d=95,a+c=86,b+d=103,n=189.代入公式得2=10.759.因为10.7596.635,所以有99%的把握认为员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革态度和工作积极性是有关的.【例2】在一次恶劣气候的飞行航程中调查男女乘客晕机的情况如下表所示,根据此资料您是否认为在恶劣气候飞行中男人比女人更容易晕机?晕机不晕机合计男人243155女人82634合计325789解:这是一个22列联表的独立性检验问题,根据列联表中的数据,得到2=3.689.因为3.6892.706,所以有90%的把握认为此次飞行中晕机与否跟男女性别有关.几点注意:(1)在列联表中注意各项的对应及有关值的确定,避免混乱.(2)若要判断X与Y有关时,先假设X与Y无关.(3)把计算出的2的值与相关的临界值作比较,确定出“X 与Y有关系”的把握.科海观潮相关与相关系数一、什么是相关 事物总是相互联系的,它们之间的关系多种多样,分析起来,大概有以下几种情况:(1)一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果.例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等.(2)第二种是共变关系,即表面看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系.例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系.(3)第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系.具有相关关系的两种现象之间,关系是复杂的,甚至可能包含有暂时尚未认识的因果关系及其共变关系在内.例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系. 统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度.相关的情况有以下三种:一是两列变量变动方向相同,即一列变量变动时,另一列变量亦同时发生或大或小与前一列变量同方向的变动,这称为正相关.如身高与体重的关系,一般讲身长越长体重就越重.第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小,但与前一列变量指向相反的变动.例如初学打字时练习次数越多,出现错误的量就越少等.第三处相关情况是零相关,即两列变量之间无关系.这种情况下,一列变量变动时,另一列变量作无规律的变动.如学习成绩优劣与身高之间的关系,就属零相关,即无相关关系,二者都是独立的随机变量.二、相关系数 相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标,作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用表示,并且是指线性相关而言. 相关系数的取值介于-1.00至+1.00之间,常用小数形式表示.它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量.相关系数的正负号,表示相关方向,正值表示正相关,负值表示负相关.相关系数取值的大小表示相关的程度.相关系数为0时,称零相关即毫无相关,为1.00时,表示完全正相关,相关系数为-1.00时,为完全负相关.这二者都是完全相关.如果相关系数的绝对值在1.00与0之间不同时,则表示关系程度不同.接近1.00端一般为相关程度密切,接近0端一般为关系不够密切.(注意:若是非线性相关关系,而且直线相关计算r值可能很小,但不能说两变量关系不密切)关于这一点如何判定,尚需考虑计算相关系数时样本数目的多少.如果样本数目较少,受取样偶然因素的影响较大,很有可能本来无关的两类事物,却计算出较大的相关系数来.例如欲研究身高与学习有无关系,如果只选3、5个人,很可能遇到身材愈高学习愈好这一类偶然现象,这时虽然计算出的相关系数可能接近1.00,但实际上这两类现象之间并无关系.究竟如何综合考虑样本数目大小,相关系数取值大小而判定相关是否密切这一问题,一般要经过统计检验后方能确定. 相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,如只能说相关系数r=0.50的两列数值比相关系数r=0.25的两列数值之间的关系程度更密切,而绝不能说前二者的密切程度是后二者密切程度的两倍.也不能说相关系数从0.25到0.50与从0.50到0.75所提高的程度一样多.存在相关关系,即相关系数取值较大的两类事物之间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025河南省职工医院护理人员招聘60人模拟试卷及答案详解1套
- 2025吕梁市事业单位招聘博士研究生考前自测高频考点模拟试题及答案详解(历年真题)
- 版杂志发行合同6篇
- 2025年甘肃省定西市人力资源有限公司招聘工作人员考前自测高频考点模拟试题及一套参考答案详解
- 2025年甘肃省陇南市徽县中医医院医师招聘模拟试卷及答案详解(夺冠)
- 2025春季中国诚通控股集团有限公司校园招聘49人模拟试卷及答案详解(必刷)
- 2025年春季福建华南女子职业学院人才招聘15人模拟试卷附答案详解(突破训练)
- 2025湖南永州市宁远县人民医院公开招聘备案制专业技术人员50人考前自测高频考点模拟试题附答案详解
- 2025贵州贵阳贵安统一招聘中小学(幼儿园)教师553人考前自测高频考点模拟试题及答案详解(历年真题)
- 2025年安庆宿松县二郎镇选聘石咀村村级后备干部2人考前自测高频考点模拟试题参考答案详解
- 基于SprintBoot的大学生实习管理系统的设计与实现
- 外踝撕脱骨折课件
- 钢架油漆翻新施工方案(3篇)
- 数字平台治理 课件 第五章 数字平台生态治理
- 2024-2025学年河南省省直辖县级行政单位人教PEP版(2024)三年级下册6月期末测试英语试卷(含答案)
- 妇科葫芦灸中医适宜技术
- 陕县支建煤矿“7.29”抢险救援案例-图文.课件
- 心血管疾病研究进展
- 英语自我介绍高中课件
- 日本0到3岁早期教育
- DB2101∕T 0118-2024 装配式模块化箱型轻钢结构房屋图集
评论
0/150
提交评论