




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学习目标1.会求线性回归方程,并用回归直线进行预测.2.理解独立性检验的基本思想及实施步骤.1.最小二乘法对于一组数据(xi,yi),i=1,2,…,n,如果它们线性相关,则线性回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).2.2×2列联表2×2列联表如表所示:Beq\x\to(B)总计Aaba+beq\x\to(A)cdc+d总计a+cb+dn其中n=a+b+c+d为样本容量.3.独立性检验常用统计量χ2=eq\f(nad-bc2,a+bc+da+cb+d)来检验两个变量是否有关系.类型一线性回归分析例1某城市理论预测2010年到2014年人口总数与年份的关系如表所示:年份201x(年)01234人口数y(十万)5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)据此估计2018年该城市人口总数.解(1)散点图如图:(2)因为eq\x\to(x)=eq\f(0+1+2+3+4,5)=2,eq\x\to(y)=eq\f(5+7+8+11+19,5)=10,eq\i\su(i=1,5,x)iyi=0×5+1×7+2×8+3×11+4×19=132,eq\i\su(i=1,5,x)eq\o\al(2,i)=02+12+22+32+42=30,所以eq\o(b,\s\up6(^))=eq\f(132-5×2×10,30-5×22)=3.2,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=3.6.所以线性回归方程为eq\o(y,\s\up6(^))=3.2x+3.6.(3)令x=8,则eq\o(y,\s\up6(^))=3.2×8+3.6=29.2,故估计2018年该城市人口总数为29.2(十万).反思与感悟解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)实际应用.依据求得的回归方程解决实际问题.跟踪训练1在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y关于x的线性回归方程.解eq\x\to(x)=eq\f(1,5)×(14+16+18+20+22)=18,eq\x\to(y)=eq\f(1,5)×(12+10+7+5+3)=7.4,eq\i\su(i=1,5,x)eq\o\al(2,i)=142+162+182+202+222=1660,eq\i\su(i=1,5,y)eq\o\al(2,i)=122+102+72+52+32=327,eq\i\su(i=1,5,x)iyi=14×12+16×10+18×7+20×5+22×3=620,所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(620-5×18×7.4,1660-5×182)=-1.15,所以eq\o(a,\s\up6(^))=7.4+1.15×18=28.1,所以y对x的线性回归方程为eq\o(y,\s\up6(^))=-1.15x+28.1.类型二独立性检验例2为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球合计男生6女生10合计48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为eq\f(2,3).(1)请将上面的2×2列联表补充完整;(不用写计算过程)(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的概率分布与均值.解(1)列联表补充如下:喜爱打篮球不喜爱打篮球合计男生22628女生101020合计321648(2)由χ2=eq\f(48×220-602,28×20×32×16)≈4.286.因为4.286>3.841,所以能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.(3)喜爱打篮球的女生人数X的可能取值为0,1,2,其概率分别为P(X=0)=eq\f(C\o\al(2,10),C\o\al(2,20))=eq\f(9,38),P(X=1)=eq\f(C\o\al(1,10)C\o\al(1,10),C\o\al(2,20))=eq\f(10,19),P(X=2)=eq\f(C\o\al(2,10),C\o\al(2,20))=eq\f(9,38),故X的概率分布为X012Peq\f(9,38)eq\f(10,19)eq\f(9,38)X的均值E(X)=0+eq\f(10,19)+eq\f(9,19)=1.反思与感悟独立性检验问题的求解策略通过公式χ2=eq\f(nad-bc2,a+bc+da+cb+d),先计算出χ2,再与临界值表作比较,最后得出结论.跟踪训练2某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成如表所示的2×2列联表;主食蔬菜主食肉类合计50岁以下50岁以上总计(3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?解(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主.(2)2×2列联表如表所示:主食蔬菜主食肉类合计50岁以下481250岁以上16218总计201030(3)χ2=eq\f(30×8-1282,12×18×20×10)=10>6.635,故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”.1.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时由高尔顿提出的,他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中,eq\o(b,\s\up6(^))的取值范围是________.答案(0,1)解析子代平均身高向中心回归,eq\o(b,\s\up6(^))应为正的真分数.2.假如由数据:(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)可以得出线性回归方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x,则经过的定点是以上点中的________.答案(3,3.6)解析易知,线性回归方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x经过定点(eq\x\to(x),eq\x\to(y)),根据计算可知这几个点中满足条件的是(3,3.6).3.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为eq\o(y,\s\up6(^))=1.197x-3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为________cm.答案56.19解析根据线性回归方程eq\o(y,\s\up6(^))=1.197x-3.660,将x=50代入,得y=56.19,则肱骨长度的估计值为56.19cm.4.下面是一个2×2列联表:y1y2总计x1a2170x25c30总计bd100则b-d=________.答案8解析∵a=70-21=49,c=30-5=25,∴b=49+5=54,d=21+25=46,∴b-d=8.5.对于线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该线性回归方程是________,根据线性回归方程判断当x=________时,y的估计值是38.答案eq\o(y,\s\up6(^))=x+1424解析首先把两组值代入线性回归方程,得eq\b\lc\{\rc\(\a\vs4\al\co1(3\o(b,\s\up6(^))+\o(a,\s\up6(^))=17,,8\o(b,\s\up6(^))+\o(a,\s\up6(^))=22,))解得eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=1,,\o(a,\s\up6(^))=14.))所以线性回归方程是eq\o(y,\s\up6(^))=x+14.令x+14=38,可得x=24,即当x=24时,y的估计值是38.1.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是自变量,哪个变量是因变量;(2)画出散点图,观察它们之间的关系;(3)由经验确定回归方程的类型;(4)按照一定的规则估计回归方程中的参数.2.独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法.利用假设的思想方法,计算出某一个统计量χ2的值来判断更精确些.课时作业一、填空题1.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是____________模型.x45678910y14181920232528答案线性函数解析画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.2.如果χ2=8.654,可以认为“x与y无关”的可信度为________.答案0.5%解析∵8.654>7.879,∴x与y无关的可信度为0.5%.3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图(图略)可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是eq\o(y,\s\up6(^))=-0.7x+eq\o(a,\s\up6(^)),则eq\o(a,\s\up6(^))=________.答案5.25解析样本点的中心为(2.5,3.5),将其代入线性回归方程可解得eq\o(a,\s\up6(^))=5.25.4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是________.(填序号)①y=2x-2;②y=(eq\f(1,2))x;③y=log2x;④y=eq\f(1,2)(x2-1).答案④解析可以代入检验,当x取相应的值时,所求y与已知y相差最小的便是拟合程度最高的.5.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查,y与x具有线性相关关系,回归方程为eq\o(y,\s\up6(^))=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为________.答案83%解析将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.6.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析研究方法预测他孙子的身高为________cm.答案185解析设父亲身高为xcm,儿子身高为ycm,由题意得出下表:x173170176y170176182易得eq\x\to(x)=173,eq\x\to(y)=176,由公式计算得eq\o(b,\s\up6(^))=1,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=176-1×173=3,则eq\o(y,\s\up6(^))=x+3,当x=182时,eq\o(y,\s\up6(^))=185.故预测该老师孙子的身高为185cm.7.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是________.(填序号)①x与y正相关,x与z负相关;②x与y正相关,x与z正相关;③x与y负相关,x与z负相关;④x与y负相关,x与z正相关.答案③解析因为y=-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设z=ay+b(a>0),所以z=-0.1ax+a+b,-0.1a<0,所以x与z负相关.8.为了探讨学生的物理成绩y与数学成绩x之间的关系,从某批学生中随机抽取10名学生的成绩(xi,yi)(i=1,2,3,…,10),并已计算出eq\o(∑,\s\up6(10),\s\do4(i=1))xi=758,eq\o(∑,\s\up6(10),\s\do4(i=1))xeq\o\al(2,i)=58732,eq\o(∑,\s\up6(10),\s\do4(i=1))yi=774,eq\o(∑,\s\up6(10),\s\do4(i=1))xiyi=59686,则物理成绩y关于数学成绩x的线性回归方程为____________.答案eq\o(y,\s\up6(^))=16.98+0.7971x解析由公式,得eq\o(b,\s\up6(^))≈0.7971,eq\o(a,\s\up6(^))=16.98,故物理成绩y关于数学成绩x的线性回归方程为eq\o(y,\s\up6(^))=16.98+0.7971x.9.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产成本,某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:eq\x\to(x)=eq\f(7,2),eq\x\to(y)=71,eq\i\su(i=1,6,x)eq\o\al(2,i)=79,eq\i\su(i=1,6,x)iyi=1481,eq\o(b,\s\up6(^))=eq\f(1481-6×\f(7,2)×71,79-6×\b\lc\(\rc\)(\a\vs4\al\co1(\f(7,2)))2)≈-1.8182,eq\o(a,\s\up6(^))=71-(-1.8182)×eq\f(7,2)≈77.36,则销量每增加1千箱,单位成本下降________元.答案1.8182解析由已知得eq\o(y,\s\up6(^))=-1.8182x+77.36,销售量每增加1千箱,则单位成本下降1.8182元.10.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关.附:χ2=eq\f(nad-bc2,a+bc+da+cb+d).P(χ2≥x0)0.100.050.0250.0100.0050.001x02.7063.8415.0246.6357.87910.828答案0.005解析由列联表数据可求得统计量χ2=eq\f(50×20×15-5×102,25×25×30×20)≈8.33>7.879,所以在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”.11.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,则他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.答案①解析查对临界值表知P(χ2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清与预防感冒有关”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能.故答案为①.二、解答题12.如表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出表中数据的散点图;(2)请根据表中提供的数据,用最小二乘法求出y关于x的线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解(1)由题设所给数据,可得散点图如图.(2)由数据,计算得eq\i\su(i=1,4,x)eq\o\al(2,i)=86,eq\x\to(x)=eq\f(3+4+5+6,4)=4.5,eq\x\to(y)=eq\f(2.5+3+4+4.5,4)=3.5,eq\i\su(i=1,4,x)iyi=66.5,所以,由最小二乘法确定的回归方程的系数为eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,x)iyi-4\x\to(x)\x\to(y),\i\su(i=1,4,x)\o\al(2,i)-4\x\to(x)2)=eq\f(66.5-4×4.5×3.5,86-4×4.52)=0.7,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=3.5-0.7×4.5=0.35,因此,所求的线性回归方程为eq\o(y,\s\up6(^))=0.7x+0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).13.在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查.调查结果:接受调查总人数110人,其中男、女各55人;受调查者中,女性有30人比较喜欢看电视,男性有35人比较喜欢运动.(1)请根据题目所提供的调查结果填写下列2×2列联表;看电视运动总计女男总计(2)能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”?附:χ2=eq\f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d为样本容量).P(χ2≥x0)0.100.050.0250.010x02.7063.8415.0246.635解(1)根据题目所提供的调查结果,可得下列2×2列联表:看电视运动总计女302555男203555总计5060110(2)根据列联表中的数据,可计算χ2=eq\f(110×30×35-20×252,50×60×55×55)≈3.667,因为χ2≈3.667<3.841,所以不能在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”.三、探究与拓展14.对某台机器购置后的运营年限x(x=1,2,3,…)与当年利润y的统计分析知具备线性相关关系,线性回归方程为eq\o(y,\s\up6(^))=10.47-1.3x,估计该台机器使用________年最合算.答案8
解析只要预计利润不为负数,使用该机器就算合算,即eq\o(y,\s\up6(^))≥0,所以10.47-1.3x≥0,解得x≤8.05,所以该台机器使用8年最合算.15.已知某地每单位面积菜地年平均使用氮肥量x(kg)与每单位面积蔬菜年平均产量y(t)之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.01
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 油气田腐蚀与防护技术考核试卷
- 组织学习与知识管理体系构建战略考核试卷
- 营养教育在儿童饮食中的应用考核试卷
- 纸质非金属材料加工技术考核试卷
- 耐火土石矿山环境保护与矿山环境保护应急预案制定考核试卷
- 潜水装备的水下作业安全教育与培训体系考核试卷
- 工业机器人维修工具考核试卷
- 影视基地租赁及影视拍摄场地租赁及宣传物料制作合同
- 住宅装修施工质量监管补充协议
- 医疗器械临床试验项目临床试验机构选择合同
- 《传染病疫情应急预案管理办法》解读
- 主题英语知到智慧树章节测试课后答案2024年秋中南大学
- 《祷告的教会》课件
- 《广州恒大俱乐部》课件
- 护理管理的发展史
- 2024网络安全技术技能人才职业能力图谱
- 2024年度羽毛球馆运营管理协议样本版B版
- 《青霉素皮试》课件
- DB52T 1211-2017 电站汽轮机数字电液控制系统并网试验及检测指标
- 服务流程模板
- 人教版英语八年级下册 Unit 6 知识点详解及练习
评论
0/150
提交评论