线性回归方程_第1页
线性回归方程_第2页
线性回归方程_第3页
线性回归方程_第4页
线性回归方程_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、全球雅思教师指导讲义切换号码。组长签字:签字日期:学生编号。年级:高二课时:3学生姓名:辅导科目:数学老师:严建斌课程主题线性回归方程教学日期和时间2014-2-11 18:00-20:00优秀的文档,值得您期待教学目标线性回归方程的基础重点和难点教学内容1.本周解释错误的问题2.梳理知识点1.线性回归方程变量之间的两种关系:函数关系和相关关系(2)制作散点图,判断线性相关性线性回归方程:(最小二乘法)最小二乘法:寻找一条回归线的方法,使样本数据点到它的距离的平方最小注:线性回归线穿过固定点2.相关系数(判断两个变量之间的线性相关性):注:(1)当为0时,变量正相关;0,变量呈负相关; 越接近

2、1,两个变量之间的线性相关性越强;当接近0时,两个变量之间几乎没有线性相关性。3.线性回归模型:随机误差:我们称之为线性回归模型,其中模型的未知参数为随机误差。随机误差残差:我们使用回归方程中的估计,随机误差,所以它是一个估计量,所以它被称为对应于一个点的残差。回归效应判断-相关指数(解释变量对预测变量的贡献率)(由表达式确定)注:学习程度越高,残差平方和越小,模型拟合效果越好;越接近1,回归效果越好。4.独立性检验(分类变量关系):(1)分类变量:该变量的不同“值”代表个人所属不同类别的变量。(2)列联表:列出两个分类变量的频率表,称为列联表。(3)列联表的观测值。(4)临界值表:0.500

3、.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果是,则推断它是“相关的”,并且在这个推断中出错的概率不超过;否则,在样本数据中没有足够的证据来支持“相关”的结论。(5)反证原则与独立性检验的比较:反证原则在这个假设下,如果矛盾被引入,它被证明是站不住脚的。独立性检查经验原则在假设条件下,如果有一个小概率事件与之冲突,则推断无效,并且在推断中出错的概率不超过这个小概率。典型示例1.(山东,2011)产品广告费用x和销售额y的统计数据如下表所示:广告费用万元423

4、5销售额y/万元49263954根据上表,回归方程=x为9.4。根据该模型,当广告费用为6万元时,预计销售量为()。A.63.6万元;b . 65.5万元C.67.7万元和72万元解析=,42,并且=x必须通过(,), 42=9.4,=9.1。线性回归方程为=9.4x+9.1。当x=6,9.1=9.46=65.5(万元)。回答乙2.(江西,2011)为了了解儿子身高与父亲身高的关系,随机选取了5对父子的身高数据如下:父亲身高x/厘米174176176176178儿子身高y/厘米175175176177177y到x的线性回归方程是()。A.=x-1 B.=x+1C.=88+x D.=176解析是

5、因为=176,=176,和直线常数交叉点(,),由y到x的线性回归方程表示,因此,(176,176)被替换成A,B,C和D来测试和选择C .答案三3.(陕西,2011)设(x1,y1),(x2,y2),(xn,yn)为变量x和y的n个样本点,直线L为通过最小二乘法从这些样本点得到的线性回归线(如图所示)。以下结论是正确的()。A.x和y的相关系数是直线l的斜率。B.X和Y的相关系数在0和1之间C.当n是偶数时,分布在l两边的样本点数必须相同D.直线L(,)的交点因为相关系数是一个表示两个变量是否具有线性相关性的值,所以它的绝对值越接近1,两个变量之间的线性相关性就越强,所以A和B是错的。c中的

6、n当它是偶数时,分布在L两边的样本点的数量可以不同,所以C是错的。根据回报回归方程必须通过样本的中心点才能知道D是正确的,所以选择D .答案D4.(广东,2011)为了了解篮球运动员范晓莉的投篮命中率与篮球比赛时间的关系,下表记录了小李当天的篮球比赛时间x(单位:小时)与投篮命中率y的关系:时间x12345命中率y0.40.50.60.60.4小李这五天的平均投篮命中率是_ _ _ _ _ _ _;用线性回归分析的方法,预测小李本月6日打6小时篮球的投篮命中率为_ _ _ _ _ _ _ _ _。小李五天平均投篮命中率分析=0.5,小李这五天平均打篮球的时间可以得出=3。根据表中的数据,可以得

7、出为=0.01,=0.47,所以回归线性方程是=0.47+0.01x,并且x=6被替换以得到玩了6个小时的第6个篮球运动员。投篮命中率约为0.53。答案是0.5-0.535.(辽宁,2011)对某地区几个家庭的年收入X(单位:万元)和年食物支出Y(单位:万元)进行了调查。调查显示,年收入X与年粮食支出Y之间存在线性相关关系,从调查数据中得到Y对X的回归线性方程:X=0.254 X 0.321。解析意义为0.254(x1)0.321-(0.254 x 0.321)=0.254。答案是0.2546.(2011)近十年来,安徽省某地区的粮食需求逐年增加。下表显示了一些统计数据:年2002200420

8、0620082010需求(万吨)236246257276286(1)利用给定的数据找出年需求量与年需求量之间的回归线性方程=x;(2)利用(1)得到的线性方程预测2012年的粮食需求。解决方案(1)从给定的数据可以看出,年需求量与年需求量大致成直线上升。以下是回归直线方程。为此,数据预处理如下:2006年-4-2024需求-257-21岁-1101929对于预处理数据,很容易计算出=0,=3.2。=6.5,=-b=3。从以上计算结果,我们知道回归线性方程是-257=(x-2 006)+=6.5(x-2 006)+3.2,即=6.5 (x-2 006) 260.2。(2)利用线性方程,2012年

9、粮食需求可以预测如下6.5 (2012-2006年)260.2=6.56 260.2=299.2(万吨)。课堂练习1.四组(x,y)的实验值分别为(1,2)、(2,3)、(3,4)和(4,5),因此y和x之间的回归线性方程为()A.=x+1 B.=x+2 C.=2x+1 D.=x-12.当比较两个模型的拟合效果时,两个模型的相关指数R2分别约为0.96和0.85,因此拟合效果较好的模型为()A.B. B. C. A和B是同一个d .不确定3.为了预测某化工厂产品的回收率Y,有必要研究其与原料中有效成分含量X的相关性。取8对观测值进行计算,=52,易=228,X=478,=1849,线性回归方程

10、为()A.=11.47+2.62x B.=-11.47+2.62xC.=2.62+11.47x D.=11.47-2.62x4.下表是一个工厂1-4月的用水量(单位:100吨)的一组数据:第x个月1234用水量y4.5432.5根据散点图,用水量y与x月有很好的线性关系,线性回归方程为=-0.7x a,则a等于_ _ _ _ _ _。5.为了规定工时定额,车间需要确定加工零件所花费的时间,因此进行了四次试验,获得的数据如下:零件数量x(件)2345处理时间y(小时)2.5344.5(1)在给定坐标系中绘制表格中数据的散点图;(2)求出y相对于x=bx a的线性回归方程,并在坐标系中画出回归线;

11、(3)尝试预测处理10个零件需要多少小时。家庭作业首先,选择题1.四组(x,y)的实验值分别为(1,2)、(2,3)、(3,4)和(4,5),因此y和x之间的回归线性方程为()A.=x+1B。=x+2C.=2x+1 D.=x-1回答一分析并画一个散点图,其中所有四个点都在一条直线上=x 1。2.以下关于样本相关系数的陈述不正确()A.相关系数用于衡量变量x和y之间的线性相关性。B.|r| 1,并且|r|越接近1,相关性越大。C.|r| 1,并且|r|越接近0,相关度越小D.|r| 1,并且|r|越接近1,相关度越小答案D3.回归线性方程=bx从一组样本(x1,y1)、(x2,y2)、(xn,y

12、n)获得。下面对回归线性方程有四种讨论:(1)直线=bx通过点(x1,y1)、(x2,y2)中的至少一个,(xn,yn);(2)直线的斜率=bx为;(3)直线=BX必须通过(,);(4)直线=bx与点(x1,y1)、(x2,y2)之间的偏差(yi-a-bxi) 2。(xn,yn)是坐标平面上所有直线与这些点之间的最小偏差。其中,正确的讨论是()A.0,B. 1C.2 D. 3答案D解析线性回归线不一定穿过任何点(x1,y1)、(x2,y2)、(xn,yn)。B=线性回归线的斜率,即回归系数;线性回归直线交点(,);线性回归线是平面上所有直线中偏差最小的直线(yi-a-bxi) 2。因此,有三种

13、说法是正确的.4.如果两个变量X和Y之间存在线性相关,它们的相关系数为R,Y相对于X的回归线的斜率为B,纵向截距为A,那么必须有()A.乙和丙有相同的符号。甲和丙有相同的符号C.乙与丁相对,甲与丁相对回答一5.当比较两个模型的拟合效果时,两个模型的相关指数R2分别约为0.96和0.85,因此拟合效果较好的模型为()A.学士C.甲、乙双方相同。不确定回答一6.为了预测某化工厂产品的回收率Y,有必要研究其与原料中有效成分含量X的相关性。取8对观测值进行计算,=52,易=228,X=478,=1849,线性回归方程为()A.=11.47+2.62x B.=-11.47+2.62xC.=2.62+11

14、.47x D.=11.47-2.62x回答一回归系数的解析公式可以用来计算a=11.47,b=2.62,所以=11.47+2.62。第二,填空7.下表是一个工厂1-4月的用水量(单位:100吨)的一组数据:第x个月1234用水量y4.5432.5根据散点图,用水量y与x月有很好的线性关系,线性回归方程为=-0.7x a,则a等于_ _ _ _ _ _。解析=2.5,=3.5,回归直线方程穿过不动点(,), 3.5=-0.72.5 .a=5.25.8.为了了解毛衣y(件)月销量与月平均气温x()的关系,某服装店随机统计了某4个月的月销量与月平均气温,数据如下表所示:月平均温度x()171382月

15、销售量y(件)24334055根据表中的数据,线性回归方程=bx b -2在a中,气象部门预测下个月的平均气温将在6左右,据此,估计这个商场下个月的毛衫销量将在_ _ _ _ _ _ _ _ _左右。(见公式:b=,a=-b)答案46从所提供的数据可以计算出,A=10,=38,B -2可以代入公式A=-B,得到A=58,即线性回归方程=-2x 58,X=6可以代入。9.对196名接受心脏搭桥手术的患者和196名接受血管清理手术的患者进行了为期3年的随访研究,以调查他们是否再次心脏病发作。结果如下表所示:又发生了心脏病从未发作过心脏病总数心脏搭桥手术39157196血管障碍清除手术29167196总数68324392尝试根据上述数据计算k2=_ _ _ _ _ _ _ _。比较这两种手术对心脏病患者的效果。_ _ _ _ _ _ _。答案1.78不能断定这两种手术对心脏病患者有不同的效果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论