回归分析的基本思想及其初步应用ppt课件_第1页
回归分析的基本思想及其初步应用ppt课件_第2页
回归分析的基本思想及其初步应用ppt课件_第3页
回归分析的基本思想及其初步应用ppt课件_第4页
回归分析的基本思想及其初步应用ppt课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3.1回归分析的根回归分析的根本思想及其初步本思想及其初步运用一运用一高二数学高二数学 选修选修2-3数学数学统计内容统计内容画散点图画散点图了解最小二乘法的思想了解最小二乘法的思想求回归直线方程求回归直线方程 y ybxbxa a用回归直线方程处理运用问题用回归直线方程处理运用问题问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之间之间 的函数关系是的函数关系是y = x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间能否之间能否 有一个确定性的关系?有一个确定性的关系?例如:在例如:在 7 块并排、外形大小一样的实验田上块并排、

2、外形大小一样的实验田上 进展施肥量对水稻产量影响的实验,得进展施肥量对水稻产量影响的实验,得 到如下所示的一组数据:到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455复习复习 变量之间的两种关系变量之间的两种关系10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻产量水稻产量 自变量取值一定时,因变量的取值带有一定自变量取值一定

3、时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。随机性的两个变量之间的关系叫做相关关系。1、定义:、定义: 1:相关关系是一种不确定性关系;:相关关系是一种不确定性关系;注注对具有相关关系的两个变量进展统计对具有相关关系的两个变量进展统计分析的方法叫回归分析。分析的方法叫回归分析。2: 现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。 如:人的身高与年龄;如:人的身高与年龄; 产品的本钱与消产品的本钱与消费数量;费数量; 商品的销售额与商品的销售额与广告费;广告费; 家庭的支出与收家庭的支出与收入。等等入。等等探求:水稻产量探求:水稻产量y与施肥量与施肥量x之间

4、大致有何规之间大致有何规律?律?10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探求探求2:在这些点附近可画直线不止一条,哪条直:在这些点附近可画直线不止一条,哪条直线最能代表线最能代表x与与y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy散点图散点图施化肥量施化肥量水稻产量水稻产量10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量yx探求探

5、求对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据1122( ,),(,),.,(,),nnx yxyxy我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:1122211()(),.(2)()nniiiiiinniiiixxyyxnxybxxxnxy,.(1)aybx1111,.nniiiixx yynn其中( , )x y称为样本点的中心。称为样本点的中心。他能推导出这个公式吗?他能推导出这个公式吗?1122( ,),(,),.,(,)nnx yxyxy假设我们曾经得到两个具有相关关系的变量的一组数据假设我们曾经得到两

6、个具有相关关系的变量的一组数据 且回归方程是:且回归方程是:y=bx+a,(1,2,., )ix in()iiiiyyybxa其中,其中,a,b是待定参数。当变量是待定参数。当变量x取取 时时 它与实践搜集到的它与实践搜集到的 之间的偏向是之间的偏向是iyoxy11( ,)x y22(,)xy( ,)iix yiiyy易知,截距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。由于的值。由于( ,)()iiiiQyyyx ab, 21( ,)()()niiiQyxyxyx 221()2() () () niiiiiyxyxyxyxyxyx2211()2() ()() ,nn

7、iiiiiiyxyxyxyxyxn yx11() ()()()nniiiiiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221( ,)()()niiiQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2222211221111()()()()()()()()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx121()()()niiiniixxyyxxyx这正是我们所要推导的公式。这正是我们所要推导的公式。在上式中,后两项和在上式中,后两项和

8、无关,而前两项为非负无关,而前两项为非负数,因此要使数,因此要使Q获得最小值,当且仅当前两项的值获得最小值,当且仅当前两项的值均为均为0,即有,即有, 1、所求直线方程叫做回归直线方程;、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。相应的直线叫做回归直线。2、对两个变量进展的线性分析叫做线性回归分析。、对两个变量进展的线性分析叫做线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxay bxy 1、回归直线方程、回归直线方程nn(x-x )(y- y )xy-n x yiiiii= 1i= 1b =,nn222(x-x )x-n xi

9、ii= 1i= 1 a = y -b x .nn11x =x,y =y .iinni= 1i= 1其其 中中最小二乘法:最小二乘法:ybxa( , )x y称为样本点的中心。称为样本点的中心。2、求回归直线方程的步骤:、求回归直线方程的步骤:1111(1),nniiiixxyynn求211(2),.nniiiiixx y求3代入公式代入公式1122211()(),(),.(1)nniiiiiinniiiixx yyxnxybxxxnxa y bxy 4写出直线方程为写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。例例1 1、察看两相关量得如下数据、察看两相关量得如下

10、数据: :x-1-2-3-4-553421y-9-7-5-3-115379101010221110,0,110,3 01 0.3 ,1iiiiiiixyyyxx求两变量间的回归方程求两变量间的回归方程. .解:列表:解:列表:i12345678910 xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi 9141512551512149NoImage1011022110110100111010010iiiiixybyxxx000aybxb.yx所求回归直线方程为所求回归直线方程为例例2:知:知10只狗的血球体积及血球的丈量值如下:只狗的血球体积及血球的丈量值如下:x45

11、424648423558403950y6.53 6.30 9.52 7.506.995.90 9.49 9.20 6.55 8.72x(血球体积血球体积,mm), y(血球数,百万血球数,百万)1画出上表的散点图;画出上表的散点图;2求出回归直线并且画出图形;求出回归直线并且画出图形;3回归直线必经过的一点是哪一点?回归直线必经过的一点是哪一点?3 3、利用回归直线方程对总体进展线性相关性的检验、利用回归直线方程对总体进展线性相关性的检验 例例3 3、炼钢是一个氧化降碳的过程,钢水含碳量的多少、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必需掌握钢水含碳量和冶炼直接影响冶

12、炼时间的长短,必需掌握钢水含碳量和冶炼时间的关系。假设已测得炉料熔化终了时,钢水的含碳时间的关系。假设已测得炉料熔化终了时,钢水的含碳量量x x与冶炼时间与冶炼时间y y从炉料熔化终了到出刚的时间的一从炉料熔化终了到出刚的时间的一列数据,如下表所示:列数据,如下表所示:x0.01%104180190177147134150191204121ymin100200210185155170205235125NoImage1 1y y与与x x能否具有线性相关关系;能否具有线性相关关系;2 2假设具有线性相关关系,求回归直线方程;假设具有线性相关关系,求回归直线方程;3 3预测当钢水含碳量为预测当钢水

13、含碳量为160160个个0.01%0.01%时,应冶炼多少分时,应冶炼多少分钟?钟?(1)(1)列出下表列出下表, ,并计算并计算i12345678910 xi104180190177147134150191204121yi100200210185155170205235125xiyi1040036000399003274522785180902550039155479401512510101022111159.8,172,265448,312350,287640iiiiiiixyyyxx1011010222211100.9906.(10)(10)iiiiiiix yx yrxxyy于是,10

14、110221101.26710iiiiixybyxxx30.51.aybx 所以回归直线的方程为所以回归直线的方程为 =1.267x-30.51 y(3)(3)当当x=160 x=160时时, 1.267.160-30.51=172, 1.267.160-30.51=172 y(2)设所求的回归方程为设所求的回归方程为ybxa例题例题4 4 从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身高和体重数据如下表:高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生的身高预告她的体

15、重的求根据一名女大学生的身高预告她的体重的回归方程,并预告一名身高为回归方程,并预告一名身高为172172的女的女大学生的体重。大学生的体重。172.85849. 0 xy分析:由于问题中分析:由于问题中要求根据身高预告要求根据身高预告体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量学学身身高高172cm女172cm女大大生生体体重重y = 0.849y = 0.849172-85.712 = 60.316(kg)172-85.712 = 60.316(kg)2.2.回归方程:回归方程:1. 散点图;散点图;n(x -x)(y -y)iii=1r=nn22(x -x)(y -y)iii=1i=1相关系数相关系数正相关;负相关通常,正相关;负相关通常,r0.75,以为两个变量有很强的相关性,以为两个变量有很强的相关性本例中本例中,由上面公式由上面公式r=0.7980.75探求?探求?身高为身高为172172的女大学生的体重一定是的女大学生的体重一定是60.316kg60.316kg吗?假设不是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论