版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八
章成对数据的统计分析8.2.1
一元线性回归模型
及其参数的最小二乘估计1.样本相关系数:2.相关系数的性质:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.复习回顾生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示.编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182我们先用散点图对上面的数据进行分析。问题1根据上述数据画出来的散点图,你发现了什么?样本相关系数为r≈0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.新课讲解问题2根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182…172…父亲身高…176174…儿子身高儿子身高不是父亲身高的函数…170…儿子身高…173169…父亲身高父亲身高不是儿子身高的函数儿子身高和父亲身高之间不是函数关系,故不能用函数模型刻画.新课讲解问题3:由于其他因素的存在,使得儿子身高和父亲身高有关系但不是函数关系,那么影响儿子身高的其他因素是什么?母亲的身高生活的环境饮食习惯...营养水平体育锻炼新课讲解
Y=bx+a+e随机误差e的特征随机误差e是一个随机变量①可取正或取负②有些无法测量③不可事先设定建立模型
我们称(1)式为Y关于x的一元线性回归模型.
Y:因变量或响应变量,
x:自变量或解释变量;新课讲解a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.追问
为什么要假设E(e)=0,而不假设其为某个不为0的常数?因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.
新课讲解问题4
你能结合父亲与儿子身高的实例,说明回归模型(1)的意义?
问题5
对于父亲身高为xi的某一名男大学生,他的身高yi一定是bxi+a吗?新课讲解函数模型与回归模型之间的差别函数模型:回归模型:
一元线性回归模型Y=bx+a+e增加了随机误差项e,因变量Y
的值由自变量x和随机误差项e共同确定,
即自变量x只能解释部分Y的变化.变量之间具有的函数关系,是一种确定性的关系变量之间具有的相关关系,是一种不确定性关系新课讲解1.在一元线性回归模型y=bx+a+e中,下列说法正确的是(
)A.y=bx+a+e是一次函数B.因变量y是由自变量x唯一确定的C.因变量y除了受自变量x的影响外,可能还受到其它因素的影响,这些因素会导致随机误差e的产生D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生C小本P147练习巩固2.若某地财政收入x与支出Y满足一元线性回归模型
Y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入为10亿元,年支出预计不会超过(
)A.9亿元 B.9.5亿元C.10亿元 D.10.5亿元D大本P77练习巩固问题3一元线性回归模型表达式
刻画的是变量Y与变量x之间的线性相关关系,其中参数a和b未知,我们能否通过样本数据估计参数a和b?参数a和b刻画了变量Y与变量x的线性关系,因此通过样本数据估计这两个参数,相当于寻找一条适当的直线,使表示成对样本数据的这些散点在整体上与这条直线最接近.新课讲解问题3如何用数学的方法刻画“从整体上看,各散点与直线
最接近”?采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置.然后测量出此时的斜率和截距,就可得到一条直线,如图(1)所示.方法一:新课讲解方法二:在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同,把这条直线作为所求直线,如图(2)所示.问题3如何用数学的方法刻画“从整体上看,各散点与直线
最接近”?新课讲解方法三:在散点图中多取几对点,确定出几条直线的方程,再分别求出这些直线的斜率、截距的平均数,将这两个平均数作为所求直线的斜率和截距,如图(3)所示.问题3如何用数学的方法刻画“从整体上看,各散点与直线
最接近”?新课讲解
设满足一元线性回归模型的两个变量的n对样本数据为(x1,
y1),(x2,
y2),‧‧‧,(xn,
yn),由yi=bxi+a+ei(i=1,2,‧‧‧,n),得显然|ei|越小,表示样本数据点离直线y=bx+a的竖直距离越小,如图所示.新课讲解当a,b的取值为
达到最小.新课讲解
新课讲解练习巩固
x681012y2356(1)请画出上表数据的散点图;
大本P77练习巩固练习巩固例2随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量y(单位:次)之间的对应数据如下表所示:x/件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 麻醉药品生产质量协议书
- 春节旅游促销方案策划(2篇)
- 儿童节策划方案创意(2篇)
- 产品方案制定概念(2篇)
- 常用促排卵方案及适应症(2篇)
- 色浆基体树脂项目可行性报告
- 锂电池配套试剂项目建议书
- 炼油、化工生产专用设备项目综合评估报告
- 机油冷却器项目计划书
- 集体备课心得体会六篇
- 二年级美术下册说课稿《8. 彩点点》 湘美版
- 阿含经中的空性课件
- 货运险培训要点课件
- 深入学习浙江千村示范万村整治工程经验宣传课件
- 语文《塞下曲》 课件
- 职业暴露针刺伤应急预案演练脚本-
- 乐理知到章节答案智慧树2023年四川音乐学院
- 2023年第十六周值周小结
- 新编日语第二册课文及读解文翻译(重排版)
- 国开电大 可编程控制器应用实训 形考任务4实训报告
- 中国移动IT技术开发及运营管理通道考试题库(含答案)
评论
0/150
提交评论