版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章成对数据的统计分析8.2.1一元线性回归模型1.样本相关系数:①当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.②|r|≤1;③当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.2.相关系数的性质:
为纪念中国人民抗日战争暨世界反法西斯战争胜利80周年,2025年9月3日天安门广场举行了盛大阅兵,歼-20S隐身利剑划破长空,运-20钢铁巨翼列阵苍穹。空军雄姿尽显,昭示正义必胜、和平必胜、人民必胜!
空军招收男飞行员的身高范围为164-185cm,现有一名有志于国防的初二男生,想成为飞行员,其父亲的身高是185.5cm,试估计这位同学的身高能否达标?父亲的身高与儿子的身高之间存在怎样的关系?编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182思考1:根据上表,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?…172…父亲身高…176174…儿子身高儿子身高不是父亲身高的函数(一)一元线性回归模型的构建追问1:父亲身高是儿子身高的函数吗?父亲身高不是儿子身高的函数…170…儿子身高…173169166…父亲身高编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182思考2:观察散点图的特点,你觉得儿子身高与父亲身高的关系是怎样的?儿子身高与父亲身高呈正线性相关关系.表明儿子的身高和父亲的身高有较强的正线性相关关系,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响.问题2为什么散点不在同一条直线上,而是大致分布在一条直线附近?随机误差e母亲身高生活环境饮食习惯体育锻炼
……追问2
随机误差e有何特征?随机误差e是一个随机变量①可取正或取负②有些无法测量③不可事先设定思考3:因为存在这些随机的因素,使得儿子的身高呈现出随机性.各种随机因素都是独立的,有些因素又无法量化.考虑到这些随机因素的作用,我们该如何引入适当的变量,借助一次函数关系刻画父亲身高对儿子身高的影响呢?问题解决用x表示父亲身高,Y表示儿子身高,e表示随机误差.假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为:称该式为Y关于x的一元线性回归模型.Y称为因变量或响应变量;x称为自变量或解释变量;a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.思考4:为什么要假设E(e)=0,而不假设它为某个不为0的常数?随机误差表示大量已知和未知的影响因素之和,因为误差是随机的,即取各种正负误差的可能性一样,它们会相互抵消,所以随机误差的期望值应为0.用x表示父亲身高,Y表示儿子身高,e表示随机误差.则它们之间的关系可以表示为下面的一元线性回归模型:思考4:你能结合身高案例解释上述模型的意义吗?故模型可解释为父亲身高为xi的所有男大学生的身高(子总体)的均值E(Y)为bxi+a,即该子总体的均值与父亲身高是线性函数关系。理解为(二)一元线性回归模型的理解思考5:父亲身高为xi的某一名男大学生,他的身高yi一定为bxi+a吗?理解为身高yi不一定为bxi+a,yi=bxi+a+ei,bxi+a是子总体的均值,yi只是该子总体中的一个样本值,这个样本值yi与均值E(Y)有一个误差项ei=yi−(bxi+a).导入问题解决:其父亲的身高是185.5cm,试估计这位同学的身高能否达标?存在随机误差
理解为议一议:函数模型与回归模型之间有何差别?请尝试分别举出两个应用函数模型和回归模型的例子.函数模型:回归模型:解释变量x(身高)模型误差e(其它所有变量)响应变量Y(体重)变量之间具有的函数关系,是一种确定性的关系变量之间具有的相关关系,是一种不确定性关系增加了随机误差项e,因变量Y的值由自变量x和随机误差项e共同确定,即自变量x只能解释部分Y的变化.函数模型:回归模型:变量之间具有的函数关系,是一种确定性的关系变量之间具有的相关关系,是一种不确定性关系举例:路程与速度的关系、正方体体积与边长的关系举例:体重与身高的关系、冷饮销量与气温的关系
C
练一练2、
将下图中的点按父亲身高的大小次序用折线连起来,所得到的图象是一个折线图,可以用这条折线表示儿子身高和父亲身高之间的关系吗?解:不能.一是父亲的身高与儿子的身高之间是随机关系,不是函数关系;二是这组数据仅是总体的一个样本,不一定能很好地描述两个变量之间的关系.练一练
例:儿童的身高随年龄的增加而增加,我国0~12岁儿童的平均身高如表所示.年龄/岁123456789101112平均身高/cm76.586.596.8104.1111.3117.7124.0130.0135.4140.2145.3151.9解:(1)①用散点图定性分析②用线性相关系数r进行定量分析(1)儿童的平均身高Y与年龄t之间能否用一元线性回归模型来刻画?(2)请说明模型中bx+a和e在本题中的具体含义是什么?综上,可以用一元线性回归模型进行刻画.
年龄/岁123456789101112平均身高/cm76.586.596.8104.1111.3117.7124.0130.0135.4140.2145.3151.9(2)请说明模型中bx+a和e在本题中的具体含义是什么?(2)bx+a表示年龄对儿童平均身高的主要影响;e表示其它因素对儿童平均身高的次要影响.建立一元线性回归模型的步骤定性分析定量分析函数关系或相关关系或没有关系(3)如果线性相关,建立一元线性回归模型(否则就是其它曲线回归模型)(2)分析数据(1)整理数据:散点图方法归纳3.(多选)如图,在四个散点图中,适合用一元线性回归模型拟合其中两个变量的是()AC练一练
解:因为回归直线的斜率为80
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 某省市场与金融机构第2章金融产品某省市场
- 女性就业培训计划
- 卫生计生监督局内控制度
- 印发职业卫生制度
- 广东省广州市育才实验学校2022-2023学年七年级上学期期中地理试题(含答案)
- 2026年家庭建设指导员考试真题(附答案)
- 2026年美术指导师考试题库及答案
- 脑卒中后遗症症状辨识与康复护理技巧
- 资产评估物品价值的
- 手术室实习同学入科宣教
- 八年级下学期期中家长会课件
- 2026年乡镇高层次人才引进笔试题库与解析
- 雨课堂学堂在线学堂云《自然辩证法概论( 武汉科技大)》单元测试考核答案
- 2025年7月浙江省普通高中学业水平考试化学试卷(含答案)
- 药物研发中的生物信息学数据处理
- 46566-2025温室气体管理体系管理手册及全套程序文件
- 湖北省历年2004-2013年高考英语试题及答案解析
- 11.2 一元一次不等式(第1课时) 初中数学人教版七年级下册教案
- 2025年高级人工智能训练师(三级)理论考试题库-含答案
- 铁路防护栅栏实施施工组织设计
- AEO(关务)管理手册
评论
0/150
提交评论