




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。 如长方形的面积 (S) 与 长(a)和 宽(b)S=ab。它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系。 变 量 间 的 关 系第1页/共51页 另一类是 变 量 间不存在完全的确定性关系,不能用精确的数学公式来表示。 如人的身高与体重的关系,作物种植密度与产量的关系,食品价格与需求量的关系等等特点:这些变量间都存在着十分密切的关系,但不能由一个或几个变量的值精确地求出另一个变量的值。 像这样一类关系在生物界中是大量存在的,统计学中把这些变量间的关系称为相
2、关关系,把存在相关关系的变量称为相关变量。 第2页/共51页相关变量间的关系一般分为两种: 一种是因果关系,即一个变量的变化受另一个或几个变量的影响。 如小麦的生长速度受遗传特性、营养水平、管理条件等因素的影响。子代的体高受亲本体高的影响; 另一种是平行关系,它们互为因果或共同受到另外因素的影响。如人的身高和胸围之间的关系属于平行关系。同胞间的身高或体重XY1Y2Y3结果原因XYYX1X2X3原因结果第3页/共51页 统计学上采用回归分析 (regression analysis)研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。第4页/共51页 统计学上采
3、用相关分析 ( correlation analysis)研究呈平行关系的相关变量之间的关系。 对两个变量间的直线关系进行相关分析称为简单相关分析(也叫直线相关分析); 对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。 第5页/共51页函数关系 有精确的数学表达式(确定性的关系) 直线回归分析曲线回归分析一元回归分析简单相关分析 直线相关分析因果关系(回归分析)变量间的关系多元非线性回归分析多元线性回归分析 相关关系 平行关系(相关分析) 多元相关分析 复相关分析偏相关分析多元回归分析 非确定性的关系第
4、6页/共51页第一节 直线回归 一、直线回归方程的建立 对于两个相关变量,一个变量用x表示,另一个变量用y表示,如果通过试验或调查获得两个变量的n对观测值: (x1,y1),(x2,y2),(xn,yn) 为了直观地看出x和y间的变化趋势,可将每一对 观 测 值 在 平 面直角坐标系描点,作出散点图第7页/共51页直线回归分析 二维散点图 作为相关分析最直观的表达形式莫过于用两变量值绘制的散点分布图 第8页/共51页 从散点图可以看出: 两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切);密切);散
5、点图直观地、定性地表示了两个变量之间的关系。为了探讨它们之间的规律性,还必须根据观测值将其内在关系定量地表达出来。 两个变量间有关或无关两个变量间有关或无关; ;若有关若有关, ,两个变量两个变量间关系类型,是直线型还是曲线型;间关系类型,是直线型还是曲线型;第9页/共51页 如果把变量y与x内在联系的总体直线回归方程记为y=x 依变量y的实际观测值总是带有随机误差,因而依变量y的实际观测值yi可用自变量x的实际观测值xi表示为:iiixy(i=1,2, , n)直线回归的数学模型第10页/共51页总体线性回归模型的图示YXiiixy ixyx 观察值观察值第11页/共51页总体线性回归模型i
6、iixy yx第12页/共51页 在x、y直角坐标平面上可以作出无数 条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。 bxaya第13页/共51页 、b应使回归估计值 与实际观测值y的偏差平方和最小,即:总的离回归平方和,即剩余平方和 y 22)() (bxayyyQ最小a020211niiiiniiixbxaybQbxayaQ第14页/共51页 整理得关于 、b的正规方程组: yxbanxyxbxa2解正规方程组,得xxySSSPxxyyxxnxxnyxxyb222)()(/)(/ )(xbya第15页/共51页分子是自变量x的离均差 与
7、 依 变 量 y 的 离 均 差 的 乘 积和 ,简 称 乘积和,记作)(yyxxnyxxyyyxxSPxy/ )()(2)(xxxxySSSPxxyyxxnxxnyxxyb222)()(/)(/ )(xySP分母是自变量x的离均差 平方和 ,记作SSX。 第16页/共51页 b叫做样本回归系数,表 示 x 改 变一个单位,y平均改变的数量。b 的符号反映了x影响y的性质,b的绝对值大小反映了 x 影响 y 的 程度y 叫做回归估计值,是当x在在其研究 范 围 内取某一个值时y值平均数 的估计值。x叫做样本回归截距,是回归直线与y轴交点的纵坐标,当x=0时, = ; y bxay第17页/共5
8、1页 回归方程的基本性质: 如果将 式代入 式,得到回归方程的另一种形式(中心化形式): 2) (yyQ0) (yy),(yx)(xxbybxxbyyxbyabxay第18页/共51页【例8-1】食品感官评定时,测得食品甜度与蔗糖浓度的关系如表8-1所示,试建立y与x的直线回归方程。蔗糖质量分数蔗糖质量分数x %1.03.04.05.57.08.09.5甜度甜度 y1518192122.623.826第19页/共51页(1)作散点图 以蔗糖质量分数(x)为横坐标,甜度(y)为纵坐标作散点图,如图8-2所示。食品甜度与蔗糖浓度的关系0510152025300246810蔗糖质量分数 x %甜度
9、y第20页/共51页4286. 57/0 .38/nxx7714.207/4 .145/nyy2143.537/0 .385 .259/222nxxSSx7857.6677 .145381 .856)(nyxxySPxy0343.847/4 .14520.3104/222nyySSy下一张 主 页 退 出 上一张 第21页/共51页 2550. 12123.537857.66xxySSSPb9585.134286. 52550. 17714.20 xbyaxy2550. 19585.13第22页/共51页 根据直线回归方程可作出回归直线,见图。从图看出,并不是所有的散点都恰好落在回归直线上,这
10、说明用 去估计y是有偏差的。y 下一张 主 页 退 出 上一张 第23页/共51页 附:直线回归的偏离度估计 偏差平方和 的大小表示了实测点与回归直线偏离的程度,因而此偏差平方和又称为离回归平方和。统计学证明:在直线回归分析中离回归平方和的自由度为n-2。那么,离回归均方为: 离回归均方的平方根叫离回归标准误,记为 ,2) ( yy)2/() (2nyyyxS第24页/共51页 离回归标准误Syx的大小表示了回归直线与实测点偏差的程度,即回归估测值 与实 际观测值y偏离(差)的程度,所以,用离回归标准误Syx来表示回归方程的偏离度。 )2/() (2nyySyxy 下一张 主 页 退 出 上一
11、张 第25页/共51页xxyySSSPSSyy/) (222) ( yy2160. 0 2143.53/7857.660343.84 /) (222xxyySSSPSSyy2078. 0) 27/(2160. 0) 2/() (2nyySyx以后我们将证明,第26页/共51页二、直线回归的显著性检验1、直线回归的变异来源图8-4 的分解图)(yy y y y bXaYP(x,y)Y)(YY )(YY yx)(yy 第27页/共51页 从图8-4看到: 上式两端平方,然后对所有的n点求和,则有 ) ()()(yyyyyy) )(2) ()()()( )(2222yyyyyyyyyyyyyy)(x
12、xbybxay)(xxbyy第28页/共51页222) () ()(yyyyyy0)()()()()() )() )(22xxxyxyxxyxxySSSSSPSPSSSPSSbSPbxxbxxbyyxxbxxbyyxxbyyxxbyyyy 所以有 ) )(2) ()()(222yyyyyyyyyy第29页/共51页反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为SSR 222) ()()(yyyyyy反映了y的总变异程度,称为y的总平方和,记为SSy反映了除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归平方和或剩余平方和,记为SSrrRySS
13、SSSS总变异又可表示为第30页/共51页rRydfdfdf1Rdf1 ndfy2 ndfrrrrdfSSMS/RRRdfSSMS/y y的总自由度的总自由度dfdfy y也划分为回归自由度也划分为回归自由度dfdfR R与离与离回归自由度回归自由度dfdfr r两部分,即两部分,即 第31页/共51页1、建立假设 无效假设HO: =0, 备择假设HA: 0。2、计算检验统计量3、显著性推断 )2/(/nSSSSdfSSdfSSMSMSFrRrrRRrR 2、回归关系显著性检验F检验 根据df1=1,df2=n-2查表,得到临界F值,并作出显著性推断。第32页/共51页xxyxyxxyxyxR
14、SSSPSPSSSPbSPSSbxxbxxbyySS222222)()()(xxyyRyrSSSPSSSSSSSS2)2/(/nSSSSdfSSdfSSMSMSFrRrrRRrR第33页/共51页,0343.84ySS,7857.66xySP2143.53xSS8161.832143.537857.6622xxyxyRSSSPbSPSS2182. 08161.830343.84RyrSSSSSS527, 1, 6171rRydfdfndf第34页/共51页下一张 主 页 退 出 上一张 变异来源变异来源偏差平方和偏差平方和SS自由度自由度df均方均方MSF值值显著性显著性回归回归83.8161
15、183.81611922.39*剩余剩余0.218250.0436总变异总变异84.03436xy2550. 19585.1301. 0,26.1639.1922)5 , 1(01. 0PFF第35页/共51页3、回归系数的显著性检验t检验1、建立假设 HO:0,HA:0。 2,ndfSbtbxyxbSSSSrrryxMSdfSSS第36页/共51页 对于 【例8.1】 资 料 ,已计算得 故有2182. 0,2143.53rxSSSS 0286. 02143.53/52182. 0/xrrxyxbSSdfSSSSSS84.430286. 02550. 1bSbt下一张 主 页 退 出 上一张
16、 第37页/共51页 当 ,查t值表,得 因 , 否定HO:0,接受HA:0,即直线回归系数b=1.2550是极显著的,表明蔗糖浓度与甜度大小存在极显著的直线关系,可用所建立的直线回归方程来进行 预测和控制。 5272 ndf571. 2)5(05. 0t032. 4)5(01. 0t)5(01. 084.43tt01. 0P第38页/共51页第二节 直线相关 进行直线相关分析的基本任务在于根据x、y的实际观测值,计算表示两个相关变量x、y间线性相关程度和性质的统计量相关系数r,并进行显著性检验。第39页/共51页我们把 叫 做 x 对 y的决定系数 ( coefficient of dete
17、rmination) 记为 r2:222) ()()(yyyyyy22)(/)(yyyy222)()(yyyyr一、决定系数和相关系数第40页/共51页 决定系数的大小表示了回归方程估测可靠程度的高低,或者说表示了回归直线拟合度的高低。显然有0r21。因为xyyxyxyxxyyxxybbSSSPSSSPSSSSSPyyyyr2222)()(决定系数表示了 两个互为因果关系的相关变量间直线相关的程度第41页/共51页统计学上把决定系数r2的平方根称为x与y的相关系数(coefficient of correlation),记为r:既可表示y与x的直线相关的程度,也可表示直线相关的性质nyynxx
18、nyxxySSSSSPryxxy2222)()()(第42页/共51页二、相关系数的计算 【例8.2】 计算10只绵羊的胸围(cm)和体重(kg) 的相关系数。 表8-3 10只绵羊胸围和体重资料第43页/共51页 根据表8-3所列数据先计算出: 代入(8-25)式得: 即绵羊胸围与体重的相关系数为0.8475。 6410/)720(51904/)(222nxxSSx57810/)680(46818/)(222nyySSy16310/ )680)(720(49123/ )(nyxxySPxy8475. 057864163yxxySSSSSPr第44页/共51页 根据实际观测值计算得来的相关系数r是样本相关系数, 它是双变量正态总体中的总体相关系数的估计值。样本相关系数r是否来自0的总体,还须对样本相关系数r 进行显著性检验。 此 时无 效 假 设、备择假设为HO:=0,HA:0。与直线回归关系显著性检验一样,可采用t检验法与F检验法对相关系数r的显著性进行检验。 第45页/共51页 F检验: F= , df1=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 分类垃圾教学课件
- 中药材种植市场拓展与农业文化遗产保护利用考核试卷
- 政策法规应对策略考核试卷
- 招标采购中的数据安全与隐私保护考核试卷
- 企业价值观与企业文化制度完善考核试卷
- 宠物主人健康行为干预措施考核试卷
- 农药生产过程节能降耗技术考核试卷
- 重庆文职辅警考试试题及答案
- 客户生命周期价值管理策略分析考核试卷
- 化学纤维在生物医学工程中的创新应用考核试卷
- 2024版工程总承包联合体协议书
- 《抖音:短视频与直播运营(慕课版)》-课件-项目六-抖音直播的复盘
- 眼科泪器病诊疗规范2023版
- 六年级下册小升初数学高频考点专项培优卷专题38:奇偶性问题(提高卷)(附参考答案)
- 2024年湘潭电化产投控股集团有限公司招聘笔试冲刺题(带答案解析)
- GB/T 13077-2024铝合金无缝气瓶定期检验与评定
- 杜邦十大安全管理理念课件
- T-QGCML 306-2022 钠离子电池正极材料
- 《公共政策概论》形考任务1参考答案
- 国家基本公共卫生服务项目绩效考核课件
- 吃动两平衡快乐又健康课件
评论
0/150
提交评论