




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、回归分析在数模竞赛中的应用1 回归分析的基本思想在实际问题中,我们会遇到各种变量,在变量与变量之间,往往存在着各种关系。有些变量之间的关系是确定性的函数关系,例如,圆的半径与圆面积之间的关系,自由落体落下的时间与落下的距离之间的关系,等等。在这些关系中,只要自变量的值确定了,因变量的值也就随之确定了。但是,有些变量之间的关系就不是这样,例如,农作物的施肥量与农作物的产量之间的关系,商品的价格与商品的销售量之间的关系,家庭的收入与家庭的支出之间的关系,父亲的身高与儿子的身高之间的关系,等等。在这些关系中,自变量的值确定了,因变量的值并不完全随之确定,还是可能有上下起伏的变化。同时,在这些关系中,
2、自变量与因变量又不是完全无关的,通过大量的统计数据,可以发现,它们之间确实存在着某种关系。我们把这样的关系,称为统计相关关系。回归分析(Regression Analysis),就是研究变量之间的统计相关关系的一种统计方法。它从自变量和因变量的一组观测数据出发,寻找一个函数式,将变量之间的统计相关关系近似地表达出来。这个能够近似表达自变量与因变量之间关系的函数式,称为回归方程或回归函数。2 回归分析问题的一般形式设有个自变量 和1个因变量 ,它们之间有下列关系: ,其中, 是函数形式已知的 元函数, 是常数,是函数 中的未知参数, 是表示误差的随机变量,一般可认为 , 。对 , 进行 次观测,
3、得到观测值: , 。对每一次观测来说,同样有下列关系 ,其中 是第 次观测时的随机误差,。回归分析目标是:从观测数据出发,求 的估计 ,使得下列平方和 达到最小: 。 由于估计的目标是使一个平方和达到最小,而平方又称为“二乘”,所以,这种估计称为最小二乘估计(Least Squares Estimator,简称LSE),求这种估计的方法称为最小二乘法(Method of Least Squares)。 把 代入 表达式,就得到的最小值 。的最小值称为残差平方和,残差平方和越小,说明回归方程表达变量之间统计相关关系的精确程度越高,也就是回归分析的效果越好。 在数模竞赛中,经常会遇到可以用回归分析
4、来解决的问题,下面是一些例子。例1(1993年全国数模竞赛A题)非线性交调的频率设计在一个电子通讯系统中,对输入信号强度和输出信号强度进行观测,得到下列数据: 051020304050608002.256.8020.1535.7056.4075.1087.8598.50已知与之间的关系,是一个次数为3次的多项式: ,作为非线性交调的频率设计的第一步,需要求出这个关系式。 这里,是自变量,是因变量,是未知参数。问题是要从和的观测值数据出发,求出参数的估计。显然,这是一个回归分析问题。例2(1993年国际数模竞赛A题)加速餐厅剩菜堆肥的生成一家自助餐厅,每天把顾客吃剩下的食物搅拌成浆状,混入厨房里
5、废弃的碎绿叶菜和少量撕碎的报纸,再加入真菌和细菌,混合物原料在真菌和细菌的消化作用下生成堆肥。 下表给出了以磅为单位的混合物原料中各种成分的的数据,以及混合物原料喂入的日期和堆肥生成的日期:食物浆绿叶菜纸片原料喂入日期堆肥生成日期8631090.7.1390.8.1011279090.7.1790.8.137121090.7.2490.8.200382090.7.2790.8.227928090.8.1090.9.1210552090.8.1390.9.1812115090.8.2090.9.2411032090.8.2290.8.228244991.4.3091.6.185760691.5.
6、 291.6.207751791.5. 791.6.255238691.5.1091.6.28 要求确定:混合物原料中各种成分的比例与堆肥生成的速率之间是否有关系?如果有关系,怎样的比例才能使得堆肥生成的速度最快? 设分别是食物浆、绿叶菜和纸片在混合物原料中的比例,是生成堆肥所需要的时间。要尝试给出与之间的关系式。可以考虑各种不同形式的关系,最简单的,可以认为它们之间有线性关系:,其中,是自变量,是因变量,是未知参数。问题是要从和的观测值数据出发,求出参数的估计(由于是各种成分在总量中的比例,它们之间有的关系,3个自变量实际上不是独立的,为了避免估计结果的不确定,实际上还应该去掉一个自变量)。
7、显然,这也是一个典型的回归分析问题。例3(1996年国际数模竞赛A题)潜水艇的探测 海洋中有一个背景噪声场,当附近有潜水艇驶过时,噪声场会发生变化。要求给出一种方法,通过在水下检测点检测到的噪声场的变化情况,探测出附近有无潜水艇,潜水艇的位置、大小、形状、运动速度和运动方向。 这个问题有各种各样不同的做法,其中一种做法是: 设 是潜水艇中心的坐标, 是潜水艇的速度分量。近似认为潜水艇的形状是一个圆柱形的主体,前后两端加上两个半球。设 是潜水艇圆柱形主体的长度, 是圆柱形底面的半径。 在海洋中设置个检测点。设第个检测点的坐标位置为,在这一点上测到的噪声强度为,。 根据水声学原理,可以得到下列形式
8、的关系式: ,。其中,是因变量的观测值,是自变量的观测值, 是未知参数,问题是要从自变量和因变量的观测值数据出发,求出参数 , 的估计。显然,这也是一个回归分析问题。3 线性回归(Linear Regression)一、线性回归问题的一般形式和解法设有个自变量 和1个因变量 ,它们之间有下列关系: ,其中, 是未知参数, 是表示误差的随机变量, 。 对 , 进行 次观测,得到一组观测值: , 。 即有 , , 。 线性回归的目标是:从自变量和因变量的观测数据出发,求未知参数 的估计值 ,使得平方和达到最小。 是 的函数,所以,这是一个多元函数求最小值的问题,我们可以通过求偏导数、解下列方程组的
9、方法,来确定 的最小值点: 从这个方程组中求得的解 ,使 达到最小,是 的最小二乘估计。(有时,线性回归问题中可能会不出现常数项,也可以类似地求解。) 当自变量个数比较多时,线性回归的具体计算是很烦琐复杂的,如果靠人工计算,工作量很大。现在计算机已经十分普及,人们已开发了许多现成的计算机程序和软件包,其中包括可以作一元和多元线性回归的软件。我们在解决实际问题时,可以利用这些现成软件,十分方便迅速地完成线性回归的计算。所以,我们这里就不将线性回归的具体计算公式详细写出来了。二、衡量线性回归结果好坏的标准(1)残差平方和(剩余平方和 Residual Sum of Squares ,简称RSS),
10、残差平方和,也就是 的最小值,记为。 越小,说明回归方程表达变量之间统计相关关系的精确程度越高,也就是回归分析的效果越好。但 的大小还与样本观测次数有关。(2)估计的标准差(残差标准差 Estimated Standard Deviation) (如果回归问题中不出现常数项,则上式中的 要改为 )。 越小,表明 越小,回归分析的效果也就越好。的大小基本上与样本观测次数无关,但它是一个有量纲的量,与因变量同一量纲,所以它的数值大小与的量纲单位大小有关。(3)多重相关系数(复相关系数 Multiple Correlation Coefficient) ,其中, , 。可以证明,有 。 越接近 ,说
11、明 越小,回归分析的效果也就越好。 是一个无量纲的量,它的大小与量纲的单位大小无关。三、线性回归应用的实例 前面介绍过的1993年国际数模竞赛A题“加速餐厅剩菜堆肥的生成”就是一个线性回归的例子,下面再看一个例子。例4(1993年全国数模竞赛B题)给足球队排名次 已知12支球队在全国甲级联赛中的成绩,要求设计一种依据这些成绩给足球队排名次的方法。 这个问题可以有多种不同的做法,回归分析就是其中的一种做法。 设 支球队的实力为 ,这些都是未知的常数。 设 是第 场比赛时,通过比分表现出来的主队与客队两队的实力之差。例如,当两队的比分为 时,可以定义 或 或 或 ,等等。设第1场比赛,是1队对2队,1队为主队,2队为客队;第2场比赛,是3队对4队,3队为主队,4队为客队;第3场比赛,是1队对4队,1队为主队,4队为客队; 。 则有 , , , 。对每一场比赛,有 ,其中, 是第 场比赛结果的随机误差, 。 可以看出,这实际上是一个不出现常数项的线性回归问题,回归方程为 。要求从观测值 (+1,-1或0)和 (比赛结果)出发,求 (各队实力)的估计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 制糖废水处理与再利用考核试卷
- 丰收之歌音乐课件
- 2025二号机冷凝器空冷器清洗合同
- 2025年监理工程师《合同管理》考试多项选择题
- 2025住宅水电安装承包合同
- 2025标准办公室设备租赁合同模板
- 运动与健康教育课:强健身心 全面发展
- 小学生地震安全教育
- 儿童敏感期课件
- 2025版VI设计服务合同示范文本
- 历代书法名作赏析课件
- 质量整改通知单(样板)
- 装配作业指导书
- 建设工程成本计划与控制课件(原)
- IPC-A-610国际标准中英文对照(doc 17)
- 《陕文投应聘表格》word版
- 建设工程围挡标准化管理图集(2022年版)
- (完整word版)中小学教育质量综合评价指标框架(试行)
- 《新概念英语》第一册单词表
- 半泽直树日语字幕台词(一)
- 拌和站地基承载力及抗倾覆计算书
评论
0/150
提交评论