数学与计算科学学1.docx_第1页
数学与计算科学学1.docx_第2页
数学与计算科学学1.docx_第3页
数学与计算科学学1.docx_第4页
数学与计算科学学1.docx_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学与计算科学学院实 验 报 告实验项目名称 某类研究学者的年薪与相关因素分析所属课程名称 数学实验 实 验 类 型 综合 实 验 日 期 2013-10-24 班 级 学 号 姓 名 成 绩 一、实验概述:【实验目的】 1.研究某类研究学者的年薪与相关因素分析问题; 2.运用回归模型来解决实际问题; 3.提高我们的编程、分析问题、建立模型的能力; 4.运用不同的方法检验模型,并进行残差分析。【实验原理】 1.利用回归模型求解实际问题; 2.MATLAB绘图方法; 3.模型检验原理; 4.残差分析原理; 5.最优回归方程的选取原理。 【实验环境】 硬件:Windows 旗舰版 Microsoft Corporation Intel(R) Core(TM)i5-3317U CPU 1.70GHz 1.70GHz,3.86GB的内存 软件:MATLAB 7.0二、实验内容:【实验方案】问题重述:对于工薪阶层的人群关心年薪与哪些因素有关,以此可制订出他们自己的奋斗目标。某科学基金会希望估计从事某科学研究者的年薪Y与他们的研究成果(论文、著作等)的质量指标、从事研究工作的时间、能成功获得资助的标准之间的关系,为此按一定的试验设计方法调查了24为研究者,得到如下数据:表7.4从事某种研究的学者的相关指标数据i123456789101112Xi13.55.35.15.84.26.06.85.53.17.24.54.9Xi29201833311325305472511Xi36.16.47.46.77.55.96.04.05.88.35.06.4yi33.240.338.746.841.437.539.040.730.152.938.231.8i131415161718192021222324Xi18.06.56.63.76.27.04.04.55.95.64.83.9Xi223353921740352333273415Xi37.67.05.04.45.57.06.03.54.94.38.05.0yi43.344.142.533.634.248.038.035.940.436.845.235.1 试建立Y和之间关系的数学模型,并对该模型进行各种统计分析,能得到一个什么样的结论?问题分析:【实验过程】(实验步骤、记录、数据、分析)1符号说明1)设从事某科学研究者的年薪为Y;2)研究成果(论文、著作等)的质量指标为;3)从事研究工作的时间为;4)能成功获得资助的标准为。2基本假设1)从事某科学研究者的年薪有三项指标:研究成果(论文、著作等)的质量指标、从事研究工作的时间和能成功获得资助的标准,它们构成模型的回归自变量;2)因变量是某科学研究者的年薪Y;3)自变量与因变量Y之间具有显著的线性关系,且考虑()固定取几组值;4)实际观测值与估计值之间的偏差均值为0,方差为,并且实际观测值的统计规律为正态分布。3模型建立与求解建立回归模型:,使用MATLAB编程得到结果为:b =17.8345 1.0947 0.3201 1.3023stats = 0.9094 66.8839 0.0000 3.11521) 回归模型中参数的估计值由以上输出结果知,回归模型中的参数分别是:=17.8345,=1.0947,=0.3201,=1.3023,=3.1152,回归方程为:。2) 模型检验:需要检验:a.F检验法:由输出结果可知,F值从stats中读取,F=66.8839,根据F检验准则知,拒绝,即认为与Y的线性关系显著。b.相关系数r的评价:stats中的第一个数据就是相关系数r的平方,即=0.9094,则=0.9536,即回归自变量与因变量具有较强的线性相关性。c.p值检验:stats中的第三个数据就是p值,即p=0.0000,同样说明回归自变量与因变量Y的线性关系显著。以上使用的三种统计推断方法推断的结果是一致的,都认为自变量与因变量Y的线性关系显著。说明以上模型假设和回归模型能够基本反映与Y的关系。3) 残差分析:a. 残差向量正态性的图形检验使用MATLAB程序进行线性回归分析,其中r,rint分别代表残差向量和残差向量的区间估计。利用残差向量r和MATLAB语句,得到如下图形:理论上可以证明,若是来自正态分布总体的样本,则点“+”呈现的三点应在一条直线上。从以上图形可知,误差的正态型假设是合理的。b.残差图分析利用残差向量r,残差的区间估计值rint和MALAB语句,得到如下所示图形:可见图中所示的三个奇异点,删除奇异点后,重新建立回归方程,MATLAB输出结果为:b =18.8972 0.8831 0.3161 1.3586stats =0.9511 110.1069 0.0000 1.6481即回归模型中的参数分别是:=18.8972,=0.8831,=0.3161,=1.3586,=1.6481,回归方程为:。时序残差图为:由图可知无奇异点,建立的线性回归模型比较适合与样本数据。4) 最优回归方程的选取: 主要通过筛选自变量,得到一个最佳的回归方程,常用的方法是逐步回归法。在MATLAB中执行程序语句,得到如下结果:图中显示了回归及方差分析的各种信息,有回归方程的系数、系数的区间估计值、均方误差、负相关系数平方、F统计量值和p值。通过对某类研究学者的年薪与相关因素分析的关系模型逐步回归分析知,最佳的回归方程是所有自变量都在回归模型中,并且是线性函数关系,即前面计算得到的回归方程就是最佳的回归方程。【实验结论】(结果)建立某类研究学者的年薪与相关因素的回归模型:,得到回归方程为:。在残差图分析中,去掉三个奇异点后建立新的回归模型,得到的回归方程为:。可见某类研究学者的年薪Y与研究成果(论文、著作等)的质量指标、从事研究工作的时间和能成功获得资助的标准线性相关。并且,当发表的研究成果的质量指标和成功获得资助的标准越高时,他的年薪也越高,这与实际情况相符。【实验小结】(收获体会)通过此次试验,我了解了更多关于回归模型方面的知识,并且可以通过MATLAB软件建立回归模型求出回归方程;并通过不同的方法对该模型进行分析,优化模型;而且得到了其残差、时序残差图等;这不仅对于我来说是一个很好的锻炼机会,提高编程能力解决实际问题,而且对于以后的工作也有一定的辅助作用。在式样过程中也遇到一些问题,但独立解决后,使自己多了一些经验,以后解决这类问题也会更加得心应手。当然,我们的建模能力还是很普通,今后会更努力学习。三、指导教师评语及成绩:评 语评语等级优良中及格不及格1.实验报告按时完成,字迹清楚,文字叙述流畅,逻辑性强2.实验方案设计合理3.实验过程(实验步骤详细,记录完整,数据合理,分析透彻)4实验结论正确. 成 绩: 指导教师签名: 批阅日期:附录1:源 程 序1.残差向量的正态性检验:clearclcA=3.5 5.3 5.1 5.8 4.2 6.0 6.8 5.5 3.1 7.2 4.5 4.9 8.0 6.5 6.6 3.7 6.2 7.0 4.0 4.5 5.9 5.6 4.8 3.9; 9 20 18 33 31 13 25 30 5 47 25 11 23 35 39 21 7 40 35 23 33 27 34 15; 6.1 6.4 7.4 6.7 7.5 5.9 6.0 4.0 5.8 8.3 5.0 6.4 7.6 7.0 5.0 4.4 5.5 7.0 6.0 3.5 4.9 4.3 8.0 5.0;a=ones(24,1);X=a,A;Y=33.2 40.3 38.7 46.8 41.4 37.5 39.0 40.7 30.1 52.9 38.2 31.8 43.3 44.1 42.5 33.6 34.2 48.0 38.0 35.9 40.4 36.8 45.2 35.1;Alpha=0.05;b,bint,r,rint,stats=regress(Y,X,Alpha)normplot(r)title(残差向量的正态性检验图);xlabel(数据);ylabel(概率);2. 时序残差图:clearclcA=3.5 5.3 5.1 5.8 4.2 6.0 6.8 5.5 3.1 7.2 4.5 4.9 8.0 6.5 6.6 3.7 6.2 7.0 4.0 4.5 5.9 5.6 4.8 3.9; 9 20 18 33 31 13 25 30 5 47 25 11 23 35 39 21 7 40 35 23 33 27 34 15; 6.1 6.4 7.4 6.7 7.5 5.9 6.0 4.0 5.8 8.3 5.0 6.4 7.6 7.0 5.0 4.4 5.5 7.0 6.0 3.5 4.9 4.3 8.0 5.0;a=ones(24,1);X=a,A;Y=33.2 40.3 38.7 46.8 41.4 37.5 39.0 40.7 30.1 52.9 38.2 31.8 43.3 44.1 42.5 33.6 34.2 48.0 38.0 35.9 40.4 36.8 45.2 35.1;Alpha=0.05;b,bint,r,rint,stats=regress(Y,X,Alpha)rcoplot(r,rint)3.修正后的时序残差图:clearclcA=3.5 5.3 5.1 4.2 6.0 6.8 5.5 3.1 7.2 4.5 8.0 6.5 6.6 3.7 6.2 7.0 4.5 5.9 5.6 4.8 3.9; 9 20 18 31 13 25 30 5 47 25 23 35 39 21 7 40 23 33 27 34 15; 6.1 6.4 7.4 7.5 5.9 6.0 4.0 5.8 8.3 5.0 7.6 7.0 5.0 4.4 5.5 7.0 3.5 4.9 4.3 8.0 5.0;a=ones(21,1);X=a,A;Y=33.2 40.3 38.7 41.4 37.5 39.0 40.7 30.1 52.9 38.2 43.3 44.1 42.5 33.6 34.2 48.0 35.9 40.4 36.8 45.2 35.1;Alpha=0.05;b,bint,r,rint,stats=regress(Y,X,Alpha)rcoplot(r,rint)title(时序残差图);xlabel(数据);ylabel(概率);4. 最优回归方程的选取:clearclcA=3.5 5.3 5.1 5.8 4.2 6.0 6.8 5.5 3.1 7.2 4.5 4.9 8.0 6.5 6.6 3.7 6.2 7.0 4.0 4.5 5.9 5.6 4.8 3.9; 9 20 18 33 31 13 25 30 5 47 25 11 23 35 39 21 7 40 35 23 33 27 34 15; 6.1 6.4 7.4 6.7 7.5 5.9 6.0 4.0 5.8 8.3 5.0 6.4 7.6 7.0 5.0 4.4 5.5 7.0 6.0 3.5 4.9 4.3 8.0 5.0;a=ones(24,1);X=a,A;Y=33.2 40.3 38.7 46.8 41.4 37.5 39.0 40.7 30.1 52.9 38.2 31.8 43.3 44.1 42.5 33.6 34.2 48.0 38.0 35.9 40.4 36.8 45.2 35.1;Alpha=0.05;b,bint,r,rint,stats=regress(Y,X,Alpha)stepwise(X,Y,2,3,4,0.1)附录2:实验报告填写说明 1实验项目名称:要求与实验教学大纲一致。2实验目的:目的要明确,要抓住重点,符合实验教学大纲要求。3实验原理:简要说明本实验项目所涉及的理论知识。4实验环境:实验用的软、硬件环境。5实验方案(思路、步骤和方法等):这是实验报告极其重要的内容。概括整个实验过程。对于验证

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论