版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 数学模型课程设计(论文)设计(论文)题目统计模型案例分析学院名称专业名称学生姓名学生学号指导教师管理科学学院应用统计学刘春莉201707100218薛源设计(论文)成绩E2C309教务处制2019年06月19日填写说明1、专业名称填写为专业全称,有专业方向的用小括号标明;2、格式要求:格式要求:用A4纸双面打印(封面双面打印)或在A4大小纸上用蓝黑色水笔书写。打印排版:正文用宋体小四号,1.5倍行距,页边距采取默认形式(上下2.54cm左右2.54cm,页眉1.5cm,页脚1.75cm)。字符间距为默认值(缩放100%,间距:标准);页码用小五号字底端居中。具体要求:题目(二号黑体居中);摘
2、要(“摘要”二字用小二号黑体居中,隔行书写摘要的文字部分,小4号宋体)关键词(隔行顶格书写“关键词”三字,提炼3-5个关键词,用分号隔开,小4号黑体);正文部分采用三级标题;第1章XX(小二号黑体居中,段前0.5行)1.1XXXXX小三号黑体XXXXX(段前、段后0.5行)1.1.1小四号黑体(段前、段后0.5行)参考文献(黑体小二号居中,段前0.5行),参考文献用五号宋体,参照参考文献著录规则(GB/T77142005)。实验一摘要:本文对某地教师薪金与其他影响因素做了合理科学的分析,建立教师薪金与其影响因素的回归模型。问题(1)中我们很难确定到底与薪金哪些因素有关,在模型中我们考虑到了题目
3、给出的所有因素,通过题目给出的数据,我们建立了初步的线性回归模型,用MATLAB软件求解。通过对解出的数据进行分析,我们发现模型存在缺陷,有些变量对因变量的影响不显著,这也就说明这些因素对所调查的教师的薪金影响较小。我们剔除了其中对因变量影响不显著的变量,使模型得到进一步的改进,然后再用对因变量影响显著的XI和X4建立了简单的统计回归模型,求解之后发现,模型依然没有达到理想的效果,然后再利用残差分析法,在前一模型中增加了他们的交互项和平方项,最终得到进一步改进的模型。然后再利用MATLAB软件对其进行求解。关键词:统计回归模型;MATLAB一问题重述某地人事部门为研究中学教师的薪金与他们的资历
4、,性别,教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人士策略的合理,特别是考虑女教师是否受到不公平的待遇,以及他们的婚姻状况是否会影响收入。为此,从当地教师中随机选了3414位进行观察,然后从中保留了90个观察对象,得到了下表给出的相关数据。尽管这些数据具有一定的代表性,但是仍有统计分析的必要。现将表中数据的符号介绍如下:Z月薪(元)XI工作时间(月)X2=l男性,X2=0女性;X3=1男性或单身女性,X3=0已婚女性;X4学历(取值06,值越大表示学历越高);X5=1受雇于重点中学,X5=0其它;X6=1受过培训的毕业生,X6=0未受过培训的毕业生或受过培训的肄业生;X7=1
5、以两年以上未从事教学工作,X7=0其它。注意组合(X2,X3)=(1,1),(0,1),(0,0)的含义。进行变量选择,建立变量X1X7与Z的回归模型(不一定包括每个自变量),说明教师的薪金与哪些变量关系密切,是否存在性别和婚姻状况上的差异。为了数据处理上的方便,建立对薪金取对数后作为因变量。(1)除了变量XIX7本身之外,尝试将他们的平方项或交互项加入到模型中,建立更好的模型量。(2)给出变量XIX7的相关系数,偏向关系,并对z,XIX7分析因子关系。ZX1X2X3X4X5X6X7ZX1X2X3X4X5X6X719987000000462201158114011210151411000047
6、299215911511131028181101004816951620100004125019110000491792167110100510281901010050169017300000161028190000005118271740000017101827000001522604175112110810723000000053172019901000091290301100005417202090000001012043001000055215920901410011135231012010561852210010000121204310001005721042131101001311
7、043800000058185222000000114111841110000591852222000000151127420000006022102221100001612594211010061226622301000017112742110000622027231100001811274200010063185222700010019109547000001641852232000001201113520000016519952350000012114625201201066261624511311022118254110000672324253110100231404540001006
8、818522570100012411825400000069205426000000025159455112110702617284113110261459660001007119482871100002712376711010072172029001000128123767010100732604308112110291496750100007418523091101013014247811010075194231900010031142479010000762027325110000321347911101007719423261101003313439200000178172032911
9、010034131094000100792048337000000351814103002110802334346112111361534103000000811720355000001371430103110000821942357110000381439111110100832117380110001391946114113110842742387112111402216114114110852740403112111411834114114111861942406110100421414117000001872266437010000432052139110100882436453010
10、000442087140002111892067458010000452264154002111902000464112110图1二问题分析与模型假设1.问题分析本题要求我们分析教师薪金与他们的资历,性别,教育程度及培训情况等因素之间的关系。按我们日常生活中的常识,教师薪金应该与他们的资历,受教育程度有密切关系,资历高,受教育程度高其薪金也应该相应的要高,性别,婚姻状况可能没有必然的联系。为了说明教师薪金于各个因素之间的关系以及女教师是否收到不公平的待遇,她们的婚姻状况是否影响其收入。我们建立统计回归模型,通过各组数据来说明他们之间的关系,并进一步分析论证来确定影响教师薪金的因素。2.模型假设
11、工作时间、性别、教育程度及培训情况之间相互独立,没有交互作用;假设教师薪金除题中所列因素之外不再考虑其他因素对教师薪金的影响;该地区的人事部门对中学教师的薪金调查是可信的;三模型建立与求解模型一为了便于研究,假定:培训情况,性别,单身与否,受雇于重点中学与否,以前从事过教师职业与否等之间没有交互作用,建立薪金Z与工作时间(XI),性别(X2),婚姻状况(X3),学历(X4),受雇学校(X5),培训情况(X6)及从事教育年限(X7)之间的多元线性回归模型(为了数据处理上的方便,我们对薪金取对数后作为自变量。)为:y二a0+alXl+a2X2+a3X3+a4X4+a5X5+a6X6+a7X7+(1
12、)其中a0,al,a2,a3,a4,a5,a6,a7是待估计的回归系数,是随机误差。它是由众多的未加考虑的因素(包括随机因素)所产生的影响。利用Matlab统计工具可以得到回归系数及其置信区间(置信水平a=0.05),检验统计的量R2,F,p的结果见图2参数参数估计值参数置信区间a07.05716.9923,7.1218al0.00170.0014,0.0019a20.0094-0.0759,0.0946a3-0.00270.0916,0.0863a40.08840.038&0.1380a50.0208-0.0486,0.0902a60.0354-0.1103,0.1811a7-0.0046-
13、0.0805,0.0712R2=0.7900F=44.0765p0.0001s2=0.0188图2结果分析:从表中R2=0.7900,即因变量(薪金)的79.00%可由模型决定,F值远大于F检验的临界值,P远小于置信水平,所以模型一从整体上看是可用的。模型二进一步的讨论:模型一的结果中我们发现对于a2,a3,a5,a6,a7其置信区间中包含0点;所以该模型是存在缺点,我们将性别,婚姻状况,受雇学校,培训情况及从事教育年限从模型中剔除不予考虑,建立一个只关于工作时间和学历程度的模型。得到模型如下:y=b0+blXl+b4X4+(2)其中b0,bl,b4是待估计的回归系数,是随机误差。它是由众多的
14、未加考虑的因素(包括随机因素)所产生的影响。利用Matlab统计工具可以得到回归系数及其置信区间(置信水平a=0.05),检验统计的量R2,F,p的结果见图3参数参数估计值参数置信区间b07.06527.0165,7.1138bl0.00170.0014,0.0019b40.10270.0794,0.1260r2=0.7874F=161.1350p0.0001s2=0.0180图3在这里就可以大致说明:分析人事策略的合理性,女教师是没有受到不公平的待遇的,同时她们的结婚与否并不会影响其收入。模型三通过上述的分析,为了得到更好的模型,我们先大致分析y与X1,X4的关系,首先利用图1的数据分别作出
15、y对X1,X4的散点图.系列1X1的散点图0123456y对X2的散点图从图中可以发现,随着XI的增加,y的值增长减小.我们对上面的模型引入自变量的X1的平方项.模型如下y二cO+c1X1+c2X4+c3X2+(3)其中cO,cl,c2,c3是待估计的回归系数,是随机误差。它是由众多的未加考虑的因素(包括随机因素)所产生的影响。利用Matlab统计工具可以得到回归系数及其置信区间(置信水平a=0.05),检验统计的量R2,F,p的结果见图3参数参数估计值参数置信区间C06.911465907047196.86302176549634,6.95991004859805c10.0042239230
16、00730.00364401902828,0.00480382697319c20.089979714416370.07302164681304,0.10693778201969c3-0.00000608009796-0.00000740826516,-0.00000475193076R2=0.8917F=236.0527p0.0001s2=0.0093可以看到R2拟合度增高,因此模型更优模型四前面的模型我们假设各个因素之间没有交互作用,但是现实中可能存在交互作用.我们应该在模型中加入交互项,以提高模型准确度.在模型三基础上增加X1与X4的交互项模型记为y二d0+dlXl+d2X4+d3X2+d
17、4XlX4(4)利用Matlab统计工具可以得到回归系数及其置信区间(置信水平a=0.05),检验统计的量R2,F,p的结果见图3参数参数估计值参数置信区间d06.910666335209976.86168392730437,6.95964874311557di0.004217347791210.00363272448148,0.00480197110094d20.095065074802230.05805279003974,0.13207735956472d3-0.00000603312814-0.00000740260117,-0.00000466365512d4-0.0000284494
18、8544-0.00021222974895,0.00015533077807R2=0.8918F=175.1996p0.05,可知在显著性水平a=0.05下接受:十:m=2。lambda二0.40390.83350.40560.89960.51710.70630.66910.58180.72680.56970.88570.44900.89990.42500.86430.4074图4因子载荷矩阵psi二0.14220.02620.23310.21380.14720.01390.00950.0870图5方差估计值由图4可得因子模型如下=0.4039+0.8335+=0.4056+0.8996=0.
19、5171+0.7068=0.6691+0.5818=0.7268+0.5697=0.8857+0.4490=0.8999+0.4250=0.8643+0.4074且由图5,可知特殊方差的估计值为8*=(0.1422,0.0262,0.2331.0.213&0.1472,0.01308970)095,0.(第四问)表3:得分最低五位表4得分最高五位表5:得分最低五位表6:得分最高五位29-1.6455471.671248-1.1126341.68574-1.003752.046544-0.9104113.411835-0.9058463.439154-2.6269531.357534-1.648
20、1311.90136-1.5425411.986427-1.5421362.173720-1.4387112.3677四、运行结果分析由表1,可以看出第一主成分Y的方差贡献率为83.6275%,前两个主成分的累积方差贡献率为91.5625%,所以只用前两个主成分就可以了.从y1的表达式看,它在每个标准化变量上有相近的正载荷.说明每个标准化变量对的重要性都差不多,反映了径赛项目均衡水平,故可以解释为径赛的“优异水平成分”从y2的表达式看,它在标准化变量:和&上都有中等程度的正载荷在后5个标准化变量上均为负载有,恰好反映了径赛中短距离项目与长距离项目的对照,故可以解释为竞赛的“距离成分”从“优异水
21、平成分”y的排序,由于径赛成绩越小越优秀。由计算结果得到,“优异水平成分”排名前5位的国家或地区分别为美国、英国、意大利、肯尼亚和法国。最后5位的国家或地区分别为库克群岛、萨摩亚、新加坡巴布业新儿内亚和缅甸,这种排序与最初对不同国家或地区的运动水平的看法基本一致。因子载荷矩阵的估计中发现.标准化变量*(500m):-(1000m)4(马拉松)的成绩在第一公共因子上的载荷较大.说明它主要反映运动员的耐力,可以解释为“耐力因子”(100m):(200m)的成绩在第二公共因子二上的载荷较大,说明它主要反映运动员的速度,可以解释为“速度因子”。“耐力因子”二越小的越擅长于长跑项目,由二得分可知,在长跑项目更具有优势的国家或地区依次为:肯尼亚、西班牙、比利
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广西北海市第二中学(北京八中北海分校)临聘教师招聘2人备考题库及答案详解(易错题)
- 2026年1月广东广州市天河区金穗幼儿园招聘编外聘用制专任教师2人备考题库带答案详解ab卷
- 2026上半年青海事业单位联考海南州招聘80人备考题库带答案详解(满分必刷)
- 体育场馆卫生管理制度范本
- 粉尘防爆安全知识暨《工贸企业粉尘防爆安全规定》考试题及答案
- 师德师风自查自纠报告及整改措施范文多篇
- 2026年教师资格之中学信息技术学科知识与教学能力通关考试题库带答案解析
- 2026中铁科研院生态环境科技公司招聘4人备考题库带答案详解(综合题)
- 2026上海交通大学医学院招聘85人备考题库带答案详解(巩固)
- 2026北京首都体育学院人才引进10人备考题库(第一批)附答案详解(黄金题型)
- 2026湖北十堰市丹江口市卫生健康局所属事业单位选聘14人参考考试题库及答案解析
- 手术区消毒和铺巾
- 企业英文培训课件
- 土方回填安全文明施工管理措施方案
- 危废处置项目竣工验收规范
- (正式版)DBJ33∕T 1307-2023 《 微型钢管桩加固技术规程》
- 2025年宠物疫苗行业竞争格局与研发进展报告
- 企业安全生产责任培训课件
- 绿化防寒合同范本
- 2025年中国矿产资源集团所属单位招聘笔试参考题库附带答案详解(3卷)
- 中国昭通中药材国际中心项目可行性研究报告
评论
0/150
提交评论