版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、矿脉分布的回归模型建立与选择论文关键词:散点图回归模型剩余标准差论文摘要:本文主要研究的是矿脉分布的模型建立,通过对数据的分析,作出散点图,然后建立适宜的回归模型,如:线性模型、二次模型、双曲线模型、对数模型等。运用atlab软件,通过对建立模型的剩余标准差比拟,选择出最适宜的回归模型为二次模型。通过对论文的研究,熟悉atlab软件的应用以及在模型建立中对模型选择的认识。1引言本文通过研究矿脉的分布的研究,建立回归模型,包括线性模型、二次模型、双曲线模型、对数模型等模型。应用atlab软件对模型的比拟与分析,选择出最适宜的模型并对结果进展分析。2模型分析2.1问题的重述一矿脉有13个相邻样本点
2、,人为地设定一原点,现测得各样本点对原点的间隔 x,与该样本点处某种金属含量y的一组数据如下附录表2.1,画出散点图观测二者的关系,试建立适宜的回归模型,如二次曲线、双曲线、对数曲线等。2.2问题的分析2.2.1模型假设本问题中没有给出明确的模型选择,我们先画出其散点图,然后对其分析,建立模型。从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个点估计,应该对它们作区间估计或假设检验,假如置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的。另外也可以用方差分析方法对模型的误差进展分析,对拟合的优劣给出评价。详细地说,回归分析在一组数据的根底上
3、研究这样几个问题:(i)建立因变量y与自变量qutequte之间的回归模型经历公式;ii对回归模型的可信度进展检验;iii判断每个自变量对y的影响是否显著;iv诊断回归模型是否合适这组数据;v利用回归模型对y进展预报或控制。2.2.2模型建立atlab统计工具箱用命令regress实现多元线性回归,用的方法是最小二乘法,用法是:b=regress(y,x).其中x,y是按照qute,qute式排列的数据,b为回归系数估计值为qute通过码头atlab建立回归模型。b,bint,rint,stats=regress(y,x,alpha)这里y,x同上,alpha为显著性程度缺省时设定为0.05,
4、b,bint为回归系数估计值和它们的置信区间,,rint为残差向量及其置信区间,stats是用于检验回归模型的统计量,有三个数值,第一个是qute,第二个是qute,第三个是与f对应的概率p,pqute回绝qute,回归模型成立.残差以及置信区间可以用rplt(,rint)画图。3模型求解3.1散点图模型的求解输入程序及题目数据,绘出散点图:图3.1从图像上看,假如第一个点数据剔除,线性关系比拟明显,但并不能排除其他模型。下面就对几种模型都加以计算比拟。图3.1,程序见附录3.13.1.1线性模型输入程序得到图3.2,程序见附录3.2图3.2结果输出:b=108.25810.1742bint=
5、107.2794109.23670.08910.2593stats=0.648420.28660.0009线性相关系数较小,线性回归模型在alpha0.0009成立第一个点为异常点仅指线性模型下,予以剔除,再次输入程序得图3.3,程序见附录3.3图3.3结果输出:b=109.06680.1159bint=108.8264109.30720.09580.1360stats=0.9428164.80600.0000剔除第一个点后线性系数和p值都变得好了很多。没有异常点。线性模型为:qute对该模型求剩余标准差:rse=sqrt(su(y-b(1)-b(2)*x1).2)/10)得:rse=0.16
6、353.1.2二次曲线考虑第一个点偏离太多,予以剔除后重新输入程序计算可得:p=-0.00430.2102108.6718二次模型qute对该模型求剩余标准差:y,delta=plynf(p,x,s);rse=sqrt(su(y-y).2)./10),得:rse=0.1231程序见附录3.43.1.3双曲线模型双曲线模型类似于qute,可以通过将x的倒数代换转化为线性模型来求。输入程序得到图(3.4,程序见附录3.5图3.4输出结果:b=111.4405-9.0300bint=111.1068111.7743-10.6711-7.3889stats=0.9302146.67330.0000有两
7、个异常点,剔除后再次输入程序可得图3.5,程序见附录3.6图3.5输出结果:b=111.5653-10.9938bint=111.2882111.8424-13.5873-8.4002stats=0.9309107.76230.0000双曲线模型qute对该模型求剩余标准差:rse=sqrt(su(y-b(1)-b(2)./x1).2)/8)得:rse=0.14873.1.4对数曲线类似于双曲线模型,输入程序得图3.6,程序见附录3.7图3.6输出结果:b=106.71131.5663bint=105.6382107.78441.08282.0499stats=0.822150.82850.0
8、000剔除异常点,重新输入程序计算可得图3.7,程序见附录3.8图3.7输入结果:b=107.97621.0496bint=107.6403108.31210.90371.1956stats=0.9625256.70140.0000对数模型qute对该模型求剩余标准差:rse=sqrt(su(y-b(1)-b(2)*lg(x1).2)/10)得:rse=0.13243.2结果比拟通过对几个模型的比拟可得,二次模型的剩余标准差最校不过几个模型的差异很校如表3.1线性模型二次模型双曲线模型对数模型0.16350.12130.14870.1324表3.14结果分析第一个点的讨论。纵观四个模型,第一个
9、点都属于异常点,需要剔除。但什么样的点必须剔除?对于这个问题,不合理的点固然要剔除,但同时点数的减少又将使得样本的容量变小,信度降低,这就需要使用者的判断。向此题中的第一个数据,很明显不符合任何模型,严重干扰回归分析,可以判断为是异常点,予以剔除。第二个是模型的选择。此题目的特点在于,因为对矿物分布和地质知识的缺乏,不能从理论上加以分析,只能从数据本身出发,加以分析。这就隐藏了很多问题。5论文中的公式qute,qute2.1qute2.2qute2.36结论通过对几个模型的比拟可得,二次模型的剩余标准差最校不过几个模型的差异很校固采用二次模型为最适宜模型附录表2.1x23457810y106.
10、42109.20109.58109.50110.00109.93110.49x111415161819y110.59110.60110.90110.76111.00111.20程序3.1x1=23457810111415151819;y=106.42109.20229.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20;plt(x1,y,+)程序3.2alpha=0.05;x1=23457810111415151819;y=106.42109.20229.58109.50110.00109.93110.49110.591
11、10.60110.90110.76111.00111.20;x=nes(13,1),x1;b,bint,r,rint,stats=regress(y,x,alpha);b,bint,stats,rplt(r,rint)程序3.3alpha=0.05;x1=3457810111415151819;y=109.20229.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20;x=nes(12,1),x1;b,bint,r,rint,stats=regress(y,x,alpha);b,bint,stats,rplt(r,rin
12、t)程序3.4x=3457810111415151819;y=109.20229.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20;p,s=plyfit(x,y,2);p程序3.5alpha=0.05;x1=23457810111415151819;y=106.42109.20229.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20;x=nes(13,1),1./x1;b,bint,r,rint,stats=regress(y,x,alpha)
13、;b,bint,stats,rplt(r,rint)程序3.6alpha=0.04;x1=57810111415151819;y=109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20;x=nes(10,1),1./x1;b,bint,r,rint,stats=regress(y,x,alpha);b,bint,stats,rplt(r,rint)程序3.7alpha=0.05;x1=23457810111415151819;y=106.42109.20229.58109.50110.00109.93110.49110.59110.60110.90110.76111.00111.20;x=nes(13,1),lg(x1);b,bint,r,rint,stats=regress(y,x,alpha);b,bint,stats
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育机构教师责任书(3篇)
- 产品质控标准履行承诺函(3篇)
- 护理评估技术
- 2026年体育理论课试题及答案
- 护理安全的风险评估
- 2026年小学五年级下册数学阶段学情诊断分析卷含答案
- 2026年小学四年级上册语文高频考点真题汇编卷含答案
- 2026年小学三年级上册作文素材积累与运用卷含答案
- 健康体检基本项目专家共识
- 伯恩斯坦-中国互联网:第二重要的事-China Internet:The second most important thing-20260416
- 项目管理项目收尾阶段验收交付流程手册
- 2026浙江省浙共体中考数学一模试卷(含答案详解)
- 护士职称聘用证明标准范本
- 盐城市2023江苏盐城广播电视总台招聘笔试历年参考题库典型考点附带答案详解(3卷合一)
- 施工现场围挡安装计划
- 四级手术术前多学科讨论制度(2025年)
- 肿瘤标志物异常结果分析
- 高考日语项目协议书
- 小学生综合素质评价表模板
- Bioactive-peptides-食品营养学课件
- 十五五规划纲要:畜禽养殖废弃物资源化利用政策
评论
0/150
提交评论