第三次个人赛论文.doc_第1页
第三次个人赛论文.doc_第2页
第三次个人赛论文.doc_第3页
第三次个人赛论文.doc_第4页
第三次个人赛论文.doc_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

孙欢 09数学1班 座位号C9观测站的重组与优化摘要本文是为了解决有关观测点的优化问题,即为达到减少观测站同时既可以节省开支,又可以使得该市年降水量的信息量损失较小的目地。本文提出的问题也是以从个别到一般的形式进行的,下面我们依次进行分析:针对问题1,我们先将观测点7,8图像进行比较并通过SPSS相关性检验,得出其拟合度较高的结论,并以8为自变量,7为因变量,构建回归模型,用SPSS解得到观测点7的回归方程,并用F检验的得到符合题中假设。针对问题2,先用分层聚类法求得大体分类和各类的组成,通过每组中方差的比较得出应当去掉哪些观测点,然后分别构建回归函数,并用F检验其是否合格,最终得到应该去掉观测点2,6,7。同时我们用相关性和显著性来检验,得到相似度最高的也为2和3,6和7,8这两组。针对问题3,我们先算出实际观测的各年平均降雨量,并用问题1,2中的回归方程得到被去掉观测点的估计值,并求出相应的均值。最终用累计函数分布图得到小于10mm的概率约为0.777,大于20mm的概率为 0.0555。检验中,我们通过用不同软件(6SQ)的计算来检验得到的结论。 针对上面的问题,我们从观测值波动的角度提出了若去掉观测点8更合理的改进,经过计算我们得出了去掉8后拟合6,7。P值(显著性指标)更大,所以我们认为改进是合理的。关键词:回归模型,分层聚类,相似度和显著性一、 问题的提出与重述问题的提出:某市有10个县,每个县有一个气象观测站(位置如附录图1),每个气象观测站测得的年降水量即为该县的年降水量。30年来各观测站测得的年降水量如附表1。为了节省开支,想要适当减少气象观测站,但希望减少观测站同时既可以节省开支,又可以使得该市年降水量的信息量损失较小。请你选出这些观测站。问题的重述:1第7个观测站和第8个观测站观测到的数据之间可能有相关关系,所以第7个观测站可以减少,第7个观测站的年降水量信息可以从第8个观测站观测到的数据中获取,问如何得出,并予以讨论。2除了观测点7还有哪些观测站可以减少,减少的观测站的年降水量信息如何获取。3如果以10个县年降水量的平均值为该市年平均降水量。在减少观测站以前,每个县年降水量都是观测数据。在减少观测站以后,被减少的观测站的年降水量只能从其它观测站观测到的数据中获取。减少观测站以前和减少观测站以后是用两种不同测量计算方法得到该市年平均降水量。两种不同测量计算方法得到的该结果会有误差,试预测误差的绝对值小于10mm的概率是多少?误差的绝对值大于20mm的概率是多少?二、 问题的分析本题是希望我们选取一些作用不大的观测站,并予以淘汰。要求既可以节省开支,又可以使得该市年降水量的信息量损失较小。我们需要做的就是,找出哪些观测点间相关性大并发现相关观测点间的降雨量关系。针对问题1我们先进行直观的作图观察,并可以用SPSS中的相关性检验来验证两观测点间是否相关性较大,然后通过构建回归模型得到观测点7的回归方程,从而可以模拟出观测点7的降雨量数据。针对问题2我们可以先用分层聚类法大体得出分组和每组的成员,然后通过方差大小的比较得到应该去掉哪些观测点,并通过构建回归模型通过每组中留下的点得出除去的观测点的相关方程,并用F法检验其是否服从原假设(是否舍去)。最后我们可以通过相关性检验来检验我们最终得到的点是否正确。针对问题3 我们列出未减少观测站时的年平均降水量。再用减少后的观测站得出年平均降水量,求其差,得到绝对之后,将这些数据拟合并检验看其服从什么样的函数分布,然后通过所学的分布函数的相关知识计算出结果。三、 符号说明与模型假设3.1符号说明符号 含义第个观测点的实际降雨量(=3,8,10)第个观测点估测的降雨量(=2,4,6,7)回归拟合得到的系数(=2,3,4,6,7,8,10)第观测点的标准差(=2,3,4,6,7,8,10)3.2模型假设:(1) 假设这段时间内没有洪涝灾害,干旱等自然灾害的影响。(2) 假设每个观测点成本都是一样的,不存在拆除观测点时成本不一的问题。四、 模型的建立与求解4.1观察比较并得出相关性我们先做出观测点7和8的雨量监测图,观察两观测点的图像变化趋势。我们通过观察图像并且应用SPSS里的相关性检验,得出观测点7与8的拟合程度很高,所以我们建立回归模型,以观测点7为因变量,以观测点8自变量,假设回归方程为:方法1:用SPSS解得到:系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)61.93127.2252.275.0316.163117.699VAR000021.022.062.95216.507.000.8951.149a. 因变量: VAR00001即: 方法2:用MATLAB中regress命令解:得到两个系数为61.9307和1.0219,所以我们可以认为SPSS解得值准确可靠。因此我们可以用观测点8的降雨量数据来估算出观测点7的降雨量数据此时我们需要用F法检验是否服从该假设1.93F=40.005,服从假设。4.21分组我们通过分层聚类法将所有检测站的树形图画出,如下图:先以5为分组标准,我们初步得到分组情况为:观测点1 一组;观测点2,3一组;观测点9一组;观测点6,7,8一组;观测点4,10一组;观测点5一组,为检验我们所分的组及其组员是否准确:下面我们考虑每组中哪一个观测站应该去掉。我们去掉观测站的一局是该观测站的到的数据与附近的观测站拟合度很高,并且波动比同组中其他观测点小的点,所以我们选取标准差这一指标。计算这几个观测站的标准差得到:=93.618 =98.863=129.197 =123.473 =80.3779 =77.5154因为观测点8要用来拟合观测点7的数据,所以不能去掉观测点8,故这一组内只能去掉观测点6.通过比较这几组数据得出应该去掉,4.22去掉观测点2所以我们建立回归模型,以观测点3为自变量,以观测点2为因变量,假设回归方程为:用SPSS求解得出:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)111.44438.0462.929.007VAR00002.957.084.90611.356.000a. 因变量: VAR00003得到F=138.95服从假设。4.23去掉观测点6建立回归模型,以观测点8为自变量,以观测点6为因变量,假设回归方程为:用SPSS求解得出:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)52.81937.3251.415.168VAR00008.945.085.90311.135.000a. 因变量: VAR00006得到: F=123.98,服从假设。4.24去掉观测点10建立回归模型,以观测点10为自变量,以观测点4为因变量,假设回归方程为:用SPSS求解得出:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)459.10380.7295.687.000VAR00004.042.182.043.230.820a. 因变量: VAR00010得到: F=0.053所以拒绝假设,所以不能去掉观测点10然后我们用相关性分析来验证我们去掉的点,用SPSS实现后得到如附表4.得到相关性最强的点为2和3,6和7和8.与我们计算的结果一致。4.31数据处理1 先计算未减少前观测点各年的平均值得到:每年平均降雨量2 计算减少点后,所有观测点的降雨量及其均值(包括减少点的估计值)(见表5 )为方便比较,我们在此列出减少点后的降雨量均值3 将上面两组数据做差求绝对值,得到: 去掉观测点前后历年市年均降雨量比较年份前均值后均值差绝对值年份前均值后均值差绝对值1976451.2459.95338.75331991528.8536.970286468.94717.34711992565.6550.306215.29381978534.4538.62874.22871993459.2462.98723.78721979513.6525.799912.19991994523.2515.60787.59221980497.6504.48716.88711995440.8449.40798.60791981468474.74256.74251996624.8622.36462.43541982570.4574.61564.21561997580582.55922.55921983548532.754515.24551998577.6577.00860.59141984496485.100210.89981999484476.33627.66381985475.2467.09268.10742000474.4479.27784.87781986532537.88465.88462001432426.97145.02861987467.2460.32746.87262002527.2527.08420.11581988420419.8420.1582003516518.91812.91811989589.6581.19158.40852004464460.33623.66381990551.2549.7341.4662005555.2561.56366.36364.32正态分布的假设和验证我们将得到的数据进行正态分布假设,用ttest检验得到h=0,接受原假设,即服从正态分布。并用normplot得到下图:可以看出与直线拟合程度较高,所以验证了其服从正态分布。我们做出正态分布图:得到其正态分布函数为:得出:预测误差的绝对值小于10mm的概率为 0.777。误差的绝对值大于20mm的概率是0.0555。五、 模型的检验针对模型一和二,我们可以给出用6SQ软件得到的相应结果进行检验。得到每组站点间的回归方程 因变量自变量回归方程观测点6观测点8观测点3观测点2观测点7观测点8这些方程与SPSS得到的方程几乎一致。因此我们认为我们上面的回归模型是正确的。六、 模型的评价与改进本题能较好的找到了使减少观测点同时并且使数据信息损失量最少的几个观测点,但是通过我们的拟合知道6,7,8三个观测点拟合度很高,而通过标准差我们计算出应该先除去观测点8,所以我们如果通过先减少观测点8,再减少6来计算得到的观测结果应该更准确。=129.197 =123.473 构造的回归方程分别为:因变量自变量回归方程观测点8观测点7观测点7观测点7得到的P值(显著性指标)大于问题2,3中的P值,所以此改进应该是合理的。七、 参考文献(1)姜启源,谢金星,叶俊,高等教育出版社,数学模型第三版。附录 附录图1附表1:观测站降雨量数据日期监 测 站123456789101976600464584448648176328232488544197748838452041643243253644851244819786165206164885445045364964325921979688440520352880376456432552440198064833649649655244855244845654419816481843125128803843443126644401982728624728432576480568504640424198359244052862472862456847246444019846884646244724245446004403363681985520384376456640432504416592432198666440842439254455257657668849619876165125522807202723602565765281988608424464328536344312296552336198975250458448847264868058470448019905605526323608324645364566564641991624384496488472552576544480672199264843249640073675272062434450419939124965923924402563042485364161994768416496408720488624472432408199545632047243261632031227264856019969125526165046005446885767445121997728440480272848576680616720440199810003524484967765685444966644321999656368480448720440408320608392200062448060030449635245636850456020017683043844485602322881766804802002824552672472472424408360512576200368858468058443241639237656844020047444164804725044323283205763682005624520680424672536632544336584附表2聚类成员案例号聚类距离11.00022277.44532277.44544314.85955.00066208.63276266.78786224.63493.000104314.85911.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30附表3 每个聚类中的案例数聚类11.00022.00031.00042.00051.00063.000有效10.000缺失20.000附表4相关性VAR00001VAR00002VAR00003VAR00004VAR00005VAR00006VAR00007VAR00008VAR00009VAR00010VAR00001Pearson 相关性1.179.129.132-.044.126.109.110.255-.194显著性.343.496.488.816.506.566.562.175.304VAR00002Pearson 相关性.1791.906*-.093-.271.132.263.260-.115.096显著性.343.000.625.147.488.160.165.543.615VAR00003Pearson 相关性.129.906*1.040-.346.080.219.185-.289.215显著性.496.000.834.061.675.244.326.122.254VAR00004Pearson 相关性.132-.093.0401-.232.260.060.067-.092.043显著性.488.625.834.218.165.751.724.629.820VAR00005Pearson 相关性-.044-.271-.346-.2321.107.125.123.201-.128显著性.816.147.061.218.573.512.517.288.501VAR00006Pearson 相关性.126.132.080.260.1071.872*.903*-.145.020显著性.506.488.675.165.573.000.000.444.916VAR00007Pearson 相关性.109.263.219.060.125.872*1.952*-.161.148显著性.566.160.244.751.512.000.000.397.436VAR00008Pearson 相关性.110.260.185.067.123.903*.952*1-.070.169显著性.562.165.326.724.517.000.000.715.372VAR00009Pearson 相关性.255-.115-.289-.092.201-.145-.161-.0701-.194显著性.175.543.122.629.288.444.397.715.304VAR00010Pearson 相关性-.194.096.215.043-.128.020.148.169-.1941显著性.304.615.254.820.501.916.436.372.304*. 在 .01 水平(双侧)上显著相关。 附表5所有观测点的降雨量及其均值(包括减少点的估计值)日期12345678910均值1976600484.4401584448648272.0743299.0186232488544459.95331977488429.5066520416432476.2083519.7556448512448468.94711978616511.9069616488544521.5714568.8082496432592538.62871979688429.5066520352880461.0873503.4047432552440525.79991980648408.9066496496552476.2083519.7556448456544504.48711981648250.9727312512880347.6795380.773312664440474.74251982728608.0406728432576529.132576.9837504640424574.61561983592436.3733528624728498.8899544.2819472464440532.75451984688518.7736624472424468.6478511.5801440336368485.10021985520305.9062376456640445.9662487.0538416592432467.09261986664347.1063424392544597.1766650.5627576688496537.88461987616456.9734552280720294.7558323.5449256576528460.32741988608381.4398464328536332.5584364.4221296552336419.8421989752484.4401584488472604.7372658.7381584704480581.19151990560525.6403632360832483.7688527.931456656464549.7341

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论