数学建模海洋表面温度建模分析_第1页
数学建模海洋表面温度建模分析_第2页
数学建模海洋表面温度建模分析_第3页
数学建模海洋表面温度建模分析_第4页
数学建模海洋表面温度建模分析_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模海洋表面温度建模分析摘要本文针对海洋表面温度观测数据进行分析, 使用聚类分析的方法, 分别采用K-means、 Birch 方法建立数学模型, 使用 Python 和 MATLAB 语言及其工具包进行编程, 在合理的假设下, 确定了各个海区众多观测点的具体集群数目, 并且对某一海区同一类观察点给定数据通过插值拟合的方式, 建立反映温度变化规律的数学模型, 同时依据建立的模型对该区域的海洋表面温度的温度变化特点进行了分析说明。针对问题一: 结合聚类分析的理论和方法,分别采用 K-means、 Birch 方法建立数学模型, 使用 Python 和 MATLAB 语言及其工具包进行编程, 在合理的假设下,确定了各个海区众多观测点的具体集群数目。针对问题二: 由问题一的对于杭州湾的聚类分析, 我们对杭州湾同一类观察点给定数据通过插值拟合的方式得出了呈周期性变化的函数表达式。 杭州湾气温随季节变化最为明显, 杭州湾周边大型城市较多, 例如上海、 杭州、 宁波等, 距离陆地较近, 受到热岛效应及全球变暖及陆地季节变化等影响出现了四季分明的温度变化趋势, 而东海和南海距离陆地较远, 海域面积较广, 其年温差最小且海洋表面温度保持在 20 以上, 证实了海洋表面的自我温控能力,台湾海峡地处大陆与台湾之间, 海洋表面温度同样四季分明, 温差接近与杭州湾, 这一变化趋势来源于其二者之间的独特的地理位置。 故以杭州湾为例, 结合其周边新一线城市杭州近年来的GDP 以及碳排放量等重要数据, 对海洋表面温度变化规律及影响因素进行探究。针对问题三: 根据前面的问题二的模型分析, 四大海域的海水表面温度在逐渐升高, 近年来海域沿海周边大型工业城市 GDP 急速增长, 工业污染程度逐年猛增,二氧化碳的排放量飞速增长,这些都是引起海洋表面温度变化的关键因素。同时我们通过灰色关联分析法,对海洋表面温度变化与 GDP 之间的关系进行分析。 结合以上几点分析了温度变化趋势对现代人们生活和社会发展带来的巨大影响。 同时为了应对全球海洋表面温度的变化对人们生产生活出现的不良影响, 我们提出几点应对措施。关键词: 观测点 聚类分析 K-means Birch一、 问题重述1 . 1 研究背景:海洋表面温度是海洋物理性质中的最基本要素之一。 海洋水团的划分、 海水不同层次的锋面结构、 海流的性质判别等都离不开海水温度这一要素。 海洋表面温度是认识和了解上层海洋生物地球物理化学过程和海气相互作用的一把钥匙。掌握水温的分布变化规律对巩固国防、推动国民经济发展有着重要的意义。近些年来温室效应加剧, 海平面上升也加剧, 作为全球重要环境问题的海平面变化,已经越来越成为海洋科学家和气象学家共同关注的热点问题。海洋表面温度变化能够从分体环境的变化情况, 海洋表面污染的增多和全球的环境的污染以及二氧化碳的排放致使气温的升高, 都会引起海洋表面温度的升高, 同时海洋温度同时又有四季的周期变化的特点, 本题给出了东海、 杭州湾、南海、台湾海峡四个海区的温度10年间的日观测数据,通过数据建模回答以下问题。1 . 2 研究问题:问题一:通过每个海区的观测的观测数据,对观测点进行聚类分析。问题二:对同一类观察点对于给定数据建立反映温度变化规律的数学模型,依据建立的模型对该区域的海洋表面温度的变化特点进行说明(比如季节, 温度的变化趋势)。问题三: 综合几个海区的情况对全球海洋表面温度变化特点进行描述, 评估其变化趋势对人类的生活影响, 同时为了不出现不良影响, 人类的生活应该如何改变。二、 模型假设假设一:题目中所提供的东海、杭州湾、南海、台湾海峡四个海区的温度10 年间的日观测数据具有真实可靠性。假设二:四个海区中的列数据表示不同的观测点假设三:四个海区中的行数据表示从第一年到第十年每日数据假设四:四个海区中十年数据每月按 30 天计算三、 各海域观测点聚类模型建立与求解3. 1 、 聚类分析原理及其分类介绍:3. 1 . 1 、 聚类分析概念及其原理:聚类分析是研究“物以类聚” 的一种方法。 聚类分析又称为群分析, 是指依据研究对象的个体特征, 对其进行分类的方法。 分类在经济、 管理、 社会学、 医学等领域, 都有广泛的应用。 聚类分析是一种建立分类的多元统计分析方法, 他能够将一批样本(或变量) 数据根据其诸多特征, 按照性质上的亲疏关系在没有先验知识的情况下进行分类, 产生多个分类结果。 各分类内部个体特征之间具有相似性,不同分类之间个体特征的差异性较大。3. 1 . 2、 聚类分析的分类:聚类分析就是根据事物本身的特性, 按照一定的类定义准则, 对研究的事物进行归类。以分类对象的标准,我们可以把聚类分为变量聚类和观测聚类。观测聚类:观测聚类又称为样本聚类,是指根据被研究对象的总体特征对其进行聚类。根据观测聚类定义, 在对事物进行分类时, 应该全面考虑描述观测对象的所有特征。变量聚类:在实际问题中,反映同一事物特征的变量有很多,根据所研究问题的重点,通常可以选择某些具有代表性的变量进行研究。 也就是说, 对描述观测事物的变量进行归类,使得每一类都代表观测事物某一方面的特征,这就是变量聚类。3. 2 聚类方法对比介绍3. 2. 1 、 K-mean 聚类方法K-means聚类也称快速聚类, 是由 MacQueen 于 1967 年提出的, 它将数据看成K维空间上的点, 以距离作为测试个体“亲疏程度” 的指标, 并通过牺牲多个解为代价换得高的执行效率。欧式距离(Euclidean distance) 指两个个体的 K 个变量值之差的平方和的平方根,其数学定义为:公式中, 是个体 x 的第 i 个变量的变量值, 是个体 y 的第 i 个变量的变量值。3. 2. 2、 Bi rch 聚类方法Birch(Balanced Iterative Reducing and Clustering Using Hierarchies)算法全称是: 利用层次方法的平衡迭代规约和聚类。BIRCH 算法是 1996 年由 TianZhang 提出来的。 首先, BIRCH 是一种聚类算法, 它最大的特点是能利用有限的内存资源完成对大数据集的高质量的聚类, 同时通过单遍扫描数据集能最小化I/O 代价。Birch 算法特点:1) BIRCH 试图利用可用的资源来生成最好的聚类结果,给定有限的主存,一个重要的考虑是最小化 I/O 时间。(2) BIRCH 采用了一种多阶段聚类技术: 数据集的单边扫描产生了一个基本的聚类, 一或多遍的额外扫描可以进一步改进聚类质量。(3) BIRCH 是一种增量的聚类方法, 因为它对每一个数据点的聚类的决策都是基于当前已经处理过的数据点, 而不是基于全局的数据点。(4) 如果簇不是球形的, BIRCH 不能很好的工作, 因为它用了半径或直径的概念来控制聚类的边界。考虑对于一个 n 个 d 维的数据对象集 。 其中 i=1, 2n, 该聚类簇的中心 C 和半径 R 定义为:其中 R 为一个聚类簇中的所有数据对象到聚类中心对象的平均距离。3. 2. 3、 轮廓系数:轮廓系数(Silhouette Coefficient) 结合了聚类的凝聚度(Cohesion) 和分离度(Separation) , 用于评估聚类的效果。 该值处于-11 之间, 值越大,表示聚类效果越好。 具体计算方法如下:1、 对于第 I 个元素 x_i , 计算 x_i 与其同一个簇内的所有其他元素距离的平均值, 记作 a_i, 用于量化簇内的凝聚度。2、 选取 x_i 外的一个簇 b, 计算 x_i 与 b 中所有点的平均距离, 遍历所有其他簇, 找到最近的这个平均距离, 记作 b_i, 用于量化簇之间分离度。3、 对于元素 x_i, 轮廓系数 s_i = (b_i a_i) /max(a_i, b_i)4、 计算所有 x 的轮廓系数, 求出平均值即为当前聚类的整体轮廓系数从上面的公式, 不难发现若 s_i 小于 0, 说明 x_i 与其簇内元素的平均距离小于最近的其他簇, 表示聚类效果不好。 如果 a_i 趋于 0, 或者 b_i 足够大, 那么 s_i 趋近与 1, 说明聚类效果比较好。3. 2. 4、 K 值选取:在本题中, k 一般不会设置很大。 故可以通过枚举, 令 k 从 2 到一个固定值, 本题中取最大为 8, 在每个 k 值上重复运行数次, 并计算当前 k 的轮廓系数,最后选取轮廓系数最大的值所对应的 k 作为最终的集群数目。3. 3、 Bi rch 聚类方法对各个海区观测点聚类结论与分析3. 3. 1 、 东海观测点聚类分析:东海观测点 Birch 聚类结果分析如图 3. 1 所示。 从图中可以分析得出, 东海的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大, 表示聚类效果越好, 因此当 K=3 时, 得到最大轮廓系数 0. 688, 故最终东海的集群数目应为 3。3. 3. 2、 杭州湾观测点聚类分析:杭州湾观测点 Birch 聚类结果分析如图 3. 2 所示。 从图中可以分析得出, 杭州湾的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大, 表示聚类效果越好, 因此当 K=3 时, 得到最大轮廓系数 0. 413, 故最终杭州湾的集群数目应为 3。3. 3. 3 南海观测点聚类分析:南海观测点 Birch 聚类结果分析如图 3. 3 所示。 从图中可以分析得出, 南海的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大, 表示聚类效果越好, 因此当 K=3 时, 得到最大轮廓系数 0. 520, 故最终南海的集群数目应为 3。3. 3. 4 台湾海峡观测点聚类分析:台湾海峡观测点 Birch 聚类结果分析如图 3. 4 所示。 从图中可以分析得出,台湾海峡的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大,表示聚类效果越好, 因此当 K=2 时, 得到最大轮廓系数 0. 566, 故最终台湾海峡的集群数目应为 2。3. 4、 K-均值方法对各个海区观测点聚类结论与分析3. 4. 1 东海观测点聚类分析:东海观测点 K-means 聚类结果分析如图 3. 5 所示。 从图中可以分析得出, 东海的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大, 表示聚类效果越好, 因此当 K=3 时, 得到最大轮廓系数 0. 672, 故最终东海的集群数目应为 3。3. 4. 2 杭州湾观测点聚类分析:杭州湾观测点 K-means 聚类结果分析如图 3. 6 所示。 从图中可以分析得出,州湾的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大,表示聚类效果越好, 因此当 K=3 时, 得到最大轮廓系数 0. 453, 故最终杭州湾的集群数目应为 3。3. 4. 3 南海观测点聚类分析:南海观测点 K-means 聚类结果分析如图 3. 7 所示。 从图中可以分析得出, 杭州湾的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大, 表示聚类效果越好, 因此当 K=3 时, 得到最大轮廓系数 0. 505, 故最终南海的集群数目应为 3。3. 4. 4 台湾海峡观测点聚类分析:台湾海峡观测点 K-means 聚类结果分析如图 3. 8 所示。从图中可以分析得出,杭州湾的样本观测点数, 随着所给定 K 值的增加, 轮廓系数也在变化, 值越大,表示聚类效果越好, 因此当 K=5 时, 得到最大轮廓系数 0. 588, 故最终台湾海峡的集群数目应为 5。四、 同类观测点温度变化规律模型建立与求解4. 1 同一类观察点数据模型的建立与分析:4. 1 . 1 杭州湾观察点数据模型建立由问题一的 K-means 聚类方法和 Birch 聚类方法对比分析可知, 杭州湾集群数目应为 3。 采用 K-means 方法分析, 将第三类观测点数据从原始 10 年数据中导出, Kmeans 聚类方法时 K=3 时属于第三类观测点的共有 234 个观测点。 对234 个观测点每天观测的数据取平均值得到该类观测点在该区域 10 年的气温数据, 将数据导入到 matlab 后绘制观测天数与该区域观测点均值气温关系曲线如图 4. 1 所示, 可以看到该类观测点观测温度随时间成周期性变化, 且走势类似于角函数曲线。 由此可以猜想该类观测点所在区域温度变化数学模型为三角函数的复合函数。我们提出 y= a + b*cos(c*x) + d*sin(e*x) (其中 x0) 这种模型的假设,其中 f(x) 为温度均值, x 为观测天数, a、 b、 c、 d、 e 为待定系数。为了确定猜想我们使用了 matlab 的曲线拟合工具, 对该类观测点观测温度均值进行了插值拟合, 在拟合工具中选择了手动输入函数模式将猜想模型键入拟合工具, 得到的拟合曲线与该区域温度变化基本吻合, 如图 4. 2 所示:拟合所得函数表达式为:y = 19.98-4.787*cos( 0.01725 *x) + 6.358 *sin( 0.01725 *x)(x0)其中评价系数 R-square 为 0. 942。为进一步探究该区域温度变化规律, 对每个月 的最高气温及最低气温进行了提取, 发现月 最低气温及月 最高气温同样呈周期性变化, 且这 9 年中相同月 份最低气温及最高气温逐年递增4. 1 . 2 各海域温度变化趋势为探究各海域气温随季节变化规律, 将已知数据进行降维。 以 30 十天为一个月 在程序中将原始数据分为 108 组(9 年共 108 个月 ) 。 以 K=3 聚类结果为例进行聚类划分, 将数据划分为三组。 首先, 对三组数据中同类观测点同一天所测数据进行算数平均。 获得该类观测点 9 年平均观测气温数据之后, 对各组数据中每隔 30 天取出一个平均值并输出, 作为该类观测点获得的月 平均气温。为了探究海洋表面温度变化规律的总体性, 对四大海域进行了月 温度变化分析, 分析中 1 到 12 个月 数据来源于九年中各月 份的平均气温。 分析结果如下图4. 3 所示: 其中杭州湾气温随季节变化最为明显, 杭州湾的特点在于周边大型城市较多例如上海、 杭州、 宁波等, 距离陆地较近, 受到热岛效应及全球变暖及陆地季节变化等影响出现了四季分明的温度变化趋势, 而东海和南海距离陆地较远, 海域面积较广, 其年温差最小且海洋表面温度保持在 20 以上, 这也证实了海洋表面的自我温控能力, 台湾海峡地处大陆与台湾之间, 海洋表面温度同样四季分明, 温差接近与杭州湾, 这一变化趋势来源于其二者之间的独特的地理位置。故下文任然以杭州湾为例, 对海洋表面温度变化规律及影响因素进行探究。4. 1 . 3 杭州湾海洋表面温度变化趋势以杭州湾为例, 将 9 年数据绘制成表格如下图 4. 4 所示: 图中易看出这九年杭州湾海洋表面温度变化趋势基本保持一致, 海洋表面温度最高值出现在 4 到 6月 份, 这略迟于周边城市夏季时间。 最低温度出现在 10 到 12 月 份, 与周边城市冬季时间基本一致。在全球化进程中全球大气温度逐年升高, 为探究海洋表面温度受全球变暖影响程度, 我们选取了部分月 份数据, 对九年中同月 份温度均值进行了比较, 结果如下图 4. 5 所示: 从图中可以看到杭州湾九年中每年的 4 月 9 月 等温度有逐年上身趋势, 但趋势不是很明显。这说明海洋温度一定程度上受到了全球变暖的影响,但海洋由于洋流及表面大气压等影响具有一点的温度自我调节能力。 自我调节能力具体表现在海洋表面温度日温差及年温差远小于周边城市。结合上述对杭州湾温度变化趋势分析, 同时结合中国 2005-2015 年国内生产总值数据 GDP(GDP 数据来源于百度数据) 如图 4. 6 所示以及 1995-2007 年浙江省碳排放量(炭排放量数据来源于百度数据) 如图 4. 7 所示。 由上述两张图表,可以了解到近年来中国 GDP 急速增长, 杭州作为中国新一线城市, 工业污染程度也在逐年增加, 同时近年来浙江省二氧化碳的排放量飞速增长, 从而致使气温的升高。五、 人类社会应对海表温度变化的措施和建议5. 1 全球海洋表面温度变化根据前面的问题二的模型分析, 四大海域的海水表面温度在逐渐升高, 这不可否认的和海域周边大型工业城市密切相关, 大型工业城市近年来 GDP 急速增长, 工业污染程度也在逐年增加, 同时近年来二氧化碳的排放量飞速增长, 从而致使气温的升高。 2003-2011 年季度 GDP 图(GDP 数据来源于百度数据) 如图 5. 1所示。 沿海(近海) 各省炭排放量(炭排放量数据来源于百度数据) 如图 5. 2所示。 四大海域集群二数据气温变化如图 5. 3 所示。通过灰色关联分析法, 对于海洋表面温度变化以及 GDP(GDP 数据来源于百度数据) 两个因素, 其随时间变化的关联性大小, 作为衡量两个因素之间的关联程度。 灰色关联度如图 5. 4。 灰色关联度柱状图如图 5. 5。 灰色相关, 其中 2, 3, 4, 5分别为杭州湾、 南海、 台湾海峡、 东海。5. 2 温度变化趋势对现代人们生活和社会发展的影响:1、 温度变化对农业的影响: 温度升高, 水分缺失, 病虫

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论