气象统计整理_第1页
气象统计整理_第2页
气象统计整理_第3页
气象统计整理_第4页
气象统计整理_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 气象资料及其表示方法一、 数据资料的统计特征要素样本中资料分布的特点-用一些统计量表征。1、 平均值 含义:平均值是要素总体数学期望的一个估计。反映了该要素的平均(气候)状况。 2、 距平 含义:反映数据偏离平均值的状况 ,也是通常所说的异常。*中心化*概念:把资料处理为距平的方法叫中心化特性:距平值的平均值为0,使用方便; 直接作为预报值,比较直观(偏高/偏低)。3、 方差和均方差(标准差)含义:是均方差,描述样本中资料与平均值差异的平均状况,反映变量围绕平均值的平均变化程度(离散程度),是方差。标准差大-变化幅度大;均方差小的要素预报比大容易,变化幅度小;变量减去某常数后均方差相同

2、。累积频率:变量小于某上限的次数与总次数之比。二、 总体和样本1、 总体(母体):统计分析对象的全体。2、样本:总体中的一部分。三、数据的标准化 各要素单位不同、平均值和标准差也不同。为使它们在同一水平上比较,采用标准化方法,使它们变成同一水平的无单位的变量-标准化变量(消除单位量纲的影响)。 证明:(1)标准化变量的平均值为0。(2)标准化变量的方差为1。峰度系数与偏度系数是用来衡量随机变量分布密度曲线形状的数字特征,描述了气候变量的分布特征。偏度系数:表征曲线峰点对期望值(平均值)偏离的程度。峰度系数:表征分布形态图形顶峰的凸平度(即渐进于横轴的陡度)。三、 状态资料和统计特征1. 状态资

3、料(离散型随机变量)表征气象要素的各种状态,观测结果无法用数据表示。2. 频率表、分布列-列出各个状态出现的频率。对样本而言是频率表,总体而言就是分布列。四、 多要素的气象资料两个方面来研究问题:“R型分析”:研究不同变量(要素)或同一要素不同格点之间的关系。(行)“Q型分析”:研究样本之间的关系(列)。五、 统计量-协方差和协方差矩阵1. 协方差 衡量任意两个气象要素(变量)之间关系的统计量(正、负相关关系)(另外一个统计量叫相关系数)(距平的内积)反映了两个气象要素异常关系的平均状况,或者两个变量的正、负相关关系。变量自身的协方差就是方差协方差带单位,不同要素之间不好比较,相关系数可解决这

4、个问题。2. 协方差矩阵 m阶对称矩阵,对角线元素是第i个变量的方差,撇号代表距平。六、 区域资料的整理和利用(1)代表站方法-平均相关系数最大的站(2)区域平均法-区域平均值要与周围格点(站点)值区别大(3)综合指数法(各站点要素方差差异较大)<越大,异常越明显>i表示区域内台站,j表示观测资料的年代第二章 选择最大信息的预报因子1. 条件概率在事件B已经发生的条件下计算事件A的概率,称为事件A在事件B已出现条件下的条件概率,记为P(A/B)。2. 天气预报指标必须满足两个经验性的条件(1) P(A/B)>>P(A)或者P(A/B)<<P(A) -A/B之

5、间有一定联系(2) (2)P(A/B)-1或P(A/B)-0 -预报指标有一定准确率3. 天气预报指标的统计检验二分类预报:只预报事件A出现或者不出现,又称为正反预报。P(A)=p,,p+q=1 求n次独立试验中,事件A出现m次的概率4. 定量数据时的指标状态要素:可以用条件概率选择预报因子并且用二项分布检验预报因子的可靠程度。定量数据要素:主要用相关系数选择预报因子或因子集,并用t检验方法检验其可靠性。5.(1)原始资料:(2)距平(均值为0)(3)标准化距平(标准化后资料均值为0,均方差为1)相关系数=协方差6. 相关系数的检验正态总体的相关检验实质上是两个变量间或不同时刻间观测数据的独立

6、性检验。所谓相关检验,就是检验 =0的假设是否显著 。在假设总体相关系数=0成立条件下,样本相关系数r的概率密度函数正好是t分布的密度函数。于是,就可以用t检验法来检验。 (1)t 检验在原假设=0的条件下,统计量符合自由度为n-2的t分布.给定信度和样本相关系数r,根据自由度查出,若 ,即 否定=0,总体相关。反之,接受=0,总体非相关。(3) 相关系数表可以计算统一的判别标准相关系数,若,则通过显著性的t检验。实际应用中,若已知自由度(n-2)和显著性水平,查相关系数表即可。7.自相关系数衡量气象要素不同时刻之间的关系密切程度的量是自协方差和自相关系数。8. 落后交叉协方差和相关系数衡量两

7、个变量不同时刻之间的相关密切程度的量,常用落后交叉协方差和落后交叉相关系数表示。9. 高自相关变量间的相关系数及其统计检验(1)两个变量无持续性(非高自相关)-t检验(2)两变量本身有强持续性或高自相关,t检验的自由度不能用,需要计算有效自由度,其中。10. 偏相关系数当存在三个以上变量互相影响时(如考虑y和x1、x2之间的关系),需要考虑消除了x1(x2)影响后,x2(x1)与y的相关关系,这时候的相关系数称为偏相关系数,记为第三章 气候稳定性检验1.步骤(1). 写出零假设H0和备选假设H1;(2). 确定检验统计量;(3). 确定显著性水平;(4). 根据数据计算检验统计量的实现值;(5

8、). 根据这个实现值计算p-值;(6). 进行判断:如果p-值小于或等于alpha,就拒绝零假设,这时犯(第一类)错误的概率最多为alpha;如果p-值大于alpha,就不拒绝零假设,因为证据不足。2. 气候稳定性检验涉及两种情形(1)某一地区气候是否具有稳定性比较不同时段气候变量的均值或者方差是否发生显著变化。(2)两个地区的气候变化是否存在显著差异 也可以通过检验均值和方差来判断。3.平均值的显著性检验(1)u检验-检验一个/二个总体均值 (2)t检验-检验一个/二个总体均值t统计量检验两地气候是否有显著差异(服从自由度n1+n2-2的t分布)。若,表明两区域的均值存在显著差异。 如果样本

9、量足够大,可以近似按下式计算:4.对方差的检验(方差反映了某一变量观测数据的偏离程度,它是变量稳定与否的重要测度)(1)检验-检验一个总体方差(2)F 检验-检验两个总体方差是否存在显著差异上述统计量遵从自由度的F分布。若则认为两地样本方差有显著差异,或者说气候有显著差异。!分析输出结果: 检验可通过p(F)值(小于,拒绝)或者t检验(大于t,拒绝)第四章 气候变化趋势分析一、 线性倾向估计1.回归系数b (气候倾向率)回归系数b表示了变量x的趋势倾向。b符号为正,说明变量随时间t的增加呈上升趋势,反之则为下降趋势,b值的大小反应了上升和下降的速率,即倾向程度。2. 相关系数r (气候趋势系数

10、) 变量与时间的相关系数表示变量x随时间变化程度。要判断变化趋势的程度是否显著,就要对相关系数进行显著性检验。二、 滑动平均滑动平均是趋势拟合技术最基础的方法,它相当于低通滤波器。用确定时间序列的平滑值来显示变化趋势。三、 累积距平累积距平也是一种常用的、由曲线直观判断变化趋势的方法。对于序列x,其某一时刻t的累积距平表示为:,计算结果分析1)累积距平曲线呈上升趋势,表示距平值增加;2)呈下降趋势,表示距平值减小; 3)从曲线明显的上下起伏,可以判断其长期显著的的演变趋势及持续性变化,甚至还可以判断出发生突变的大致时间。从曲线小的波动可以考察其短期的距平值变化。四、 五、七和九点二次平滑 对时

11、间序列做五点二次、七点二次和九点二次平滑,与滑动平均一样,也起到低通滤波的作用,以展示出变化趋势。 优点:可以克服滑动平均削弱过多波幅的缺点。 根据最小二乘法原理确定系数,可以得到五点二次、七点二次和九点二次平滑公式。第五章 一元线性回归一元回归处理的是两个变量之间的关系,即一个预报量和一个预报因子之间的关系。求回归系数的方法称为最小二乘法。距平形式的回归方程: 当变量为距平时,回归方程可以不用求a,因为a=0,回归直线通过原点。,标准化距平形式的回归方程:利用 ,回归问题的方差分析(1)意义 评价回归方程的优劣。(2)预报量的方差可以表示成回归估计值的方差(回归方差)和误差方差(残差方差)之

12、和。方差分析表明,预报量y的变化可以看成由前期因子x的变化所引起的,同时加上随机因素e变化的影响,这种前期因子x的变化影响可以归为一种简单的线性关系,这部分关系的变化可以用回归方差的大小来衡量。如果回归方差大,表明用线性关系解释y与x的关系比较符合实际情况,回归模型比较好。两边同时乘以n变成各变量离差平方和的关系。, U和Q分别称为回归平方和及残差平方和,称为总离差平方和。U反映了回归值的分散程度。Q反映了观测值偏离回归直线的程度。1.总平方和()反映因变量的 n 个观察值与其均值的总离差。2.回归平方和(U) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之

13、间的线性关系引起的 y 的取值变化,也称为可解释的平方和。3.残差平方和(Q)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和。相关系数与线性回归(1)因为回归方差不可能大于预报量的方差,可以用它们的比值来衡量方程的拟合效果。即:,上式含义:表明了预报因子x对预报量y的方差的线性关系程度,这一比值又称为解释方差。也可以说明相关系数的含义:它是衡量两个变量线性关系密切程度的量,又被称为回归方程的判决系数。判决系数R2 (coefficient of determination)1. 回归平方和占总离差平方和的比例;2. 反映回归直线的拟合程度;3. 取值范围在 0

14、 , 1 之间;4. R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差;5. 判决系数等于相关系数的平方,即R2r2(2)回归系数b与相关系数之间的关系,r与b同号。回归方程的显著性检验原假设回归系数b=0的条件下,上述统计量遵从分子自由度为1,分母自由度为(n-2)的F分布,若线性相关显著,则回归方差较大,因此统计量F也较大;反之,F较小。对给定的显著性水平, 查表得到F临界值,如果 ,则拒绝原假设,认为线性相关显著。注意: 对于一元线性回归来说,因为F的相关系数表达式开方就是相关系数t检验的表达式,故回归方程的检验与相关系数的检验一致。回归分析与相关分析的区别:1. 相关分析

15、中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化。2. 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量。3. 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。第六章 多元线性回归多元回归就是研究一个预报量和多个预报因子之间的关系。主要讨论较为简单的多元线性回归。其分析原理与一元线性回归分析完全相同。一、 线性回归模型的其他两种形式距平形式

16、:二、 回归问题的方差分析和一元回归问题方差分析类似,预报量的方差可以表示成回归估计值的方差(回 归方差)和误差方差(残差方差)之和。三、 复相关系数复相关系数是衡量一个变量(预报量)和多个变量(因子)之间的线性关系程度的量,因为变量之间的关系可归结为一个多元线性回归方程,所以复相关系数是衡量预报量和估计量之间线性相关程度的量,通常记为意义:上式反映了回归平方和、总离差平方和与复相关系数的关系。可见,复相关系数实际是衡量p个因子对预报量的线性解释方差的百分率,其变化在01之间。四、回归方程的显著性检验 假设预报因子与预报量之间无线性关系,则回归系数应该为0。检验假设:计算统计量:,遵从分子自由

17、度为p,分母自由度为n-p-1的F分布,在显著性水平下,若,认为回归方程是显著的。五、预报值的95%置信区间 ,六、预报因子的显著性检验若在预报因子中减去第i个因子,再建立对y的预报方程,则回归系数、回归平方和、残差平方和记为,定义第i个 因子的方差贡献为是因子离差矩阵的逆矩阵的第i行第i列元素。计算统计量符合自由度为(1,n-p-1)的F分布。给定信度以后,当第i个因子的方差贡献是显著的。七、 利用回归方程进行预报的步骤1.确定预报量并选择恰当的因子。2.根据数据计算回归系数标准方程组所包含的有关统计量(因子的交叉积、矩阵协方差阵或相关矩阵,以及因子与预报量交叉积向量等);3.求解线性方程组

18、,定出回归系数;4.建立回归方程并进行统计显著性检验;5.利用已经给出的因子带入回归方程做出预报量的估计,求出预报值的置信区间。!根据输出结果,写出相应的方程复相关系数 调整复相关系数 残差方差的无偏计 13次观测数据 自由度 离差积和 方差的无偏估计Y 第七章 逐步回归方法既要选择对预报量影响显著的因子,又要使回归方程的残差方差估计很小,这样才有利于气象预报。逐步回归的三种方案1、 逐步剔除方案2、逐步引进方案3、双重检验的逐步回归方案第八章 气象场的自然正交展开 m是空间点,n是时间序列长度。气象场的自然正交展开,是将X分解为时间函数Z和空间函数V两部分,即或者1.含义:场中第i个格点上的第t次观测值,可以看作是p个空间函数和时间函数的线性组合 。上式表明,第t个场可以表示为m个空间典型场,按照不同的权重线性叠加而成。V的每一列表示一个空间典型场,由于这个场由实际资料确定,故又叫经验正交函数。上述分解要求满足下列两个条件:2.分解方法:A为实对称矩阵,根据实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论