统计概念及基本统计量_第1页
统计概念及基本统计量_第2页
统计概念及基本统计量_第3页
统计概念及基本统计量_第4页
统计概念及基本统计量_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学是什么?统计学是对令人困惑费解的问题作出数字设想的艺术。《大英百科全书》指出:“统计学是一门收集数据、分析数据、并根据数据进行推断的艺术和科学〞。案例1当你告诉他们你已经交上一个新朋友时,他们决不会问你任何有关根本领宜的问题。他们不会对你说:“他的声音像谁?最喜欢什么游戏?他收集蝴蝶吗?〞,取而代之,他们会问:“他有多大年龄?有几个兄弟?体重有多少?他的父亲挣多少钱?〞

仅仅从这些数字,他们才认为已经了解了有关他的一切。身高?体重?钱?案例2吸烟导致肺癌,抗生素治疗胃溃疡,锻炼有助于预防心脏病……我们怎么知道这些?因为科学家有统计数据证明。案例3市场调查和分析人才依托自己的市场学知识,通过自己掌握的调查工具和手段,对所关注的行业进行调查,并依据调查的结果进行分析。整个工作过程涵盖了统计学、经济学等多方面的知识。因此,统计学的独特之处在于,它能对不确定性进行量化,使其精确。统计的含义统计一词通常有三种含义:即统计工作、统计资料、统计学。统计工作是对社会、经济以及自然现象的总体数量方面进行搜集、整理和分析过程的总称;统计资料是统计工作的成果,即是通过统计工作所取得的各种数字资料及与之相关的其它资料的总称;统计资料也即统计信息,包括人口信息、根本单位信息、固定资产信息、宏观经济信息等,是国家和地区的最根底、最重要的信息资源。统计学是一门系统地论述统计理论和方法的科学;它们既有区别又有联系:统计学与统计工作是理论与实践的关系,而统计工作的成果便是统计资料。统计研究的基本方法大量观察法统计分组法综合指标法420-2-4-6-8-10400,000300,000200,000100,0000年距今温度距平(℃)目前的CO2浓度是42万年的最大值南极东方站〔Vostok〕测量的大气CO2浓度变化300275250225200175150325浓度CO2(ppmv)气候变化与人类活动相关南极LawDome冰芯资料显示近1000年大气CO2浓度,工业化〔1750年〕以来,明显增加10001200140016001800年2000280300320340360浓度(ppmv)CO2气候变化与人类活动相关近年来,CO2持续增加:1970-2004年增加了70%预计2030年将比2000年增加45-110%气候变暖与人类活动相关379ppmv夏威夷MaunaLoa观象台测量的大气CO2浓度变化(KeelingandWhorf,2004)增温气候变化与人类活动有关(IPCCAR4,2007)最近100年是过去1000年中最暖的最近20年是过去100年中最暖的

2006年中国的极端天气气候事件5.春季森林火险等级高雷击引发大兴安岭特大森林火灾3.强热带风暴“碧利斯”横扫我国南方七省(区)

2.百年一遇超强台风“桑美”登陆

10.

12月太阳连续强烈爆发8.夏季暴雨洪涝福建高考延期

4.重庆、四川历史罕见高温伏旱

9.北方出现14年来最严重的酸雨

7.暴雪阻旅客春节返乡6.强沙尘暴频袭我国北方北京一夜降尘33万吨6969R691.2006年是我国1951年以来最暖的一年气候变化是什么?平均值离差值四川近50年来气候变化情况

—2006年全省年平均气温17.1℃,比常年值偏高1.1℃,是气象记录以来最高的一年—年平均气温已连续10年高于常年—1997年全省降水量795mm,是1961年最少年份—2006年全省年平均降水量807mm,较常年偏少16%,是1961年以来次少年份

2006年重庆、四川遭遇历史罕见高温伏旱

2006年夏季,重庆遭遇了百年一遇特大伏旱,四川出现1951年以来最严重伏旱。6月1日-8月21日,重庆、四川平均降水量为345.9mm,是1951年以来历史同期最小值年均气温变化曲线与演变趋势线、5次多项式拟合线〔a九寨沟;b松潘县;c假设尔盖;d红原〕概率统计的认识思想认识世界的思想方法哲学的认识和描述,文学的描述,经验认识数学的认识和描述数学认识世界研究世界的两种主要方法微积分式确实定性认识方法大数的概率统计方法这两种方法是气象研究和气象预报中都需要的,本质上说,由于大气及其气象要素场时空变化的随机性特征,可能概率统计方法更为根本些概率统计是许多气象专业课程的根底,(也是其他许多专业问题的认识根底)统计天气预报,中长期天气预报,天气学,气候学等概率统计认识问题的思路大量随机现象(无序数据)出现的概率(频率)局部数据的统计推断(推断全体特征)推断结果的检验(点估计,假设检验)建立方程(确定性)注释:混沌-确定性和随机性的桥梁气象实践:集合预报统计天气学的学习目标气象统计分析-气象数据的规律统计天气预报-对未来天气的预测大纲第一章气象资料及其整理§1、气象资料的表示〔了解〕§2、根本统计量〔掌握〕§3、统计量的检验〔掌握〕§1、气象资料的表示一、气象资料根本理念气象问题的分析和预报需要依据大量的气象观测资料某个气象要素及其变化可看成一个变量或随机变量要素资料全部称为全体,能收集到的局部资料称为样本统计学的根本内容利用统计学方法对样本进行分析,估计和推测总体的规律性§1、气象资料的表示二、单个变量的表示单个气象要素(研究总体),x样本〔某一时间段或空间的资料〕n样本容量时间序列(随时间变化的数据序列)t=1,2,……n…变量类型连续型随机变量如T,P等离散型随机变量如冰雹,晕,华,云等,可用0,1或分级数值化变量类型可互相转化连续—离散规定临界值T0,如大于临界值记为1,小于那么记为0离散—连续将有,无等记为1,0或0,1,2,3,…

§1、气象资料的表示二、单个变量的表示三、多个变量的表示§1、气象资料的表示多个变量:多个气象要素资料多个变量资料:多个要素某段时间的资料向量表示矩阵表示资料阵向量表示——p个变量,n个样本第i个变量第j个时刻矩阵表示——横资料阵,竖资料阵资料阵——北京气温资料〔可构成各种形式的资料阵〕第一章气象资料及其整理§1、气象资料的表示〔了解〕§2、根本统计量〔掌握〕§3、统计量的检验〔掌握〕几类根本统计量概况平均值-总趋势标准差和方差协方差和相关系数峰度系数和偏度系数§2、根本统计量一、平均值-总趋势平均值的含义统计描述:描述资料数字平均状态的统计量。变量〔要素〕总体数学期望的一个估计值。无偏估计〔量〕值。意义描述:总趋势,集中度,集中性意义理解:大多数,中位§2、根本统计量平均值的计算考虑样本的权重:权重平均值样本的权重相同:算术平均值根据意义计算:中位数,众数一、平均值-总趋势§2、根本统计量一般平均值〔权重〕算术平均值统计中平均值的表示单个要素向量表示横资料阵n个元素为1组成的列向量例如对12月、1月、2月北京气温,其平均向量可利用表1.1的资料组成的矩阵算得要素资料增加时平均值的计算其中xn+1为增加一个资料时变量的实测值。因为据平均值定义有距平:异常,对平均值的正常情况的偏差。资料计算中表示某一数值与平均值之差。距平公式单变量样本(序列)中每个样品资料点的距平值组成的序列称为距平序列,某一变量距平序列也可以用距平向量记为:距平变量为:由p个要素(变量)的距平值的资料用横的次序排列组成的资料阵称为横距平资料阵,记为距平性质:距平变量的平均值为0对于使用距平变量,其平均值为0的证明如下:距平变量的意义可滤去平均值,使各变量在同一水平上进行比较;各变量的平均值为0,可带来研究上的方便和计算上的方便;可作为预报值,其偏高或偏低值更加直观。二、标准差和方差-差异的平均差异的含义最大、最小,最大-最小与平均趋势的差异:距平差异的总趋势:差异的平均意义差异的标准或标准的差异:标准差和方差差异的表示最大差异个别差异:距平差异的趋势:总体差异,即差异的总和问题:总和为0解决方法:首先认为正负差异都是差异,都不能忽略;然后所有的差异都应该相加并不能抵消标准差:描述样本中资料与平均值差异的平均状况的统计量,衡量了资料围绕平均值的平均变化幅度。标准差的平方,称之为方差。标准差和方差的计算:例多个变量第k个变量的方差〔距平向量〕xdk=(xdk1xdk2…xdkn)。x’dk为xdk的转置。12月气温随时间变化幅度比1月大要素资料增加时方差的计算方差的无偏估计量作为总体方差的无偏估计量气象中常用作为总体的方差估计量,但在显著性检验中无偏估计量亦常用。标准化变量:能在同一水平上比较的变量变量性质标准化变量的平均值为0,即标准化变量的方差为1例三、协方差与相关系数意义:衡量任意两个气象要素或变量之间关系的统计量。——协方差和相关系数协方差数学及统计含义数学公式协方差亦可记为两个变量距平向量的内积,即为协方差的统计意义:反映两个气象要素异常关系的平均状况。用距平的正负反映要素的变化方向用不同要素距平的乘积的正负符号反映两者之间的联系方向或趋势xk如果代表前冬某一个月平均温度;xl代表后冬其一个月平均温度,前冬温度出现负距平的时候,后冬就出现正距平;前冬温度出现正距平的时候,后冬就出现负距平。相反变化的关系相反,两个序列距平乘积值之平均必为一个正值。增加一个样本时协方差的计算公式协方差表征了两个变量变化的正、负相互关系。变量自身对自身的协方差就是该变量的方差。相关系数数学及统计意义数学公式消去常数1/n即得用距平向量形式可表示为性质:〔1〕变量自身对自身的相关系数为1〔2〕相关系数绝对值变化在0~1之间如果已经计算第k个变量与第l个变量的协方差对两个变量距平交叉积之和时标准化变量的方差〔3〕增加一个样本时的相关系数计算协方差及相关系数的计算协方差阵和相关系数阵skl元素表示第k个变量与第l个变量的协方差rk1为第k个变量与第l个变量的相关系数协方差阵和相关系数阵协方差阵还可以用横距平资料阵表示为协方差阵和相关系数阵的计算分级相关系数实际需要分级相关系数三类公式分级相关系数数据分级的方法分为n级四、自协方差和自相关系数含义公式衡量气象要素不同时刻之间的关系密切程度的量是自协方差和自相关系数。时间间隔τ(τ=t2一t1,设t2>t1)的自协方差为

τ亦称时间落后步长。当τ为正整数时,称为落后相关系数;反之那么为超前相关系数。对应的自相关系数为12月的方差五、峰度系数和偏度系数意义公式峰度系数,偏度系数K阶中心距二阶中心矩就是上面提到的方差;三阶中心矩是用来描述变量概率密度分布非对称性的,如果其计算值为正值,说明密度分布曲线的峰点在平均值的左方,反之亦然;四阶中心矩用来描述分布曲线的陡度,如果其计算值小,反映观测值与平均值靠近,分布曲线就比较陡,反之,那么说明分布曲线平缓。对遵从正态分布的变量而言,对应的偏度和峰度值应为零。因此,可以通过计算某一气象要素的偏度和峰度值,考察它们偏离零的程度,以便确定它们是否遵从正态分布。K阶中心距第一章气象资料及其整理§1、气象资料的表示〔了解〕§2、根本统计量〔掌握〕§3、统计量的检验〔掌握〕§3、统计量的检验统计结果是否具有普遍意义?会不会是随机抽样的偶然性的结果?显著性检验一、平均值的显著性检验大样本检验(统计量近似遵从正态分市)小样本检验(统计量遵从t分布)在气象上,大多使用t分布统计量。§3、统计量的检验一、平均值的显著性检验统计量§3、统计量的检验遵从自由度为n-1的t分布,其中假设t>tα,就拒绝原假设,认为x0与其它年份有显著差异。一、平均值的显著性检验例如 对北京1月气温,要检验1976年的月平均气温值是否与其它年份有显著不同。计算其余年份样本平均值及标准差,据(1.6)与(1.9)式有§3、统计量的检验一、平均值的显著性检验例如

§3、统计量的检验一、平均值的显著性检验 即sn=1.06。将此代入(1.23)式,计算得 从附表(t分布)中查得在5%显著水平、自由度为30-1时的临界值tα

=,§3、统计量的检验|t|>tα

,故认为1976年1月气温与其它年份有显著差异。2.045一、平均值的显著性检验用标准化值进行直接比较来检验对上面一例,计算得§3、统计量的检验显然||>tza、故认为1976年1月气温是异常的。二、两组样本平均值差异的显著性检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论