环境管理_环境数理统计_第1页
环境管理_环境数理统计_第2页
环境管理_环境数理统计_第3页
环境管理_环境数理统计_第4页
环境管理_环境数理统计_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章: 概率论基本概念和统计学基础,一、概率及其运算 二、随机变量的分布 三、常见的统计量,什么是概率?,概率是0和1之间的一个数值,表示某个事件发生的可能性或经常程度。 随机事件发生的概率,通常用字母P表示。如事件A的概率记作P (A)。 小概率事件:发生概率很小的事件。 (Small probability event) 对小概率事件研究的重要性: 用小概率事件对假定的模型进行判断是假设检验的基础。,得到概率的三种途径,一、利用等可能事件(古典概率法) 计算这些概率的基础就是事先知道(或者)假设这些事件是等可能的,且事件总数是有限的。 这种事件又称为等可能事件(Equally likely event)。 二、根据长期相对频数(统计概率法) 通过观察事件在大量重复试验中出现的频率来估计的概率,若重复试验的次数为n,事件A发生的频率为m,则事件发生的频率为m/n。 又称为相对频数(Relative frequency)。,得到概率的三种途径,这种计算方法得到的概率称为统计概率。当试验次数n无限增大时,统计概率值呈现出稳定在某一数值的特征,称为概率的稳定性。它体现了事件A发生的可能性大小是事件本身固有特性的反映。 三、主观概率(Subjective probability) 既不能由等可能性来计算,也不可能从试验中得出。但可根据经验、常识或其他相关因素来判断的某一事件发生的可能性,这种概率称为主观概率。 例如,你今年暑假去九寨沟旅游的概率。 国家今年推行新的环保措施的概率。,概率的基本性质和运算,概率是非负数,即 若事件是不可能事件,则 概率不大于,即 若事件是必然事件,则 对任何两事件和有 若事件和事件互斥,则 对任一事件有 对任何两事件和,若 ,则恒有,概率的相关术语,互补事件(complementary event) 独立事件(Independent event) 互不相容事件(Mutually exclusive event) 条件概率(conditional probability) 优势或赔率(Odds):互补事件概率之比。Odds=p/(1-p),随机变量的分布(一),随机变量 随着随机因素变化而变化,但又遵从一定概率分布规律的变量。 随机变量的分布 随机变量取一切可能值或范围的概率或概率的规律称为概率分布(Probability distribution),简称分布。 概率的分布可以用表、各种图来表示,也可以用公式来表示。 一个概率分布是和某总体(population)也称为样本空间(sampling space)相联系的。,随机变量的分布(二),为什么要确定一个随机变量的概率分布? 在前面提到抽样调查时的总体(或有限总体)没有与概率相联系的实际存在。 但在确定了抽样方法之后,有限总体就可能与概率有关的总体有某种联系,并且可能对诸如总体进行推断。 这里的总体或样本空间为一个抽象的空间,它是由某种试验的所有可能结果点组成的,这些结果的获得都服从某种概率规律。 一个总体(样本空间)是由一个取值范围及相连的概率所组成的。因此给出了概率分布就等于知道了总体。,随机变量的分布(三),离散随机变量 如果随机变量X只能以一定的概率取离散的数值, 则称这种变量为离散型随机变量。 连续随机变量 如果随机变量X以一定概率的取值充满某一数值区间,即在某一数值区间中可任意取值,取值数量有任意多个,则称这种变量为连续型随机变量。 分布和分布函数 一个随机变量取值的规律,称为该随机变量的分布; 表征随机变量分布的函数就是分布函数; 给定随机变量X,考虑X的值小于x的概率为, 显然它是x的函数,我们称其为随机变量X的分布函数。,几种分布函数,概率分布的描述 离散变量的概率分布由其所有可能取值k的概率来描述。 连续变量的概率分布由其取值范围内的点x的概率密度函数(probability density function, pdf) f(x)来描述。 连续随机变量在单独点上的概率为零,而在某区间上概率可以利用积分得到。 累积分布函数(Cumulative distribution function, cdf),简称为分布函数。它是随机变量小于或等于某数x的概率,记为F(x)。 对离散变量,分布函数为: 对连续变量,分布函数为:,随机变量的分布(四),分布函数的性质,则有:,随机变量的分布(五),分布密度函数(Distribution Density Function),常见的离散分布(一),二项分布 (Binomial Distribution),常见的离散分布(二),常见的离散分布(三),例题:,假设性检验所涉及的小概率事件,常见的离散分布(四),Poisson分布 衡量某种事件在一定期间内出现的数目的概率。 是单参数离散分布,随机变量取值为非负数。 参数既是分布的均值又是分布的方差。 参数为的poisson概率分布为:,蓝色表示为3,即P(3) 红色表示为6,即P(6) 黑色表示为10,即P(10),Poisson概率分布图例,总体的理论分布 正态分布 对数正态分布 分布 分布 指数分布 Weibull分布 Maxwell分布,常见的连续变量的分布(一),抽样统计量的分布 样本均值的分布 T -分布 F-分布 分布,正态分布(一),正态分布是一种具有重要理论和实践意义的连续型理论分布。在环境数据统计分析中,正态分布同样具有重要意义。 一般而言,当随机变量受到很多随机因素的影响,而每一随机因素的影响很小,不起决定性作用时,具有这种特性的随机变量,一般服从正态分布。 还有很大一类随机变量近似服从正态分布。,正态分布(二),正态分布(三),正态分布(四),正态分布(五),对数正态分布(一),抽样统计量的正态分布(一),抽样统计量的正态分布(二),抽样统计量的正态分布(三),抽样统计量的 分布(一),抽样统计量的 分布(二),抽样统计量的 分布(三),抽样统计量的 分布(三),抽样统计量的 t 分布(一),抽样统计量的 t 分布(二),抽样统计量的 t 分布(三),抽样统计量的 t 分布(四),抽样统计量的 t 分布(五),抽样统计量的F分布(一),抽样统计量的 F分布(二),抽样统计量的F分布(三),抽样统计量的F分布(四),Excel中常用统计函数,正态分布函数 NORMSDIST(z) 返回标准正态分布累积函数。 NORMDIST(x,mean,stand_dev,TRUE) 返回指定平均值和标准偏差的正态分布累积函数。 NORMSINV(probability) 返回标准正态累积分布函数的分位数。 NORMINV(probability,mean,stand_dev) 返回正态累积分布函数的分位数。,Excel中常用统计函数,对数正态分布函数 LOGNORMDIST(x,mean,stand_dev) 返回指定平均值和标准偏差的对数正态分布累积函数。 LOGINV(probability,mean,stand_dev) 返回对数正态累积分布函数的分位数。 如果 p=LOGNORMDIST(x,.),则 LOGINV(p,.)=x。 Probability 是与对数分布相关的概率。 Mean 为 ln(x) 的平均值。 Standard_dev 为 ln(x) 的标准偏差。,Excel中常用统计函数,T分布函数 TDIST(x,degrees_freedom,tails ) 返回学生 t 分布的概率。 TDISTINV(probability,degrees_freedom) 返回作为概率和自由度函数的学生 t 分布的 t 值。 Probability 为对应于双尾学生 t 分布的概率。 X 为需要计算分布的数字。 Degrees_freedom 为表示自由度的整数。 Tails 指明返回的分布函数是单尾分布还是双尾分布。 如果 tails = 1,函数 TDIST 返回单尾分布。 TDIST 的计算公式为 TDIST = P( Xx )。 如果 tails = 2,函数 TDIST 返回双尾分布。 TDIST 的计算公式为 TDIST = P(|X| x) 。,Excel中常用统计函数,CHI-2分布函数( ) CHIDIST(x,degrees_freedom) 返回 分布的概率(单尾)。 函数 CHIDIST 按 CHIDIST=P(Xx, degrees freedom) 计算。 CHIINV(probability,degrees_freedom) 返回 分布函数的上侧分位数。 如果 probability = CHIDIST(x,.),则 CHIINV(probability,.) = x 。 Probability 为 分布的概率(单尾)。 Degrees_freedom 自由度 x 为用来计算分布的数值。,Excel中常用统计函数,F分布函数 FDIST(x,degrees_freedom1,degrees_freedom2) 返回 F 概率分布。 函数 FDIST 的计算公式为 FDIST=P( Xx ) 。 FINV(probability,degrees_freedom1,degrees_freedom2) 返回 F 概率分布的上侧分位数。 如果 p = FDIST(x,),则 FINV(p,) = x。 Probability 与 F 累积分布相关的概率值。 X 参数值。 Degrees_freedom1 分子自由度。 Degrees_freedom2 分母自由度。,常见的样本统计量(又称特征量),样本的二重性 既是一组具有同一分布的观测值数据 又是一组不同次实验时可变化的随机变量 统计量的二重性 既是一个不含未知参数的样本的已知函数 又是一个随机变量(具有特定分布函数),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),正态分布与非正态分布的偏度和峰度,某市大气中PM10全年监测数据时间序列图 -用Excel软件中X,Y散点图工具作图,某市大气中PM10全年监测数据频数分布图 -用Matlab软件中Hist(x)作图,某市大气中PM10全年监测数据正态概率分布图 -用Matlab软件中Normplot(x)作图,某市大气中PM10全年监测数据取对数后的频数分布图 -用Matlab软件中Hist(log(x)作图,某市大气中PM10全年监测数据取对数后作正态概率分布图 -用Matlab软件中Normplot(log(x)作图,常见的样本统计量(又称特征量),常见的样本统计量(又称特征量),概率论与统计学的区别与联系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论