常见统计分布及其特点_第1页
常见统计分布及其特点_第2页
常见统计分布及其特点_第3页
常见统计分布及其特点_第4页
常见统计分布及其特点_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【附录一】常见分布汇总

一、二项分布

二项分布(BinomialDistribution),即重复n次的伯努利试验

(BernoulliExperiment),用§表示随机试验的结果,假如事务发生的

概率是P,则不发生的概率q=l-p,N次独立重复试验中发生K次的概率

是。

Hx=上)=0加(1一")2=6(匕刃,”)

(尢=0,1,•।n),

二、泊松poisson分布

1、概念

当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其

中人为np。通常当nM10,pW0.1时,就可以用泊松公式近似得计算。

2、特点——期望和方差均为人。

3、应用(固定速率出现的事物。)——在实际事例中,当一个随机事务,

例如某电话交换台收到的呼叫、来到某公共汽车站的乘客,以固定的平均

瞬时速率A(或称密度)随机且独立地出现时,那么这个事务在单位时间

(面积或体积)内出现的次数或个数就近似地听从泊松分布

三、匀称分布uniform

设连续型随机变量X的分布函数F(x)=(x-a)/(b-a),a<x<b

则称随机变量X听从[a,b]上的匀称分布,记为X-U[a,b]o

四、指数分布ExponentialDistribution

1、概念

犷x>0

/(x)=,

0x<0

mu=3mu=5mu=10

2、特点——无记忆性

(1)这种分布表现为均值越小,分布偏斜的越厉害。

E[X]=1D[X]=(

(2)无记忆性

当s,t>0时有P(T>s+t|T>t)=P(T>s)即,假如T是某一元件的寿命,

已知元件运用了t小时,它总共运用至少s+t小时的条件概率,与从起先

运用时算起它运用至少s小时的概率相等。

3、应用

在电子元器件的牢靠性探讨中,通常用于描述对发生的缺陷数或系统故障

数的测量结果

五、正态分布Normaldistribution

1、概念

2、中心极限定理与正态分布(说明白正态分布的广泛存在,是统计分

析的基础)

中心极限定理:设从均值为口、方差为。八2;(有限)的随意一个总体中抽

取样本量为n的样本,当n充分大时,样本均值的抽样分布近似听从均值

为口、方差为。八2/n的正态分布。

3、特点——在总体的随机抽样中广泛存在。

4、应用——正态分布是假设检验以与极大似然估计法ML的理论基础

定理一:设XI,X2,X3.ooXn是来自正态总体N(582)的样本,

则有

样本均值X~N(M,52/n)——总体方差经常未知,用t分布较多

六、x2卡方分布(与方差有关)chi-squaredistribution

1、概念

若n个相互独立的随机变量红、6、……、§n,均听从标准正态

分布(也称独立同分布于标准正态分布),则这n个听从标准正态分布的

Q二日

随机变量的平方和;一1构成一新的随机变量,其分布规律称为卡

方分布(chi-squaredistribution),其中参数n称为自由度

【留意】假设随机干扰项呈正态分布。因此,卡方分布可以和RSS残差

平方和联系起来。用RSS/62,所得的变量就是标准正态分布,就听从卡

方分布。

(0,otherwise

2、卡方分布的特点

(1)/分布的均值为自由度n,记为E*)=n。(这个简单证明)

2

(2)/分布的方差为2倍的自由度(2n),记为D(r)=2no

(3)假如/.),公(⑸相互独立,则:(独立可加减)

—仍)+9(⑸听从f分布,自由度一+”;

听从/分布,自由度为叭-火

3、图形特点

4、应用

定理二,设XI,X2,X3.ooXn是来自正态总体N(由82)的样

本,则有

样本均值X~N(M,52/n)

纪臣〜x2(nj)

o~

(1)正态分布以与卡方分布是F检验的基础。大量的检验用到了F检

验:F检验、二大检验。

七、t学生分布(用样本方差s来标准化)----Student'st-distribution

1、概念(适用于62未知)

【理解】把样本标准正态化的U变换前提是方差已知,但总体方差是

未知的,所以用样本方差来代替总体方差。依据中心极限定理,抽样听从

方差为总体方差除以n的正态分布。

由于在实际工作中,往往。是未知的,常用s作为。的估计值,为了与u

变换区分,称为t变换,统计量t值的分布称为t分布(u变换指把变量

转换为标准正态分布)

【思索】为什么样本方差比总体方差要小?因为一个是总体方差,一

个是样本均值的方差。不同

2、特点

1)与标准正态分布曲线相比,自由度v越小,t分布曲线愈平坦,曲

线中间愈低,曲线双侧尾部翘得愈高;自由度v愈大,t分布曲线愈接近

正态分布曲线,当自由度v=8时,t分布曲线为标准正态分布曲线。

定理三:设XI,X2,X3.ooXn是来自正态总体N(p,82)的样

本,则有

样本均值X~N(M,52/n),S为样本方差

X-H/、

----~t(n-1)

S/Jn【留意】S是样本方差。中心极限定理说的是样

本均值的方差。

八、F分布F-distribution

1、概念

F分布定义为:设X、Y为两个独立的随机变量,X听从自由度为kl

的卡方分布,Y听从自由度为k2的卡方分布,这2个独立的卡方分布被

各自的自由度除以后的比率这一统计量的分布

2、特点

(1)它是一种非对称分布;

(2)它有两个自由度,即nl-l和n2-l,相应的分布记为F(nl

-1,n2-l),nl通常称为分子自由度,n2-l通常称为分母自由

度;

(3)F分布是一个以自由度(川-1)和为参数的分布族,不

同的自由度确定了F分布的形态。

„1

dfx,df2,a=

(4)F分布的倒数性质:dft,dfi.1—n

(5)残差平方和之比通常与F分布有关。

九、逻辑分布logistic(分类评定模型)一一最早应用最广的离散选择模

1、概念

1-尸⑺

2、特点

用作增长曲线并为二进制响应建模。在生物统计和经济领域运用。

Logistic分布由尺度和位置参数描述。Logistic分布没有形态参数,也就

是说其概率密度函数只有一个形态。

下列图形显示了不同参数值对Logistic分布的效应。

尺度参数的效应位置参数的效应

Logistic分布的形态与正态分布的形态相像,但Logistic分布的尾部更

长。

十、伽马分布

1、概念----伽玛分布(GammaDistribution)是统计学的一种连续

概率函数。Gamma分布中的参数a称为形态参数(shapeparameter),

B称为尺度参数(scaleparameter)。

假设随机变量X为等到第Q件事发生所需之等候时间,密度函数为

aiXx

f(xfXta)=^—x~e~lx>0

Ha)

2

EX=aXrVar(x)=aA

特征函数为

伽马分布的可加性

当两随机变量听从Gamma分布,且单位时间内频率相同时,Gamma

数学表达式

若随机变量X具有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论