些重要的概率分布.ppt_第1页
些重要的概率分布.ppt_第2页
些重要的概率分布.ppt_第3页
些重要的概率分布.ppt_第4页
些重要的概率分布.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一些重要的概率分布一些重要的概率分布 1、正态分布 2、样本均值的抽样分布或概率分布 3、 x分布 4、 t分布 5、 F分布 6、 x分布、 t分布、 F分布与正态分布的 关系 11、正态分布、正态分布 l1.1 什么是正态分布? l对于连续型随机变量而言,正态分布是最 重要的一种概率分布,其形状似“钟型”。 l经验表明:对于其值依赖于众多微小因素 且每一因素均产生微小的或正或负影响的 连续型随机变量来说,正态分布是一个相 当好的描述模型。如身高、体重、考试成 绩等。 为了方便,通常用: 表示随机变量X服从正态分布。 符号表示随机变量服从什么样的分布; N表示正态分布; ,为正态分布的(总体)均值(或期望)和 方差。 X是一个连续型随机变量,可在区间(,+ )内任意取值。 -2 2 68%(近似 ) 3-3 95%(近似) 99.7%(近似 ) 正态曲线下的区域示意图 1.2 1.2 正态分布的性质正态分布的性质 : l 正态分布曲线以均值为中心,对称分布 。 l 正态分布的概率密度函数呈中间高、两边 低,在均值处达到最高,向两边逐渐降低, 即随机变量在远离均值处取值的概率逐渐变 小。 l 正态曲线下的面积约有68%位于 两值 之间;约有95%面积位于2之间;约有 99.7%的面积位于 3之间。这些区域可用 作概率的度量。 l 正态分布可由两个参数,来描 述,即一旦知道,的值,就可以根 据附录表查到随机变量X落于某一区 间的概率值。 l 两个(或多个)正态分布随机变量 的线性组合仍服从正态分布。该性质 很重要,解释如下: l 正态分布的偏度为0,峰度为3。 令: 假定X和Y相互独立,设a、b为常数, 考虑线性组合:W=aX+bY 则有: 其中 , 例:令X表示在曼哈顿非商业区一花商每日出售玫瑰花数 量,Y表示在曼哈顿商业区一花商每日出售玫瑰花的数量 ,假定X和Y均服从正态分布,且相互独立。已知: XN(100,64),YN(150,81),求两天内两花商出售玫瑰花 数量的期望和方差。 W=2X+2Y 根据上述公式,得: E(W)=2E(X)+2E(Y)=500 Var(W)=4Var(X)+4Var(Y)=580 因此,W服从均值为500,方差为580的正态分布,即 WN(500,580) 1.3 1.3 标准正态分布标准正态分布 l由于期望和方差的不同,正态分布之间会存在一定 的区别(见下图),如何将其简单化,从而引入标 准正态分布。 12 不同均值,同方差的两个正态分布图 12 1=2 不同均值,不 同方差 相同均值,不 同方差 标准正态分布标准正态分布 l如果变量X的均值为,方差为,定义一个 新的变量Z, 则根据性质5,变量Z的均值为0,方差为1 。在统计学中,我们称之为单位或标准正 态变量,用符号表示为: 任一给定均值和方差的正态变量都可转化为标准正 态变量,将其标准化可以大大简化计算。 l例:变量X表示面包房每日出售的面包量,假 定它服从均值为70、方差为9的正态分布,即 X(70,9),求任给一天,出售面包数量大于75 条的概率。 l首先,定义变量Z,Z=(75-70)/31.67 l求:P(Z1.67) l查正态分布表得: l P(0Z1.67)=0.4525 l则:P(Z1.67)=0.5-0.4525=0.0475 l即每天出售面包的数量超过75条的概率为 0.0475。 1.67 0 0.4525 0.0475 f(Z) 标准正态变量概率密度函数 2 2 样本均值的抽样分布或概率分布样本均值的抽样分布或概率分布 l引言:样本均值是总体均值的估计量,但是由于 样本均值是依靠某一给定样本而定,因此它的值 会因随机样本的不同而变化。由此,我们将样本 均值看作随机变量,在样本是随机抽取得到的条 件下,求样本均值的概率密度函数。 l随机抽样:表示总体中每一个个体有同等机会被 选入样本。 l独立同分布随机变量:由X1、X2,Xn构成容 量为n的随机样本Xs,如果所有的Xs是从同一个 概率密度(Xi有相同的概率密度函数)中独立抽 取得到的,称Xs为独立同分布随机变量。 2.1 2.1 样本均值的概率密度样本均值的概率密度 l例:已知正态分布的均值为10,方差为4,即 N(10,4)。现在从这个正态总体中抽取20个随机样 本,每个样本包括20个观察值,对抽取的每一个样 本,得到其样本均值,因此,共有20个样本均值。 来自N(10,4)的20个样本均值 9.641 10.134 10.040 10.249 9.174 10.321 10.480 9.504 11.386 8.621 9.740 9.739 9.937 10.184 10.250 9.765 10.334 10.410 10.57 10.57 求和=201.05 20个样本的频率分布 样本均值范围频数频率 8.59.0 1 0.05 9.09.5 2 0.10 9.510.0 5 0.25 10.010.5 9 0.45 10.511.0 2 0.10 11.011.5 1 0.05 8.75 9.25 9.75 10.25 10.75 11.25 0.50 0.05 0.25 样本均值 来自N(10,4)总体的20个样本均值的分布 理论依据: 若X1,X2,X3,Xn是来自于均值为 ,方差为的正态总体的一随机样本。则样 本均值 也服从正态分布,其均值为,方 差为/n,即: 也就是说,样本均值 的抽样(或概率) 分布,同样服从正态分布。 2.2 样本均值概率分布的标准正态变量 : 将样本均值的概率密度转化为标准正态 分布后,可以从标准正态分布表中计算 某一给定样本均值大于或小于给定的总 体均值的概率。 例:令X代表某一型号汽车每消耗一加仑汽油所 行驶的距离(英里)。已知X(20,4)。则对于由 一个25辆汽车组成的随机样本,求:每消耗一 加仑汽油所行驶的平均距离大于21英里的概率 。 分析:由于X服从均值为20,方差为4的正态分 布,则样本均值也服从正态分布,其均值为20 ,方差为4/25。那么, Z服从标准正态分布,求: 查标准正态概率密度表得: 即每消耗一加仑汽油所行驶的平均距离 大于21英里的概率为0.0062。 2.3 2.3 中心极限定理中心极限定理 l引言:从正态总体中抽样,其样本均值 服从正态分布,那么,如果从其他总体 中抽样,情况如何呢? l中心极限定理:如果X1,X2,Xn是 来自(均值为,方差为)任一总体的 随机样本,随着样本容量的无限增大, 其样本均值趋于正态分布,其均值为 ,方差为/n。 33、 分布分布 l3.1 何谓分布? l分布是统计学中常用的一种概率分布,它与正 态分布有紧密的关系。 l统计理论证明:标准正态变量的平方服从自由度 为1的分布,用符号表示为, 其中,Z是标准正态变量,即ZN(0,1); x的下 标(1)表示自由度。自由度是指平方和中独立观察 值的个数。因为我们考虑的是一个标准正态变量 的平方,故自由度为1。 现在令Z1,Z2,,Zk为k个独立的标准正态变 量(即每一个变量都是均值为0,方差为1的正 态变量),现在对所有的变量Zs平方,则它们 的平方和服从自由度为k的X分布,即 公式里的自由度为k,因为在所有变量的平方 和中,有k个独立的观察值。 分布的几何图形: f() 概率密度 K=2 K=5 K=10 变量的密度函数 0 3.2 3.2 分布的性质 l与正态分布不同, 分布只取正值(它是平 方和的分布),并且取值范围从0到无限大。 l 与正态分布不同, 分布是斜分布,其偏度 取决于自由度的大小,自由度越小,越向右偏 ,但是随着自由度的增大,逐渐呈对称,接近 于正态分布。 l 分布的期望值为k,方差为2k。k为分布 的自由度。即分布的方差是其均值的2倍。 l 若E1、E2分别为自由度为k1,k2的两个相互独 立的 变量,则其和(Z1+Z2)也是一个变量, 其自由度为(k1+k2)。 可以证明: 样本方差与总体方差的比值 与自由度(n-1)的积服从自由度为(n-1)的 分布。公式表示为: 其中,为总体方差,S为样本方差, 样本容量为n。 44、 t t分布分布 l回忆:若样本均值 ,则 变量Z服从标准正态分布。 即: 假定已知和的估计量S,则可以 用样本标准差(S)代替总体标准差 (),得到一个新的变量t。 根据统计理论得知:变量t服从自由度为 (n-1)的t分布。 注意:在这里,自由度为(n-1),而不是n 。 结论:从正态总体中抽取随机样本,若该 正态总体的均值为,但方差用其估计 量S来代替,则其样本均值服从t分布。 通常用符号tk表示,其中k表示自由度。 k=120(正态) K=20 K=5 0 不同自由度下的 t分布 t t分布的性质分布的性质 l t分布与正态分布相类似,具有对称性。 l t分布的均值与标准正态分布均值相同, 为0,但方差为k/(n-2)。由此,在求t分布的 方差时定义自由度必须大于2。 l标准正态分布的方差等于1,因此,t分布方 差总大于标准分布的方差,也就是说,t分布 比正态分布略“胖”些。 t分布与正态分布: 当k增大时,t分布的方差接近于标准正态分布方差 值1。 例如:当k=10时,t分布的方差为10/8=1.25; 当k=30时,t分布的方差为30/28=1.07; 当k=100时,t分布的方差为100/98=1.02; 结论:随着自由度的逐渐增大,t分布近似于正态分 布。 注意:对于t分布,不要求其样本容量很大,k=30时 ,t分布与正态分布已很近似。 t t分布表的使用分布表的使用: : 0 -1.8121.812 例:自由度为10,P(t1.812)=P(t1.812)=P(t1.812)+P(t-1.812)=0.1 0.05 0.05 t t分布表举例:分布表举例: l例:变量X表示面包房每日出售的面包量, 在15天内,出售面包的样本方差为16。假 定真实的出售量为70条,求任意15天内出 售面包平均数量为74条的概率。 l分析:本例中已知样本方差S=16,则S=4 ,总体均值(真实的出售量)=70,运用t变 量公式得: 查t分布表,自由度为(n-1)=15-1=14 当自由度为14时,查表得,t值大于等于 2.977的概率为0.005,大于等于4.140的概 率为0.0005,所以,t值大于等于3.873的 概率介于0.00050.005之间。 练习1: 上例中其他条件不变,现假定15天 内出售面包的平均数量为72条,求获得 此数量的概率。 按照上述步骤,首先运用t变量公式,求出 t变量。 查t分布表,当自由度为14时,t值大于等于 1.761的概率为0.05,大于等于2.145的概率为 0.025,因此,t值取1.936的概率介于0.025与 0.05之间。 查t分布表的注意事项: 自由度为(n-1),而不是n。 t分布表具有对称性,t值大于等于 某一特定值的概率与t值小于等于该特 定值相反数的概率相等。 55、 F F分布分布 lF分布是如何定义的? l令随机样本X1,X2,X3,Xm来自均值 为x和方差为x的正态总体,其样本容量 为m;随机样本Y1,Y2,Y3,Yn来自均 值为y和方差为y的正态总体,其样本容 量为n;且这两个样本相互独立。假设知道 这两个随机样本的样本方差Sx和Sy(两个 总体方差的估计量)。 定义一个新的变量F, 分析F值:如果这两个总体方差真实相等 ,则计算出的F值接近于1,如果两个总 体方差真实值不相等,则F值不等于1; 两总体方差相差越大,则F值越大。 统计理论表明:如果x =y(即两总体 方差相等),则F服从分子自由度为 k1=(m-1),分母自由度为k2=(n-1)的F分布 。 需要说明一点: 在概率论与数理统计中,更准确的说法是:( Sx/ x)/(Sy/ y)服从F分布,但我们上式给出, x =y,故样本方差之比服从F分布。 F分布又称为方差比分布,通常用符号表示为: 其中的双下标表明了分子与分母的自由度。 在计算F值时,将方差大的值放在上面,故F值总 是大于或等于1。 F F分布的性质分布的性质 l 与分布类似,F分布也是斜分布,向右 偏,其取值范围也为0到无限大(见下图) 。 0 F f(F ) 概率密度 F2,2 F50,50 F10,2 l 与分布类似,当自由度k1,k2逐渐增大 时,F分布近似于正态分布。 l t分布变量的平方服从分子自由度为1,分 母自由度为k的F分布,即 l 变量与其自由度之比近似为分母自由度 为m,分子自由度很大(无限大)的F变量 ,即 当n 对于大容量的样本,我们可以用分布来代 替F分布;同样,也可用F分布代替分布。 性质3也可以改写为: 即若分子自由度充分大,则Fm,n值的m倍 ,等于自由度为m的分布。 例:两个班做同样的计量经济学测试。其中,一班 级共有学生100名,二班级共有学生150名。老师从 一班级随机抽取25个学生,从二班级随机抽取31个 学生,观察得到两个班级学生考试平均分数的样本 方差分别为100和132。假设学生考试平均分数这一 随机变量服从正态分布,能否认为这两个班级的分 数平均值同方差。 分析:这两个随机样本来自两个正态总体,并且相 互独立,则首先利用公式计算F值。 F=132/100=1.32 它服从自由度为30、24的F分布。 查F分布表得当分子自由度为30、分母自 由度为24时,在显著水

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论