第六章--概率分布PPT课件_第1页
第六章--概率分布PPT课件_第2页
第六章--概率分布PPT课件_第3页
第六章--概率分布PPT课件_第4页
第六章--概率分布PPT课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

. 1,第6章概率分布,1,后验概率(统计概率)随机事件a在n次实验中出现了m次,m和n的比是随机事件a出现的频度。 1、概率定义、3、2、先验概率(古典概率)经典概率模型被要求满足两个条件: (1)实验的所有可能结果是有限的: (2)各自可能结果出现的可能性相等。4,2,概率的基本性质,(1)概率公理1 .任何随机事件a的概率都是非负的。 0P(A)12 .不可能发生事件的概率等于零。 3 .必然事件的概率等于1。 概率相加定理相互不兼容事件:在一次实验和调查中,如果发生事件a,就一定不会发生事件b,这两个事件是相互不兼容事件。 加法定理(additiverule ) :互不兼容事件a、b的和的概率等于这两个事件概率的和。 也就是说,6,(3)概率的乘法定理独立事件:一个事件的出现不影响其他事件的出现。 相关事件或依赖事件:事件a的概率根据事件b是否发生而变化,事件b的概率根据事件a是否发生而变化。7、乘法定理(product rule ) :两个独立事件同时出现的概率等于这两个事件的概率的乘积。 (1)随机变量是否具有连续性进行分类,分为离散分布(二项分布、泊松分布、超几何分布)和连续分布(正态分布、负指数分布、威布尔分布)。 (2)按分布函数的由来分类,分为经验分布和理论分布。 (3)根据概率分布记述的数据特征进行分类,分为基本的随机变量分布和采样分布。 概率分布的类型,9,第二节正态分布(高斯分布),一,正态分布特征(一)正态分布曲线函数正态分布曲线函数也称为概率密度函数,其一般方程式是,10,(二)正态分布的特征1 .正态分布的形式是对称的,其对称轴是通过平均分的垂线。 2 .正态分布的中央点最高,然后逐渐向两侧下降,曲线的形状先向内侧弯曲,然后向外侧弯曲,拐点位于正和负的1标准偏差,曲线的两端无限延伸到接近基线的地方,但不能与基线交叉。 由于正规曲线上的面积为1,在平均分左右对称,因此通过平均分的垂线在正规曲线上的面积相等,分为两个部分,分别为0.50。 (4)正态分布是一族分布。 根据随机变量的平均、标准偏差的大小和单位的不同,分布形态也不同。(5)正态分布中各种差异量的值有一定的比率。 (6)在正态分布曲线中,标准偏差与概率(面积)有一定的数量关系。 例如,在正负标准偏差之间,占总面积的68.26%; 正负1.96个标准偏差之间,包含总面积的95%的正负2.58个标准偏差之间,包含总面积的99%的正负3个标准偏差之间,包含总面积的99.74%。 正态分布的特征,13,14,2,正态分布表的制作和使用,(1)正态分布表的制作和结构正态分布表的结构,一般是第一栏的包含z分单位的第二列:密度函数或比率的数值(y )第三列:概率值(p )。 使用正态分布表根据1.z得分求出概率p,即根据已知的标准得分求出面积。 求某z点的数值和平均值(Z=0)之间的概率。 求出某z分数以上或以下的概率。 求两个z分数之间的概率。例1,(1)求出某z得分和平均(z=0)间的概率直接调查表,例2,(2)求出某z得分以上或以下的概率eg:Z=1以上或以下的概率解: Z=1时,p=0.34134z=1以上的概率为0.5-0.34134, (2)求出某z得分以上或以下的概率eg:Z=3.24以上的概率解: z=3.24 z=1以上的概率为0.5-0.34134,例4,(3)求出两个z得分间的概率eg:Z=3.24和z=-1.74间的概率解:两个z 如果两个z是该号,则概率减少的两个z得分为正负,则两个概率相加,20、2 .根据概率p求出z得分,即根据面积求出标准得分的数值。 已知从平均值开始的概率值求出z值(直接查找表)。 知道正态分布两端的概率值,求出该概率值边界点的z值(0.5-p,然后查表)。 如果知道正规曲线中央部分的概率,就求z分数是多少(然后查表,z是正和负两个值)。 3 .知道概率p或z的值,以确定概率密度y,即正态曲线的高度(注意,直接查看表,p是中间的还是两个部分)。 偏态量的公式SK=0时,分布为对称的SK0时,分布为正偏置状态,SKq且nq5,则二项分布可被视为正态分布的近似形式。 当二项分布的平均值和标准偏差满足pq、nq5 )时,二项分布接近正态分布。 此时,二项分布的x变量(即成功的次数)具有=np,即x变量为=np的正态分布。47、三、二项分布的应用解决了包含机会性质的问题。 机会问题是指在实验和调查中,实验结果可能起因于推测。48,【例6-6】正误问题有10道题,解答者回答了几道题才觉得他是真的,回答了几道题才觉得不是推测因素?49,解:推测和推测错误的概率是p=q=0.5,np=5,这两个分布接近正态分布,所以根据正态分布概率,Z=1.645时,这一点以下包含整体的95%。 用原点表示, 1.645=5 1.6451.58=7.6=8,50,2项分布函数的计算结果正解为8个问题和更大的总概率,51,“例6-7”有10个多重选择问题,每个问题有5个答案,其中只有一个是正解的答疑不是对几个问题的推测结果吗? 如果.52,一,正态分布和渐进正态分布二,t分布三,X2分布四,f分布,53,一,正态分布和渐进正态分布,统计量分布属于正态分布或渐近正态分布,则进行统计推论的理论依据是正态分布的理论。 以样本平均为例,正态分布的应用情况如下。54、1、1 .整体分布为正态,方差(2 )为已知,样本平均的分布为正态分布。 根据中心极限定理,样本平均数的平均数等于整体平均数,样本平均数的标准偏差除以样本容量的平方根,差分检验值为、55、2、2 .虽然整体分布不正规,但已知2,在这种情况下,当样本足够大时(n30 ),该样本平均数根据中心极限定理,样本平均数等于整体平均数:样本平均数的标准偏差除以样本容量的平方根:检验值:56,第四节的采样分布,区分三种不同性质的分布:整体分布:整体内个体数的度数分布。 样品分布:样品内个体数值的度数分布。 采样分布:一种本统计量的概率分布。 如果(n30 )色散和标准偏差的分布足够大,则样本色散和标准偏差的分布逐渐变成正态分布,58,二,t分布:由小样本统计量组成的概率分布左右对称,峰值相对窄,分布形状根据样本容量n-1的变化而变化,59,(二) t分布表的使用t分布表由t值、自由度和显着水平这三个数值构成。 两侧概率通常写为t/2,单侧概率写为t。 t的值越大,p的值越小。 在样本平均分布1 .整体分布为正态,方差(2 )未知的情况下,样本平均分布为t分布。 如果总体分布是非正规的,并且方差(2 )未知,则如果满足n30的条件,则样本平均分布接近t分布。 根据n个随机变量X1、X2、Xn,根据这些n个正态分布的随机变量的平方和Xi2构成新的随机变量的分布规则,被称为(n )分布,其中参数n被称为自由度如果正规整体的平均未知,则将样本平均设为的推定值,则2分布的自由度为df=n-1。65,(1.2分布的特征1.2分布为正偏置分布。 n或n-1越小,2分布越偏向。 2分布为一族分布,正态分布为其极限分布。 2.2的值都是正值。 3.2分布具有加法性,2分布之和也是2分布。 2是遵循df=df1 df2 dfk的2分布。 如果df2,则2分布的平均值:方差。 5.2分布为连续型分布,但离散型分布也与2分布接近。66、分布概率表(附表12、P475 )、2分布曲线中的面积均为1。 根据自由度和值求出的概率p为值以上的概率,以下的概率为0.5-p,67,4, f分布、两个正态分布的整体、其平均和方差分别为:和从这两个整体中分别随机提取电容n1和n2的样本,通过对每个样本计算2值,来计算无限的数量和对每个2随机变量对应的自由度df1和df2(df1=n1或n1-1 可确定df2=n2或n2-1)的比率,其可称为f比率,其中.68、f的比率分别是用样本方差除以其总体方差所得的比率。 如果是命令的话。 也就是说,从一个总体采样,其f比率可以写成、69,从一个正态总体中随机提取容量为n1和n2的两个样本,将其方差的比率分布设为f分布,将分子的自由度设为n1-1,将分母的自由度设为n2-1。(1)f分布的特征1.F分布是正偏置分布,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论