常用概率分布.ppt_第1页
常用概率分布.ppt_第2页
常用概率分布.ppt_第3页
常用概率分布.ppt_第4页
常用概率分布.ppt_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章常用概率分布,本章内容,概率论相关数学知识复习第一节二项分布第二节泊松分布第三节正态分布(重点)-查表和Excel表格计算第四节样本平均数的抽样分布第五节t分布(重点)1、掌握正态分布、t分布的概念、内涵2、掌握t分布规律及其与标准正态分布的关系,概率统计定义:在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率(。,如此定义的概率称为统计概率(statisticsprobability),或者称后验概率(posteriorprobability)。,概率的性质(1)对于任何事件A,有0P(A)1;(2)必然事件的概率为1,即P()=1;(3)不可能事件的概率为0,即P()=0。,概率分布,事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probabilitydistribution)。为了深入研究随机试验,我们先引入随机变量(randomvariable)的概念。,随机变量,描述随机事件的变量称为随机变量。随机变量的取值在一次试验前不能确定,具有随机性。作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值,则试验结果可用变量x来表示。【例】对10种品牌袋装奶粉进行质量检测,其可能结果是“0种合格”、“1种合格”、“2种合格”、“”、“10种袋装奶粉都合格”。若用x表示袋装奶粉合格品牌数,则x的取值为0、1、2、10。,离散型随机变量:如果表示试验结果的变量x,其可能取值为可列个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量(discreterandomvariable);连续型随机变量:如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量(continuousrandomvariable)。,离散型随机变量的概率分布要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。如果我们将离散型随机变量x的一切可能取值xi(i=1,2,),及其对应的概率pi,记作P(x=xi)=pii=1,2,(41)则称(4-1)式为离散型随机变量x的概率分布或分布。常用分布列(distributionseries)来表示:,x1x2xn.p1p2pn从分布列可以一目了然看出随机变量X的可能取值及取这些值的概率。离散型随机变量的概率分布具有pi0和pi=1这两个基本性质。连续型随机变量的概率分布连续型随机变量(如身高、体重等)的概率分布不能用分布列来表示,因为其可能取值是不可数的,不能一一列出。改用随机变量x在某个区间内取值的概率P(axb)来表示。下面通过频率分布密度曲线予以说明。,图41为数据资料的频率分布直方图,图中纵座标取频率与组距的比值。可以设想,如果样本取得越来越大(n+),组分得越来越细(i0),某一范围内的频率将趋近于一个稳定值概率。这时,频率分布直方图各个直方上端中点的连线频率分布折线将逐渐趋向于一条曲线。,当n+、i0时,频率分布折线的极限是一条稳定的函数曲线。对于样本是取自连续型随机变量的情况,这条函数曲线将是光滑的。这条曲线排除了抽样和测量的误差,完全反映了数据资料的变动规律。这条曲线叫概率分布密度曲线,相应的函数叫概率分布密度函数,简称分布密度。对该曲线积分所得的函数称为概率分布函数。,(42)式为连续型随机变量x在区间a,b)上取值概率的表达式。可见,连续型随机变量的概率由概率分布密度函数确定。,若变量X概率分布密度函数记为f(x),则x取值于区间a,b)的概率为图中阴影部分的面积,即P(axb)=(4-2),第一节二项分布,一、贝努利试验及其概率公式(1)在相同条件下进行了n次试验,各次试验彼此之间是独立的,(2)每次试验结果出现且只出现对立事件A与之一,在每次试验中出现A的概率是常数p(0p2)(4-27)t分布密度曲线如图4-12所示,其特点是:,Gammafunction,1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值。3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n30时,t分布与标准正态分布的区别很小;n100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致。,t分布的概率分布函数为:(4-28)因而t在区间(t1,+)取值的概率右尾概率为1-Ft(df)。由于t分布左右对称,t在区间(-,-t1)取值的概率也为1-Ft(df)。于是t分布曲线下由-到-t1和由t1到+两个相等的概率之和两尾概率为2(1-Ft(df)。对于不同自由度下t分布的两尾概率及其对应的临界t值已编制成附表3,即t分布表。,例,当df=15时,查附表3得两尾概率等于0.05的临界t值为2.131,其意义是:P(-t-2.131)=P(2.131t+)=0.025;P(-t-2.131)+(2.131t20.05(df),则p0.05,否定无效假设,F分布,F分布定义为:设X、Y为两个独立的随机变量,X服从自由度为m的卡方分布,Y服从自由度为n的卡方分布,这2个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=(x/m)/(y/n)服从自由度为(m,n)的F-分布,上式F服从第一自由度为m,第二自由度为n的F分布。,SAS和SPSS统计软件的使用,第一节SAS软件的应用,1.简介2.特点3.如何使用,1.简介,StatisticalAnalysisSystem,在科学数据统计分析、试验设计、文件管理等方面有着重要的应用,2.特点,是一款专业的统计分析软件简单、方便、实用英文界面,需要使用者熟

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论