第三章 几种常见的概率分布律_第1页
第三章 几种常见的概率分布律_第2页
第三章 几种常见的概率分布律_第3页
第三章 几种常见的概率分布律_第4页
第三章 几种常见的概率分布律_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章几种常见的概率分布律,回顾一下,在上一章里讲了变量及其概率分布的一般概念。,离散变量用概率函数来研究,概率函数定义了这个变量取每个值的概率;,连续变量用密度函数(一条曲线)来研究,通过这条曲线我们可以求得变量在某个特定区间取值的概率。,在这一章里,我们将介绍一些在实际研究中应用最广的变量类型及其概率分布。,离散变量,连续变量,二项分布,泊松分布,超几何分布,负二项分布,指数分布,正态分布,标准正态分布,第一节二项分布(BinomialDistribution),1.贝努利试验和在什么情形下应用二项分布,贝努利试验(Bernoullitrial):试验只有两种可能的结果,并且发生每种结果的

2、概率是一定的。,例如:抛一枚硬币,看得到正面还是反面;掷一次骰子,看得到6还是没有得到6;随机抽查一名婴儿的性别,看是男是女,在贝努利试验里,两种结果可分别称为“成功”和“失败”,或者“事件A发生”和“事件A没有发生”。,什么情形时应用二项分布:实验中进行了n次独立的贝努利试验,统计在这n次试验中总共获得了多少次“成功”。“成功”的次数,记为变量X;X称为二项分布变量,X的概率分布称为二项分布。,(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。,X的可能取值为0,1,2,n。所以X是个离散型变量。,二项分布变量的一些例子:,(2)调查250名新生婴儿的性别,记男婴的总数为

3、X,则X服从二项分布。,(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。,(4)n头病畜治疗后的治愈数X,X服从二项分布。,(5)n尾鱼苗的成活数X,X服从二项分布。,2.二项分布的常用记号,3.二项分布的概率函数P(x),怎样得到P(x)?,以n4,x2为例,欲求P(x2)?。,每种方式发生的概率为:,其它5种方式发生的概率也是如此。,例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪的概率。,所以,窝产仔10头,有7头白猪的概率是0.2503。,例二,有一批玉米种子,出苗率为0.67。现任取6粒种子种1穴中,问这穴至少有1粒种子

4、出苗的概率是多少?,这说明每穴种6粒种子,几乎肯定出苗。,4二项分布的概率分布表和概率分布图,除以P(x)表示,二项分布也可通过表或图来直观显示。,例如,抛硬币4次,获得的正面数记为X,则X服从二项分布。X的概率分布表为,X的概率分布图为,注意:,5二项分布变量的平均数和标准差,平均数,方差和标准差,例三,某树种幼苗成材率为70,现种植2000株,问成材幼苗数的平均值和标准差是多少?,第二节泊松分布(PoissonDistribution),1.在什么情形下应用泊松分布,泊松分布是一种用来描述一定的空间或时间里稀有事件发生次数的概率分布。,服从泊松分布的变量的一些例子:,一定畜群中某中患病率很

5、低的非传染性疾病患病数或死亡数。,畜群中遗传的畸形怪胎数,单位空间内某些野生动物或昆虫数,每升饮水中的大肠杆菌数,2.泊松分布的概率函数与特征数,泊松分布变量X只取零和正整数:0,1,2,其概率函数为,泊松分布的平均数,泊松分布的方差和标准差,例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到3个微粒,问在一次观察中看到3个微粒的概率是多大?少于3个微粒的概率是多少?若观察100张片子,大约有多少张片子看到的微粒数少于3个?,第三节正态分布(NormalDistribution),正态分布是一种最重要的连续型变量的概率分布。,在生物科学研究里,有许多变量是服从或近似服

6、从正态分布的,如水稻产量、小麦株高、玉米百粒重等;,许多统计分析方法是以正态分布为基础的。,不少随机变量的概率分布在样本容量增大时趋于正态分布。,因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。,1正态分布的定义与主要特征,定义:若变量X的概率分布的密度函数为,f(x)的曲线为,X的分布函数,没有更简化的形式,正态分布的主要特征:,(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是x=,(2)曲线是非负函数,以x轴为渐近线,分布从到,(3)曲线在x=处各有一个拐点,即在-,+范围内是上凸,其余是下凸。,(4)曲线有两个参数:和。代表平均数,代表标准差,和一起决定曲线的

7、位置和形状。越大,则曲线沿x轴越向右移动;反之向左。是变异度参数,愈大则曲线愈“胖”;反之则愈瘦。,(5)曲线下和x轴所夹的总面积为1,=0.5,=1,=2,2标准正态分布,定义:=0,=1时的正态分布称为标准正态分布。标准正态分布变量记为U,写作UN(0,1)。,普通正态分布与标准正态分布,X,Z,(Z),(Z),标准正态分布曲线,标准正态分布的累积分布曲线,累积分布函数,标准正态分布有以下特性:,1、在u0时(u)达到最大值。2、当u不论向哪个方向远离0时,(u)的值都减小。3、曲线两侧对称。4、曲线在u1和u1处有两个拐点。5、曲线与横轴所夹面积等于1。6、累积分布曲线围绕点(0,0.5

8、)对称。,标准正态分布概率密度曲线在-1+1的区间内占总面积的68.27%,在-1.96+1.96的区间内占总面积的95%;在-2.58+2.58的区间内占总面积的99%。,标准正态分布的累积概率函数,曲线下面积分布规律,标准正态分布的三个常用概率,99.74%,65.26%,95.46%,3标准正态分布的概率计算,查表法:表2(253页)列出了标准正态变量的累积分布函数值,即U小于某个值u的概率:P(Uu),关系式:,4一般正态分布的概率计算,通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。,对于服从N(,2)的随机变量X,首先要进行标准化变换,使之变为标准正态分布,再按上述方法

9、查表。变换的方法是:,定理:,关于一般的正态分布,以下的一些概率经常用到:变量X落在的不同倍数区间的概率。,这些结论可以用一个实例来印证:,以第一章里的120头母羊的体重资料为例:,由表可见,实际频率与理论概率相当接近,说明120头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。,5正态分布的单侧、双侧临界值(分位数),附表2列出了概率的数值,即对于给定的u,列出了曲线下u左边的面积。,在以后的统计推断中,我们经常需要做与上面相反的工作:即已知曲线下右侧尾区的一定面积,求对应的临界值u,注意:这些临界值在第五章假设检验时经常用到,双侧概率或单侧

10、概率,【例】已知猪血红蛋白含量x服从正态分布N(12.86,1.332),若P(xl1)=0.03,P(xl2)=0.03,求l1,l2。依题意2=0.03,=0.06又因为故P(xl1)+P(xl2)=P(u-u)+P(uu),=1-P(-uuu)=0.06=由附表2查得:u0.06=1.880794,所以(l1-12.86)/1.33=-1.880794(l2-12.86)/1.33=1.880794即l115.36,l215.36。,6中心极限定理(centrallimittheorem),中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,1.若随机变量x服从正态分布N(2);、,是由x总体得来的随机样本,则统计量=xn的概率分布也是正态分布,且有=,,即服从正态分布N(,2n)。2.若随机变量x服从平均数是,方差是2的分布(不是正态分布);,是由此总体得来的随机样本,则统计量=x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论