版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 几种常见的概率分布律回顾一下,在上一章里讲了变量及其概率分布的一般概念。 离散变量用概率函数来研究,概率函数定义了这个变量取每个值的概率; 连续变量用密度函数(一条曲线)来研究,通过这条曲线我们可以求得变量在某个特定区间取值的概率。在这一章里,我们将介绍一些在实际研究中应用最实际研究中应用最广的变量类型及其概率分布广的变量类型及其概率分布。离散变量离散变量连续变量连续变量二项分布二项分布泊松分布泊松分布超几何分布负二项分布指数分布正态分布正态分布标准正态分布标准正态分布第一节第一节 二项分布二项分布(Binomial Distribution)1.贝努利试验和在什么情形下应用二项分布贝
2、努利试验贝努利试验(Bernoulli trial):试验只有两种可能的结果,并且发生每种结果的概率是一定的。例如:抛一枚硬币,看得到正面还是反面;掷一次骰子,看得到6还是没有得到6;随机抽查一名婴儿的性别,看是男是女 在贝努利试验里,两种结果可分别称为“成功成功”和和“失败失败”,或者“事件A发生”和“事件A没有发生”。 什么情形时应用二项分布什么情形时应用二项分布:实验中进行了n次独立的贝努利试验,统计在这n次试验中总共获得了多少次“成功”。“成功”的次数,记为变量X;X称为二项分布变量,X的概率分布称为二项分布。(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。X的可
3、能取值为0,1,2,n。所以X是个离散型变量。二项分布变量的一些例子:二项分布变量的一些例子:(2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。(3)调查n枚种蛋的出雏数,出雏数X服从二项分布。(4)n头病畜治疗后的治愈数X,X服从二项分布。(5)n尾鱼苗的成活数X,X服从二项分布。2. 二项分布的常用记号; :贝努利试验的次数n成功”的次数;的取值,即总共获得“二项分布变量X :x“成功”的概率;一次贝努利试验中获得 :“失败”的概率;显然是一次试验中获得 :1次“成功”的概率。总共获得xxP : )(3. 二项分布的概率函数P(x) 怎样得到P(x)?种:次成功的方式有
4、次贝努利试验里,获得在2424C以以n n4 4,x x2 2为例,欲求为例,欲求P P(x x2 2)?)?。 ffss fsfs fssf sffs sfsf ssff612121234! 2 ! 2! 4 ,)!( !2424依据计算公式位置的组合方式。是从四个位置选取两个:注意CxnxnCCxn每种方式发生的概率为:22)1 ()(1)(1f)P(f)P(s)P(s)P(P(ssff)乘法法则其它5种方式发生的概率也是如此。24224)1 ()2( 24CPxn次成功的概率为次试验中取得因此,在xnxxnCxPxn)1 ()( *次成功的概率是共获得此贝努利试验中,在由此类推到一般情形
5、,的讨论:关于xnxxnCxP)1 ()(”这个名称。项,所以有“二项分布的第展开是二项式)从形式上来说,(1)1 ()1 (1xCnxnxxn011100)1 ()1 ()1 ()1 ()1 (nnnxnxxnnnnnnCCCCnxnxnnxnxxnCxP0011)1 ()1 ()( 2)(例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3:1。求产仔10头,有7头白猪的概率。,视白猪为成功,有个二项分布的问题,解:根据题意,这是一775. 043 ,10 xn7107710)75. 01 (75. 0)7()7(CPxP2503. 025. 075. 0! 3
6、! 7!1037所以,窝产仔10头,有7头白猪的概率是0.2503。例二,有一批玉米种子,出苗率为0.67。现任取6粒种子种1穴中,问这穴至少有1粒种子出苗的概率是多少?服从二项分布。则设出苗的种子数为。视出苗为成功,有个二项分布的问题。解:根据题意,这是一xxn,67. 0 , 6 )6()2() 1() 1()1(xPxPxPxPP粒出苗至少有9987. 00905. 00799. 00157. 033. 067. 033. 067. 033. 067. 0066642265116CCC这说明每穴种6粒种子,几乎肯定出苗。9987. 00013. 0133. 067. 01 )0(1)(1
7、)1(6006CxPPP没有出苗粒出苗至少有另外一种方法:4 二项分布的概率分布表和概率分布图除以P(x)表示,二项分布也可通过表或图来直观显示。xP(x)00.062510.25020.37530.25040.0625例如,抛硬币4次,获得的正面数记为X,则X服从二项分布。X的概率分布表为062. 05 . 05 . 0)0(, 5 . 0, 44004CPn时,分布偏斜:时,分布对称;5 . 05 . 0X的概率分布图为注意:时,负偏时,正偏5 . 05 . 05 二项分布变量的平均数和标准差 平均数nxxxPXE0)()(定义证明:nxxnxxxnxn0)1 ()!( !nxxnxxxn
8、xn1)1 ()!( !nXE)(10111)1 ()!1( ! nttntxttntn101)1 ()!1( !)!1(nttnttntnn1)1 (nnnxxnxxnxn1)1 ()!()!1(!n 方差和标准差222)()()(XEXEXVar证明:nxxnxxxnxn02)1 ()!( !)1 ()(2nXVar)1 (nnxxxPXE022)()(定义nxxnxxxxxnxn02)()1 ()!( !nxxnxnxxnxxxnxnxxxnxn002)1 ()!( !)()1 ()!( !nnnnnnxnxnnxnxnnnxxnxnxxxnxnnxxnxxnxnxnxxnxnxxnx2
9、22211222122) 1()1 ()!()!1()!1()1 ()!()!2()!2() 1()1 ()!( !)()1 ()!( !)1 ( )()(222222nnnnnnnXVar例三,某树种幼苗成材率为70,现种植2000株,问成材幼苗数的平均值和标准差是多少?服从二项分布。则株幼苗的成材数为解:设XX,2000。根据题意,70. 0 ,2000n140070. 02000n平均数49.203 . 07 . 02000)1 (n标准差第二节第二节 泊松分布泊松分布(Poisson Distribution)1. 在什么情形下应用泊松分布泊松分布是一种用来描述一定的空间或时间里稀有事
10、件发生次一定的空间或时间里稀有事件发生次数数的概率分布。服从泊松分布的变量的一些例子: 一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。 畜群中遗传的畸形怪胎数 单位空间内某些野生动物或昆虫数 每升饮水中的大肠杆菌数2. 泊松分布的概率函数与特征数泊松分布变量X只取零和正整数:0,1,2,其概率函数为exxPx!)(是自然对数底数。其中7182. 2 , 0e页。证明见情形下的情形来近似。在这种布可以用二项分布在怎么得到的呢?泊松分注意:40,!)1 (, 0,)(exCnnxPxxnxxn 泊松分布的平均数)(XExxexxPXExxx00!)()(证明:111)!1()!1(xxxx
11、xexe01!ttxtteee泰勒级数 泊松分布的方差和标准差)(2XVar222)()()(XEXEXVar证明:22)()()1()() 1(XEXEXXEXEXXXExxxxP2) 1()(02) 1(!xxxxxe2222)!2(xxxe22ee例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到3个微粒,问在一次观察中看到3个微粒的概率是多大?少于3个微粒的概率是多少?若观察100张片子,大约有多少张片子看到的微粒数少于3个?。松分布,且有事件数,所以它服从泊里的稀有,可以看成是一定空间微粒数解:一张片子里看到的3X2240. 0! 33!) 3(33exeX
12、Px4232. 0 ! 23! 13! 03 )2() 1()0()3(323130eeeXPXPXPXP)(32.424232. 0100)3(100张大约有XP第三节第三节 正态分布正态分布(Normal Distribution)正态分布是一种最重要的连续型变量的概率分布。 在生物科学研究里,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等; 许多统计分析方法是以正态分布为基础的。 不少随机变量的概率分布在样本容量增大时趋于正态分布。因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。1 正态分布的定义与主要特征 定义:变量X的概率分布的密
13、度函数为222)(21)(xexf。服从正态分布,记为为方差,则称变量为平均数,其中,),(22NXXf(x)的曲线为 X的积累分布函数dxedxxfxXPxFxxx222)(21)()()(没有更简化的形式 正态分布的主要特征:(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是 x=(2)曲线是非负函数,以x轴为渐近线,分布从到(3)曲线在x=处各有一个拐点,即在-, +范围内是上凸,其余是下凸。(4)曲线有两个参数:和。 代表平均数,代表标准差, 和一起决定曲线的位置和形状。 越大,则曲线沿x轴越向右移动;反之向左。 是变异度参数, 愈大则曲线愈“胖”;反之则愈瘦。(5)曲线下和x轴所夹的总
14、面积为1=0.5=1=22 标准正态分布 定义:=0,=1时的正态分布称为标准正态分布。标准正态分布变量记为U,写作 UN(0,1)。2221)(ueu密度函数:dxeuUPuxu2/221)()(分布函数:的曲线:密度函数)(u普通正态分布与标准正态分布普通正态分布与标准正态分布XZ(Z)(Z)ZZ221( ),2zzez xexfx,21)(222)(标准正态分布曲线标准正态分布曲线 标准正态分布的累积分布曲线标准正态分布的累积分布曲线 累积分布函数累积分布函数 标准正态分布有以下特性:标准正态分布有以下特性: 1、在、在u0时时(u)达到最大值。达到最大值。 2、当、当u不论向哪个方向远
15、离不论向哪个方向远离0时,时,(u)的值都的值都减小。减小。 3、曲线两侧对称。、曲线两侧对称。 4、曲线在、曲线在u1和和u1处有两个拐点。处有两个拐点。 5、曲线与横轴所夹面积等于、曲线与横轴所夹面积等于1。 6、累积分布曲线围绕点(、累积分布曲线围绕点(0,0.5)对称。)对称。 标准正态分布概率密度曲线在标准正态分布概率密度曲线在-1-1+1+1的区间内占的区间内占总面积的总面积的68.27%68.27%,在,在-1.96-1.96+1.96+1.96的区间内占总的区间内占总面积的面积的95%95%;在;在-2.58 -2.58 +2.58+2.58的区间内占总面的区间内占总面积的积的
16、99%99%。dzebZaPzba22121)(2121()()2zzZPZzedz 曲线下面积分布规律曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%标准正态分布标准正态分布 正态分布正态分布 面积或概率面积或概率 -11 68.27% -1.961.96 1.96 95.00% -2.582.58 2.58 99.00% 标准正态分布的三个常用概率标准正态分布的三个常用概率99.74%65.26%95.46%3 标准正态分布的概率计算 查表法:表2(253页)列
17、出了标准正态变量的累积分布函数值,即U小于某个值u的概率:P(Uu)左边的面积即为表中列出的数值uu)(关系式:)()()()()(abaUPbUPbUaP)()(ccUP)(1)(1)(ddUPdUP)53. 134. 0()4( ),56. 2|(|)3(),58. 2()2( ),64. 1() 1 (),1 , 0(UPUPUPUPNU试求:例一,已知05050. 0)64. 1(1查表)解:(UP00494. 099506. 01)58. 2(1)58. 2()2(查表UPUP01046. 000523. 02)56. 2(2)56. 2|(|) 3(UPUP30392. 06330
18、7. 093699. 0)34. 0()53. 1()53. 134. 0 () 4 (UPUPUP 4 一般正态分布的概率计算通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。 对于服从对于服从N(,2)的随机变量)的随机变量X,首先要进,首先要进行标准化变换,使之变为标准正态分布,再按行标准化变换,使之变为标准正态分布,再按上述方法查表。变换的方法是:上述方法查表。变换的方法是:xu定理:) 1 , 0(),(2NXNX,则假设变量bXaPbXaP)(因此,baPU定理abcXPcXP)(同理,ccUPdXPdXP)(dUPddUP11。求下列概率:例二,如果变量)4026( )
19、 3( );40( )2( );26( ) 1 ( )5 ,30(2XPXPXPNX21186. 0)8 . 0(53026530)26() 1 (查表解:UPXPXP02275. 097725. 01)2(1 530405301)40(1)40()2(查表UPXPXPXP76539. 021186. 097725. 0)8 . 0()2( )28 . 0(5304053053026)4026( )3(查表UPUPUPXPXP关于一般的正态分布,以下的一些概率经常用到:变量X落在的不同倍数区间的概率。6826. 0)(XP9545. 0)22(XP9973. 0)33(XP95. 0)96.
20、196. 1(XP99. 0)58. 258. 2(XP这些结论可以用一个实例来印证:以第一章里的120头母羊的体重资料为例:41. 5 , 9 .51sx由表可见,实际频率与理论概率相当接近,说明120头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。5 正态分布的单侧、双侧临界值(分位数)附表2列出了概率的数值,即对于给定的u,列出了曲线下u左边的面积。,已知面积为在以后的统计推断中,我们经常需要做与上面相反的工作:即已知曲线下右侧尾区的一定面积 ,求对应的临界值u ?u的值。页)给出了(附表。上侧临界值的称为uu256 3,已知面积为uu
21、。下侧临界值的称为。;同时,我们有因此,uuUPuUP )()(。双侧,也可以记为双侧临界值的称为那么平均分配到两侧,即如果将面积下侧。全部放在曲线的上侧或的单侧临界值是将面积)(,)|(|2/2/uuuUP的上侧临界值的双侧临界值注意:22/2/2/u界值和双侧临界值。的上侧临界值、下侧临和例三,求01. 005. 0;645. 105. 0) 1 (305. 0查表时,上侧临界值解:u;645. 105. 0u所以,下侧临界值96. 1)( 3025. 005. 0查表双侧双侧临界值uu;326. 201. 0)2(301. 0查表时,上侧临界值u;326. 201. 0u所以,下侧临界值576. 2)( 3005. 001. 0查表双侧双侧临界值uu注意:这些临界值在第五章假设检验时经常用到双侧概率或单侧概率双侧概率或单侧概率【例例】已知猪血红蛋白含量已知猪血红蛋白含量x服从正态分布服从正态分布 N (12.86,1.332 ),若,若P(xl1) =0.03,P(xl2)=0.03,求求l1,l2 。 依题意依题意 2=0.03,=0.06又因为又因为 故故 P(xl1)+ P(xl2) = P(u-u) + P(uu)03. 0)()33. 186.1233. 186.12()(11uuPlxPlx
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人荣誉申请守秘承诺书3篇范文
- 新能源汽车绿色物流信息化改造计划
- 数据加工质量保证承诺书范文6篇
- 行政办公用品申请与采购管理工具库存与消耗统计
- 2025-2026学年河北保定六校联盟高二上学期期中地理试题
- 历史加快改革开放和社会主义现代化建设步伐 课件 2025-2026学年统编版八年级历史下学期
- 2024-2025学年度辅警招聘考试试卷附答案详解(突破训练)
- 2025年大兴安岭地区新林区社区网格工作人员考试题库及答案
- 2026年海外仓尾程配送渠道选择与成本优化策略
- 2026年首批次新材料保费补贴80%申报材料准备实务
- “十五五规划纲要”解读:双碳引领绿色发展
- 《应急预案编制与演练》全套教学课件
- 诊所医疗废物污水污物粪便处理方案
- 第3课《错了就要改》(名师课件)
- 护理共情疲劳开题报告
- 医疗设备维护PDCA质量控制方案
- 《化工原理》实验指导书
- 铁路隧道敞开式TBM始发及试掘进施工实施细则
- 高考化学湖北长江作业本 化学人教选择性必修2 04 课后素养评价(四)
- 2026年苏州工业职业技术学院单招职业适应性测试题库及答案1套
- 全国护理心电图比赛试题(附答案)
评论
0/150
提交评论