生物统计28420ppt课件_第1页
生物统计28420ppt课件_第2页
生物统计28420ppt课件_第3页
生物统计28420ppt课件_第4页
生物统计28420ppt课件_第5页
已阅读5页,还剩157页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概 率 概率分布 与 第三章 第一节:概率基础知识 一、概率的概念 二、概率的计算 三、概率的分布 四、大数定律 一、概率基本概念 ( 一)事件 定义:在一定条件下,某种事物出现与否 就称为事件。 自然界和社会生活上发生的现象是各 种各样的,常见的有两类。 在 一定条件下必然出现某种结果或必然不出现某种结果 。 确定性事件 必然事件( U) (certain event) 不可能事件( V) (impossible event) 一、概率基本概念 在 一定条件下可能发生也可能不发生。 随机事件 (random event) 不确定事件 (indefinite event) 一、概率基本概念 为了研究随机现象,需要进行大量重复的调查、实验、测试 等,这些统称为试验。 一、概率基本概念 随机事件 事 件 一、概率基本概念 ( 二)频率( frequency ) 若 在 相同的条件下,进行了 n次 试验,在这 n次 试验中,事件 A出现的次数 m称为事件 A出现的频 数,比值 m/n称为事件 A出现的频率 (frequency), 记为 W(A)=m/n 。 0W(A) 1 一、概率基本概念 表 3-1 玉米种子发芽试验结果 种子总数 (n) 10 20 50 100 200 500 1000 发芽种子数 (m) 9 19 47 91 186 458 920 种子发芽率 (m/n) 0.900 0.950 0.940 0.910 0.930 0.918 0.920 种子发芽与否是不能事先确定的,但从表中可以看出 ,试验随着 n值的不同,种子发芽率也不相同,当 n充分大 时,发芽率在 0.92附近摆动。 例 : 一、概率基本概念 频率表明了事件频繁出现的程度,因而其稳定性说 明了随机事件发生的可能性大小,是其本身固有的 客观属性,提示了隐藏在随机现象中的规律性。 概 率 一、概率基本概念 ( 三)概率( probability,P) 概率的统计定义:设在相同的条件下,进行大量重复试验 ,若事件 A的频率稳定地在某一确定值 p的附近摆动,则称 p为事件 A出现的概率。 P(A) = p 统计概率 一、概率基本概念 抛掷一枚硬币发生正面朝上的试验记录 实验者 投掷次数 发生正面朝上的次数 频率 (m/n) 蒲丰 4040 2048 0.5069 K 皮尔逊 12000 6019 0.5016 K 皮尔逊 24000 12012 0.5005 随着实验次数的增多,正面朝上这个事件发生的频率稳定 接近 0.5,我们称 0.5作为这个事件的概率。 一、概率基本概念 ( 三)概率( probability,P) P(A) = p=lim 在一般情况下,随机事件的概率 P是不可能准 确得到的。通常以试验次数 n充分大时,随机 事件 A的频率作为该随机事件概率的 近似值 。 m n m n 一、概率基本概念 0P(A)1 任何事件 P(U)=1 必然事件 P(V) 0 不可能事件 00 , q0, p+q=1, x是一个离散型随机变量,取值 为 0, 1, 2, , n。 p(x) Cnxpxqn-x Cnx n! x!(n-x)! n=试验次数(或样本含量) n=4 x=在 n次 试验中事件 A出现的次数 x=2 p=事件 A发生的概率(每次试验是恒定的) p=0.9 1-p=事件 A不发生的概率 1-p=0.1 p(x)=X的概率函数 =P(X=x) P(2) 则 4粒种子有两粒发芽的概率为: P(x)= p2 q4-2=60.920.12=0.0486 例: 由于二项式中 p+q=1, ( p+q ) n = 1 p(0) +p(1) +p(2) + + p(x) + + p(n) =1 一、二项分布 P(x) =1nx=0 或者 n个事件构成一个完全事件系,所以有: 现已求出某事件发生的概率,若试验 N次, 则该事件发生的理论次数为: 理论次数 NP(x) 二项分布的概率累积函数为: F (x) =P(x)=1 3:1 若每次观察 4株,共观察 100次,问红花为 0 、 1、 2、 3、 4株的概率各为多少? (二)二项分布的计算 例:豌豆 F1为红花和白花,杂交后 F2红花:白花 3: 1 F1 F2 概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C40p0q4 0.0039 0.0039 0.39 P(1) C41p1q3 0.0469 0.0508 4.69 P(2) C42p2q2 0.2109 0.2617 21.09 P(3) C43p3q1 0.4219 0.6836 42.19 P(4) C44p4q0 0.3164 1.000 31.64 合计 1.000 100 表 观察 4株出现红花的概率分布表 (p=0.75 q=1-p=0.25) 概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C50p0q5 0.00001 0.00001 0.01 P(1) C51p1q4 0.00045 0.00046 0.45 P(2) C52p2q3 0.0081 0.00856 8.1 P(3) C53p3q2 0.0729 0.08046 72.9 P(4) C54p4q1 0.32805 0.40951 328.05 P(5) C55p5q0 0.59049 1.0000 590.49 孵化小鸡的概率分布表 (p= 0.90 q=0.10) 例 2:鸡蛋孵化率为 0.90,每次选 5个进行孵化,试求孵出小鸡 的各种可能概率,若做 1000次试验,其理论次数分别为多少? 二项 分布概率函数 概率的计算 样本容量的确定p(x) Cnxpx(1-p)n-x 例:某小麦品种在田间出现自然变异的概率为 0.0045, ( 1)调查 100株,获得两株或两株以上变异植株的概率是多少? ( 2)期望有 0.99的概率获得 1株或 1株以上的变异植株,至少应调 查多少株? ( 1) n=100, p=0.0045 P(x2)=1- P(0)- P(1)=0.0751 ( 2) P(0)=0.01 n=1021(株) 一、二项分布 (三)二项分布的形状和参数 (1)当 p值 较小且 n不大 时,分布是偏倚的。 随 n的增大,分布趋于 对称; 二项分布的 形状 由 n和 p两个参数决定。 B(n,p) 一、二项分布 (三)二项分布的形状和参数 ( 2)当 p值趋于 0.5时,分布趋于对称。 统计学证明,服从二项分布 B(n,p)的随机 变量所构成的 总体的平均数 、 标准差 与 n、 p这两个参数有关。 一、二项分布 (三)二项分布的形状和参数 n p )1( pnp -=s 在二项分布中,事件 A发生的频率 x/n称 为二项成数,即百分数或频率。则 二项成数 的平均数 和 标准差 分别为: 也称为 二项总体百分数的标准误 ,当 p 未知时,常以样本百分数 来估计。此时上 式改写为: = 称为样本百分数标准误。 例:豌豆红花纯合基因型和白花纯合基因型杂 交后,在 F2代红花植株与白花植株出现的比例 为 3:1。每次观察 4株, n=4, 红花出现概率为 p=3 4 0.75。 ( 1)红花出现的平均株数 =n p = 3.0 (株 ) ( 2)标准差 =0.8660(株))1( pnp -=s n1 0,1,2,3,4 n2 n3 n4 n5 n100 总体红花出现株数 一、二项分布 (三)二项分布的形状和参数 ( 1)红花出现的频率的平均数: p n p /n = 3.0/4 = 0.75 = p n1 n2 n3 n4 n5 n100 0,0.25,0.5,0.75,1.0 总体红花出现频率 二项 分布的百分数,成数 二、泊 松 分 布 二、泊松分布 泊松 分布 (Poisson distribution) 是一种可以 用来描述和分析随机地发生在单位空间或时 间里的稀有事件的概率分布,也是一种离散 型随机变量的分布。 泊松 分布是二项分布的一种特殊类型。 二、泊松分布 泊松 分布的概率函数 可由二项分布概率函数推导出来 !)( x exP l= - x 为参数, = np x = 0,1,2, p(x) Cnxpx(1-p)n-x !)( x exP l= - x = 2 = = P( ) p(x) Cnxpx(1-p)n-x n p )1( pnp -=s 2=np(1-p) = np = 二、泊松分布 P( )的形状由 确定 较小时,泊松分布偏倚。 增大时,泊松分布趋于对称。 无限增大时,泊松分布接近正态分布。 形状 形状形状 二、泊松分布 对于小概率事件,可用泊松分布描述其概率分布 。 二项 分布当 p30 当 2未知, 且 n30时 ,其曲线接近正态分布曲线, df 时则和正态分布曲线重合。 t分布曲线与横轴所围成的面积为 1。 同 标准正态分布曲线一样,统计应用中最为关心的是 t分布曲线下的面积(即概率)与横轴 t值间关系。 为 使用方便,统计学家编制不同自由度 df下的 t值表。 在 相同的自由度 df时, t值越大,概率 P越小 。 在 相同 t值时,双尾概率 P为单尾 概率 P的两倍 。 1 2 df增大, t分布接近正态分布,即 t值接近 u值 。3 t落于 - t0.05, + t0.05 内的 概率为 0.95 t落于 - t0.01, + t0.01 内的 概率为 0.99 置信度为和的 t临界值 。 t0.05( 4) 2.776 t0.01( 4) 4.604 -2.776 +2.776 五、 x2 分布 从方差为 2的 正态总体中,随机抽取 k个 独立样本,计算 出样本方差 S2, 研究其样本方差的分布。 df = k-1 在 研究样本方差的分布时,通常将其标准化,得到 k个正 态离差 u, 则 概率密度函数 概率累积函数 2分布于区间 0,+ ),并且呈反 J型的偏斜分布 。 1 2分布的偏斜度随自由度降低而增大,当自 由度 df=1时,曲线以纵轴为渐近线。 2 随 自由度 df的增大, 2分布曲线渐趋左右对称, 当 df30时,卡方分布已接近正态分布。 3 对于给定的 (0x2(n)=的点 x2(n)为 x2分布的上 分位点(右尾概率)。 表中表头的概率 是 2大于表内所列 2值的概率。 df = 2 P( 2 5.99) 0.05 P( 2 9.21) 0.01 P( 2 0.10) 0.95 六、 F 分布 设从一正态 总体 N(, 2) 中 随机抽取样本容量为 n1、 n2的两个独立样本,其样本方差为 s12、 s22, 则定义其 比值: 此值具有 s12的自由度 df1=n1-1和 s22的自由度 df2=n2-1。 如果对一正态总体在特定的 df1和 df2进行一系列 随机独立抽样,则所有可能的值就构成一个 分布。 分布的概率密度函数是两个独立 2变量的概 率密度所构成的联合概率密度。 分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论