第四章概率分布《试验设计与统计分析》PPT课件.ppt

上传人：带*** IP属地：江西上传时间：2020-02-25 格式：PPT 页数：102 大小：1.56MB 积分：18 举报 版权申诉

免费预览已结束，剩余97页可下载查看

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四章概率分布在自然界或人类社会中发生的各种现象通常可划分为两类确定性现象 definitephenomena 一定条件下必然发生的现象随机现象 randomphenomena 一定条件下可能发生但结果不止一个哪个结果发生预先并不知道的比如抛掷一枚硬币随机现象的统计规律随机现象虽然表现为不确定性但在大量重复试验观测下其结果会呈现出某种特定的规律称作随机现象的统计规律如掷一枚硬币正面朝上的频率接近0 5 概率分布就是描述随机现象的统计规律本章主要介绍事件和概率二项分布和泊松分布正态分布抽样分布第一节事件和概率一事件1 随机试验满足下述三个条件的试验称为随机试验 randomexperiment 试验可在相同条件下重复进行试验的所有可能结果是明确可知的并且不止一个每次试验总是恰好出现这些可能结果中的一个但在试验之前却不能肯定会出现哪一个结果在统计学里随机试验可简称为试验 2 事件 event 试验中所观察到的结果 3 基本事件随机试验的每一个可能结果称为基本事件 elementaryevent 或简单事件 simpleevent 不可再分 4 复合事件由若干个基本事件组合而成的事件称复合事件 compoundevent 也称作复杂事件5 必然事件每次试验中一定发生的结果称作必然事件 certainevent 用表示 6 不可能性事件在任何一次试验中都不可能发生的结果称作不可能事件 impossibleevent 用表示 7 随机事件每次试验中可能发生也可能不发生的结果称作随机事件 randomevent 用A B C等表示二事件之间的关系和运算 1 包含若事件A的发生必导致事件B发生则称事件B包含事件A 2 相等则称事件A等于事件B 记作A B 3 和若事件A与事件B至少一个发生某事件就发生则某事件称作A与B的和事件简称为和记作读作A并B 或A B 读作A加B 推广到n个事件的和 4 积若事件A与事件B同时发生某事件才发生则称某事件为A与B的积事件简称为积记作读作A交B 或AB 读作A乘B 推广到个n个事件的积 5 差称事件A发生但事件B不发生的事件为A减B的差事件简称为差记为A B 6 互斥若事件A与事件B不能同时发生则称A与B互斥或互不相容互斥包括非此即彼的情形但互斥不一定是非此即彼事件关系满足 7 对立称事件A不发生就发生的事件为A的对立事件记为事件的发生非此即彼显然 8 独立若事件A发生的概率不影响事件B发生的概率则称事件A与事件B相互独立反之亦然 A与B是一对彼此独立的事件注意独立与互斥对立的区别互斥指两事件不能同时发生满足独立指一事件发生的概率与另一事件发生的概率无关对立事件互斥但不独立因为它们满足9 完备事件系若n个A1 A2 An事件两两互斥且满足下式则称该个事件为一个完备事件系注意概率之和等于1并且两两互斥的事件系才是完备事件系两个条件缺一不可例4 1 用集合图描述事件之间的关系和运算并理解和掌握它们的实际意义图4 1事件之间的关系和运算三概率用于度量事件发生可能性大小的数值称作事件的概率 probability 通常用P A P B 等表示事件的概率具有下述性质设A为任一事件则0 P A 1 必然事件的概率为1 P 1 不可能事件的概率为0 P 0 2 概率的统计定义若在相同条件下将试验重复n次且事件A出现了nA次则事件的频率 frequency 定义为如果随着试验重复次数n的增大事件A的频率越来越稳定地在某一常数附近摆动则称常数为事件A的概率 probability 即这就是统计意义上的概率定义 statisticalprobability 历史上曾有几个著名的抛一枚均质硬币试验见教材许多情况下p很难准确获得通常以n充分大时事件A出现的频率作为它的概率的估计值即四概率计算法则1 对立事件和互斥事件的加法公式若A和为对立事件若A和B为互斥事件 P A B P A P B 2 独立事件的乘法若A B为相互独立事件 P AB P B P A 若A1 A2 An为独立事件系 P A1 A2 An P A1 A2 P An 第二节随机变量及其分布一随机变量在随机试验中被测定的量是可取不同值的变量且其取值具有随机性这样的变量称为随机变量用X表示 X的某次取值记作小写的x 此时就称X作随机变量 randomvariable 就称x作随机变量的一个观察值 observedvalue 或简称观测 observation 间断性 internalvariable 或称为离散 discretevariable 随机变量如果随机变数只有有限个可能的取值并在试验中以确定的概率来取这些数值就称它为间断性或离散随机变量质量性状和计数的数量性状的试验结果常常是间断性随机变量连续性随机变量 continuousvariable 如果随机变数可能的取值充满一个区间并且试验结果落在任意区间内的概率是确定的就称它为连续性随机变量计量性状的试验结果通常是连续性随机变量二随机变量的概率分布随机变数可能的取值或取值区间的概率反映了随机变数的统计规律性称为概率分布 1 离散间断性随机变量的概率分布所谓离散随机变量的概率分布就是指概率函数f x 和分布函数F x 两个基本函数它们提供了概率分布规律的完整信息概率函数 probabilityfunction f x 设随机变数X可能的取值为x1 x2 xk 每个取值对应的概率P X xi 为p1 p2 pk 为离散间断性随机变量的概率函数表4 1间断性随机变量的概率分布列分布函数 cumulativedistributionfunction F x 为分布函数亦称作概率累积函数间断性随机变量一般用概率分布列来表示这种规律性其概率分布列见表4 1 例4 2 转基因桑树植株抗病性检验邱健德 2006 参试植株分两组即转基因组和一般桑树组将病级分为级观测发病的植株数由于观测数量足够多故发病的概率近似等于频率试以此概率为基础求解随机变量的概率函数和分布函数表4 2桑树植株发病级的概率函数和分布函数 2 连续随机变量的分布连续性随机变量一般用分布函数F x 和概率密度函数f x 来表示其概率分布规律分布函数概率累积函数 F X 若X为一连续随机变量 x 为任意实数则X的分布函数或概率累积函数为 F X P X x 分布函数F x 的直观意义就是随机点X落在区间 x 上的概率概率密度函数f x 如果存在非负函数f x 使则称f x 为连续随机变量的概率密度函数简称概率密度 probabilitydensity 亦称密度函数 densityfunction 或分布密度 distributiondensity 图4 2连续随机变量的概率密度曲线图4 3连续随机变量的分布函数曲线连续随机变量在给定区间取值的概率对于连续随机变量x 若已知它的分布函数F X 则x的观察值属于任一区间 x1 x2 的概率可由下式求得 1 大数定律相同条件下大量重复的试验事件发生的频率随试验次数的无限增大而趋于事件的概率这是最早的一个大数定律 lawoflargenumber 一般的大数定律研究随机变量n次观测的平均数随n无限增大是否趋向某定值的问题称作平均数的稳定性如果 n无限增大平均数就趋于一个定值此时称平均数具有稳定性三大数定律及小概率事件原理大数定律是许多统计方法赖以成立的理论依据称其为统计估计大数就是所谓的足够多足够多的独立重复试验大数定律 2 小概率事件原理依据大数定律概率很小的事件其频率也很小若只做一次试验该事件实际上应当不会发生因此人们常常认为那些概率很小的事件实际上是不可能发生的此原理称之为小概率事件的实际不可能原理简称作小概率事件原理一般认为概率小于0 05或小于0 01的事件为小概率事件 0 05和0 01称为小概率事件的临界概率对于其它特殊场合规定的临界概率值可根据事件的性质合理确定第三节二项分布和泊松分布一 0 1分布二项总体分布有些总体的各个个体的某种性状只能发生非此即彼两种结果此和彼是对立事件如种子的发芽和不发芽等这种由非此即彼事件构成的总体叫做二项总体为便于研究将这类的试验结果数量化此事件设为1 具概率p 彼事件设为0 具概率q 因而二项总体又称为0 1总体其概率关系显然为 p q 1q 1 p 表4 3二项总体的概率分布列 0 1分布 m p s2 pq 图4 40 1分布的概率函数例4 3 以某试验地的5株蔬菜为总体调查蚜虫为害情况令x 1代表受害 x 0代表未受害 5株的观察结果为0 1 0 1 0 试求危害率的数学期望m和方差s2 说明该试验地蚜虫的平均危害率为0 4 危害率变异的方差为0 24 此例也说明了二项总体的平均数为m p 方差为s2 pq 二二项分布从二项总体中每次以样本容量n抽样将会有n 1种可能的结果这n 1种可能的结果有它各自的概率而组成一种分布就叫二项概率分布简称二项分布 binomialdistribution 又称贝努利分布 010111001010101000101010010110011010000101101011101 00000 11111 以n 5抽样有6种可能的结果即变量X有6种可能的取值二项总体 0 1 总体这6种可能的结果有它各自的概率而组成一种分布就叫二项概率分布简称二项分布 binomialdistribution 又称贝努利分布 0 1 2 3 4 5 二项展开式三计算二项分布概率的方法例4 4 在一批发芽率为0 9的种子里取5粒进行发芽试验以x为发芽粒数试做出试验结果X的概率分布列四二项分布的形状和参数图4 5表示表4 4的概率分布列这是一个偏态的概率分布因为其p q且n较小如果p q则二项分布是对称的见图4 6 理论分析和实践结果都表明当n很大时即使p q的二项分布其图形也接近对称见图4 7 图4 5表4 4的概率分布图图4 6p q 0 5 n 5的二项分布图示图4 7p 0 4 q 0 6 n 20的二项分布图示例4 5 某玉米种子发芽率为0 6 今按设计株距穴播若每穴播4粒预计田间保苗率是多少首先考虑这里的田间保苗率实际上是每穴有种子发芽的概率这是一个和事件可计算为可知此时田间预计保苗率为97 44 例4 6 在已往大规模田间播种作业中已观测到种子的出苗概率为0 6 若每穴播10粒试确定播种作业的穴粒数分布求出在此出苗概率 0 6 下田间保苗率 95 的最少穴粒数解设出苗种子数X为随机变量服从二项分布其概率函数为表4 5田间播种作业穴粒数的概率函数和分布函数 10 3 图4 8每穴出苗种子数的概率函数二项分布概率函数观察值 x 设田间保苗率大于95 时最少穴粒数为每穴n粒与上题相同田间保苗率实际上是每穴有种子发芽的概率因此至少一粒种子出苗的概率如下由此可见穴粒数达4粒以上就可基本保证每穴必出苗最佳穴粒数定为4 五泊松分布当n较大 p或q较小 np或nq 5时二项分布将为泊松分布 Poissondistribution 所接近令 np 则泊松分布的概率分布为记作X p 泊松分布的概率函数仅含一个参数意味着只要获知概率函数就被完全确定泊松分布的期望和方差相等且均为这是泊松分布所特有的性质如果试验次数很大某事件出现的次数很小那么此事件的出现次数将服从泊松分布泊松分布的概率函数图形见图4 11 图4 9泊松分布的概率函数例4 11 为考察果树品种A和B的幼苗在某栽植地区的抗寒力及分布设置200个面积相等且足够大的抽样小区观测小区寒害株数小区内遭受寒害的株数观测结果为0 1 2 3 4和5 统计寒害株数相同的小区数小区寒害次数计算小区寒害率小区寒害次数与观测小区总数之比结果见表4 6 试用泊松分布预测小区寒害率并与观测结果比较同时考察两品种抗寒力的差异表4 6两果树品种的小区寒害株数次数和寒害率的观测结果品种A 品种B 品种A的泊松分布概率函数品种B的泊松分布概率函数图4 10品种A小区寒害率的观察值与泊松预测值图4 11品种B小区寒害率的观察值与泊松预测值一批种子中不合格种子占0 005 从中抽取800粒试求其中不合格种子恰有10粒和不多于5粒的概率因为n 800 p 0 005 np 4 5 所以可按泊松分布来计算后者也可以在泊松分布累积函数表中查出第四节正态分布正态分布是田间试验与统计分析中最重要的一种分布生物科学的许多随机变量均服从正态分布比如产量株高生物量等 n趋于无穷大任意分布平均数的分布均趋于正态分布这意味着n足够大时可用正态分布近似平均数的分布 n趋于无穷大二项分布泊松分布等许多分布都趋于正态分布这意味着n足够大时可用正态分布近似这些分布三大抽样分布t c2和F均源于正态分布总体的抽样而它们又是形成统计方法的基础一正态总体分布随机变数X服从正态分布记为X N m s2 s2 正态分布的概率密度函数为正态分布的概率累积函数为二正态分布曲线的性质 1 正态分布曲线以总体平均数为中心向左右两侧对称分布 2 正态分布曲线是一单峰曲线总体平均对应的概率密度最大左右两侧离越远对应的概率密度越小 3 总体平均数决定曲线的中心位置标准差决定曲线的变化率和不同的总体其正态分布曲线的位置和形状各异因此正态分布曲线是以参数和的不同而变化的曲线系统 4 正态分布曲线在 1 处有拐点两尾向左右无限延伸以横轴为渐近线全距为至 5 无论和为多少正态分布曲线与横轴间的总面积都等于1 意为随机变数X的取值位于至之间的概率为1 即图 6 无论和为多少随机变数的取值落在任意区间 a b 的概率为直线x a和x b与正态分布曲线和横轴间的面积即表4 7几个常见区间所对应的概率图4 12正态概率密度曲线及随的变化固定图4 13正态概率密度曲线及随的变化固定返回性质图4 14正态分布曲线正态分布的概率计算随机变数X在 a b 范围内的概率等于X在 a b 范围内的定积分计算曲线下从到x的面积其式如下 FN x 称为正态分布的累积函数或分布函数具平均数和标准差 f x 为概率密度函数 P X a FN a P a X b FN b FN a 服从正态分布的随机变数X都可通过标准化变换为正态离差u来计算其落于任意区间的概率总体平均数 0 方差 1的正态分布称标准正态分布标准化是以一个新变数U代替X 将X离其平均数的差数以为单位进行标准化即U称为正态离差是一个服从标准正态分布的随机变数其概率密度函数为具平均数 0 方差 1 记为U N 0 1 附表1给出的正是标准正态分布的累积函数值从N 2 到N 0 1 从几何意义上说仅是作了坐标轴平移和尺度单位的变换它带来的相应改变是分布中心从处移到0处尺度单位从x的单位变为标准差的单位图4 15a正态分布曲线图图4 15b标准正态分布曲线图由对立事件概率之和P X x P X x 1得得变量在任意区间 x1 x2 内取值的概率如下例4 13 设U N 0 1 试计算P U1 38 P U 1 P U 2 P U 3 由正态分布函数表附表1 查得 2 1 0 0179 1 38 0 9162 1 0 8413 1 0 1587 2 0 9772 2 0 0228 3 0 9987 3 0 0013P U1 38 1 P U 1 38 1 0 9162 0 0838P U 1 P 1 U 1 1 1 0 8413 0 1587 0 6826P U 2 0 9545P U 3 0 9973 图4 16正态累积函数的图示 f u 0 4 3 2 10123U 图4 17区间 1 1 2 2 和 3 3 的概率图示图4 18标准正态分布的概率计算例4 14 设X N 3 9 试计算P X7 53 P X 3 9 由附表1查得 1 4 0 0808 1 51 0 9345 0 3 0 6179 2 3 0 0107 图4 19任意正态分布的概率计算假定X是一个随机变量服从 30 5的正态分布即 X N 30 25 试求其取值小于26 大于40和介于26和40之间的概率本例不是标准正态分布须经标准化后才能可求出落于各区间的概率查附表2 0 8 0 2119 例4 9 试求正态分布曲线对应中间概率为0 95和两尾概率为0 01时随机变数X的取值区间设对应中间概率为0 95的取值区间为 x1 x2 即P x1 X x2 0 95 经标准化变换后查附表2 1 96 0 025 1 96 0 975 于是有u1 1 96 u2 1 96 即P 1 96 U 1 96 0 95 或P U 1 96 0 95 也即P 1 96 X 1 96 0 95 或P X 1 96 0 95 附表1正态分布函数表同理可得 2 58 0 005 2 58 0 995 于是有u1 2 58 u2 2 58 即P U2 58 0 01 或P U 2 58 0 01 也即P Xm 2 58s 0 01 或P X m 2 58s 0 01 图4 20中间概率和两尾概率的图示中间概率P 1 962 58 0 01 否定区接受区否定区否定区接受区否定区 0 025 0 025 0 95 0 005 0 005 0 99 u u 中间概率对应的随机变数的取值区间一般称为接受区两尾或一尾概率对应的取值区间一般称为否定区接受区与否定区的界限称为临界值上述问题的实质在于计算中间概率P U u 为a时的临界值也可利用正态离差表附表2 很方便地查到例如查附表2中当a为0 05时 u0 05 1 959964 即表示P U 1 959964 0 05 当为0 01时 u0 01 2 575829 表示P U 2 575829 0 01 附表2正态分布两尾临界值表一尾的u 值等于附表3中两尾u2 的值一尾的u 两尾的u2 例如一尾概率为0 05时 u0 05等于附表2中两尾的u0 10 1 644854 一尾概率为0 01时 u0 01等于附表2中两尾的u0 02 2 326348 第五节抽样分布一总体与样本的关系第一个方向是从总体到样本从一般到特殊其目的是研究从总体中抽出的所有可能样本统计量的分布及其与原总体的关系第二个方向是从样本到总体从特殊到一般用样本对总体参数作出推断 1 样本平均数分布的平均数等于总体平均数二 2 样本平均数分布的方差等于总体方差除以样本容

人人文库> 全部分类> 应用文书 > 产品手册

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第四章概率分布《试验设计与统计分析》PPT课件.ppt

文档简介

温馨提示

最新文档

评论

第四章 概率分布 《试验设计与统计分析》PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第四章概率分布《试验设计与统计分析》PPT课件.ppt