已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章概率与概率分布,1,本章重点掌握,常用概率分布的特点附录:常用概率分布数学用表的使用,2,1.概率基础知识,1.概率的概念,事件(events),可以预言在一定条件下是否出现的事件:必然事件(certainevent)U和不可能事件(impossibleevent)V,在一定条件下,可能发生,也可能不发生的事件:随机事件(randomevent),频率(Frequencey),设事件A在n次重复实验中发生了m次,其比值m/n称为事件A发生的频率,记为:,3,频率与概率的关系_例,从图中还可以看出,随着样本量的增大,观测值的波动性逐渐减小并趋于真值。,真值,4,概率(Probability),某事件A在n次重复试验中,发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定件p,于是则定义p为事件A发生的概率,记为:,P(A)=p,基本性质:任何事件的概率都在0和1之间,即:0P(A)1必然事件的概率等于1,P(A)=1不可能事件的概率等于0,P(A)=0,5,统计调查与概率,随机变量:问卷中的项目、样本统计量(、S、P),随机事件:调查问卷中项目的取值(性别A男B女),概率:样本量无穷大时,统计汇总得到的频率,6,2.概率的计算,(1)事件相互关系,和事件(sumevent),积事件(productevent),互斥事件(mutuallyexclusiveevent),对立事件(contraryevent),独立事件(independentevent),完全事件系(completeeventsystem),A1+A2+An,A1A2An,AB=V,A+B=U,AB=V,相互独立,互不影响,两两相斥,必然生发其一。,7,(2)概率计算法则,加法定理(additivetheorem),互斥事件A和B的和事件的概率等于事件A和事件B的概率之和。P(A+B)=P(A)+P(B),推理1:如果A1、A2、An为n个互斥事件,则其和事件的概率为:P(A1+A2+An)=P(A1)+P(A2)+P(An)推理2:对立事件A的概率为:P(A)=1-P(A)推理3:完全事件体系和事件的概率等于1,8,例:调查某玉米田,一穗株占67.2%,双穗株占30.7%,空穗株占2.1%,试计算一穗株和双穗株的概率、有穗株的概率。,P(A+B)=P(A)+P(B)=0.672+0.307=0.979,P(A)=1-P(A)=1-0.021=0.979,9,乘法定理(multiplicativetheorem),如果事件A和B为独立事件,则事件A与事件B同时发生的概率等于事件A和事件B各自概率的乘积。P(AB)=P(A)P(B),推理1:如果A1、A2、An彼此独立,则P(A1A2An)=P(A1)P(A2)P(An),例:播种玉米时,每穴播种两粒种子,已知玉米种子的发芽率为90%,试求每穴两粒种子均发芽的概率和一料种子发芽的概率。,10,练习题:,1.每个人的一对第1号染色体分别来自祖母和外祖母的概率是多少?一位男性的X染色体来自外祖父的概率是多少?,2.假如父母的基因型分别为IAIO和IBIO。他们的两个孩子都是A型血的概率是多少?他们生两个O型血的女孩的概率又是多少?,3.一名神经科医生听取6名研究对象对近期所作梦的叙述,得知其中有3名为忧郁症患者,3名是健康者。现从6名研究对象中选出3名,问:1)一共有多少种配合?2)每一种配合的概率?3)选出忧郁症患者的概率?4)至少选出两名忧郁症患者的概率?,11,3.概率分布,定义:随机变量所有取值的概率所形成的分布数列或分布图。例:500户家庭人口分布,12,13,14,15,4.大数定律,大数定律(lawoflargeunmbers):是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称,最常用的是贝努里大数定律。可描述为:设m是n次独立试验中事件A出现的次数,p是事件A在每次试验中出现的概率,则对于任意小的正数,有如下关系:,说明:当试验条件不变的情况下,重复次数n接近无限大时,频率m/n与理论概率p的差值,必定小于一个任意小的正数,即两者可以基本相等,当样本量足够大时,样本就可以代替总体,16,辛钦大数定律(Khinchinetheorem):是用来说明为什么可以用算术平均数来推断总体平均数的。,从以上的解释,我们可以将大数定律通俗地表达为:样本容量越大,样本统计数与总体参数之差越小。“样本统计数无限地接近总体参数”,17,2.几种常见的理论分布,1.二项分布,随机变量的分布可用分布函数(distributionfunction)来表述其概率。常见的几种理论分布有:,离散型变量,连续型变量,二项分布泊松分布,正态分布,对于某个性状,常常可以把其资料分成两个类型。这样的结果只能是“非此即彼”两种情况,彼此构成对立事件,我们把这种事件所构成的总体,称为二项总体(dinomialpopulation),其频率分布称为二项分布(binomialdistribution)。,例:二项总体:豌豆花色;性别;种子发芽/不发芽穗的有芒/无芒,18,二项分布的形状,二项分布的形状是由n和p两个参数决定的。当p值较小且n值不大时,图形是偏倚的,随着n值的增大,分布趋于对称。当p值趋于0.5时,分布趋于对称。2)二项分布的参数总体平均数(次数)为:x=xip(xi)=np总体标准差(次数)为:x=(xi-)2p(xi)=npq,二项成数,即百分数(percentage):p=x/n=p/n=p平均数p=p/n=pq/n标准差,19,2.泊松分布,在生物学研究中,有许多事件出现的概率很小,而样本容量或试验次数往往却很大,即p值很小,而n值很大。这时,二项分布就会变成另外一种特殊的分布,即泊松分布(Poissondistridution)。,例:泊松分布资料:变异细胞计数;突变碱基;变异植株家畜怪胎样方小见植物,泊松分布是一种离散型随机变量的分布,其分布的概率函数为:,泊松分布的形状由参数所确定。当较小时,偏倚的;当=20时,逼近于正态分布N(,)当=50时,这两种分布除一个是离散型,一种是连续型外,没有多大区别。,20,泊松分布在生物学研究中的应用:1)在生物研究中,有许多小概率事件,其发生概率往往小于0.1,甚至小于0.01。对于这些小概率事件,都可以用泊松分布描述其概率分布,从而作出需要的频率预期;2)由于泊松分布是描述小概率事件的,因而二项分布当p0.1和np5时,可用泊松分布来近似,例:用显微镜检查某食品样本内结核菌的数目,对在某些视野内各小方格中的细胞数加以计数,然后按不同的细菌数把格子分类,记录每类中的格子数目。结果如下表,试求各种细菌数的理论格子数。?,=,=2.9831,21,例:某小麦品种中出现变异植株的概率为0.0045,调查100株,获得两株或两株以上变异植株的概率是多少?期望有0.99的概率获得1株或1株以上的变异植株,至少应调查多少株?,22,3.正态分布,正态分布也称高斯分布,是一种连续型随机变量的概率分布。它的分布状态是多数变量都围绕在平均值左右,由平均值到分布的两侧,变量数减少。正态分布是一种在统计理论和应用上最重要的分布。,正态分布的应用:1.试验误差的分布一般服从于正态分布;2.正态分布还可作为离散型随机变量或其他连续型随机变量的近似分布;3.有些样本虽并不符合正态分布,但从总体中随机抽样的样本容量相当大时,其样本平均数的分布也近似于正态分布。,(1)正态分布的概率函数,正态分布记为N(,2),表示具有平均数为,方差为2的正态分布,其形状主要由这两个参数来决定。,23,(2)正态分布的特征,当x=时,有最大值;当x-的绝对值相等时,f(x)值也相等;的绝对值越大,f(x)值越小,但永远不会等于零,24,4.正态分布曲线完全由两个参数来决定。,25,和对正态曲线的影响,26,若XN(,),则变量Z称为标准正态分布。,记为XN(0,1)例:身高XN(1.72,0.27),则身高X的标准分数变量,(3)标准正态分布,27,标准正态分布的特点及大小概率事件,(1)标准正态分布曲线的均值为0,标准差为1;(2)界于2个标准差内的总概率为95.45%,约等于95%,称为大概率区间,用1-表示,则小概率=5%;(3)界于3个标准差内的总概率为99.73%,约等于99%,称为极大概率区间,极小概率区为1%。(4)在标准正态分布中,大、小概率的分界值Z称为临界值,用Z或Z/2表示;(5)如果某测量标准分数Z界于-Z/2-1)有一正态分布的平均数为16,方差为4,试计算:(1)落于10到20之间的数据的百分数。(2)小于12或大于20的数据的百分数。,48,答案:,1.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年山东德州经开区抬头寺中学初三第三次质检数学试题含解析
- 2026年四川省广安市武胜县重点名校初三下学期第二次诊断性测验物理试题试卷含解析
- 河北省新乐市重点达标名校2026年中考数学试题全真模拟密押卷(六)含解析
- 2026年大学大一(建筑施工技术)混凝土施工工艺操作阶段测试题及答案
- 2025年前台防疫接待礼仪真题解析
- 护理文件书写的患者参与
- 护理教育创新竞赛课件模板
- 急救护理标准化培训
- 临床医学教材课件内科学第八篇风湿性疾病第二章风湿热
- 护理课件制作软件分享
- 毕业设计(论文)-一种链式运输机传动装置设计
- 毕业设计(论文)-某轻型货车鼓式制动器设计
- 老年护理呼吸系统
- 提升团队执行力的关键因素
- 基于大数据的企业档案资源整合与共享机制研究
- 《建筑装饰设计收费标准》(2024年版)
- 电子商务平台供应商对接流程
- 《环保材料科普》课件
- 2024年沙洲职业工学院高职单招语文历年参考题库含答案解析
- DB32/T 4874-2024既有建筑幕墙维护与改造工程技术标准
- 2025年人教版英语五年级下册教学进度安排表
评论
0/150
提交评论