版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、样本,总体,统计推断,随机抽样,统计推断,第三章 概率、概率分布,一、概率的概念,二、概率的计算,三、概率的分布,四、大数定律,一、概率基本概念,(一)事件,必然事件(U):一定条件下必然出现。 不可能事件(V):一定条件下必然不出现。 随机事件(A):一定条件下可能出现。 生物统计学只讨论随机事件。,一、概率基本概念,(二)频率,设事件A在n次重复试验中发生了m次,其比值m/n称为事件A发生的频率(frequency),记为W(A)=m/n。,(三)概率(probability, P),事件A在n次重复试验中,发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值
2、p,于是定义p为事件发生的概率(probability),记为,P(A) = p,0P(A)1,P(U)=1,P(V)0,二、概率的计算,(一)事件的相互关系,和事件,积事件,互斥事件,对立事件,独立事件,完全事件系,二、概率的计算,(一)事件的相互关系,事件A和事件B中至少有一个发生而构成的新事件称为事件A和事件B的和事件,记作A+B。,n个事件的和,可表示为A1+A2+An。,和事件,A,B,A,B,二、概率的计算,(一)事件的相互关系,事件A和事件B中同时发生而构成的新事件称为事件A和事件B的积事件,记作AB。,n个事件的积,可表示为A1A2An。,积事件,A,B,二、概率的计算,(一)
3、事件的相互关系,事件A和事件B不能同时发生,则称这两个事件A和B互不相容或互斥。,n个事件两两互不相容,则称这n个事件互斥。,互斥事件,二、概率的计算,(一)事件的相互关系,事件A和事件B必有一个发生,但二者不能同时发生,且A和B的和事件组成整个样本空间。即A+B=U,AB=V。我们称事件B为事件A的对立事件。,对立事件,二、概率的计算,(一)事件的相互关系,事件A和事件B的发生无关,事件B的发生与事件A的发生无关,则事件A和事件B为独立事件。,独立事件,二、概率的计算,(一)事件的相互关系,如果多个事件A1、A2、A3、An两两互斥,且每次试验结果必然发生其一,则称事件A1、A2、A3、An
4、为完全事件系。,完全事件系,二、概率的计算,(二)概率的计算法则,若事件A与B互斥,则 P(A+B)=P(A)+P(B),推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An),推理2 P(A)=1-P(A),推理3 完全事件系的和事件的概率为1。,二、概率的计算,(二)概率的计算法则,事件A和事件B为独立事件,则事件A与事件B同时发生的概率为各自概率的积。 P(AB)=P(A)P(B),推理:A1、A2、An彼此独立,则 P(A1A2A3An)=P(A1)P(A2)P(A3)P(An),播种玉米,两粒种子,种子的发芽率为90%,A:第一粒种子发芽,B:第二粒种子发芽,C:两粒种子
5、均发芽,D:一粒种子发芽,E:两粒种子均不发芽,三、概率分布,(一)离散型变量的概率分布,要了解离散型随机变量x的统计规律,必须知道它的一切可能值xi及取每种可能值的概率pi。,对离散型变量x的一切可能值xi(i=1,2,3) 及其对应的概率pi。,三、概率分布,(一)离散型变量的概率分布,此表列出了该鱼群年龄构成的全部,称为该鱼群年龄的概率分布。,三、概率分布,(一)离散型变量的概率分布,设离散型变量x的所有一切可能值xi(i=1,2,3),取相应值的概率为pi,则pi称为离散型随机变量x的概率函数。,定义,三、概率分布,(二)连续型变量的概率分布,n 增加,组距减少,分组多 直方条增加,阶
6、梯形曲线趋于光滑,(二)连续型变量的概率分布,当n无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布也就转化为概率分布了,此曲线为总体的概率密度曲线。曲线函数用f(x)表示。,三、概率分布,(二)连续型变量的概率分布,a,b,连续型随机变量的概率由概率分布密度函数所确定。,三、概率分布,(二)连续型变量的概率分布,对于随机变量在区间 ,则该事件为必然事件。,概率密度函数f(x)与x轴所围成的面积为1。,频率W(A),概率P(A),n 值大,统计数,参 数,四、大数定律,大数定律:概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。
7、,样本容量越大,样本统计数与总体参数之差越小。,四、大数定律,贝 努 里 大 数 定 律,辛 钦 大 数 定 律,设m是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意小的正数,设x1,x2,x3,xn是来自同一总体的变量,对于任意小的正数,四、大数定律,只要从总体中抽取的随机变量相当多,就可以用样本的统计数来估计总体的参数。,参数,统计数,随机变量的分布可用分布函数来表述概率,离散型变量 (discrete random variable),连续型变量 (continuous random variable),二项分布 泊松分布,正态分布,变 量,离散型随机变量
8、的分布,哺乳动物,种子,穗子,生物个体,雄性,雌性,发芽,不发芽,有芒,无芒,成活,死亡,对立事件,一、二项分布,二项总体,二项分布,“非此即彼”事件所构成的总体,概率分布,二 项 总 体,试验只有两个对立结果,重复性 独立性,一、二项分布,(一)二项分布的概率函数,试验的条件不变,即在每次试验中事件A出现的概率皆为p。,任何一次试验中,事件A的出现与其余各次试验中出现何种结果无关。,从雌雄各半的100只动物中,做一抽样试验。,第一次从这100只动物中随机抽取1只,记下性别后放回,再做第二次抽样。,不论第一次抽样结果,第二次抽样中,得到雌性或雄性的概率仍是50100。,这两次试验是独立的,第一
9、次抽样后不放回,再做第二次抽样。,这两次试验是非独立的,雄性动物,抽到雄性的概率是4999,抽到雌性的概率是5099,雌性动物,抽到雄性的概率是5099,抽到雌性的概率是4999,放回式抽样,非放回式抽样,二项分布,超几何分布,在放回式抽样中,若抽样试验共进行10次,,其中包括3只雄性动物的概率是多少?,包括3只及3只以下的概率是多少?,在10次试验中,抽到雄性动物的只数是一随机变量,记为X,X的可能值是0,1,2, ,10。 现在要求出X3和X 3的概率。,一、二项分布,n=试验次数(或样本含量) n=10 x=在n次试验中事件A出现的次数 x=3 p=事件A发生的概率(每次试验是恒定的)
10、p=0.5 1-p=事件A不发生的概率 1-p=0.5 p(x)=X的概率函数=P(X=x) p(3) F(x)=P(X 3) F(3),m表示雄性动物 f表示雌性动物,mmmfffffff 表示在10次抽样中,前3次抽中的都是雄性动物。,抽样间相互独立,每次抽到雄性动物的概率是p,抽到雌性动物的概率是1-p,P(mmmfffffff)=p3(1-p)7,一、二项分布,在10次抽样中,抽到3只雄性动物的所有方式数,相当于从10个元素中,取3个元素的组合数C103,一、二项分布,P(mmmfffffff)=p3(1-p)7,mmfmffffff, mfmmffffff, fmmmffffff,
11、ffmmmfffff, ,p(3) C103p3(1-p)7,抽到3只雄性动物的概率,p(3) C103p3(1-p)7,p(x) Cnxpx(1-p)n-x,二项式p+(1-p)n展开式的第x+1项,因此称为“二项分布”,p+(1-p)n=1,p(0) +p(1) +p(2) + + p(x) + + p(n) =1, p(x) =1,一、二项分布,p(0) =0.0009766 p(1) =0.0097656 p(2) =0.0439453 p(3) =0.1171876,F(3)= p(0) +p(1) +p(2) + p(3) =0.1718751,x表示在n次试验中事件A出现的次数,
12、概率分布函数为 P(x)=Cxnpxqn-x,P(x)为随机变量x的二项分布,记作 B(n,p),一、二项分布,(一)二项分布的概率函数,(二)二项分布的形状和参数,二项分布的形状由n和p两个参数决定。,(1)当p值较小且n不大时,分布是偏倚的。随n的增大,分布趋于对称;,(2)对于固定的n和p,当x增加时,P(x)先随之增加并达到极大值,以后又下降。,(3)当p值趋于0.5时,分布趋于对称。,服从二项分布B(n,p)的随机变量所构成的总体的平均数 、标准差与n、p这两个参数有关。,一、二项分布,(二)二项分布的形状和参数,显微镜视野内染色体有变异的细胞计数,抽检大量产品中出现次品的件数,田间
13、小区内出现变异植株的计数,二、泊松分布,泊松分布(Poisson distribution)是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。,泊松分布是二项分布的一种特殊类型。,二、泊松分布,概率函数可由二项分布概率函数推导出来。,为参数,n p,二、泊松分布,P( )的形状由确定, 较小时,泊松分布偏倚。 增大时,泊松分布趋于对称。 无限增大时,泊松分布接近正态分布。,二、泊松分布,对于小概率事件,可用泊松分布描述其概率分布。,二项分布当p0.1和np5时,可用泊松分布来近似。,2,1,n大,p与1-p接近,大,二项分布,泊松分布,正态分布,正态分布是生物统计学的重
14、要基础。,围绕在平均值左右,由平均值到分布的两侧,变量数减少,即两头少,中间多,两侧对称。,特点,正态分布也称为高斯分布。,三、正态分布,三、正态分布,(一)正态分布的概率函数,f(x) 为正态分布的概率密度函数,表示某一定x值出现的概率密度函数值。,总体平均数,总体标准差,圆周率,3.14159,e为自然对数底,2.71828,N (,2),x=时,f(x)值最大,正态分布曲线以平均数为中心的分布。,三、正态分布,(二)正态分布的特征,1,x-的绝对值相等时,f(x)也相等,正态分布密度曲线以为中心向左右两侧对称。,2,f(x)是非负函数,以x轴为渐近线,x的取值区间为(-,+) 。,三、正
15、态分布,(二)正态分布的特征,3,正态分布曲线由参数,决定, 确定正态分布曲线在x轴上的中心位置,确定正态分布的变异度。,三、正态分布,(二)正态分布的特征,4,大,曲线展开度越大,数据分散; 小,曲线展开度小,数据集中。,正态分布曲线在x=处各有一个拐点,曲线通过拐点时改变弯曲度。,三、正态分布,(二)正态分布的特征,5,分布曲线与x轴围成的全部面积为1,6,三、正态分布,若一个连续型随机变量x取值于区间(a,b),其概率为,三、正态分布,(三)标准正态分布,N (,2),正态分布是依赖于参数(,2)的一个曲线系,正态曲线的位置及形态随(,2)的不同而不同,需将其标准化。,N(0,1),三、
16、正态分布,f(u)称为标准正态分布(standard normal distribution)或u分布方程。,u表示标准正态离差,它表示离开平均数有几个标准差。,三、正态分布,正态分布标准化实质上做出了座标轴的平移和尺度转换,使正态分布具有平均数为0,标准差为1。记作N(0,1),三、正态分布,标准正态分布u落在区间(a,b的概率,三、正态分布,(四)正态分布的概率计算,三、正态分布,P(-1u1)=0.6826,P(-2u2)=0.9545,P(-3u3)=0.9973,P(-1.96u1.96)=0.95,P(-2.58u2.58)=0.99,三、正态分布,(四)正态分布的概率计算,服从正
17、态分布N(,2)的随机变量,x的取值落在区间x1,x2 的概率,记作P(x1xx2),等于服从标准正态分布的随机变量u在(x1-)/ , (x2-)/ 内取值的概率。,三、正态分布,(四)正态分布的概率计算,计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。,三、正态分布,(四)正态分布的概率计算,P(-x+),P(-2x+2),P(-3x+3),=P(-1u1)=0.6826,= P(-2u2)=0.9545,= P(-3u3)=0.9973,三、正态分布,(四)正态分布的概率计算,三、正态分布,(四)正态分布的概率计算,1.96
18、 0.025,(two-tailed probability),(one-tailed probability),三、正态分布,(五)正态分布的应用,1,估计参考值范围,20株小麦,其株高(cm)分别为82,79,85,84,86,84,83,82,83,83,84,81,80,81,82,81,82,82,82,80, 其平均值为82.3cm,标准差为1.7502cm。 求:小麦株高95%的正常范围值。, 78.57, 85.73 ,三、正态分布,(五)正态分布的应用,1,估计参考值范围,x85(cm) 的概率?,P(x85)P(u1.54) 1-F(u=1.54) =1-0.9328=0.
19、0618,三、正态分布,(五)正态分布的应用,2,质量控制,服从正态分布的变量落在2 及3的概率为95%和99%,在试验中,为了控制检测误差,常以x2s作为上下警戒线,以x3s作为上下控制线。,三、正态分布,(五)正态分布的应用,3,正态分布是很多统计方法的理论基础。,二项分布,泊松分布的极限均为正态分布,在一定条件下,均可按正态分布的原理来处理。后面的t检验,方差分析,相关回归分析等多种统计方法均要求分析的指标服从正态分布。对于非正态分布资料,实施统计处理的一个重要途径是先作变量的转换,使转换后的资料近似正态分布,然后按正态分布的方法作统计处理。,根据样本对总体做出估计和推断,并不是直接用样
20、本本身,而是用样本的统计量来对总体做出估计和判断。但由于从总体中抽取的样本提供的信息仅是总体的一部分,因此它不能提供完全准确的信息,必然存在着一定的误差。即,对于样本容量相同的多次随机抽样,得到样本函数的观察值也是不同的,且其取值有一定的概率,即统计量也是一个随机变量,因而也有它的分布,称为抽样分布(sampling distribution)。,总体,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。,样本平均数是总体平均数的无偏估计值。,样本方差是总体方差的无偏估计值。,样本标准差s不是总体标准差的无偏估计值。,一、抽样试验与无偏估计,二、样本
21、平均数的分布,(1)样本平均数分布的平均数总体平均数。,(2)样本平均数分布的方差总体方差除以样本容量。,样本平均数的标准误差(标准误) (standard error of mean),二、样本平均数的分布,(3)如果从正态分布总体N(,2)进行抽样,其样本平均数x是一具有平均数 ,方差2/n的正态分布,记作N(,2/n)。,中心极限定理 (central limit theorem),连续型变量,离散型变量,(4)如果被抽总体不是正态分布总体,但具有平均数和方差2 ,当随样本容量n的不断增大,样本平均数 x 的分布也越来越接近正态分布,且具有平均数,方差2 /n 。,偏态分布,正态分布,不
22、论总体为何种分布,只要是大样本,就可运用中心极限定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化。,样本平均数差数的分布,从两个相互独立的正态总体中抽取样本,得到样本平均数差数的分布也是正态分布。样本平均数差数的平均数等于总体平均数的差数,样本平均数差数的方差等于两样本平均数方差除以各自样本容量之和。 如,从N(5,25)的总体中抽取n135的样本,从N(10,5)的总体中抽取n240的样本,则两样本平均数差数的平均数为5。方差为25355404756,三、样本平均数差数分布,四、t 分布,在实际研究中,经常遇到 未知,且样本容量n不大的情况,这
23、时若用s来代替。其并不服从正态分布,而是服从具n-1自由度的t分布。,t分布,标准差已知的样本平均数分布,u=,t=,总体方差未知或样本容量n小于30时,标准离差的分布呈t分布。,四、t 分布,对于不同的自由度,t分布有不同的曲线。,四、t 分布,()t分布曲线左右对称,围绕平均数t =0 向两侧递降。,(2)t分布受自由度df=n-1制约,每个df都有一条t分布曲线。,(4)和正态分布相比,t分布的顶端偏低,尾部偏高,自由度df30时,其曲线接近正态分布曲线,df时则和正态分布曲线重合。,(3)df小,t值离散程度大。,四、t 分布,t分布曲线与横轴所围成的面积为1。,同标准正态分布曲线一样,统计应用中最为关心的是t分布曲线下的面积(即概率)与横轴t值间的关系。,为使用方便,统计学家编制了不同自由度df下的t界值表。,在相同的自由度df时,t值越大,概率P越小。,在相同t值时,双尾概率P为单尾概率P的两倍。,df增大,t分布接近正态分布,即t值接近u值。,在相同的P值下,随df的增加,临界t值减小。,四、t 分布,t落于- t0.05, + t0.05 内的概率为0.95,t落于- t0.01, + t0.01 内的概率为0.99,置信度为和的t临界值。,t0.05(4)2.776 t0.01(4)4.604,-2.776+2.776,五
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 豫南地区猪繁殖与呼吸综合征的血清学剖析及病毒溯源探究
- 谷红注射液对大鼠脑出血模型中NGB与IL-6表达影响及脑保护机制探究
- 谐波电能计量中FFT算法的改进与优化研究
- 2026中铁会展有限公司长春分公司招聘5人笔试备考题库及答案详解
- 语料库视角下英式英语词汇美国化的深度剖析与演进洞察
- 语境赋能:高中英语词汇教学的创新与实证探索
- 语域与语类理论:英语听力教学革新的关键钥匙
- 语义与交际翻译视角下英语新闻标题翻译的多维度解析
- 2026陕西西安交通大学大型仪器设备共享实验中心招聘4人考试参考题库及答案详解
- 2026陕西西安国际港务区陆港第七小学教师招聘15人笔试备考题库及答案详解
- 《工业机器人系统操作员三级(高级)理论知识考核要素细目表》
- 江苏省部分高中2024-2025学年高一下学期期末迎考物理试题
- 智能网联汽车技术课件:智能网联汽车技术架构
- 树木学南方本试题及答案
- 《电机与变压器》全套教学课件
- 江苏省事业单位退休人员住房补贴政策
- 租电瓶车合同协议书范本
- 肠系膜上动脉夹层护理查房
- 引导接车课件
- 北京市西城区2023-2024学年八年级下学期期末英语试题(解析版)
- 书籍委托创作合同范例
评论
0/150
提交评论