版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章,概率和概率分布,上一章,我们介绍了如何收集和归纳样本,资料。但是,我们研究一组样本数据的最,终目的不在于研究样本本身,而是根据样,本提供的信息对其来自的总体的特征和分,布规律作出尽可能精确和可靠的推断,这,称为,统计推断,由于抽样误差的存在,统计推断的结论带,有一定的不确定性,即它不可能是完全正,确的,所以,我们在理解和运用统计推断的方法,之前,必须熟悉,不确定性的理论概率和,概率分布,第一节,概率的基本概念,1,概率论的一些基本术语,试验:通常我们把根据某一研究目的,在,一定条件对自然现象所进行的观察或试验,统称为试验,例如,抛一枚硬币;掷一次骰子;观,察随机挑选的,6,个新生婴儿中
2、男婴,的数目,随机试验:试验之前无法预测出现哪一个,结果的试验称为随机试验,例如,抛硬币;掷骰子;观察随机挑,选的,6,个新生婴儿中男婴的数目,在一定条件下生长的小麦随机挑选,出一株测株高,注意:生物统计学里是以随机试验为,研究对象的,基本事件:试验的每一个最基本的结果,一般用小写字母,a,b,c,来表示,事件:基本事件的集合。一般用大写字母,A,B,C,来表示,不可能事件:任何一次试验中,一定不会,出现的结果。用,表示,例一,在掷一次骰子的试验中,有如下的一,些可能发生的事件,基本事件有,6,个,其它的事件有,事件,A,得到一个奇数,1,3,5,事件,B,得到一个偶数,2,4,6,事件,C,
3、得到最大的数,6,事件,D,得到一个不小于,2,的数,2,3,4,5,6,事件,E,得到数字,0,2,事件的运算,事件的和(并,事件,A,和事件,B,的和,记为,A U B,包含,A,和,B,里的一切基本事件或元素,其意义是,A,B,两事件至少发生一个,例如,A,随机抽取一名患者,测得红血球含量是,1,15,个单位,B,随机抽取一名患者,测得红血球含量是,10,30,个单位,事件,A U B,随机抽取一名患者,测,得红血球含量是,1,30,个单位,事件的交,事件,A,和事件,B,的交,记为,A,B,简记为,AB,包含,A,和,B,共同拥有的基本事件或元,素,其意义是,A,B,两事件同时发生,例
4、如,A,随机抽取一名患者,测得红血球含量是,1,15,个单位,B,随机抽取一名患者,测得红血球含量是,10,30,个单位,事件,A,B,随机抽取一名患者,测,得红血球含量是,10,15,个单位,互不相容事件,如果,A,和,B,两事件的交是不可能事件,即,A B,则,A,和,B,称为互不相容,例如:在例一中,A,掷骰子掷得一个奇数,B,掷骰子掷得一个偶数,则,A B,即,A,和,B,两事件互不相,容,3,概率的定义,一个事件,A,的概率,记为,P,A,,是事件,A,发生的可能性的定量计量,概率的三个性质,1,任何事件概率均满足,0,P(A)1,2,必然事件的概率为,1,3,不可能事件的概率为,0
5、,即,P,0,注意:计算概率时,结果为,5,或,0.3,时肯定是错误的,4,概率的求法,两种途径,1,统计方法,适用于进行了大量试验时,假设试验共进行,k,次,事件,A,出现了,l,次,则,事件,A,发生的频率是,l/k,随着,k,的增大,频率,l/k,趋于一个常数,p,那么,p,就是事件,A,发生的概率,例如:如何求一个人某年中被闪电击中的概率,中国,1.1,10,9,人中,在,2005,年被闪电击中的人数,为,3300,人,则某人被闪电击中的概率为,3300/1.1,10,9,3,10,6,2,理论方法,适用于可以进行数学推算,在,试验的每个基本事件等可能,时,A,中包含的基本事件数,m,
6、事件,A,的概率,P,A,所有的基本事件数,n,例如,A,掷骰子得到一个奇数,1,3,5,的概率为,P(A)=m/n=3/6=1/2,两个孩子的家庭里,孩子性别为两男的概率是多,少,解:事件,A,孩子性别为两男,男男,所有可能的基本事件有,男男,男女,女男,女女,所以,P(A)=m/n=1/4,同理,孩子性别为一男一女的概率是,2/4=1/2,注意:在生物统计学里,我们着重于,讨论理论方法,5,概率的一般运算法则,概率的一般运算法则可以帮助我们计算一些复杂,事件,或称为复合事件的概率,所谓复合事件就是由几个事件形成的。例,如,AUB,AUBUC,A,BUC,等等,加法法则,P(AUB,P(A,
7、P(B,P(AB,如果,A,B,不相容,则有,P(AUB,P(A,P(B,P,A,1,P,A,A,表示事件,A,不发生,称为,A,的对立事件,条件概率法则,条件概率,P(A|B,指的是在已知事件,B,已发生的条件,下,事件,A,发生的概率,P(A,B,P(A,B,P(B,乘法法则,P(A,B,P(B)P(A,B,P(A)P(B,A,例二,一个袋子里放有,10,个男人和,15,个女人的姓名纸条,法官从袋子里依次抽出两个姓名。有两种可能的抽样方法,1,非放回式抽样,,2,放回式抽样。求每种方法下,两个姓名均为男性的概率,解,1,非放回式抽样:任何东西抽出后就不再,被放回去,P,两个姓名均为男性,P
8、,第一次抽得男性,第二次抽得男性,乘法法则,P,第一次抽得男性,P,第二次抽得男性,第一次抽得男性,10,9,25,24,0,15,2,放回式抽样:任何东西被抽出后,在实行,下一次的抽取前被放回去,P,两个姓名均为男性,P,第一次抽得男性,第二次抽得男性,乘法法则,P,第一次抽得男性,P,第二次抽得男性,第一次抽得男性,10,10,25,25,0,16,独立事件,若事件,A,的发生,并不影响事件,B,发生的概率,即,P(B|A)=P(B,或,P(A|B)=P(A,我们称,A,和,B,互相独立,性质:如果,A,和,B,互相独立,那么,P(A,B)=P(A)P(B,第二节,概率分布,1,随机变量,
9、随机变量:就是随机试验中被测的量,例如,1,测量一定条件下生长的小麦的株高。小麦株高是,随机变量,2,从,1000,只动物(雌雄各半)的群体,放回式抽样,每次抽取,10,只,记录其中雄性的个数。设,10,只动物中,雄性的个数为,X,则,X,就是一个随机变量,随机变量的取值有随机性。随机变量所有可,能值的分布规律称为,概率分布,随机变量,能帮助我们深入理解总体和样本的概念,使总体和样本的关系更加明确,随机变量的引入,使统计学的深入研究成为可能,随机变量与总体和样本的关系,总体:随机变量可能取值的全体,样本:随机变量的,n,个独立观察值,例如在研究一定条件下生长的小麦的株高时,总体,是所有在这种条
10、件下生长的小麦的株高的全体,也就是小麦株高这个随机变量的所有可能的取值,假如获得了,200,株小麦株高数据的样本,样本也,就是小麦株高这个随机变量的,200,次独立观测值,随机变量一般用大写字母来表示,如,X,Y,U,等。变量的观测值一般用小写字母来表示,如,x,i,y,i,u,i,等表示随机变量,X,Y,U,的第,i,次观测值,注意:在第一章里,我们已经使用了这样的符号,样本表示为,x,1,x,2,x,n,变量的类型,1,离散型变量:取值有限个或可数无穷个孤立,的数值,譬如,a,掷一次骰子得到的数,b,一只母鸡一周里下的蛋数,2,连续型变量:可能取值为某范围(或某区间,内的任何值。可能取的值
11、间不存在间隙,譬如,a,小麦株高,b,奶牛产奶量,2,概率分布,变量的概率分布描述该变量的所有值的分布,的规律,也就是变量对应的总体的分布,概率分布,频数分布,总体的值的分布,样本的值的分布,2.1,离散型概率分布,离散型概率分布也就是,一个函数或表,它定义了这个,离散变量的所有值对应的概率,1,概率函数,P,X,x,p,x,定义了值,x,的概率,显然概率函数应满足,p,x,0,p,x,1,x,x,例一,p,x,x,0,1,2,3,是不是一个概率函数,5,0,1,2,3,6,解,p,x,1,所以,p,x,不可能是概率函数,5,5,5,5,5,x,例二,已知,P,X,k,c,k,1,k,其中,常
12、数,0,且,接近于,0,试求,c,的值,k,1,2,是变量,X,的概率函数,解:因为,P,X,k,是概率函数,所以有,P,X,k,1,即,k,1,c,k,1,1,k,k,c,1,k,1,k,1,k,2,由微积分可知,e,1,2,3,6,1,k,1,所以,e,1,k,k,1,k,k,k,因此,c,k,1,k,k,e,1,2,概率分布表:列出变量的每个值及其概,率,譬如,掷一次骰子的概率分布表为,x,1,2,3,4,5,6,P(x,1/6,1/6,1/6,1/6,1/6,1/6,2.2,连续型概率分布,连续型变量的一个特征是取的值非常多(不可数,无法象离散型变量那样对每一个值赋予一个概率,所以,在
13、研究连续型变量时,我们不研究它取每个值,的概率,即,P,X,x,,而是研究它在一个区间中,取值的概率。具体来说,有三种形式,P,aXb,P,Xc,P,Xd,另一方面原因,P,X,x,0,对于任何,x,在研究连续型变量概率时,,“,均可相应,换成,而概率数值不变,P,aXb,P,a,X,b,P,Xc,P,X,c,P,Xd,P,Xd,问题:怎样求这三种概率,答:借助于,密度函数,f(x,曲线,或称概率分布,密度曲线,f(x,的图,形,每个连续型变量都有它自己的密度函数曲线,密度函数曲线总在,x,轴的上方,且曲线,下的总面积等于,1,P,a,X,b,f,x,曲线下在,a,和,b,之间的面积,f,x,
14、dx,a,b,P,X,c,f,x,曲线下在,c,左边的面积,c,f,x,dx,P,X,d,f,x,曲线下在,d,右边的面积,f,x,dx,d,一个术语,分布函数或称累积分布函数,是随,机变量,X,取得小于,x,0,的值的概率,F,x,0,P,X,x,0,x,0,f,x,dx,F(x,0,在分布函数已知的情况下,概率也可以通过分布函,数来求,所以,P,a,X,b,F,b,F,a,P,X,c,1,P,X,c,1,F,c,P,X,d,F,d,1,x,2,例一(指数分布),已,知变量,X,的密度函数为,f,x,e,x,0,2,a,求该变量的分布函数,b,求,P,X,2,c,求,P,1,X,2,解,a,
15、F,x,0,x,0,0,1,x,2,x,2,x,0,e,dx,e,0,1,e,2,x,0,2,1,b,P,X,2,F,2,1,e,c,P,1,X,2,F,2,F,1,1,e,1,1,e,1,2,e,1,2,e,1,第三节,总体特征数,样,本,特,征,数,样本平均数,x,样本标准差,s,样本方差,s,2,称做,统计量,从样本计算来的量称为统计,量,它的数值随样本的不,同而不同,称做,总,体,特,征,数,总体平均数,也称数学期望,总体标准差,总体方差,2,参数,值是恒定的,1,随机变量的数学期望,E(X,也就,是总体平均数,随机变量,X,的数学期望是指长期观测,X,所得数据的平均数,记作,E(X,
16、也就是总体平均数,计算公式,离散型随机变量,E,X,p,x,x,x,连续型随机变量,E,X,均可理解成变量,或总体)每,个值根据概率,的加权平均,f,x,xdx,例一,用一种复合饲料,饲养动物,每天增重,x,i,斤,相应的概率分布为,p,x,i,试求每天增重的数学期,望是多少,每天增重,x,i,0.5,1.0,1.5,2.0,P(x,i,0.10,0.20,0.50,0.20,解,E,X,p,x,i,x,i,i,1,4,0,10,0,5,0,20,1,0,0,50,1,5,0,20,2,0,1,4,1,x,2,例二,已知变量,X,的密度函数为,f,x,e,x,0,2,求该变量的数学期望,解,E
17、,X,f,x,xdx,0,1,x,2,e,xdx,2,x,d,e,0,x,2,分部积分法,xe,x,2,0,e,0,x,2,dx,2,2,随机变量的方差,Var(X,也就是,2,总体平均数,随机变量,X,的数学期望是指长期观测,X,所得数据的方差,记,作,Var(X,也就是总体方差,2,称为总体标准差,计算公式,离散型随机变量,Var,X,p,x,x,2,x,2,连续型随机变量,Var,X,2,均可理解成变量,或总体)每,个值离均差的,平方根据概率,的加权平均,f,x,x,2,dx,例三,接本节例一,求,每天增重的方差是多少,每天增重,x,i,p(x,i,x,i,x,i,2,x,i,2,p(x
18、,i,0.5,1.0,1.5,2.0,解,0.10,0.20,0.50,0.20,0.9,0.4,0.1,0.6,0.81,0.16,0.01,0.36,0.081,0.032,0.05,0.072,Var,X,p,x,i,x,i,0,081,0,032,0,05,0,072,2,i,1,4,0,235,1,例四,设某均匀分布变,量的密度函数为,f,x,0,x,2,试求,2,该变量的数学期望和方,差,解,E,X,f,x,dx,0,2,2,0,1,x,2,dx,0,1,2,4,2,Var,X,f,x,x,dx,0,2,2,2,0,1,1,2,x,1,2,3,3,统计学里关于数学期望和方差运算,的一些运算公式,假设,c,和,A,为常数,X,为随机变量,则,数学期望,E,c,c,E,cX,cE,X,E,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 半包装修验收合同范本
- 商铺中介佣金合同范本
- 医院购置药品合同范本
- 包工监控维修合同范本
- 同意解除劳动合同范本
- 劳务班组围墙合同范本
- 商场绿化施工合同范本
- 合作门窗家装合同范本
- 2025-2030智慧林业生态产品价值实现途径与政策导向分析
- 2025-2030智慧旅游行业市场发展趋势研判及服务模式创新与投资方向选择报告
- 2026届湖南省高三上学期九校联盟9月联考数学试卷
- 2025年初级经济师考试《人力资源管理专业知识与实务》试卷及答案
- T-BSCIA 1-2024 保山小粒咖啡专用复合肥料
- 消化内科常用药物
- 妇科急腹症的观察及护理
- 2025年招标投标(评标评审专家)试题及参考答案
- 广东省玩具出口竞争力提升问题研究
- 2025版煤矿安全规程学习培训课件
- 文物普查合同7篇
- 行政礼仪理论知识培训课件
- 眼眶骨折护理查房课件
评论
0/150
提交评论