




已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实用生物统计,主讲:郝雪梅曲红北京大学生科科学学院haoxmquh010-62751853010-62755206,郝雪梅(北京大学生命科学学院)2012秋季学期,课程目标,理解并能正确应用有关统计方法熟练掌握常用统计方法:假设检验、方差分析、回归分析等了解其它统计方法的适用范围、限制条件等关于教材及课程内容:关于期中考试:征集实验数据及可以作为范例的论文,课时分配,第1章:概率论基础1学时第2章:随机变量极其数字特征5学时第3章:统计推断12学时期中考试及复习(李程教授)3学时第4章:方差分析8学时第5章:回归分析8学时第6章:协方差分析2学时第7章:实验设计8学时期末复习1学时,学习方法,高效率利用课堂:听懂,复习独立完成作业:单周单学号学生交作业多动脑,多问问题,理解基础上记忆论坛:,参考书,侧重应用的参考书:生物统计学基础罗斯纳著,孙尚拱译,科学出版社,2004生物统计学李春喜等著,科学出版社,2008统计学基本概念与方法吴喜之等译,高教出版社,2000生物实验设计与数据分析GerryP.Quinn等著,蒋志刚等译,高教出版社,2003生物医学研究的统计方法方积乾编,高教出版社,2007,参考书,侧重原理公式推导的参考书:生物统计学(第二版)杜荣骞,高等教育出版社,2003生物统计(第二版)刘来福等著,北京师范大学出版社,2007医学统计参考书:医学统计学(第二版)徐勇勇,高等教育出版社,2004,参考书,“统计学”参考书:统计学(第二版)贾俊平,清华大学出版社,2006统计学的世界(第五版)戴维穆尔,郑惟厚译,中信出版社,2003关于实验设计:试验设计茆诗松等,中国统计出版社,2004,统计学,统计学能做什么由上学期生统调查数据:身高、体重得到一些统计结果误用统计学的结果狗按直线规律咬人冰淇林吃得越多,犯罪率就越高统计学不能做什么关于第三刹车灯,统计学能做什么?,身高、体重数据能否反映生科院新生的情况?能否反映北大新生的情况?能否反映中国同龄人的身高情况?数据量是否足够?如果能反映某个群体的身高情况,其准确性如何?是否可靠?,关于调查问卷,如何比较男生与女生的数据差异?结论是否可靠?由调查数据得到的平均身高与总体期望值有多大差异?如何比较今年与去年的数据是否存在差异?,关于调查问卷,研究实例:用不同方法处理培养的神经元,比较各方法之间是否有差异实验结果显示:各方法之间很可能存在差异,但不同批次之间差异亦较大,如何统计实验数据将不同批次、同一处理方法的原始数据作为一组数据与另一处理方法的原始数据进行比较将不同批次、同一处理方法的数据归一化后的数据与另一处理方法的归一化数据进行比较,前言,前言,问题:比较两组数据是否有差异的计算本身很简单,但以上两种统计方法是否正确?如何对实验结果进行统计以得到可靠的结论?生物统计特殊的抽样方法特殊的实验设计方法,生物研究的特殊性不确定性服用同样的药物,不同的病人反应不同用相同条件培养的细胞长势不同种植在相邻试验田里的、遗传特性相同的小麦最终产量有所不同既使实验条件保持的尽可能一致,仍然会有不同程度的变异性,生物统计学,生物系统本身的不确定性生物研究者需要从这种天然的不确定性中发现可能存在的规律性从“噪声”中发现挖掘“信号”,生物统计学,生物统计学,提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征(第一、二章:随机现象的数学描述随机变量、概率模型等)判断实验结果的可靠性:正确判断实验结果是某些因素造成的还是误差造成的统计分析提供由样本推断总体的方法统计推断(第三、四、五、六章:统计(推断)方法)提供实验设计的一些重要原则实验设计(第七章:实际运用),生物统计的基本用途,第一章概率论基础,例1-1有人认为女性患乳腺癌的危险性随初育年龄增加而增大。现调查2000名4554岁未患乳腺癌的妇女,其中A组1000名20岁以前生育,B组1000名30岁以后生育,跟踪观察5年。若A组中4名患乳腺癌,B组5名患病,能否推断以上观点正确?如果A组、B组分别为10000名妇女,A组40名患病,B组50名患病,由此又可得出什么结论?此类问题需要借助概率论中“概率”回答,1.1随机现象与统计规律性,研究随机现象的数学规律有关概念必然现象:一定条件下必然发生可以预言的、肯定的结果,又称为决定性事件随机现象:一定条件下,其结果是不可预言的、不肯定的,又称为随机事件偶然事件发生的概率就是该事件隐藏着的特性统计学:利用概率论得出的规律,揭示随机现象偶然性中蕴含的必然性,概率论,随机现象的数学描述:随机事件样本点样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件随机现象的每一个结果,简称事件,一般用大写字母A,B,C等表示样本点样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点随机现象的每一个最基本的、不可再分割的结果即基本事件,称为一个样本点,一般用表示样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间所有可能的样本点的集合构成样本空间,一般用表示,写作=,也可称为全空间不可能事件为空集,用表示事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间事件或复合事件部分样本点的集合构成了事件或称复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间事件或复合事件复合事件的概率,1.2样本空间与事件,随机现象的数学描述:随机事件样本点样本空间事件或复合事件复合事件的概率事件间的关系及运算,1.2样本空间与事件,例1-2:对三粒种子进行发芽实验,结果可能是:如果考虑种子顺序,例放在不同的培养皿中:1:三粒都不发芽;2:第一粒发芽,二、三不发芽;3:第二粒发芽,一、三不发芽;4:第三粒发芽,一、二不发芽;5:第一、二粒发芽,三不发芽;6:第一、三粒发芽,二不发芽;7:第二、三粒发芽,一不发芽;8:三粒都发芽1,2,3,4,5,6,7,8样本空间包含1,2,3,4,5,6,7,8八个样本点,1.2样本空间与事件,如果不考虑种子顺序:A1:三粒都不发芽A2:恰有一粒发芽A3:恰有两粒发芽A4:三粒都发芽A1,A2,A3,A4:复合事件,可由1,2,3,4,5,6,7,8组合而成,1.2样本空间与事件,事件之间的关系:,包含关系相等关系互不相容对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系A发生B必然发生,称B包含A或A包含于B,记为:BA或AB相等关系互不相容对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系相等关系互不相容对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系相等关系AB且BA,称A与B相等,记为A=B互不相容对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系相等关系互不相容对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系相等关系互不相容一次试验中A与B不能同时发生,称A与B互不相容或相斥、相离,即AB=样本点或基本事件之间一定是互不相容的对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系相等关系互不相容对立关系独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,事件之间的关系:,包含关系相等关系互不相容对立关系A不发生也是一个事件,称为A的逆事件或对立事件,记为独立关系,事件之间的关系:,设同一试验中有两个事件A,B,其关系如下:,两事件的并两事件的积或交两事件的差逆运算,事件的运算:,两事件的并A与B至少有一个发生也是一个事件,称为A与B的“并”,记为AB特例:若AB=,可把“并”称为“和”,记为A+B两事件的积或交两事件的差逆运算,事件的运算:,两事件的并两事件的积或交两事件的差逆运算,事件的运算:,两事件的并两事件的积或交A和B同时发生,称为A与B的“积”或“交”,记为AB或AB两事件的差逆运算,事件的运算:,两事件的并两事件的积或交两事件的差A发生但B不发生,称为A与B的“差”,记为AB逆运算,事件的运算:,两事件的并两事件的积或交两事件的差逆运算,事件的运算:,Venn图,与算数运算相似,事件的运算也存在优先级:1.逆:相当于乘方2.交:相当于乘法3.并或差:相当于加减法,事件运算顺序,交换律:与算数运算相同AB=BA,AB=BA注意:AB“差”运算不满足交换律结合律:与算数运算相同(AB)C=A(BC),(AB)C=A(BC)分配律:与算数运算不同,并对交、交对并都成立(AB)C=(AC)(BC)*(AB)C=(AC)(BC),事件运算规律,德莫根(DeMorgan)定理:对于n个事件甚至可列个事件,上述定理仍成立:注意:算数运算中没有类似的定理,即:并的非等于非的交,交的非等于非的并,事件运算规律,例1-31965-1974年期间美国男婴出生率,1.3概率,例1-4乳腺癌发病率:“未患乳腺癌的40岁妇女在70岁之内乳腺癌的发病率为1/11”可推出以下结论大样本中,11个人约有1个人会患乳腺癌;样本越大,发生概率越接近1/11在现实生活中,试验不可能做无限次,只能从一个大样本中用频率估计一个事件发生的概率,随机事件发生可能性大小的定量描述概率的古典解释概率的频率解释概率的公理化定义,1.3概率,概率的古典解释古典概型等可能概率的频率解释概率的公理化定义,1.3概率,概率的古典解释概率的频率解释概率的公理化定义,1.3概率,概率的古典解释概率的频率解释频率稳定性随机现象在大量重复试验或观察中,某一结果出现的次数与总试验次数之比,随着总试验次数的增多总是非常稳定的频率接近概率概率某随机事件A在n次试验中发生了m次,n不断增大时,A发生的频率越来越接近某个确定值p一般不可能准确得到概率p,由频率稳定性得:,1.3概率,概率的古典解释概率的频率解释概率的公理化定义,1.3概率,概率的公理化定义:设样本空间包含基本事件和复合事件,则这些事件的概率定义为一个函数,使样本空间的每一事件对应一个确定的实数P,这个实数称为概率,并且满足以下公理:公理1:对中事件A有P(A)0公理2:对样本空间有P()=1P()=0公理3:如果中事件A、B互不相容,则:P(AB)=P(A)+P(B)=P(A+B),1.3概率,概率可加性:对互不相容事件A和B有P(A+B)=P(A)+P(B)问题:对任意事件A、B,P(AB)=?概率加法:P(AB)=P(A)+P(B)-P(AB)例1-5高血压:X为表示舒张压DBP的变量,设事件A正常舒张压(DBP90):P(A)=0.7事件B高血压疑似(90DBP0,P(B)0作为条件的事件概率不能为0推广:,条件概率与概率乘法,例1-7传染病:使用例1-6中的数据,请给出在已知A医生做出阳性诊断后B医生也诊断病人患有传染病的概率。解:已知事件A=医生A诊断为阳性:P(A)=0.1事件B=医生B诊断为阳性:P(B)=0.17且P(AB)=0.08则P(B|A)=P(AB)/P(A)=0.8B医生可证实A医生诊断的80%,条件概率与概率乘法,随机事件之间除包含、相容等关系外,还存在的另一种关系独立性定义:对任意事件A和B,若P(AB)=P(A)P(B)特殊乘法法则则称A,B是独立的A,B独立等价于B的发生对A没有任何影响,也不提供任何消息,反之亦然,1.5独立性:定义,例1.22袋中有a只黑球和b只白球,有放回摸球,求:(1)第二次摸黑球的概率;(2)已知第一次摸黑球,第二次也摸黑球的概率。解:以A表示第一次摸黑球,B表示第二次摸黑球,则:,A与B互相独立,1.5独立性,例1.23把例1.22中有放回摸球改为不放回摸球,仍求及解:,A与B不互相独立计算概率时常用到公式,1.5独立性,定义:A,B,C为三个事件,若下列4式同时成立,则称它们互相独立,(1.1),(1.2),(1.1)式成立,则A、B、C两两独立问题1:从(1.1)式是否可能推出(1.2)式?问题2:从(1.2)式又是否可能推出(1.1)式?,1.5独立性:多个事件独立性,例1-8袋中装有四个大小相同的球,其中红球兰球黄球各一个,另一个是涂有红兰黄三种颜色的球,设A=“任取一球其上涂有红色”B=“任取一球其上涂有兰色”C=“任取一球其上涂有黄色”请问A、B、C是否相互独立?解:由题可知P(A)=1/2,P(B)=1/2,P(C)=1/2,P(AB)=1/4,P(AC)=1/4,P(BC)=1/4,P(ABC)=1/4,1.5独立性:多个事件独立性,显然P(AB)=P(A)P(B)P(AC)=P(A)P(C)P(BC)=P(B)P(C)但P(ABC)P(A)P(B)P(C)即:A、B、C不相互独立事件ABC是两两相互独立的,但三个事件不一定是相互独立的定义中的4个条件缺一不可,1.5独立性:多个事件独立性,以上定义推广:A1,A2,An为n个事件,若对任何正整数k(2kn),有其中i1,i2,ik为满足下式的任何k个自然数:1i1i2ikn则称为A1,A2,An互相独立若n个事件独立,则其中任何m个(2m0,(i=1,2,)(2)A1+A2+A3+An+=(完全性)则对任一事件B,有:事件组A1,A2,An为样本空间的一个分割,或完备事件组(见下图),1.6全概公式与逆概公式,1.6全概公式与逆概公式,例1.31由于通信系统会受到干扰,接收台收到的不全是正确信号,现已知发报台分别以概率0.6和0.4发“”和“-”。发“”时,收报台分别以0.8和0.2的概率收到“”和“-”;发“-”时,分别以0.9和0.1的概率收到“-”和“”。求当收报台收到“”时是正确的概率。解:令A为发“”原因,B为收“”结果则P(A)=0.6,P()=0.4,通讯的正确性,1.6全概公式与逆概公式,贝叶斯(Bayes)公式:又称逆概公式若非空事件组A1,A2,An,互不相容,且其并集可以覆盖事件B,则证明:由条件可知,再利用全概公式替换P(B),即可得原式,1.6全概公式与逆概公式,1.6全概公式与逆概公式,例1.32中年男性人群中,20%超重,50%正常,30%低体重,他们动脉硬化的概率分别为30%,10%,1%。从中随机取一人,恰为动脉硬化者,求他分属各组的概率。解:A1,A2,A3分别表示体重超重、正常、偏低原因B表示动脉硬化结果由题意可得:P(A1)=0.20,P(A2)=0.50,P(A3)=0.30,(各原因导致结果的概率),1.6全概公式与逆概公式,0.531与概率0.03相差很远体重与动脉硬化很有关系是在旧知识基础上得到的,是对旧知识的修正,对事件的新的认识形式上贝叶斯公式只是条件概率的简单推论,但却包含了归纳推理的思想,后来被发展为一种关于统计推断的系统理论和方法贝叶斯统计,1.6全概公式与逆概公式,例:病人患疾病A1,A2,An,中的某一个时,都会出现症状B(如体温,某种化验指标等等)患医生需诊断病人出现B症状时患哪种病,即求解法:A1,A2,An,为可能引起症状B的所有病因假设:一个病人不可能同时得两种病P(Ai):人患各种病可能性,可从资料中获得:可由历史知识获得利用贝叶斯公式求得通过比较各大小即可对疾病作出诊断综合从多个症状所得到的条件概率,诊断会更准确一些采用计算机进行诊断原则上是可行的,1.6全概公式与逆概公式,例1.33一道题同时列出m个答案,要求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届山东省滨州沾化区六校联考九上化学期中教学质量检测模拟试题含解析
- 涂布机安全生产培训
- 创业贷款政策解读
- 2026届四川省广元市旺苍县九年级化学第一学期期末监测试题含解析
- 甘肃省临夏市第一中学2026届英语九上期末学业水平测试模拟试题含解析
- 文案策划个人年终总结
- 河北省丰润区2026届九年级英语第一学期期末质量跟踪监视模拟试题含解析
- 2026届山东省淄博市临淄区召口乡中学化学九年级第一学期期中质量检测模拟试题含解析
- 甘肃省张掖市临泽二中学、三中学、四中学2026届九上化学期中复习检测试题含解析
- 2026届四川省内江市球溪中学九年级化学第一学期期末统考试题含解析
- 635MPa级热轧带肋高强钢筋应用技术规程
- 蜀道集团招聘笔试
- 历年全国普通话考试真题50套
- 第三单元小数除法(单元复习讲义)教师版-2024-2025学年五年级上册(人教版)
- 2025年上海市高考语文专项复习:识记背诵默写
- 人教版(2024新版)七年级上册英语Starter Unit1单元测试卷(含答案)
- 化粪池清底服务合同
- TGXAS-松阔混交林培育技术规程编制说明
- 幼儿园的食品安全工作计划
- (新教科版)科学五年级上册全册教学反思
- 职业技术学院《老年常见疾病预防与照护》课程标准
评论
0/150
提交评论