生物统计-随机变量与概率分布.ppt_第1页
生物统计-随机变量与概率分布.ppt_第2页
生物统计-随机变量与概率分布.ppt_第3页
生物统计-随机变量与概率分布.ppt_第4页
生物统计-随机变量与概率分布.ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 概 率 分 布 (Probability Distribution),3.1 随机变量及其分类 3.2 概率分布 3.3 正态分布 3.4 二项分布 3.5 普哇松分布,3.1 随机变量及其分类,随机变量(random variable): 在一定范围内随机取值的变量,离散性随机变量:如性别等 连续性随机变量:如身高等,3.2 概率分布(复习知识),概率分布是描述随机变量取值的概率的函数,主要有3种函数: 概率函数描述离散性随机变量取各个可能值的概率的函数。 概率密度函数描述连续性随机变量取某值的密度的函数。 概率分布函数描述随机变量取值小于等于某值的概率的函数。也称为累计分布函数,3

2、.2 概率分布(复习知识),随机变量的数学期望,设a是常量,X和Y是两个独立的随机变量,,随机变量的方差,第三章 概 率 分 布 (Probability Distribution),3.3 正态分布 (Normal Distribution),一 类型,连续性随机变量所服从的概率分布,二。特点,概率密度函数,曲线只有一个峰,峰值位于x = 处, 曲线关于直线x = 对称,因而平均数 = 中位数 = 众数, 曲线以x轴为渐近线向左右无限延伸, 曲线在x = 1 处各有一个拐点, 曲线由参数 和 完全决定, 决定曲线在x轴上的位置, 决定曲线的形状, 大时,曲线图形显得矮和宽, 小时,曲线图形显

3、得高与窄,三. 概率计算,双侧概率(两尾概率, two-tailed probability),随机变量X 落在平均数左右标准差 一定倍数以外的概率,单侧概率(一尾概率, one-tailed probability),随机变量X 落在小于平均数左侧标准差一定倍数以外或大于右侧标准差一定倍数以外的概率,四 标准正态分布(Standard Normal Distribution),对于任意正态分布随机变量 , 将X作线性变换 , 这个变换称为标准化,Z N(0, 1) 的正态分布,其概率密度函数为:,当XN ( ) 时,,当XN ( 0,1 ) 时,数字特征,当XN ( ) 时,数字特征,Z的分

4、布函数,查附表1得到:,当u=2时,F(2)=0.97725, u=3时,F(3)=0.99865。,五 根据正态分布表查概率,Z N(0, 1) 的正态分布,0.025,0.005,0.05,六 临界值(分位数)(critical value),双侧分位数,2.33,1.96,2.58,P( -1 Z 1) = 68.26% P( -2 Z 2) = 95.45% P( -3 Z 3) = 99.73% P( -1.96 Z 1.96) = 95% P( -2.58 Z 2.58) = 99%,P ( - X + ) = 68.26% P ( - 2 X + 2 ) = 95.45% P (

5、 - 3 X + 3 ) = 99.73% P ( - 1.96 X + 1.96 ) = 95% P ( - 2.58 X + 2.58 ) = 99%,对于任意的正态分布N(, 2),N(0, 1),表2-3 200头金华猪二月龄体重资料 单位:kg,表2-3 200头金华猪 二月龄体重资料 单位:kg,134,表2-3 200头金华猪 二月龄体重资料 单位:kg,134,134个观察值,67%,3.4 二项分布 (Binomial Distribution),一 类型,离散型随机变量所服从的概率分布,假设:在相同条件下进行了n次试验,每次试验只有两种可能的结果(可计为1和0),每次试验结

6、果为1的概率为p,为0的概率为1-p,各次试验彼此间是独立的,则在n次试验中,结果为1 的次数是个随机变量,其分布为二项分布,3.4 二项分布 (Binomial Distribution),一 类型,离散型随机变量所服从的概率分布,概率计算 n次重复独立实验中,事件A出现的次数k的概率,k=0,1,2,n p+q=1,三 二项分布的平均数,方差和标准差,当实验结果以事件A发生次数k表示时,当实验结果以事件A发生的百分数k/n表示时,例题:一种鸭通常被感染上某种传染病的概率为0.2,现有一种新的疫苗,将其注射25只鸭以检验其效果,结果发生感染的不超过1只,试判断这种疫苗对预防感染该传染病是有效

7、的。,假设疫苗未起作用,则在自然情况下,25只鸭中被感染的只数 X B ( k; 25, 0.2 ),P ( X 1) = =0.0274,根据小概率原理,小概率事件在一次观察中是不应该发生的。,3.5 普哇松分布(Poissons Distribution),一 类型,离散型随机变量所服从的概率分布,主要描述稀有事件(小概率事件)在一定时间或空间范围内的发生次数的概率分布,k=0,1,2,n, XP(k;),2np,4.1 抽样分布 4.2 参数估计 4.3 假设检验,第四章 统计推断概述,4.1 抽 样 分 布,一. 随机样本,代表性, 独立性,第四章 统计推断,4.1 抽 样 分 布,一

8、. 随机样本,4.1 抽 样 分 布,二. 统计量是随机变量,参数 ?,三. 抽样分布,(一)统计量所服从的概率分布为抽样分布,三. 抽样分布,(二)正态总体样本均数抽样分布的性质,1. 设,(X1, X2, Xn ) 是其样本,则,(二)正态总体样本均数抽样分布的性质,(二)正态总体样本均数抽样分布的性质,1. 设,(X1, X2, Xn ) 是其样本,则,2.中心极限定理:无论原总体是什么分布,只要样本足够大,样本平均数就近似服从正态分布。,(二)正态总体样本均数抽样分布的性质,1.,设,(二)正态总体样本均数抽样分布的性质,1.,设,样本抽样,(三)抽样误差 (sampling erro

9、r),从同一总体中随机抽取样本含量相等的若干样本,得到若干个样本均数,这些样本均数不完全相等,并且与总体均数也存在差异,由于抽样而产生的样本均数和总体均数间的差异称为均数的抽样误差,由于抽样而产生的样本标准差和总体标准差间的差异称为 ?的抽样误差,(三)抽样误差,均数的抽样误差,标准差的抽样误差,(三)抽样误差,均数的抽样误差,标准差的抽样误差,(四)标准误 (standard error, SE) : 样本统计量的标准差度量抽样误差 标准误小,表示抽样误差小,统计量较稳定,与所估计的参数较接近。,(四)标准误 (standard error, SE) : 样本统计量的标准差度量抽样误差,均数

10、的标准误 (standard errorof mean, SEM) : 样本平均数的标准差 它反映来自同一正态总体的样本平均数的离散程度以及样本均数和总体均数的差异程度,即均数抽样误差大小。,其它标准误 : 如标准差的标准差,率的标准差等,(四)标准误 (Standard error, SE),总体,如果总体方差2未知,可用样本方差S2来代替,得到样本标准误:,均数的标准误 (standard errorof mean, SEM),标准误与标准差standard deviation (SD),标准差(SD):描述某总体或样本内部个体值的变异,标准误(SE):描述样本统计量的变异,通常用“均数标

11、准差” 表示一组数据的平均水平和离散程度,有时用“均数标准误” 表达样本均数及其离散程度以及样本均数和总体均数的差异程度 必须注明以免误解,除了均数的标准误,还有率的标准误,回归系数的标准误,用标准差衡量离散程度,用标准误 衡量离散程度,标准差,均数标准误,郝拉娣,于化东,标准差与标准误,编辑学报,2005,17:116-118,平均数标准误,(五) 常用抽样分布,正态分布 分布 t分布 F分布,介绍一些常用统计量的分布,如无特殊的说明,假设所研究的样本抽自正态总体。,卡平方分布 卡平方分布、t 分布及F分布都是由正态分 布所导出的分布,它们与正态分布一起,是生 物统计中常用的分布。 当X1、

12、X2、Xn相互独立且都服从标准 正态分布N(0,1)时,Y= 的分布称为自由 度等于 n 的卡平方分布,记作Z (n),,卡平方分布的性质: 分布是非对称分布,具有可加性,即当Y与Z 相互独立,且Y (n),Z (m),则 Y+Z (n+m)。,1)卡平方分布的 E=n,D或Var=2n; 2)可加性:相互独立,相加后仍为卡平方分布,自由度相加; 3)不取负值; 4)非对称,形状与自由度有关。,图4-1 不同自由度下的 2 分布密度曲线,附表3给出了2分布的上侧分位数,当给定其上侧(右侧)尾部的概率为 时,该分布在横坐标上的临界值,记为,上侧,下侧,若要知道下侧(左侧)尾部的概率为 时2分布的

13、临界值,只需查上尾概率为1- 的上侧分位数即可,上侧,下侧,例如当自由度df = 9,下尾概率为 = 0.05,查上尾概率为1-0.05 = 0.95的上侧分位数得,例如当自由度df = 9,下尾概率为 = 0.05,查上尾概率为1-0.05 = 0.95的上侧分位数得,2. t 分布,哥塞特(W.S. Gosset,18761937) 1908年,哥塞特首次以“学生” (Student)为笔名,在生物计量学杂志上发表了“平均数的概率误差”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。,2. t 分布 若Z与Y相互独立,且ZN(0,

14、1), Y (n),则 的分布称为自由度等于,n 的 t 分布,记作t t (n),,请注意:t 分布的密度曲线也是关于 t=0 对称 , 与 N( 0,1 )分布 的密度曲线相似 , 受自由度n 的影响,n 越小离散的程度越大, n30时与N ( 0,1 )分布的密度曲线几乎重叠为一。,图4-3 不同自由度下的 t 分布密度曲线,附表4给出了t分布的双侧分位数,即对于t t (n),当上侧和下侧两尾的概率之和为(每侧为 /2)时,t分布在横坐标上的临界值的绝对值,记为t,3. F分布 若X与Y相互独立,且 X (m),Y (n),则 的分布称为第一自由度等于m、第二自由度等于n 的F分布,记作 FF (m, n),,Sir Ronald Aylmer Fisher (1890-1962),1)非对称,形状与自由度有关; 2)不取负值; 3)若F F (m, n),则 F (n, m); 4)若t t (n),则 F (1, n);,图 不同自由度下的F 分布密度曲线,上侧,下侧,请注意: 可以查附表5(F 分布的上侧分位数表),,请注意: 若要借

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论