版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Poisson分布的统计分布的统计分析分析内容内容Poisson分布的概念与特性分布的概念与特性1Poisson分布样本均数与总体均分布样本均数与总体均数的比较数的比较 3Poisson分布两样本均数的比较分布两样本均数的比较4STATA计算计算5Poisson分布总体均数的估计分布总体均数的估计2Poisson分布的概念分布的概念v 描述所观察到的某事件发生次数描述所观察到的某事件发生次数x的概率的概率v 对于观察单位充分小的情况下某事件发生是非常罕见的对于观察单位充分小的情况下某事件发生是非常罕见的v 罕见事件罕见事件: ,n很大很大,而不大而不大,xn0每个格子的大小恰好能容纳一个细菌1
2、L水细分格子数n 有限格子 中有细菌x0 xnx什么是什么是Poisson分布分布vPoisson分布主要用于描述在单位时间(空间)分布主要用于描述在单位时间(空间)中某种事件发生数的概率分布中某种事件发生数的概率分布 放射性物质在单位时间内的放射次数 在单位容积充分摇匀的水中的细菌数 野外单位空间中的某种昆虫数v显然,显然,Poisson分布也是一种离散型随机变量的分布也是一种离散型随机变量的分布分布 什么是什么是Poisson分布分布v可以认为满足以下三个条件的随机变量服从可以认为满足以下三个条件的随机变量服从Poisson分布:分布: 平稳性:X的取值与观察单位的位置无关,只与观察单位的
3、大小有关 独立性:在某个观察单位上X的取值与前面各观察单位上X的取值独立(无关) 普通性:在充分小的观察单位上X的取值最多为1v实际上可以看作是在二项分布要求上更进了一步实际上可以看作是在二项分布要求上更进了一步什么是什么是Poisson分布分布vPoisson分布的概率分布规律分布的概率分布规律 X取值范围为非负整数,即0,1,; 其相应取值概率为 式中e:自然对数的底,e2.7182;是大于0的常数。 X服从以为参数(X的总体均数)的Poisson分布可记为XP() Poisson分布的特性分布的特性vPoisson分布的均数与方差分布的均数与方差 由Poisson分布计算概率公式可见Po
4、isson分布只有一个参数 。这个参数就是Poisson分布的总体均数。不同的总体均数对应于不同的Poisson分布 总体方差也等于此参数 这是Poisson分布的特性Poisson分布的特性分布的特性vPoisson分布的可加性分布的可加性 如果X1, X 2 , , X k相互独立,且它们分别服从Poisson分布,则T= X1+ X2+ Xk也服从Poisson分布,其参数为原各参数之和1+ 2+ kv正态分布与正态分布与Poisson分布的关系分布的关系 只取决于均数,均数很小时分布很偏,当均数增加时,逐渐趋于对称 当均数越来越大时,Poisson分布逐渐逼近于均数为,方差为的正态分布
5、。据此性质,均数较大的Poisson分布可按正态分布近似计算Poisson分布的特性分布的特性Poisson分布的特性分布的特性vPoisson分布与二项分布的关系分布与二项分布的关系 设XB (n , ),则当n且n保持不变时,可以证明X的极限分布是以n 为参数的Poisson分布 由以上性质可得,当n很大,很小时,二项分布近似Poisson分布。当n很大时,二项分布概率的计算量相当大。因此可以利用二项分布的Poisson近似这一性质,当n很大且很小时,可以用Poisson分布概率计算替代二项分布的概率计算 Poisson分布总体均数的估计分布总体均数的估计小样本时总体均数的估计小样本时总体
6、均数的估计v当待估总体均数与样本均数的观察单位相同时,当待估总体均数与样本均数的观察单位相同时,总体均数的点估计就是样本计数,也就是说此时总体均数的点估计就是样本计数,也就是说此时的样本计数就是样本均数。的样本计数就是样本均数。v按照分布规律,直接通过计算不同发生数的概率按照分布规律,直接通过计算不同发生数的概率即可得到区间估计即可得到区间估计 例7.1 对某一水体进行卫生学评价,随机取得100ml水样,培养得大肠菌落30个,试估计该水体中平均每100毫升所含大肠菌数的95%可信区间。 由于希望求得的是100毫升水样的菌落数可信区间,因此可以将这些水样看作是一个观察单位来进行分析。 Cii命令
7、大样本时总体均数的估计大样本时总体均数的估计v在大样本时可以直接利用正态近似原理得到区间在大样本时可以直接利用正态近似原理得到区间估计估计v当待估总体均数与样本均数的观察单位不同时,当待估总体均数与样本均数的观察单位不同时,要根据样本观察单位进行估计,然后把估计结果要根据样本观察单位进行估计,然后把估计结果进行单位转换,使估计结果中的观察单位与总体进行单位转换,使估计结果中的观察单位与总体观察单位相同观察单位相同(用正态近似方法可以直接变换观察用正态近似方法可以直接变换观察单位单位)。大样本时总体均数的估计大样本时总体均数的估计 例例7.2 7.2 测得某放射性同位素半小时内发出的脉测得某放射
8、性同位素半小时内发出的脉冲数为冲数为490490个,试估计该放射性同位素平均每个,试估计该放射性同位素平均每3030分分钟脉冲数的钟脉冲数的95%95%可信区间可信区间。 已知n=490,由于此样本计数大于50,故可考虑利用近似正态分布的原理估计其总体均数。这里,待估总体均数的单位是30分钟,样本均数也是观察了1次30分钟得到的,所以应当以30分钟作为一个观察单位 可直接按照近似原理计算,或者用cii命令计算 由于观察单位数等于1,因此公式中标准误的大小就等于标准差大样本时总体均数的估计大样本时总体均数的估计 例例7.3 7.3 为了解某地新生儿出生缺陷的发生水平,为了解某地新生儿出生缺陷的发
9、生水平,该地某年内共监测新生儿该地某年内共监测新生儿192000192000人,其中出生缺人,其中出生缺陷的发生数为陷的发生数为19771977人,监测出生缺陷发生率为人,监测出生缺陷发生率为102.97/102.97/万,试估计该地新生儿出生缺陷发生率的万,试估计该地新生儿出生缺陷发生率的95%95%可信区间。可信区间。 新生儿出生缺陷的发生率常以万分率来表示,如果以1万人为单位,该地监测的新生儿出生数192000人可看作是19.2个观察单位(即n=19.2),其样本均数为102.97,正态近似时的标准差也应当按此计算 注意此时标准误的大小不等于标准差 计算结果与不同的观察单位大小无关Poi
10、sson分布样本均数与分布样本均数与 总体均数的比较总体均数的比较小样本计算小样本计算 例例7.4 7.4 一般孕产妇的死亡率是一般孕产妇的死亡率是56/1056/10万,某地研万,某地研究者为了解当地孕产妇的死亡率是否低于一般,究者为了解当地孕产妇的死亡率是否低于一般,对该地对该地75007500名孕产妇进行监测,其中名孕产妇进行监测,其中3 3名死亡,死名死亡,死亡率为亡率为40/1040/10万,试作统计推断。万,试作统计推断。 可利用Poisson分布的概率函数直接计算假设检验所需的的概率P值,和检验水准比较之后下结论。 分析步骤分析步骤v H0H0:当地孕产妇的总体平均死亡数与一般孕
11、产妇的死亡当地孕产妇的总体平均死亡数与一般孕产妇的死亡数相等数相等 H1 H1:当地孕产妇的总体平均死亡数低于一般孕产妇的死亡当地孕产妇的总体平均死亡数低于一般孕产妇的死亡数数 单侧 正态近似法正态近似法 例例7.5 7.5 利用例利用例7.37.3的结果,若全国新生儿的结果,若全国新生儿出生缺陷发生率为出生缺陷发生率为89.62/89.62/万,研究该地新万,研究该地新生儿出生缺陷发生率是否高于全国的水平,生儿出生缺陷发生率是否高于全国的水平,试作统计推断。试作统计推断。 可利用正态近似的原理作以下计算进行u检验 H0:当地新生儿出生缺陷平均发生数与全国的平均当地新生儿出生缺陷平均发生数与全
12、国的平均发生数相等发生数相等 H1:当地新生儿出生缺陷平均发生数高于全国的平当地新生儿出生缺陷平均发生数高于全国的平均发生数均发生数 单侧分析步骤分析步骤已知1977X ,192000n,00.008962 故00192000 0.009862 1720.7n,其值远远大于20。可代入公式(7.3) : 1977 1720.76.1791720.7u 查附表1,标 准正 态分 布 界值表 ,单 侧界值U0.05 1.64, 得0.0005P,按0.05水准,拒绝0H,接受1H,可认为该地新生儿出生缺陷发生率高于全国。 Poisson分布两样本均数的比较分布两样本均数的比较方法原理方法原理v当两
13、个样本计数均较大时,可根据当两个样本计数均较大时,可根据Poisson分布分布近似正态分布的性质作近似正态分布的性质作u检验。当两样本计数中检验。当两样本计数中有一个较小或两个均较小时,可先作变量转换,有一个较小或两个均较小时,可先作变量转换,然后再作适当的检验。本节仅介绍两个样本计数然后再作适当的检验。本节仅介绍两个样本计数均较大时的均较大时的u检验。根据两个样本观察单位是否检验。根据两个样本观察单位是否相同,所采用的计算公式又分为两种。相同,所采用的计算公式又分为两种。方法原理方法原理v 两样本观察单位相等两样本观察单位相等 近似u检验的公式为: 显然,是由两样本的u检验公式直接化简而来v
14、 两样本观察单位不等两样本观察单位不等 近似u检验的公式原形不变,但简化后的公式不同22112122212121/nXnXXXnsnsXXu等样本分析实例等样本分析实例 例例7.6 7.6 为研究两水源被污染的情况是否相同,为研究两水源被污染的情况是否相同,在每个水源各随机抽取在每个水源各随机抽取1010份水样,每份份水样,每份1 ml1 ml,作作细菌培养。甲水源水样共得细菌菌落细菌培养。甲水源水样共得细菌菌落580580个,乙水个,乙水源水样共得菌落源水样共得菌落432432个,试作统计推断。个,试作统计推断。 都是按照10ml进行的计数,因此可以将其看成是一个观察单位 如果按1ml来计算
15、,检验结果不变不等样本分析实例不等样本分析实例 例例7.7 7.7 为研究某省不同性别意外伤害死亡情况为研究某省不同性别意外伤害死亡情况有无差异,已知有无差异,已知20002000年该省疾病监测数据中,男年该省疾病监测数据中,男性性292512292512人,女性人,女性283474283474人,因意外伤害死亡的人,因意外伤害死亡的人数分别为人数分别为180180人、人、6060人,试作统计推断。人,试作统计推断。 由于观察人数不同,因此需要考虑化成相同的观察单位大小,此处可根据喜好自行设定,例如按照每10万人口作为一个观察单位不等样本分析实例不等样本分析实例v假设检验假设检验 H0:男女的平均意外伤害死亡人数相同 1:男女的平均意外伤害死亡人数不同 =0.05 调整相同观察单位 P0.001,拒绝H0,可以认为男性平均意外伤害死亡高于女性,差异有统计学意义。11806.15429.2512x 26 02 .1 1 72 8 .3 4 7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院后勤保障科奖惩制度
- 公益性岗位制度制定会议
- 养鸡企业生产制度
- 水洗厂管理制度表
- 怎么让财务制度更完善
- 学校信访责任制度
- 三坐标卫生责任制度
- 工会委员会出资责任制度
- 强化项目责任制管理制度
- 销售经理责任制制度
- 常见的发电方式
- 华能电力定员标准
- 《诊断学基础 十三五高职 》读书笔记思维导图PPT模板下载
- GB/T 7926-2015数控往复走丝电火花线切割机床精度检验
- GB/T 16983-2021化学试剂二氯甲烷
- GA/T 1433-2017法庭科学语音同一认定技术规范
- 新版人教版小学美术四年级美术下册全册教案
- GB∕T 8050-2017 纤维绳索 聚丙烯裂膜、单丝、复丝(PP2)和高强度复丝(PP3)3、4、8、12股绳索
- DB62∕T 2992-2019 黄土地区高速公路路基施工技术规范
- 《愿望的实现》原文大全
- 线束加工基础知识
评论
0/150
提交评论