已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,第一节均数抽样误差与t分布,欲了解总体的特征,最直接的方法是对总体中的每个观察单位进行测量,通过整理分析得到总体参数,但这在医学研究实际中往往是不可能实现的。通常应用抽样研究,通过样本指标来了解总体特征。,.,2,抽样研究所得样本均数会不会恰好等于未知的总体均数呢?如果固定样本含量n从同一总体中进行多次抽样,所得样本均数又会如何呢?,.,3,假设已知某地30岁-40岁正常男性血清总胆固醇的均值为5.0mmol/L,标准差为0.6mmol/L。现从该总体中进行随机抽样,每次抽取30名正常男子,并测得他们的血清总胆固醇水平,最终共抽取100份样本,并计算出每份样本的均数。,.,4,.,5,由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差(samplingerror)。抽样造成的样本均数与总体均数间的差异就称为均数的抽样误差。在抽样研究中,抽样误差是不可避免的,但抽样误差分布具有一定的规律性。,.,6,图3-1从正态分布总体N(5.0,0.62)中随机抽样所得样本均数的分布,.,7,样本均数大部分分布在总体均数5.0的左右,中间多、两边少,左右基本对称,服从正态分布,并且样本均数的变异范围比原变量的变异范围要小很多。,.,8,样本均数的标准差称为均数的标准误,简称标准误,用符号表示。均数的标准误说明各样本均数围绕总体均数的离散程度,可用来反映样本均数的抽样误差大小。,.,9,中心极限定理,从正态总体N(,2)中,随机抽取例数为n的样本,样本均数也服从正态分布;即使从偏态总体随机抽样,当n足够大时(n50),样本均数近似正态分布。,.,10,从均数为,标准差为的正态或偏态总体中,抽取例数为n的样本,样本均数的总体均数也为,标准差与原标准差成正比,与样本例数的平方根成反比。,.,11,.,12,越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,越小,样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。,.,13,的大小与成正比,与成反比。当固定不变时,样本含量n增大,减小。因此,在实际工作中,可通过适当增加样本含量来减小抽样误差。,.,14,常未知,用S估计,因此均数标准误的估计值为,.,15,t分布的演化,.,16,常未知,若用,这时对样本均数进行的不是Z变换而是t变换,统计量t不再服从N(0,1)标准正态分布,.,17,英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明统计量t服从v=n-1的t分布,.,18,又称为Studentt分布(Studentst-distribution),.,19,t分布的图形及特征,.,20,t分布的特征为:以0为中心,左右对称的单峰分布越小,t值越分散,峰越矮,尾越高增大,t分布逐渐逼近Z分布,时,t分布即为Z分布,.,21,t界值表,横标目:自由度纵标目:概率P(曲线下面积)表中数字:自由度为,概率P为时,所对应的t界值,记为t,.,22,单侧:或双侧:即,.,23,在相同自由度时,t的绝对值越大,P越小在相同P值时,自由度越大所对应的t界值越小在相同t值时,双侧概率P为单侧概率P的两倍时,t界值即为Z界值,.,24,第二节总体均数的点估计与区间估计,点估计(pointestimation):将样本统计量直接作为总体参数的估计值区间估计(intervalestimation):按事先给定的概率,估计包含未知总体参数的一个可能范围,.,25,区间估计的实质假设某个总体的均数为,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含。即P(A50),.,30,例6-3中,因n=120,试求该地正常成年男性血清胆固醇平均水平的95可信区间。,即(3.55,4.17)mmol/L,.,31,例6-1从某地随机抽取120名30岁-40岁正常男性,得其血清总胆固醇水平的均数为4.95mmol/L,标准差为0.64mmol/L,试估计该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间。,.,32,因n=120,属于未知但n足够大,又均数为4.95mmol/L,标准差为0.64mmol/L,故该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间为即(4.84,5.06)mmol/L,.,33,当未知n较小,.,34,可信区间的涵义,从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。在实际研究中,一般只进行一次抽样,算得一个可信区间,对于这个可信区间来说,我们就认为该区间包含了总体均数,把握度为95%。,.,35,图6-5从N(0,1)中随机抽样算得的100个95可信区间(n=10),.,36,可信区间的两个要素,可信度:可靠性,即1-。一般取90%、95,可人为控制区间的宽度:区间的大小(区间的长度),越小越好必须二者兼顾,.,37,均数的可信区间与参考值范围的区别,.,38,第三节总体率的点估计与区间估计,.,39,一、二项分布,如某实验中小白鼠染毒后死亡概率P为0.8,则生存概率为=1-P=0.2,1、对一只小白鼠进行实验的结果为:死(概率为P)或生(概率为1-P)2、对二只小白鼠(甲乙)进行实验的结果为:甲乙均死(概率为P2)、甲死乙生概率为P(1-P)、乙死甲生概率为(1-P)P或甲乙均生概率为(1-P)2,概率相加得P2+P(1-P)+(1-P)P+(1-P)2=P+(1-P)23、依此类推,对n只小白鼠进行实验,所有可能结果的概率相加得Pn+cn1P(1-P)n-1+.+cnxPx(1-P)n-x+.+(1-P)x=P+(1-P)n其中n为样本含量,即事件发生总数,x为某事件出现次数,cnxPx(1-P)n-x为二项式通式,cnx=n!/x!(n-x)!,P为总体率。因此,二项分布是说明结果只有两种情况的n次实验中发生某种结果为x次的概率分布。其概率密度为:P(x)=cnxPx(1-P)n-x,x=0,1,.n。:,.,40,二项分布的图形,.,41,当=0.5时,分布对称;当0.5,分布呈偏态;当0.5时分布呈负偏态;特别是当n值不是很大时,偏离0.5愈远,分布愈偏,.,42,随着n的增大,二项分布逐渐逼近正态分布。如=0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。一般地说,如果n或n(1-)大于5时,常可用正态近似原理处理二项分布问题,.,43,二项分布的性质:累积概率,(1)二项分布的概率之和等于1,.,44,(2)单侧累积概率,至多有m例阳性的概率(下侧累积概率),至少有m例阳性的概率(上侧累积概率),.,45,二项分布的性质:均数和方差,阳性结果发生数X的总体均数总体方差总体标准差,.,46,二项分布的抽样分布及其性质,二项分布的随机抽样性质仍然被中心极限定理所反映在n足够大时,样本率近似服从正态分布样本率p的均数等于样本率p的标准差(率的标准误),.,47,二、Poisson分布,当二项分布中n很大,p很小时,二项分布就变为Poisson分布,Poisson分布实际上是二项分布的极限分布法国数学家SimeonDenisPoisson(1781-1840)1837年在关于判断的概率之研究一文中提出的描述随机现象的一种常用分布,.,48,Poisson分布也是一种重要的离散型概率分布,用于研究单位时间、单位人群、单位空间内,某稀有事件发生次数的分布单位体积水中细菌数单位体积空气中粉尘数单位时间内放射性物质放射出的质点数单位空间中某些昆虫数一定人群中恶性肿瘤或罕见非传染性疾病患病数或死亡数,.,49,可以认为满足以下三个条件的随机变量服从Poisson分布:平稳性:X的取值与观察单位的位置无关,只与观察单位的大小有关独立性:在某个观察单位上X的取值与前面各观察单位上X的取值独立(无关)普通性:在充分小的观察单位上X的取值最多为1,.,50,Poisson分布的概率函数,若随机变量的概率函数为:,则称此变量服从Poisson分布,记为,.,51,Poisson分布的累计概率,.,52,Poisson分布的图形,.,53,Poisson分布的性质均数和方差,Poisson分布的均数和方差相等,均为;即,.,54,Poisson分布中均数的抽样分布及其性质,在足够大时,Poisson分布的平均计数近似正态分布平均计数的标准误n=1时(1个单位),,.,55,三、总体率的估计,根据样本率,也可以对总体率做出点估计和区间估计。我们用样本率p作为总体率的点估计值。总体率的点估计亦未考虑其抽样误差大小,而总体率的区间估计克服了点估计的缺陷。,.,56,利用样本资料可估计二项分布总体率的1-可信区间,取0.05或0.01。对于,且接近于0或1时,可直接查表得到总体率的(1-)可信区间。,.,57,例6-6某医院应用氨苄青霉
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 本科生毕业实习及毕业论文(设计)管理手册
- 2025年台湾省公务员申论应用文写作冲刺押题试卷(含答案)
- 2025年数字内容创作中心可行性研究报告及总结分析
- 2025年健康生活方式推广项目可行性研究报告及总结分析
- 2025年仓储物流自动化系统项目可行性研究报告及总结分析
- 2025年环保型涂料生产项目可行性研究报告及总结分析
- 2025年高效节能厨电产品研发项目可行性研究报告及总结分析
- 2025平方公里生态保护区项目可行性研究报告及总结分析
- 2025年无人零售商店投资可行性研究报告及总结分析
- 2025年充电桩网络布局项目可行性研究报告及总结分析
- 2025年河北省高职单招考试六类职业适应性测试(综合)
- 2025消防宣传月专题培训
- 水冷无功补偿安置施工方案
- 村报账员基础知识培训课件
- 企业风险管理评估表全面覆盖版
- 烟叶种植基础知识培训课件
- 2025内初班语文试卷及答案
- 园林机械维修培训知识课件
- 榨季运输安全培训简讯课件
- 2025年-网络安全等级测评报告模版(2025版)新版
- 移动应用开发白皮书方案2025
评论
0/150
提交评论