统计在考古学中的应用-第八讲-比例ppt课件_第1页
统计在考古学中的应用-第八讲-比例ppt课件_第2页
统计在考古学中的应用-第八讲-比例ppt课件_第3页
统计在考古学中的应用-第八讲-比例ppt课件_第4页
统计在考古学中的应用-第八讲-比例ppt课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,统计学在考古中的应用,第八讲,2,.,性别比例玉器种类比例是否有随葬品二元变量二项式分布N30,接近正态分布,3,.,总体比例的置信区间,1.假定条件两类结果总体服从二项分布可以由正态分布来近似使用正态分布统计量,3.总体比例的置信区间为,4,.,置信度,(1-)%区间包含了%的区间未包含,5,.,总体比例的置信区间(实例),东下冯墓地男性11,女性6,11/6=1.83随机涨落vs.异常?0.166元君庙男性85,女性61,85/611.37偏离,6,.,可靠性样本容量不能根据观测值进行直接推断,必须统计推断,7,.,根据比例区间估计公式可得样本容量n为,估计总体比例时样本容量的确定,其中:,8,.,根据均值区间估计公式可得样本容量n为,估计总体均值时样本容量的确定,样本容量n与总体方差2、允许误差、可靠性系数Z之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比,其中:,9,.,置信度、精密度和样本容量,相对误差RSD精密度、准确度,10,.,1.假定条件两个总体是独立的两个总体服从二项分布可以用正态分布来近似2.两个总体比例之差P1-P2在1-置信水平下的置信区间为,两个总体比例之差的区间估计,11,.,两个总体比例之差的估计(实例),【例】某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,它们从两个城市中分别随机地调查了1000个成年人,其中看过广告的比例分别为p1=0.18和p2=0.14。试求两城市成年人中看过广告的比例之差的95%的置信区间。,12,.,两个总体比例之差的估计(计算结果),P1-P2置信度为95%的置信区间为,我们有95%的把握估计两城市成年人中看过该广告的比例之差在0.79%7.21%之间,13,.,比例数一致性的假设检验,墓地甲:10060墓地乙:5035混合样本:,14,.,赤峰案例子弹图,15,.,某类实体的缺失能否说明某类实体不存在,样本没有时,推断总体中比例小于1总体比例小于1时,样本没有P0.01N1,10,100,16,.,2检验,介绍了计数资料的U检验,用以推断两个率是否相等。2检验用以检验多个率(或构成比)之间差异是否具有显著性,当然也适合于两组比较。,17,.,2检验的用途:,推动两个总体构成比是否有差别推断几组总体构成比之间有无差别两个变量之间有无关联性频数分布的拟合优度检验,18,.,四格表资料的2检验,在医学资料中,常常需要比较两个样本率之间的差异有无显著性,如推断某人群男与女的某种疾病的患病率是否相等,即该病是否与性别有关。这类资料由4个数据构成:男与女的患病人数和未患病人数,统计学称这类资料为四格表资料。,19,.,下面介绍四格表资料的2检验的几种计算,一通用公式法二.专用公式法三.四格表2值的校正公式四.精确概率法五.配对四格表资料的2检验,20,.,一.通用公式法,例1为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照人群的尿棕色素阳性率有无差别?两组人群尿棕色素阳性率比较,21,.,(1)建立检验假设和确定检验水准H0:两种方法总体阳性率相同,即1=2H1:两种方法总体阳性率不相同,即12检验水准=0.05(2)计算检验统计量,22,.,理论频数是在H0成立的条件下每个格子理论上的数据。若H0成立,则合计的消除率为38/73=52.05%,则铅中毒病人理论上应有36*38/73=18.74人呈阳性。,23,.,理论频数T11=36*38/73=18.74T12=17.26T21=19.26T22=17.742=23.12自由度f=(R-1)(C-1)=1(3)确定p值自由度f=(R-1)(C-1)=1查2界值表得P0.005(4)推断按=0.05拒绝H0,认为两种方法总体阳性率不相同。,24,.,二.专用公式法,以上计算2统计量的公式对任意行列表都适合,而对于四格表资料,可以用其简化公式,2=,例1(续),25,.,三.四格表2值的校正,一.由于2界值表是由连续分布:2分布计算出来的,但原始数据属计数资料是离散的,由此计算出来的2值也是离散的,特别是四格表,有时若不校正,所求2值偏大,所得概率p值偏低。二.n40,且T5时,用未校正的2值1T5,且n40时,宜用校正2值或用精确概率计算法T0.05,按=0.05水平不拒绝H0,尚不能认为穿不同防护服的皮肤炎患病率有差别。若不校正,2=4.33p0.05,28,.,四.确切概率法(Fishersexactprobability),例3在某牧区观察慢性布鲁氏病患者植物血凝素皮肤试验反应,资料如下,问活动型与稳定型布氏患者反应阳性率有无差别?,29,.,H0:两型阳性率相等,即1=2H1:两型阳性率不等,即12在将原四格表周边数字(行和与列和)不变的情况下,变动a值,以得到不同情况:,30,.,计算每种情况下的|P1-P2|和p(i)值,p(i)值按下列公式来计算:p为|P1-P2|大于等于原来表中的|P1-P2|值(0.233)的情况下的p(i)的和,即p=p(0)+p(1)+p(4)=0.2668,31,.,五.配对资料的2检验,在前面已介绍了配对设计的t检验,配对设计的t检验是对于计量资料(观察值),将两种处理分别施于条件相同的两个受试对象,或施于同一受试对象某种处理前后某指标的变化,比较两总体均数的差异。若是对于计数资料,我们用配对资料的2检验(McNemar检验)。,32,.,例用两种检验方法对某食品作沙门氏菌检验,结果如下,试比较两种方法的阳性结果是否有差别?配对设计两种方法结果比较,33,.,分析:我们可以用上节的方法计算2值来判断两种处理的结果有无相关关系(有无联系),但是我们现在的目的是比较两法结果的差异,如果将两法的阳性率186/239与165/239作比较(用前节方法)是不正确的,因为理论频数是在两法结果相互独立假设下推算出来的,,2=相关,34,.,比较两法结果有无差别,要着眼于两法结果不一致的部分。H0:总体B=C检验统计量,当b+c40时2=当b+c40时2=1样本例数较少时还可以用精确概率法,原理同配对设计的符号检验。,35,.,H0:甲法阳性乙法性例数与甲法阴性乙法阳性例数相同,即总体B=CH1:总体BC=0.052=12.90查2界值表p0.005,拒绝H0,认为两法检验结果不一样,荧光抗体法阳性结果高于常规培养法。,36,.,样品容量影响关联强弱度量,37,.,行列表的2检验,前面介绍的四格表只有2行2列,只能对2个率或2类构成比作出比较。在医学研究中有时要比较几个率,如:要比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。有时要分析几组多类构成的构成比是否相同,如:以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致。有时要推断2个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。行列表的2值计算2=(R-1)(C-1),38,.,1.多个率比较,例3研究复方哌唑嗪对高血压病治疗效果的临床试验并与复方降压片和安慰剂作对照,结果如下表,问三种药物效果有无差别?三种药物治疗高血压病的有效率比较,39,.,H0:三种药物的总体有效率相同,即1=2=3H1:123不全相等=0.05,2=2查2界值表得p0.005,按=0.05水平拒绝H0,认为三种药物的治疗效果不全相同。,40,.,例41979年某地爆发松毛虫病,333例患者按年龄以14岁为界分成2组,资料如表,试考察两组病人病变类型的构成比有无差别?,某地两组松毛虫病患者型别构成比较,H0:两组患者中患各型松毛虫病的构成比相同H1:两组患者中患各型松毛虫病的构成比不同=0.052=70.14查表得p0.005,拒绝H0,认为两组患者中患各型松毛虫病的构成比不同。,2多个构成比比较,41,.,3双向有序且属性不同的分类资料的关联性检验,例6某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如下,问矽肺患者肺门密度的增加与期次有无差别?,42,.,H0:矽肺期次与肺门密度级别无关,即各期矽肺构成比相同且各级肺门密度构成比相同H1:矽肺期次与肺门密度级别有关=0.052=163.01=4查表得p0.005,拒绝H0,认为矽肺期次与肺门密度级别有关。,43,.,1行列表的2检验要求理论频数不宜太小,要求不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1。2如果以上条件不能满足,可采用:l增加样本含量l删去某行或某列l合理地合并部分行或列l用精确概率法3多个率或构成比比较的2检验,结论为拒绝H0时,仅表示几组有差别,并非任2组之间都有差别。若要了解之,可进行2表的分割。,注意事项,44,.,行列表的分割,例3(续)哌唑嗪组与降压片组的有效率接近,将此2组合并,得到2个分割表:,分割表1分割表2,21=4.41922=29.615,45,.,可以得出21+22=34.034约等于原来的2=32.74,两者不相等是由于分割表中理论频数的数值与总表中理论频数不同所致。即有结论,哌唑嗪、降压片与安慰剂的有效率均不相同。,46,.,频数分布拟合优度的2检验,在医学实际工作中常需要考察一个样本的频数分布是否符合某种概率模型规定的理论分布,如果符合就可将它按该理论分布来处理。,47,.,某地爆发流行细菌性痢疾,为了分析这次爆发流行是否存在家庭内成员间的传播,共调查了四口之家288户,数据如下,试检验能否用二项分布模型来拟合这一组实际资料。,48,.,分析:如果能够拟合,表明家庭成员发病与否是独立、等概率的。H0:此次流行不存在家庭内成员间的传播估计二项分布的总体率:=发病总人数/调查总人数=0.18576,49,.,50,.,2=81.00=4-1=3,查表得p0.05拒绝H0,认为本次调查的四口之家内发病人数的分布不符合二项分布,此次流行可能存在家庭成员间的传播。,51,.,趋势性2检验,当暴露水平按多个等级分类时,经常需要检验是否存在剂量-反应关系,即随着暴露水平的升高,阳性率是否有增加或减少的趋势。,52,.,例一项心肌梗塞发生前饮酒的病例-对照研究结果如下,试分析每日饮酒量与心肌梗塞发生之间是否存在剂量反应关系。心肌梗塞患者及对照者的每日饮酒量,53,.,STATISTICSFORTABLEOFIBYJCochran-ArmitageTrendTest-Statistic=2.736Prob(Right-sided)=0.003Prob(Two-sided)=0.006Cochran-Mantel-HaenszelStatistics(BasedonTableScores)StatisticAlte

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论