




已阅读5页,还剩63页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章绪论案例辨析及参考答案案例11某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。得出的结论是“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。请问其结论合理吗为什么应该如何案例辨析样本不能代表总体。总体是“大学生”,而样本仅为某地三年制职业技术学院学生;社会学调查的样本含量显得不足;“理、工、文、医学生分别挑选”这种说法中隐含人为“挑选”的意思,不符合统计学要求。正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生”下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。案例12两种药用于同一种病,A药治疗5例,4例好转;B药治疗50例,36例好转。结论是A药优于B药。请问其结论合理吗为什么应该如何案例辨析A药样本仅5例,样本含量太少;得出“A药优于B药”没有交待是否采用了统计学推断方法,若用目测法得出结论,则结论没有说服力;未明确研究目的和研究结果将被使用的范围。正确做法应明确研究目的和研究结果将被使用的范围,若是个别研究者或临床医生想了解这两种药的大致疗效,属于小规模的临床观察,其结论仅供少数人在今后临床实践中参考,其样本含量可能不需要很大,因为观察指标是定性的(有效、无效),一般来说,每个药物组也需要几十例(以不少于20例为宜);若属于新药的期临床试验,那就要严格按有关规定,比较准确地估计出所需要的样本含量,不仅如此,还有很多严格的要求,详见本书中临床试验设计一章;从明确定义的总体中随机抽样进行实验研究,得到的实验结果不能仅凭数据大小作出判断,应进行假设检验,以提高结论的可信度。案例13某研究者为了探讨原发性高血压患者肾小管早期损害的监控指标,选取尿常规、蛋白定性检查阴性,血肌酐、尿素氮均在正常范围内的原发性高血压患者74例作为病例组,其中男43例,女31例,平均年龄61岁(4073岁)。根据高血压的病程将患者分为三组,组高血压病期10年,组高血压病期1020年,组高血压病期20年。另选取53名体检健康的职工为对照组。观测两组尿视黄醇结合蛋白(RETINALBINDINGPROTEIN,RBP)、微量白蛋白MICROALBUMIN,MALB、2微球蛋白2MICROGLOBULIN,2MG和N乙酰D氨基葡萄糖苷酶NACETYLDGLUCOSAMINIDASE,NAG四项定量指标的取值。结论为尿RBP、MALB、2MG和NAG是原发性高血压患者肾小球、肾小管早期损害的敏感指标。请辨析这样设计实验存在什么问题正确的做法是什么案例辨析研究对象的选取在病例组和对照组之间存在不均衡性,即两组受试者之间,除了一组患有高血压,另一组未患高血压以外,在其他很多与评价高血压可能导致坏影响的方面都不一致。对照组选取的是53名体检健康的职工,未明确写出平均年龄以及年龄所在的范围,也未交代性别构成情况。但由我国现行的退休制度可知,在职职工的年龄通常在1860岁之间,平均年龄大约40岁。由临床医学基本常识可知,很多因素(比如年龄、性别等)不仅对血压有影响(通常是随着年龄的增大,血压有升高的趋势),而且对肾功能也有一定程度的影响;况且,高血压患者与健康职工还在“体力和脑力劳动强度、生活方式、心理和精神的紧张程度等诸多方面不具有可比性,而这些重要的非实验因素可能对肾功能也存在不同程度的影响。总之,原研究者所选取的病例组与对照组在很多重要的非实验因素方面(特别是年龄)不具有可比性,降低了结论的说服力。正确做法欲探讨高血压早期肾损害的监控指标,应根据高血压患者病程所分的三个组确定受试者的年龄段,从患者所取自的人群范围内随机选取一定数量的正常健康人(而不应仅局限在原研究者所在单位内),将正常健康人也分成相应的三个年龄段,并应尽可能确保在每个年龄段中,病例组与对照组受试者在其他重要非实验因素方面(如性别构成、体力和脑力劳动强度、生活方式、心理和精神的紧张程度等)均衡一致,采用相应的统计分析方法去比较定量指标的测定结果之间的差别,其结论才具有较高的可信度。案例14某部队共有1200人,在某段时间内患某病的人数有120人,其中男性114人,女性6人。某卫生员进行统计分析后说,经假设检验,该病的两性发病率(114/12095与6/1205)之间的差别有统计学意义,由此得出结论“该病男性易得”。你对这个结论有何看法若结论是错误的,那么,错误的实质是什么正确的做法是什么案例辨析这个结论是错误的因为在这1200人中,究竟有多少男性和多少女性并不清楚,无法计算男性发病的频率和女性发病的频率。假如其中有1194名男性和6名女性,则男性发病率为120/11941001005,而女性全部发病(女性总例数太少,不宜用百分之百发病率来描述)。显然,原来的结论是不成立的。该卫生员所犯错误的实质是将发病人员中性别的频率错误地当作人群中发病的频率了,因而得出毫无根据的错误结论。正确做法若这1200人是从一个总体中抽出来的样本,要弄清在这1200人中男、女人数各是多少,设分别为和,然后,分别计算男性和女性的发病频率,即男N女,;要想得出两个发病频率之间的差别是否能反映总012男男NP06女女P体的情况,还应进行统计推断(即进行假设检验,此处从略)。第2章统计描述案例辨析及参考答案案例21本章的例21中,该医生同时还观察了1402名临产母亲的住院天数(教材表214),并得到平均住院天数为66天。请对此发表评论。教材表2141402名临产母亲生产期间的住院天数组段(1)组中值XI(2)频数(3)频率FI(4)1279563343162254565593987782431733910896351112574071314231641516191361718906419201007212220142324201425263021合计1402100由加权法的计算公式(22)求出平均住院天数天610264012450356X案例辨析首先观察资料的分布形式,由于呈正偏峰分布,选用上述结果描述住院天数的平均水平不合适。正确做法宜选用不受定量资料分布情况限制的中位数来描述住院天数的平均水平。本例计算结果为M61(天)。案例22某人编制了一张统计表(教材表215),你认为哪些需要改进教材表21519761979年吉林市各型恶性肿瘤的死亡率年龄组疾病015355575胃癌无113/10万1992/10万150/10万31344/10万食管癌无01/10万218/10万3520/10万7356/10万肝癌034/10万164/10万2530/10万9751/10万13433/10万肺癌无041/10万2021/10万12510/10万13753/10万案例辨析原表格存在的问题标题不准确;线条过多,出现了斜线、竖线和多余的横线;数字区域出现了文字;小数位数不统一,小数点没有纵向对齐;量纲的标注位置有误。正确做法将原统计表中存在的上述错误纠正过来,修改后的统计表见案例表21。案例表2119761979年吉林市各年龄组人群部分恶性肿瘤死亡情况调查结果各年龄组死亡率(1/10万)疾病015355575胃癌00011319921500031344食管癌00001021835207356肝癌肺癌034000164041253020219751125101343313753案例23某人绘制一张统计图(教材图211),你认为哪些需要改进1972197219721952195219521801401006020教材图2111952年与1972年某地肺结核、心脏病和恶性肿瘤的死亡率案例辨析原图形存在的问题缺标题;复式条图误用为单式条图;纵轴的量纲未注明;未正确给出图例。正确做法将原图中存在的上述错误纠正过来,重新绘图(案例图21)。案例图21某地三种疾病死亡率在1952与1972年间的变化案例24以病死率为考察指标,对两所医院某病的治疗水平进行比较,结果见教材表216,由合计的病死率得出结论为乙医院治疗水平优于甲医院,请评述这个结论。教材表2162000年两所医院某病的病死率比较甲医院乙医院病情严重程度出院人数病死数病死率/出院人数病死数病死率/轻10088065065100中3003612025040160重6009015010018180合计10001341341000123123案例辨析由教材表216可以看出,此表编制得不够规范,更为严重的是,虽然甲医院各种病情患者的病死率均低于乙医院,但总的病死率却是甲医院高于乙医院。这个矛盾的出现,是由于甲医院收治的重病人多,轻病人少,乙医院则是重病人少,轻病人多。两家医院收治患者的病情不均衡,不宜直接比较基于各自病情状况的病死率“粗病死率”。正确做法因各医院收治的患者在病情方面不均衡,直接进行比较是不正确的,而是要进行标准化处理后再比较。标准化(STANDARDIZATION)有直接标准化法和间接标准化法两种。(1)直接标准化首先确定一个标准组,将其病情分布视作标准分布,即两家医院理论上共同的病情分布状况。例如,某省内两家医院的对比,可以将全省、全国该类型患者入院时的病情分布作为标准组。这里,将两家医院各种程度病情的患者数对应相加,“构造”出标准组,这是在不能获得参考文献关于全省、全国情况时的做法。直接标准化计算过程见案例表22。案例表22用直接标准化法对2000年两所医院某病的病死率作比较原病死率PI预期病死率数NIPI病情严重程度标准组人数NI甲医院乙医院甲医院乙医院轻750801006075中5501201606688重700150180105126合计2000134123231289甲医院的标准化病死率51023标准组的总人数预期死亡数之和依照标准组的病情分布甲P乙医院的标准化病死率4510289标准组的总人数预期死亡数之和依照标准组的病情分布乙P经标准化,甲医院的标准化病死率低于乙医院,正确反映了两组病死率水平的对比关系。以甲医院的计算为例,粗病死率是以甲医院实际病情分布为权重,对甲医院病死甲P率水平的加权平均;标准化的则是以标准组病情分布为权重,对甲医院病死率水平的甲加权平均。即41315061203810156280甲P52725027277甲当进行对比的两组率为样本率时,下结论前需做假设检验,这里略去。(2)间接标准化也需首先确定一个标准组(由文献获得),并给定标准组的各年龄别病死率及总的病死率。由案例表23求出两家医院各自收治的患者按标准组的病死率水平将发生的总的死亡数。标准组的选择依据同直接标准化法。案例表23用间接标准化法对2000年两所医院某病的病死率作比较出院人数预期病死率数NIPI病情严重程度标准组病死率PI甲医院乙医院甲医院乙医院轻9010065090585中140300250420350重160600100960160合计1351000100014701095按标准组的病死率水平,甲医院有147例死亡,而实际甲医院仅有134例死亡,甲医院实际的病死发生程度低于标准组,两者程度之比134/147091称作标化死亡比(STANDARDMORTALITYRATIO,SMR),于是3125甲甲SMRP同理,。1653125309/乙乙结果,认为乙医院的病死率高于甲医院。这是根据数值大小得出的直观判断结果。若希望得出两医院标准化病死率之间的差别是否具有统计学意义,应进行假设检验,此处从略。本题目是以“病死率”为例阐述了阳性率的标准化的问题,其余如死亡率、发病率、治愈率等同理。第3章概率分布案例辨析及参考答案案例31为估计某地居民尿汞值的参考值范围,测得某地200名正常成人的尿汞值如教材表36。教材表36某地200名正常成人的尿汞值/1LG尿汞值04812162024283236404448例数45304120151213546342试根据该样本资料估计该地居民尿汞值的95正常值范围。下面给出了多种解法,请辨析正误并讲出道理。若有正确的,请指出来;若没有正确的,请一定要补充上。解法一计算得该样本资料的均数1378(),标准差1171(),于是估X1LGS1LG计该地居民尿汞值的95正常值范围为(,)(,3673)96X79。1LG解法二估计该地居民尿汞值的95正常值范围为(,)(266,2490)095XS095S。1G解法三估计该地居民尿汞值的95正常值范围为(,)(,3298)164XS425。1LG解法四估计该地居民尿汞值的95正常值范围为(0,)(0,3298)()。164XS1LG解法五估计该地居民尿汞值的95正常值范围为(0,)(0,3673)()。196XS1LG解法六估计该地居民尿汞值的95正常值范围为(0,)(0,2490)()。95XS1G解法七估计该地居民尿汞值的95正常值范围为(,)(,1378)(164XS425)。1LG解法八估计该地居民尿汞值的95正常值范围为(,)(,1378)(196XS179)。1G解法九估计该地居民尿汞值的95正常值范围为(,)(266,1378)(095XS1)。LG案例辨析以上所有解法均是错误的。本案例解法一至解法九均利用正态分布法估计正常值范围,但却忽略了对该资料的正态性判断或检验。正确做法严格的正态性检验常用的方法有Z检验(通常称为矩法)、W检验、D检验等,需要借助统计软件完成。在这里我们用粗略判断的方法作出频率分布图看是否对称,如果对称可初步判断为正态分布,否则判为非正态。该例频率分布明显不对称(案例图31)。000100200300400500604812162024283236404448尿汞值(G/L)频率密度案例图31表36资料的频率分布由此图可粗略判断尿汞值这个指标不服从正态分布(经对数变换后频率分布仍不对称),所以不能用正态分布法估计正常值范围,而应用适合描述偏态分布的百分位数法,计算,故估计该地居民尿汞值的95正常值范围不高于38()。3895P1LG在本例中,如果该地居民尿汞值呈正态分布,则上述解法四计算公式是正确的,因为汞是对人身体有害的微量元素,越少越好,又不可能取负值,下限应该为0,只需求出单侧上限即可。案例32某地区10万人口中出现了20例流行性腮腺炎病例,有人希望据此推断该地区10万人口中不少于20人患流行性腮腺炎的概率。于是,有几位爱动脑筋的学生给出了自己的解法。请辨析他们的解法之正误,并讲出道理。解法一20120XPXPE1920E1E250201解法二752908902C8902C1911909110PXP解法三74290E01E20112XP解法四752900C8C82119721210案例辨析上述解法均是错误的。解法一将发生流行性腮腺炎的人数看作是服从的POISSON分布,并近似服从正态分布,来计算相应的概率。但本例各观察单2N位是否患病不是互相独立的,不满足POISSON分布的应用条件,所以不能按照POISSON分布模型处理。解法二按照二项分布计算概率,同样因为各观察单位是否患病非独立,不满足二项分布的应用条件。解法三也是按照POISSON分布计算概率,因为模型选择的错误,所以导致结果错误,同样可分析解法四。正确做法就本例而言,因患这种病是有传染性的,即不满足独立性条件,没有合适的统计计算方法;若满足独立性,则以上四种计算方法均正确。在解法一中,因,20将POISSON分布用正态分布来近似,近似程度较差,故计算出来的概率与直接按POISSON分布或二项分布计算的结果有较大出入。第4章参数估计案例辨析及参考答案案例41某研究者测得某地120名正常成人尿铅含量(MGL1)如下尿铅含量04812162024283236合计例数1422291815106321120试据此资料估计正常成人平均尿铅含量的置信区间及正常成人尿铅含量的参考值范围。由表中数据得到该例的,某作者将这些数据代120N138S70SX入公式(420),即采用计算得到正常成人平均尿铅含量100置信区间为XZ1(,140684);采用公式计算得到正常成人尿铅含量100参考值范围为(,260306)。请问这样做是否合适为什么应当怎么做案例辨析该定量资料呈偏峰分布,不适合用正态分布法计算参考值范10围。正确做法可以用百分位数法求正常成人尿铅含量100参考值范围的单侧上限。例如,当005时,可直接求分位数,(0,)就是所求的正常成人尿铅含量95P95P的95正常值范围。欲求正常成人尿铅含量总体均数的置信区间,当样本含量N较大(比如说,大于30N或50)时,样本均数就较好地接近正态分布(根据数理统计上的中心极限定理)。本例,因为较大,不必对原始数据作对数变换就可以用估计总体均数的置信区120NXZS间。案例42在BIPAP呼吸机治疗慢性阻塞性肺病的疗效研究中,某论文作者为了描述试验前的某些因素是否均衡,在教材表45中列出了试验前患者血气分析结果。由于作者觉得自己数据的标准差较大,几乎和均数一样大,将标准差放在文中显得不雅观,于是他采用“均数标准误”(),而不是“均数标准差”()来对数据进行描述。XSXS问在研究论文中以教材表45方式报告结果正确吗为什么教材表45试验组和对照组治疗前血气分析结果X组别例数年龄/岁PHPACO2/KPAPAO2/KPASAO2/试验组12630043373600563004339250558512173对照组10625039573800663004339160628645225案例辨析描述数据的基本特征不能采用,因为为反映抽样误差大小的指XSX标,只表示样本均数的可靠性,而不能反映个体的离散程度。不仅如此,因仅为与其对XS应的的,有时,即使很大(甚至大于),用表示离散度时,不易被察觉出SN/1SX来,因此,用表达定量资料时,往往具有欺骗性。X正确做法当各组定量资料服从或近似服从正态分布时,反映个体的离散程度应该采用标准差,即描述数据的基本特征必须采用;否则,需要采用描述数S31QM据的基本特征。此处,为中位数、和分别为第1四分位数和第3四分位数。M1Q3案例43某市往年的12岁男孩平均身高为1400CM。现在从该市的12岁男孩中随机抽得120名作为研究对象,得到平均身高为1431CM,标准差为63CM。请估计该样本对应总体均数的95置信区间,并确定该均数是否与往年不同。某学生的回答如下“该例12岁男孩平均身高的点估计值为1431CM,按公式(421)计算得到该点估计值的95置信区间为14191442CM。因为往年12岁男孩平均身高为1400CM,没有落在所计算的95置信区间以内,所以可以认为现有男孩平均身高与往年身高有差异”。请指出学生回答中的不恰当之处。案例辨析不恰当之处有三“点估计值的95置信区间”的说法不对;“以往男孩平均身高没有落在所计算的95置信区间以内”的说法不对;“现有男孩平均身高与往年身高有差异”的说法不对。正确做法应该说“点估计值对应总体均数的95置信区间”;应该说“95置信区间没有覆盖(包括)以往男孩平均身高”;应该说“现有男孩平均身高与往年男孩平均身高的差异有统计学意义”。第5章假设检验案例辨析及参考答案案例51为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药T的疗效均值为,进行检验,无效假设是,对立假设是,检验水平1。0T00结果值很大,拒绝了无效假设。“拒绝了无效假设”意味着什么下面的说法你认为对吗T(1)你绝对否定了总体均数相等的无效假设。(2)你得到了无效假设为真的概率是1。(3)你绝对证明了总体均数不等的备择假设。(4)你能够推论备择假设为真的概率是99。(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1。(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99的机会得到具有统计学意义的结果。提示就类似的问题,HALLER和KRUSS(2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。(见STATISTICALSCIENCE,2005,203223230)案例辨析6个选择均不正确。(1)可能犯类错误。(2)1是表示在无效假设成立的条件下,犯类错误的概率。(3)可能犯类错误。(4)1是表示在无效假设成立的条件下,犯类错误的概率,而不是推论备择假设为真的概率是99。(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是。P(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;199是指无效假设成立的条件下不犯错误的概率是99。正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为。P案例52某工厂生产的某医疗器械的合格率多年来一直是800。最近从该厂一次抽取20个该器械检测,合格13个,计算得到合格率为650;一周后又抽取15个器械检测,合格10个,计算得到合格率为667,分别进行检验,得到两总体率相等的结论,Z表明合格率没下降,两个合格率的平均值为6585,进行检验,得到两总体率不等的结论,表明合格率下降了。请对这一结论发表你的意见。案例辨析不正确,因为分别用20和15的两个小样本计算的样本频率与总体概N率800比较,进行两次检验,样本量太小,检验功效太小,不能得到总体概率不等的Z结论。正确做法加大样本量,对样本频率所代表的总体概率与已知总体概率800进行假设检验,具体方法从略。(样本量的估计见本书第15章样本含量估计)第6章两样本定量资料的比较案例辨析及参考答案案例61为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了以下资料术前(24例)315300286397452203373240362205231290331352289264259238304316279330340327术后(12例)203223311922151832302821(1)有人采用了两独立样本的检验,结果1592,34,0017甲药与乙药、甲药与丙药之间差异有统计学意义,而乙药与丙药之间差异无统计学意义。即甲药杀灭钉螺效果好于乙药与丙药,而乙药与丙药之间效果接近。另外,可以看出,参数检验的检验功效高于非参数检验。第8章定性资料的比较案例辨析及参考答案案例81某单位调查了4类人员乙型肝炎表面抗体(HBSAB)的阳性率,想比较3种病人与健康人群的阳性率有无差别,数据见教材表814。教材表8144类人员乙型肝炎表面抗体(HBSAB)的阳性率组别阳性人数阴性人数合计阳性率/肝癌病人肝炎病人食管癌病人健康人1718531591601421511761781471549661011340195合计43612655656请大家对本案例讨论如下问题(1)若看成一个42列联表资料进行1次检验,是否能达到分析目的2(2)若将每一种病人与健康人群HBSAB的检查结果分别组成四格表,进行3次四格表检验,对否(3)怎样达到分析目的案例辨析(1)因为分析目的是“想比较3种病人与健康人群的阳性率有无差别”,进行1次检验,不能达到分析目的。2(2)独立地进行3次四格表检验是不妥的,因为那样做会增大犯假阳性错误的概2率。正确做法(1)就本例而言,对于这个4组二分类资料,当小于5的理论频数的个数少于总格子数的1/5时,适合用一般检验进行总的分析。其结果是141489,000222P7005,4类人员HBSAB阳性率之间的差别有统计学意义。(2)接着作两两比较,原作者较关注3种病人与健康人的HBSAB比较,其阳性率是否有差异,因此只需比较3次。但每次比较,对应的检验水准应作调整(见后)。(3)为了达到前述的统计分析目的,又使犯假阳性错误的概率不增加,应当对每个四格表资料进行假设检验时降低检验水准,即取。于是,肝癌308205/病人和健康人比较85779,0003400083;肝炎病人和健康人比较2P292883,0002300083;食管癌病人和健康人比较0180P校27,0670700083。因此可以认为,肝癌病人、肝炎病人和健康人的HBSAB阳性率有差异,而不能认为食管癌病人和健康人的HBSAB阳性率有差异。(说明检验通常2为单侧检验,所以,校正的应等于,这里为两两比较的总次数)2/C案例82在论文果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效观察中,为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,将患者随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞磷胆碱。治疗效果分为无效、有效和显效三种结果(教材表815)。教材表815观察组与对照组的疗效比较疗效(例数)组别显效有效无效合计观察组584418120对照组564335134合计1148753254原作者采用列联表的专用检验公式,结果是474,005,认为两组疗效22P之间的差异有统计学意义。请大家对本案例讨论如下问题(1)原作者的分析目的是什么选用检验的问题在哪里2(2)什么情况下可以选用检验2(3)本问题应选用的统计分析方法是什么为什么要选择这样的方法案例辨析分析目的为“比较观察组与对照组治疗新生儿缺氧缺血性脑病的疗效有无差异”;选用检验不能达到前述的分析目的,因为此检验法与疗效的有序性没有任何2联系。正确做法(1)如果仅关心两个实验分组中的患者在三个疗效等级上的人数分布是否相同,此时,可以选用检验。2(2)本例的定性资料属于“结果变量为有序变量的单向有序的23列联表资料”,为了实现前述的统计分析目的,应选用秩和检验。本例采用秩和检验进行统计分析,00936。尚不能得出两组疗效之间的差异有统计学意义的结论。78102HCP案例83某研究者欲比较食管癌TNM分期的某种基因蛋白阳性表达率有无差异,收集了食管癌A期患者7例、B期患者10例、期患者23例,检测了某种基因蛋白的阳性表达例数()分别为3、8和21例。研究者考虑食管癌的TNM分期是有序变量,因此X运用秩和检验处理资料,结果61191,00134(教材表816),差异有统计学CHP意义。教材表816食管癌TNM分期的阳性表达情况与秩和检验结果食管癌TNM分期NN/XCHPA73/7B108/1061191001342321/23请大家对本案例讨论如下问题(1)原作者的分析目的是什么在此目的下应选择的统计分析方法是什么(2)在什么情况下可以选用秩和检验案例辨析原作者盲目选择秩和检验处理了该资料。原作者的分析目的是“食管癌TNM分期在某种蛋白的阳性表达率方面有无差异”;为实现此分析目的,首先应弄清这是一个什么样的列联表资料。食管癌TNM分期这个有序变量是“原因变量”,不是“结果变量”,结果变量为“是否阳性”,故此定性资料可以被视为“双向无序的32列联表资料”。正确做法以采用一般检验或FISHER精确检验(若小于5的理论频数的个数小于2总格子数的1/5)处理资料为宜。可将教材表816整理成案例表81,因为有3个理论频数小于5,故采用FISHER精确概率法进行计算更合适,结果是00172,可以认为食P管癌TNM不同分期某种蛋白的阳性表达率之间的差异有统计学意义。案例表81食管癌TNM分期的某种蛋白阳性表达情况食管癌TNM分期阳性例数阴性例数合计A347B821021223合计32840但当结果变量为多值有序变量,且希望比较各期患者在结果上的差别是否具有统计学意义时,需要选用秩和检验。本例,原作者对原因变量“赋值或打分”,采用秩和检验是没有意义的。第9章关联性分析案例辨析及参考答案案例91有研究者以“正常血糖、糖耐量减低及2型糖尿病人群胰岛素抵抗与非酒精性脂肪肝的相关分析”为题,研究了非酒精性脂肪肝的患病率与糖尿病分级(即正常血糖、糖耐量减低和2型糖尿病三级)的关系。以正常血糖者、糖耐量减低者和2型糖尿病患者为研究对象,年龄、性别可比,无大量饮酒史、肝炎史,脂肪肝的诊断以影像学结果为准。指标以均数标准差表示,统计分析采用两组独立样本比较的T检验。结果发现,三组血糖、胰岛素、血脂水平等和脂肪肝患病率差别有统计学意义(数据及统计结果见教材表97),糖耐量减低组与正常血糖组比较P005,2型糖尿病组与糖耐量减低组比较P005。结论,随着正常血糖向糖耐量减低及糖尿病发展,血糖、血脂、胰岛素抵抗指数及脂肪肝患病率等指标值皆升高并逐渐加重,差异有统计学意义,认为脂肪肝患病率与血糖水平、血胰岛素、血脂、胰岛素抵抗、糖耐量减低和2型糖尿病等成正相关。教材表97三种血糖水平人群的血生化及脂肪肝患病率血糖/1LMOL胰岛素/1OL组别例空腹餐后空腹餐后三酰甘油/1LMOL总胆固醇/1L胰胰素抵抗指数/1LMOL脂肪肝患病率/正常血糖87500556107418248090330090605483糖耐量减低626505821311427134582110460812076942型糖尿病688326125341683211444261551081907838经检验,糖耐量减低组与正常血糖组比较,以及2型糖尿病与正常血糖组比较,各指标比较的值TP均005。结论为各月份的出院患者数差异无统计学意义。试对此分析发表评论。教材表229某医院口腔科19941998年出院的农村患者数月份年度123456789101112199467911119859711101995144151394795107121996956146997651051997133910346121051010199805108962494126案例辨析与正确做法若将资料看作1月12月共12个组的独立样本,显然不能利用先后获得的观察结果间的关联性。根据原始观察值求出如下谱密度图(案例图221,横坐标、纵坐标均已换为算术尺度。对该例的谱峰作假设检验的过程见方积乾主编现代医学统计学(2002,人民卫生出版社)第253页。结论为原始时间序列存在周期性的活动。6050403020100PERIOD4035025015DENSITYWINDOWTUKYHAMING5案例图221农村患者数时间序列的谱密度图案例222周期图和谱密度图可以刻画时间序列在频域空间的特征,谱密度图相对于周期图而言,能克服谱峰分裂造成的假象,故有人认为周期图本身没有应用价值。如果某实例分析中在谱密度图的T4(月)、T45(月)、T12(月)处均有峰值出现,则结论是原始序列一定存在4个月、45个月和12个月的周期性活动成分。请对以上观点发表评述。案例辨析与正确做法如教材2242的结尾段落所述,对周期性活动的最终确定尚需假设检验的支持,而不能直接根据谱密度图或周期图直接下结论。假设检验的统计量计算,需要借助周期图各处的曲线高度。所以,不可以认为周期图没有应用价值。第23章遗传数据基因定位的统计方法案例辨析及参考答案案例231为了研究糖尿病与标记位点P的关系,某研究者进行了病例对照研究,共640例,数据见教材表2318。教材表2318299例病例与341例对照的性别及基因型频数分布男女人群PP,PPPP合计PP,PPPP合计病例43367916555220对照5347100130111241合计9683179295166461对于该资料,研究者首先分析病例组与对照组的性别构成是否有差异,用检验20667,P0414。EO221因此,可认为病例组与对照组的性别构成无差异,两组性别均衡。因此,下面只考虑基因型对疾病的影响。合并教材表2318中的男女性别相应的基因型数据,得教材表2319。教材表2319299例病例与341例对照的基因型频数分布基因型人群PP,PPPP合计病例20891299对照183158341合计391249640仍采用检验,得216943,P0000。EO221因此,按005的检验水准,可认为位点P与糖尿病关联。请讨论(1)该资料的分析方法是否合适为什么(2)应该如何分析该资料案例辨析从教材表2318的数据分析,虽然病例组与对照组的性别构成均衡,但分别分析男性组、女性组的糖尿病与标记位点P的关系,经2检验,发现2值分别为00363,221334,P值分别为0848900001;或者按性别进行分层分析,值的BRESLOWORDAY齐性检验2值为59404,P值为00148,认为不齐。因此,性别与标记位点之间存在交互作用,即在不同性别下,标记位点对疾病的影响不一致,从而不能把男女性别合并后相应的基因型数据表进行分析。正确做法宜分性别分析男性组、女性组的糖尿病与标记位点P的关系,或者采用LOGISTIC回归模型把交互作用项引入模型。第24章基因表达谱分析的生物信息学方法案例辨析及参考答案案例241为实现对某种疾病的判别诊断,现用已知疾病样本和正常样本作为训练样本构建决策森林分类器,共包含10个决策树,所采用的终止规则为指定树的深度。用该分类器对某未知样本进行分类决策,得到教材表242结果,表示未知样本被决策为疾病1P类的概率,则表示被决策为正常类的概率。请根据教材表242结果对该未知样本进行2P最终决策。教材表242各个决策树对未知样本的决策结果DT1PDT1P210900106094006209500570480523046054808801240490519046054504006010047053根据教材表242所显示结果可对未知样本采用近似投票法,即根据每一个决策树对该未知样本的决策结果将该样本近似判别为优势类,并对所诊断的类别计数,这样将该样本判别为疾病优势类的票数为4,即090、095、094、088时所对应的优势类。同理可1P得到该样本被判别为正常优势类的票数为6,即054、051、060、052、054、053时2所对应的优势类。最后根据不同优势类的计票结果将该未知样本判别为正常类。试问(1)用上述思想对未知样本进行决策是否合理为什么(2)应该如何对该未知样本进行最终决策案例辨析用近似投票的思想分析不合理。因为这种思想只考虑优势类的数目,而未考虑优势类与非优势类之间的差异,在两者相差不显著的情况下认为未知样本就属于所谓的优势类,过于武断,会产生很大误差甚至错误。若构建决策树时每一个叶子结点中的样本都是单一类,是可以应用投票法进行决策的。正确做法应充分考虑样本被判别为优势类和非优势类的概率,采用后验概率进行决策,即分别计算未知样本被判别为两类的后验概率,设表示疾病类,表示正常类,则1C2C第一个决策树对未知样本决策为类和类的后验概率分别为1C21IXVCP21,KIXVCP9019012IXVC21,KIXVC同理可得到其他9个决策树对该未知样本判别为类和类的各个后验概率值,最后1C2对该未知样本进行综合决策TJIJICXVCPXG10164301TJIJIC102257因为,所以该未知样本最终应该判别为疾病类。21ICICXG第25章META分析案例辨析及参考答案案例251低胆固醇的干预治疗降低患者死亡风险的META分析。为探讨低胆固醇的治疗干预措施是否能降低患者死亡风险(主要指降低冠心病的死亡风险),SMITHD等搜集了34项随机对照临床试验,基本信息见教材表256。各纳入研究试验组采用的干预措施分为药物干预、饮食干预及外科干预三种。患者类型分为一级预防、二级预防及其他三种,即该纳入研究主要对已有心血管疾病的患者进行低胆固醇干预治疗的列为二级预防,主要对无心血管疾病的患者进行低胆固醇干预治疗的列为一级预防,非一级预防或二级预防的则列为其他。试对教材表256的资料进行META分析。教材表256低胆固醇干预治疗降低患者死亡风险的34项随机对照试验研究试验组患者数N1I对照组患者人数N2I试验组总死亡人数AI对照组总死亡人数CI优势比ORI优势比95CIFORORI权重WI校正后的权重WI干预方式患者类型120420228510480290791498743饮食二级预防228514770380930591471854821药物二级预防315611937400620361041383714药物二级预防4883023023004122136125药物二级预防5303303014001289043041药物其他627927661820660450972625944药物二级预防720620641550680431081826816饮食二级预防81231292024085045163920566饮食二级预防91080101511111309807412950031139饮食二级预防1042714381271000621611664782药物二级预防1124425331510580360941645778药物二级预防1250501712161068381518383药物二级预防1347482320133060297598425药物二级预防14306004021001395044043手术二级预防15555227891025723065058072326571411药物二级预防1642442217417809507312551511146饮食一级预防1719919428310860501501269682饮食二级预防1835036742480910581411979845药物二级预防19797845080022288232201药物二级预防201149112937480750491162036855药物一级预防2122123739281590942681415722饮食二级预防225426813110511883118110饮食二级预防23717257072023229289242药物二级预防2445414516269248108091129121911315饮食一级预防2542141749620760511132398913手术二级预防26949401033001820037036药物二级预防273113171912163079337725486药物二级预防2819061900687109506813433701026药物一级预防292051203044431010661552152875药物一级预防3065821663333243081731316260药物一级预防315331529623618113110715998721283药物一级预防32484901033001839037036药物其他339452101680074210037036药物二级预防34232912073009599087082药物二级预防(1)该META分析的效应指标为优势比。先进行异质性检验,由教材表256数据计算每个研究的效应及权重(若纳入研究试验组或对照组的总死亡人数为0,LNIIYORIW按05计算OR值)。再由式252计算Q统计量,Q8823,P00001,表示研究间存在异质性,采用随机效应模型DL法进行效应合并。(2)由式2524计算异质性校正因子D,即研究间方差的估计,可得D0068。再由式2523,根据D值及各纳入研究的权重,计算各纳入研究校正后的权重WI。IW(3)由式2525及2526,可得到合并效应值的点估计与区间估计,合并为OR089,合并的95CI为078,102,95CI包含1,因此,尚不能认为低胆固醇的干OR预治疗能降低患者的死亡风险。请讨论上述META分析方法是否合适结论是否准确为什么如何对上述资料进行META分析案例辨析与正确做法(1)该META分析纳入了34项RCT,异质性检验拒绝H0,即研究间存在异质性。采用二分类变量随机效应模型的DL法进行效应合并,从方法学上看并没有什么不妥,但对有异质性的研究,应考察异质性的来源。从教材表256提供的信息看,这34项RCT的干预类型有药物干预、饮食干预及手术干预三种,患者的类型也有一级预防、二级预防及其他三类。因此,不考虑纳入研究在干预措施及患者类型等方面的差异,直接进行效应合并,并据此得出的结论是不准确也不可靠的。比较可靠的方法是对这34项研究进行亚组分析。(2)按干预类型进行亚组分析,考察不同干预措施对META分析的结果是否有影响(手术干预的两项研究不作分析)。用REVMAN软件对9项低胆固醇饮食干预的研究进行META分析,结果见案例图251。异质性检验P003,研究间仍有异质性,故采用随机效应模型进行效应合并。合并OR为092,合并OR的95CI为075,121,95CI包含1,因此,尚不能认为低胆固醇饮食干预能降低患者的死亡风险。对23项低胆固醇药物干预的研究进行META分析,结果见案例图252。异质性检验P000001,可见研究间异质性很大,采用随机效应模型。合并OR为089,合并OR的95CI为073,101,95CI包含1,因此,尚不能认为低胆固醇药物干预能降低患者的死亡风险。案例图251低胆固醇饮食干预META分析结果案例图252低胆固醇药物干预META分析结果从亚组分析的结果看,不同的干预措施对META分析的结果没有影响,低胆固醇饮食干预与低胆固醇药物干预的合并OR的95CI均包含1,因此,尚不能认为低胆固醇干预治疗能降低患者的死亡风险。另一方面,异质性检验表明,亚组内的研究仍有异质性,因此,干预方式不是导致研究间异质性的主要原因,需要进一步探讨异质性的来源。(3)按患者类型进行亚组分析,分别考察对一级预防与二级预防的患者(患者类型为其他的两项研究不作分析)低胆固醇干预治疗降低死亡风险的META分析结果是否有差异。用REVMAN软件对患者类型为一级预防的7项研究进行META分析,结果见案例图253,异质性检验P012,可以认为研究间异质性不大,故采用固定效应模型进行效应合并。合并OR为109,合并OR的95CI为098,121,95CI包含1,因此,对一级预防患者(即对无心血管疾病的患者),尚不能认为低胆固醇干预治疗能降低患者的死亡风险。对患者类型为二级预防的25项研究进行META分析,结果见案例图254。异质性检验P002,研究间仍有异质性,采用随机效应模型进行效应合并。合并OR为081,合并OR的95CI为070,094,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 14996-2025变形高温合金冷轧板材和带材
- 2025年汽车行业智能驾驶技术发展前景预测报告
- 2025年区块链技术应用前景分析报告
- 2025年互联网金融行业全球市场前景研究报告
- 2025年信息技术行业区块链技术应用前景展望研究报告
- 2025年石墨烯行业技术应用与市场前景研究报告
- 2025年网络安全行业量子安全技术应用前景研究报告
- 崇左市2025广西崇左市江州区自然资源局招聘2人笔试历年参考题库附带答案详解
- 宁波市2025年浙江宁波财经学院公开招聘工作人员12名笔试历年参考题库附带答案详解
- 国家事业单位招聘2025国家海洋环境监测中心招聘拟聘事业编制人员(第一批)笔试历年参考题库附带答案详解
- 国开电大《工程数学(本)》形成性考核作业5答案
- 部编版五年级上册语文教案1-6单元(表格式)
- GB/T 4798.5-2007电工电子产品应用环境条件第5部分:地面车辆使用
- GB/T 4513-2000不定形耐火材料分类
- 12YJ6 外装修标准图集
- 阅读与思考(选学)为什么要证明课件
- HPLC高效液相色谱解读课件
- 中医诊断学望诊
- DN1000顶管施工方案
- 《外科学》第七节 直肠癌
- DB32∕T 2975-2016 水运工程建设管理用表
评论
0/150
提交评论