统计学对医学的贡献.doc_第1页
统计学对医学的贡献.doc_第2页
统计学对医学的贡献.doc_第3页
统计学对医学的贡献.doc_第4页
统计学对医学的贡献.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学对医学的贡献 统计在医学上的应用 Theapplicationofstatisticsinmedicine 西医在上个世纪对人类的最大贡献就是发现了抗生素。 Westernmedicineinthelargestcontributiontothehumanisthediscoveryofantibiotics.抗生素是治疗所有细菌性疾病的最佳武器,但是在治疗肺结核时却遇到了点小麻烦。肺结核史称“白色瘟疫”,是一种很厉害的传染病。人类虽然早在1885年就分离出结核杆菌,但很长一段时间内医生们拿它毫无办法,病人只有寄希望于自己的免疫系统足够坚强。 Antibioticsisthebestweapontotreatbacterialdiseasesall,butwhentheymetalittletroubleinthetreatmentoftuberculosis.Historyoftuberculosiscalledwhiteplague,isakindofverysevereinfections.Humanalthoughisolatedmycobacteriumtuberculosisasearlyas1885,butthedoctorstakeitforalongtimethereisnoway,thepatientonlyhopethatyourimmunesystemstrongenough. 最先被发现对肺结核有效的抗生素是链霉素。可是,和青霉素不同的是,使用链霉素的肺结核病人的病情经常会反复,医生们一直搞不懂到底是为什么。 Thefirstwasfoundfortuberculosisiseffectiveantibioticsstreptomycin.But,unlikethepenicillin,usingstreptomycintuberculosispatientsoftenrepeated,doctorshavebeendontunderstandwhy. 揭开谜底的是一个名叫布拉德福德?希尔(BradfordHill)的生物统计学家。此人出生于英国的一个医生世家,小时候立志要子承父业,却因第一次世界大战的缘故被迫加入空军。服役期间他得了肺结核,幸运的是他的免疫系统足够坚强,侥幸逃过一劫。不过他元气大伤,当医生的幻想破灭了,只好改行学习经济学,并因此而获得了大量的统计学知识。 TouavelthewasamannamedBradfordHillbiostatistician(BradfordHill).ThispersonwasborninadoctorsfamilyinBritain,asachildtofollowthem,butbecauseofthefirstworldwarwasforcedtojointheairforce.Serviceduringtheperiodhehadtuberculosis,fortunatelyhisimmunesystemwillbestrongenoughtogetoffthehook.Hebroadcastnearlyeviscerated,however,whenthedoctordisillusion,hadtoreroutedtostudyeconomics,andacquiredalotofstatisticalknowledge. 希尔的恩师格林伍德是个非常聪明的学者,他认为现代医学必须运用统计学的方法才能保证治疗的准确性。要知道,当时的西方医学骨子里和中医一样,仍然属于“经验医学”,医生们更愿意相信自己多年临床积累的经验,而不是客观的科学实验。格林伍德则不然,他本人精通统计学,非常推崇1935年出版的一本名为怎样设计科学实验的教科书。这本书的作者运用统计学原理,提出了一整套设计科学实验的方法和原则。 Hillsteachergreenwoodisaverycleverscholar,hethinksthatmodernmedicinehastousestatisticalmethodstoensuretheauracyofthetreatment.Wanttoknow,justlikeChinesemedicine,westernmedicineatthattimehisbonesarestillbelongtoexperienceofmedicine,doctorsaremorewillingtobelieveinyourselfformanyyearsclinicalexperience,ratherthananobjectivescientificexperiments.Greenwood,otherwise,heisproficientinstatistics,in1935 / publishedabookcalledhowtodesignscientificexperimenttextbooks.Theauthorofthebookusingthestatisticstheory,putforwardasetofmethodsandprinciplesofdesignscience experiments. 1945年,格林伍德从伦敦卫生学校首席教授的职位上退休,他推荐希尔做为自己的接班人。就这样,一个没有受过科班训练的统计学家当上了医学院的教授。次年希尔被邀请加入了肺结核试验委员会,这个委员会的主要任务就是检验链霉素到底能不能治疗肺结核。 In1945,greenwoodretiredfromthepositionofchief,aprofessorattheLondonschoolof hygieneandheremendedhillashissuessor.Inthisway,onehadnoregulartrainingonthestatisticalpropertyofthemedicalschoolprofessor.Hillwasinvitedtojointhetuberculosistestboardthefollowingyear,themaintaskofthismitteeisinspectionstreptomycincancuretuberculosis. 要知道,青霉素刚被用于临床时根本不会有人想到要去检验它的有效性,因为病人服药后几天内就见效,临床效果好得惊人。可是肺结核杆菌外表有一层厚厚的黏膜,链霉素不容易接触到它,因此病人往往需要连续注射几个月链霉素才能见效。即使如此,当时的英国医学界仍然认为没必要进行什么科学检验,只要多找几个病人,观察一下疗效就可以了。 Justwanttoknow,penicillinwasusedforclinicalpurposeswontsomeonethinkofgoingtotesttheeffectivenessofitbecausemedicationwithindaysaftertheeffective,clinicaleffectisgood.Buthaveathicklayerofmucousmembranetuberculosisbacillusappearance,streptomycinisnoteasytoeintocontactwithit,sothepatientoftenrequirecontinuousinjectionof streptomycintoworkafewmonths.Evenso,thethenBritishscientificinspectionofthemedicalprofessionstillthinkdontneedto,aslongasfindafewmorepatients,andobservethecurativeeffectisok. 做为一个外行,希尔不信邪,他坚持必须先进行一次科学试验来验证链霉素的有效性。正好当时英国刚刚从二战中走出来,国库空虚,买不起那么多链霉素大量供应给医院,专家们只好同意先进行一次小规模临床试验,并请希尔来设计试验方案。希尔找来108名患者充当“试验品”,其中54人服药,52人做为对照。但究竟谁服药谁对照,完全是随机选取的,就连主治医生也不知道谁是谁,这个方法是希尔对现代医学所做的最大的贡献,他认为医生的主观印象会影响试验的准确性,必须随机取样,并用统计学的方法对结果进行分析。 Asalayman,hillsspirit,heinsistedthatmustfirstbeascientificexperimentwascarriedouttoverifytheeffectivenessofstreptomycin.Britainhadjustwalkedoutoftheworldwarii,emptycoffers,cantaffordsomuchstreptomycinplentyofsuppliesforhospitals,expertshadtoagreetoasmallclinicaltrials,andhilltodesigntestplan,please.Hillto108patientsasexperiment,amongthem54people,52peopleascontrol.Butwhomedicinewhocontrol,pletelyisrandomlyselected,evendoctorsdontknowwhoiswho,thismethodishilldidtomodern medicinesgreatestcontribution,hethinkthatthedoctorssubjectiveimpressionwillaffecttheauracyoftest,mustberandomsampling,andstatisticalmethodstoanalyzetheresults. 半年后,服药的病人中有28人病情明显好转,对照组却有14人死亡,显示链霉素确实有效。假如事情到此结束的话,希尔的贡献也许就不值一提了。可是,3年后,服药组有32人死亡,对照组则死了35人,两者几乎不存在统计意义上的差别。这一惊人的结果 / 让医生们得出结论:链霉素确实有效,但是一段时间后细菌会产生抗药性。假如当初没采用希尔的建议,那么医生们决不会那么快就得出这个结论。 Ofpatientsaftersixmonths,thereare28peopleconditionimprovedmarkedly,thecontrolgroupthereare14peoplearedead,aordingtostreptomycinreallyworks.Ifthingstothisend,hillscontributionmaybeinsignificant.Threeyearslater,however,medicationgrouphas32 peoplewerekilledandthecontrolgroupdied35people,almostthereisnostatisticalsignificancedifference.Thissurprisingresultletdoctorsconcludedthatstreptomycinreallyeffective,butthebacteriawilldevelopresistanceafterperiodoftime.Ifdidnotadopthillsadvice,sothedoctorsneverreachedthisconclusionsoquickly. 一旦找出原因,解决办法自然很快就想出来了,那就是在使用链霉素的同时。再让病人服用另一种药物。这个药很快就找到了,这就是“对-氨基水杨酸”(PAS)。这种药单独使用时疗效并不高,但医生们希望两种药结合使用能对付细菌的抗药性,理由很简单:假如病菌对每种药物的抗药性产生几率都是1,那么同时产生两种抗药性的几率就是 1/10000。试验结果验证了这一理论的正确性,链霉素+PAS的方法使结核病人的存活率上升到了80。 Oncefindoutthereasonandsolutionnaturallywanttoeoutsoon,thatisatthesametimeofusingstreptomycin.Letpatientstakinganotherdrug.Thismedicinewillsoonfindit,thatisto-aminosalicylicacid(PAS).Thismedicinecurativeeffectislowwhenusedalone,butdoctorshopethattwokindsofdrugsusedinbinationcandealwithbacterialresistance,thereasonissimple:ifgerms,drug-resistantstrainsofeachourrenceprobabilityis1%,thenatthesametimeproducetwokindsofdrugresistancerateis1/10000.Experimentalresultsvalidatethecorrectnessofthetheory,methodofstreptomycin+PASthatTBpatientssurvivalrateincreasedto80%. 后来又有几种新药被发现,医生们又按照希尔的方法进行了几次试验,证明3种药物合用的疗效比两种药物还要好很多。如果三种药物持续用上2年的话,结核病的治愈率几乎可以达到100。人类终于宣布攻克了“白色瘟疫”。 Thenthereareseveralkindsofnewdrugswerefound,doctorsandseveraltestshavebeencarriedoutaordingtohillsapproach,toprovethecurativeeffectofthreekindsofmedicinesalotbetterthanthetwodrugs.Ifthethreedrugsforlast2years,thecurerateofTBcanreachalmost100%.Humanfinallyannouncedtooverethewhiteplague. 希尔采用的这一方法叫做“随机对照试验”(RandomisedControlledTrial),这种方法很快就成为医学研究领域的标准试验方法,目前所有已知的西药必须经过这种方法的检验才能上市。从此,西医从经验医学时期进入了实证医学的时代。 Hill,usingamethodcalledrandomizedControlledtrials(RandomisedControlledtrials),thisapproachquicklybecameastandardtestmethodinthefieldofmedicalresearch,atpresentalltheknownwesternmedicinemustpassthroughtheinspectionofthismethodtothelisted.Sincethen,westernmedicinefromexperienceperiodhasenteredtheeraofevidence-basedmedicine. 至此,希尔的故事还远未结束。1947年,英国医学研究委员会又给希尔布置了一个新的任务:找出肺癌和吸烟之间的关系。那一年英国的肺癌死亡率比25年前提高了15倍,这个数字引起了广泛的关注。大家都想找出其中的原因,有人说这是因为工业化造成的空 / 气污染,还有人说这是由于新式柏油马路散发的有毒气体,只有少数医生怀疑是吸烟造成的。 Atthispoint,hillsstoryisfarfromover.In1947,theBritishmedicalresearchcouncilagaingavehillanewtask:findouttherelationshipbetweensmokingandlungcancer.Thatyear Britainslungcancermortalityis15timeshigherthan25yearsago,thatfigurehascausedwideattention.Everyonewanttofindoutthereason,someonesaysthisisbecauseindustrializationcausedbyairpollution,otherssayitisbecauseofthenewasphaltissendingoutpoisonousgases,onlyahandfulofdoctorssuspectedtobecausedbysmoking. 众所周知,两次世界大战造就了大批吸烟者,据统计,英国当时有超过90的成年男子都是香烟的瘾君子。正是因为吸烟人数实在太多,希尔犯了难。他不可能去统计得肺癌的人当中抽烟的有多少,不抽烟的有多少,因为他几乎找不到不吸烟的人。 Asisknowntoall,thetwoworldwarshasproducedalargenumberofsmokers,aordingtostatistics,theUKwasmorethan90%oftheadultmaleaddictsarecigarettes.Becauseoftoomuchsmoking,hillmadedifficult.Hewontbeabletogetlungcancerstatisticsofsmoke,howmany,howmanydontsmoke,becausehealmostcouldntfindapeoplewhodontsmoke. 怎么办呢?希尔想出了一个变通的办法。首先,他做了个合乎情理的假设:如果吸烟确实能引起肺癌,那么吸烟越多的人得肺癌的几率就越大。其次,他认为必须排除其它的致癌因素,比如空气污染,初次吸烟年龄,居住环境等等。换句话说,他必须找出一群人,其它方面都比较相似,只有吸烟的量不同。 Howtodo?Hillcameupwithanalternativesolution.Firstofall,hemadeareasonable assumption:ifsmokingcancauselungcancer,sothemorepeoplesmoking,thegreatertheriskoflungcancer.Second,hethinkmustruleoutothercarcinogenicfactors,suchasairpollution, smokingageforthefirsttime,livingenvironmentandsoon.Inotherwords,hemustfindagroupofpeople,otheraspectsaresimilar,onlytheamountofsmokingisdifferent. 1948年,他从伦敦的医院里找出了649个肺癌病人,以及同样数量的情况相似的其它病人。然后他雇佣了一批富有经验的调查人员,挨个询问病人的吸烟史,把结果做成了一个统计表。结果显示,肺癌病人中有99.7的人吸烟,其它病人则有95.8是瘾君子。这两个数字当然说明不了什么问题,可当他把病人按照吸烟数量的多少分成不同的组之后,情况发生了变化。有4.9的肺癌病人每天吸50支烟以上,而只有2.0的其它病人每天吸这么多烟。也就是说,吸烟越多的人患肺癌的几率就越大。 In1948,hewasfromthehospitalinLondonfound649lungcancerpatients,andthesamenumberofsimilartothatofotherpatients.Thenhehiredagroupofexperiencedresearchers,eachaboutthepatientssmokinghistory,theresultsmakeaTAB.Resultsshowedthatlungcancerpatients,99.7%ofpeoplesmoking,otherpatient95.8%aredrugaddicts.DoesntmeanalltheNumbers,ofcourse,whatistheproblem,butwhenheputthepatientsintodifferentgroupsaordingtohowmuchthenumberofsmoking,thesituationhaschanged.4.9%oflungcancerpatientssmokefiftycigarettesadayormore,whileonly2.0%ofthepatientswithothersuctionsmokesomucheveryday.Thatistosay,themorepeoplesmoking,thegreaterthechanceofdevelopinglungcancer. 1950年,希尔把这个实验结果发表在英国医学杂志上,首次科学地证明了吸烟和肺癌的对应关系。但是这个结果相当微妙,不懂统计学的人很难理解其中的重大意义。为 / 了进一步说明这个问题,希尔又设计了一个全新的实验。他给6万名英国医生发了封调查表,请求他们把自己的生活习惯和吸烟史详细记录下来寄还给他。之所以选择医生做为调查对象,是因为希尔相信医生们对自己生活状况的描述能力肯定比普通老百姓更精确,也更诚实。 Thehill,in1950,theexperimentalresultspublishedintheBritishmedicaljournal,forthefirsttimescientificallyprovedthecorrespondingrelationshipbetweensmokingandlungcancer.Buttheresultisquitedelicate,donotknowthestatisticsitisdifficulttounderstandthe significanceofthem.Tofurtherillustratetheproblem,hillanddesignanewexperiment.Hesent60000Britishdoctorsquestionnaire,askthemtoputtheirownlifestyleandsmokinghistorydetailsdownandsenditbacktohim.Choosedoctorasinvestigationobject,becausehillbelievedoctorsabilitytodescriptionsoftheirlivingconditionsmustbemoreauratethanordinarypeople,andmorehonest. 有4万名医生寄回了调查表。希尔把他们按照吸烟数量进行了分类,并要求他们(或者他们的家属)及时汇报自己的健康状况。2年半后,有789名医生因病去世,其中只有36人死于肺癌。但是当他把医生们的吸烟量和发病率联系起来后,发现只有肺癌的死亡率和吸烟量有对应的关系,其余疾病都和吸烟量没有任何关联。比如,每天吸25克烟草的人的肺癌死亡率比每天吸1克烟草的人多2倍以上,而其它疾病的死亡率前者只比后者多20。 Thereare40000doctorssentbackthequestionnaire.Hillputthemaordingtothenumberofsmokingareclassified,anddemandedthatthey(ortheirrelatives)inatimelymannertoreporttheirhealth.Aftertwoandahalfyears,thereare789doctorsduetoillness,diedonly36peoplediedoflungcancer.Butwhenheputthesmokingandtheincidenceofdoctors,foundthatonlythemortalityoflungcancerandsmokinghaveacorrespondingrelation,therestofthediseaseisassociatedwithsmokingdoesnthaveany.Everyday25gramsoftobao,forexample,thelungcancerdeathratesthansmokingeverydaypeoplemorethan2timesmorethan1gramoftobao,andotherdiseasemortalityoftheformeronly20%morethanthelatter. 1993年,大约有2万名当初接受调查的英国医生去世了,其中有883名医生死于肺癌。如果把他们的吸烟数量和肺癌发病率联系起来的话,就可以得出一个惊人的结论:每天吸25根烟以上的人得肺癌的几率比不吸烟的人多25倍!后来其它一些类似的研究也都得出了相似的结论。现在,吸烟和肺癌的关系已经是家喻户晓了,发达国家的烟民数量正在逐年下降,其肺癌的发病率也呈现出下降的趋势。那些因为戒烟而免于肺癌的人真应该感谢希尔当初所做的贡献。 In1993,about1993hadsurveyedtheBritishdoctordied,ofwhich883doctorsdeathfromlungcancer.Iftheirnumberandincidenceoflungcancerlinkedtosmoking,youcangeta surprisingconclusion:suckpeopleover25cigarettesadayriskoflungcancerthannon-smokersmorethan25times!Latersomeothersimilarstudieshavefoundsimilarresults.Now,the relationshipbetweensmokingandlungcancer,itwasalreadyahouseholdname,thenumberofsmokersindevelopedcountriesarefallingyearbyyear,theincidenceoflungcanceralsopresentadownwardtrend.Thosefromlungcancerbecauseofsmokingthecontributionwhichreallyshouldthankhillatthebeginning. 希尔使用的第一种方法叫做“对照研究”(CaseControlStudy),第二种方法叫做“定群研究”(CohortStudy)。这两种方法是目前群体医学研究领域最常用的两种生物统计学方 浅析医学文献中常见的统计学问题 【摘要】目的:分析医学文献中常见的统计学问题;方法:小组成员分别寻找各文献中的统计学错误,共同讨论并提出正确改正方法;结果:本组发现目前医学文献中仍存在不少统计学错误,包括统计图表的设计不当、资料处理方法的选择不当、统计结论错误、未作统计学分析等等,对论文质量造成了影响;讨论:医学文献中的统计学错误,从根本上来说是作者自身对统计学原理的认识不清造成的。因此,各医学工作者应全面系统地学习其理论,真正地理解并掌握统计学方法。 【关键词】医学文献统计学错误 医学科研论文是进行科研交流的重要形式,也是反映医学科研成果的主要载体,读者能够通过一篇严谨、科学的科研论文了解作者在该领域中所做的工作,进而科学地判断和评价研工作的水平及研究结论的可信度。然而,本小组在一些医学文献中发现了不少统计学方面的错误,它们妨碍了作者得到正确的结论,影响了论文的质量。本文把发现的这些错误拿出来供大家一起讨论,以期共同探讨与学习。 本组把发现的统计学应用错误分为以下几类:统计图表的设计不当、资料处理方法的选择不当、统计结论错误、未作统计学分析和其它类。下面我们将分别对各类错误进行简要讨论。(1) 1.统计图表的设计不当 统计表和统计图是描述资料特征、呈现统计分析结果的重要工具,一份好的统计表能够简明扼要地表达资料的特点;一份好的统计图能够准确、直观地呈现统计结果,给读者留下深刻的印象。然而,在阅读文献中我们却发现了各种瑕疵,影响了读者对文献的理解,如标题过于简单、缺少标目、未注明单位、主谓语安排混乱等等。例一(2): 本表中不但缺少第一列纵标目和单位,还存在标目表述简单,小数点位数不相同,缺少合计的分割线等问题。改正后为: 表2高考生睡眠时间的分布统计 男女合计睡眠时间(h)人数百分比(%)人数百分比(%)人数百分比(%) 6196.693010.60498.64714551.4114350.8328950.9789933.459332.8618833.169227.75144.95366.351020.7031.0650.88合计284100.00283100.00567100.00通过统计表,可以使数据简单明了,层次清楚,便于进一步的计算、分析、比较。一张准确简洁的统计表能反映作者扎实的理论基础和严谨的工作态度,不能马虎了之。 2.资料处理方法的选择不当 资料处理方法的选择直接关系到实验结论的准确与否,然而我们仍然发现一些文献误用t检验、卡方分析,从而得到了错误的结论。 例二(3):误用卡方检验来分析单向有序资料 实验题目中药治疗小儿病毒性心肌炎的临床观察 研究方法将近年收治的病毒性心肌炎患儿分为中药治疗组及对照组,比较两组患儿的治愈率及无效率。 统计方法采用SPSS10.0软件进行统计学分析,计数资料采用卡方检验,P0.05为有显著性差异 分析结果如图 本组讨论:本类资料属于等级变量资料。欲比较两组的疗效是否有差别,作者误用一般的行列表的卡方检验,这显然是没有考虑到等级这个因素,可因此损失大量信息,检验效率不高,有时甚至得出错误结论。这是由于卡方检验只能说明各处理组结构是否均衡而不能检验效应是否有差别,如果对其中的两列不同疗效的数值进行调换,卡方值不会有变化,但秩和检验统计量有变化。所以,该资料应该采用利用等级信息较好的秩和检验或Ridit分析。 例三(4):多个处理组与对照组的比较用两组间的t检验 研究题目不同剂量丙种球蛋白治疗川崎病的临床疗效对比 实验方法118例川崎病(KD)患儿随机分为三组, 各组选用不同 的丙种球蛋白剂量,其他治疗相同。观测患儿退热、淋巴结肿大、黏膜充血消退、多形性皮疹及手足症状消退的时间及冠状动脉损害发生率,并进行统计学分析。 统计方法采用SPSS13.0分析软件进行统计分析,计量资料所有结果均用均数?标准差表示。组间比较采用t检验 分析结果如图(部分) 本组讨论:此组资料仅处理因素不同,而每个处理组均需相互比较,多组之间两两t检验会增加犯第一类错误的概率,超出事先确定的=0.05的控制范围。故应先用完全随机设计方差分析,再用Dun-t检验法或SNK法,而不能如原文简单地用成组资料的t检验。 3.统计结论错误 统计学方法对于科研工作者是必不可少的,但是有些论文作者只列出了原始数据,不经统计学处理,仅仅就原始数据进行分析讨论;或者在文中未提及所采用的统计学方法,而仅仅列出P值便称结果差异无显著性或差异有显著性,这些都是不能得到严谨科学的结论的。 例4(2) 研究题目浙江省567名高考生身体状况的调查研究 研究方法按考试排名抽取xx年浙江省参加高考的考生1100名,分为A(尖子生)B(中等生)C(落榜生)三个层次,通过调查问卷形式对其进行身心健康等一系列调查,实收问卷567份。 统计方法五点量表部分编码数量化,用SPSS10.0软件包进行统计分析。选择题部分采用百分比形式进行统计处理 分析结果如图(部分) 作者做出结论:A、B、C3个层次学生在身体状况这一层面上的平均得分分别为11.64、10.73、10.77,总体平均分为11.11,这表明3个层次学生的身体状况良好。经方差分析表明,3个层次的组间差异显著(P0.01);A层次学生的身体状况显著优于B、C层次学生的身体状况(P0.05),B层次和C层次之间没有显著差异。本组讨论:上述结果中P0.01只能说明“三组学生的身体状况不完全相同”具有统计学意义,而不能说其“组间差异显著”。三组之间两两比较未注明统计方法(例如SNK法或Dunt法),未注明统计量和P值,也不能因为A组的平均分比B、C组高就说A组“显著”优于B、C组。 一、平均水平常用的统计指标及其适用范围? 常用统计指标包括算术均数,几何均数,中位数。 算术均数适用于对称分布,特别是正态分布的数据; 几何均数适用于经对数变换后频数分布对称或呈等比级数的数据; 中位数主要适用于三种情形:?非正态分布资料(对数正态分布除外)。?频数分布的一端或两端无确切数据的资料。?总体分布不清楚的资料。 二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。例数太少会使相对数波动较大,这种情况下最好用绝对数表示。 2.正确计算合计率。计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率。 3不能以构成比代替率。构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度。 4.注意资料的可比性。在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。 5.样本率或构成比的比较应做假设检验。由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。 三、正常值范围与置信区间的区别 四、标准误与标准差的区别与联系。 五、简述四格表卡方检验统计方法的选择条件 六、行列表资料2检验的注意事项 1.行列表资料中各格的理论频数T均不应小于1,并且1T5的格子数不宜超过格子总数的1/5,否则可能产生偏性。处理的方法有三种:?增大样本含量,使理论频数增大;?根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。?改用双向无序RC表的Fisher确切概率法。 2.多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪些两总体率之间有差别,需进一步做多个样本率的多重比较。 3.对于有序的RC表资料不宜用2检验。因为行列表资料的2检验与分类变量的顺序无关。 七、参数检验和非参数检验的适用范围和优缺点 参数检验适用范围:总体分布已知、总体方差齐的资料 优点:能充分利用资料提供的信息,检验效能较高。 缺点:对样本所对应的总体分布有比较严格的要求,这样就限制了它的适用范围。 非参数检验适用范围:1总体分布类型不明确的计量资料2偏态资料3等级资料4不满足参数检验条件的资料,如个别数据较大或数据的一端或两端是不确定数值。5初步分析 优点:1适用范围广,可应用于参数检验难以处理的资料。2受限条件少,不受总体分布的限制3具有稳健性4方法简便,易于理解和掌握。缺点:对于符合参数检验的资料,若采用非参数检验,会导致信息损失和检验效能下降,增加犯第二类错误的概率。 八、卡方检验基本思想。 X2反应的是实际频数与根据假设检验算得的理论频数吻合程度。若检验假设H0:1=2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果X2值很大,即相对应的P值很小,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12。 九、简述最小二乘法与最大似然函数法在原理及应用上的异同之处。 (1)原理方面:最小二乘法是一种根据残差平方和最小来求解方程系数;最大似然法是一种非线性拟合方法,常用于Logistic回归分析中回归模型的估计,其基本思想是先建立似然函数和对数似然函数,再通过使对数似然函数最大来求解相应的参数值。 (2)应用方面:最小二乘法用于在线性回归分析中回归系数的确定;最大似然法常用于Logistic回归,cox回归中回归系数确定。 十、简述偏相关系数与复相关系数的区别 一、概念不同:偏相关系数是在对其它变量的影响进行控

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论