卫生统计学简答题(3).doc_第1页
卫生统计学简答题(3).doc_第2页
卫生统计学简答题(3).doc_第3页
卫生统计学简答题(3).doc_第4页
卫生统计学简答题(3).doc_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 常用概率分布一、二项分布的特征二项分布图的高峰在=n处或附近;为0.5时,图形是对称的;当不等于0.5时,分布不对称当对同一n,离0.5愈远,对称性愈差对同一,随着n的增大,分布趋于对称当n时,只要不太靠近0或1,特别是当n与n(1-)均大于5时,二项分布趋于对称。当n时,且0时,二项分布近似Poisson分布二、二项分布的应用条件是什么?实验总次数n一定每次试验只有两个可能结果且相互独立,不予考虑“可疑”等模糊结果,属于二分类资料每次试验只出现一个结果并且是两个可能结果中的一个结果已知发生某结果与概率为且不变,则其对立结果的概率为(1-)n次试验在相同条件下进行且各次试验结果相互独立三、Possion分布的特征?Possion分布的总体均数与总体方差相等,均为当较小时,图形呈偏态分布;当较大时,图形呈正态分布Poisson分布的观察结果具有可加性四、正态分布的定义若连续性随机变量X的概率密度函数为:其中为均值,为标准差,则随机变量X服从正态分布,记为XN(,2 )相应的分布函数(概率密度的累积函数)为:五、正态曲线的性质曲线在x轴的上方,与x轴的上方,与x轴不相交曲线是单峰的,它关于直线x=对称 曲线在x=处达到峰值(最高点),在x=处有拐点曲线与横轴x所夹面积为1均值反应随机变量的平均水平(位置参数),向右平移表示逐渐增大,向左平移表示逐渐减少。标准差反映随机变量的集中趋势(形状参数),越大曲线越“矮胖”,表示分布越分散;越小曲线越“瘦高”,表示分布越集中。当n很大,很小时,n=为一常数时,二项分布近似于Poisson分布P(n)当n较大时,不接近0也不接近m时,二项分布近似于正态分布,N(n,n(1-))当20时,Poisson分布渐近正态分布N(,)六、简述二项分布、Possion分布、正态分布的区别与联系区别:二项分布、Possion分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。联系:Possion分布可以视为n很大而很小的二项分布。当n很大而和1-都不是很小的时候二项分布渐近正态分布,当20的时候,Possion分布渐近正态分布。七、对于一组近似正态分布的资料,除样本含量n外,还可计算 ,S和 1.96X ,问各说明什么?为算数均数,说明正态分布或近似正态分布资料的集中趋势S为标准差,说明正态分布或近似分布资料的离散趋势 1.96X 可估计正态指标的95%医学参考值范围,即此范围在理论上应包含总体的95%的个体值。八、正态分布、标准正态分布与对数正态分布有何异同1、相同点: 随机变量的类型相同服从这种分布的随机变量都是连续型随机变量 可转化性对数正态分布变量记对数变换后可转化为正态分布变量正态分布变量经标准化变换后可转化为标准正态分布2、不同点: 表示不同正态分布记为N(, 2 ),是曲线族标准正态分布是一种特殊的正态分布(均数为0,标准差为1),记为N(0,1)对数正态分布记为N(lgX,2 lgX ),为另一曲线族 概率密度函数曲线不同正态曲线、标准正态曲线均呈对称性对数正态曲线呈非对称性,为右偏态 应用不同正态分布和标准正态分布应用广泛,其资料可直接用于统计分析服从对数正态分布的资料一般先记对数变换后,再进行统计处理九、控制图的基本原理如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布;依据标准正态分布曲线下面积的分布规律性,确定出现概率非常小的若干情况作为异常标准如果出现相应结果则判为异常。十、质量控制判断异常点的8种情况:1. 某点位于控制线3S之外2. 在中心线的一侧连续有9个点3. 连续6个点稳定地减少或增加4. 连续14个点交替上下5. 连续3个点中有2个点位于2S之外6. 连续5个点中有4个点位于1S之外7. 在中心线一侧或两侧连续15个点位于1S之内8. 在中心线一侧或两侧连续8个点位于1S之外十一、医学参考值范围(reference range)(一) 定义是指包括绝大多数“正常人”的各种生理及生化指标常数,由于存在个体差异,生物医学数据并不是常数,而在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准,但不是“金标准”(二) 制定方法正态分布法、百分位数法(三) 确定原则 选定足够多例的同质正常人作为研究对象,所谓“正常人”并不是指任何器官、组织的形态与功能都健全的人,而是指所有可能影响研究指标(确定参考值范围的指标)的因素观察值均处于正常范围内,从可行的角度考虑,可以说:原则上应是体检合格者(健康人)并且所有已知对研究指标有影响的因素观察值均处于正常范围内;对于某些指标为不正常或患某种疾病的对象,如果有充分的证据表明这些不正常指标或所患疾病不会对研究指标有任何影响,则这些对象仍可以作为制定这个参考值范围的研究对象 控制检测误差 如果有明显的指标(如年龄、性别)影响同质性,则应考虑进行分组分别建立参考值范围 根据专业知识正确选择单、双侧参考值范围 根据假阳性和假阴性与危险程度合理选择百分界值 必要时,除计算参考值范围外,也给出可疑范围(四) 确定方法参考值范围是根据正常人的数据估计绝大多数的正常人所在范围。这一范围与确定根据数据分布与特点选择相应的估计方法 正态分布法:对于正态分布以及近似正态分布资料,公式如下:双侧:单侧: 百分位数法当资料不服从正态分布,则利用百分位数法估计参考值范围例如,确定95%参考值范围,相应的百分界值为:双侧:P2.5P97.5单侧:低侧P5;高侧P95 对数正态分布法如果对资料取对数后y=ln(x)呈近似正态分布此时以y值按正态分布法算出参考值范围,再对其求反对数(五) 制定参考值范围与一般步骤: 定义“正常人”,不同的指标“正常人”的定义也不同 选定足够数量的正常人作为研究对象 用统一和准确的方法测定相应的指标 根据不同的用途选定适当的百分位数,常用95% 根据此指标与实际含义,决定用单侧范围还是双侧范围 根据此指标与分布决定计算方法,常用于计算方法:正态分布法、百分位数法第五章 参数估计一、什么是抽样误差?抽样误差如何减少抽样误差?样本均数与抽样分布特点?(一)抽样误差是指从一个总体中随机抽取一个或多个样本,所得的样本统计量与相应的总体参数之间的差异,或者各个样本统计之间的差异称为抽样误差(二)可以通过增加样本量来减少抽样误差(三)样本均数抽样分布的特点 样本均数恰好等于总体均数是极其罕见的 样本均数之间存在差异 样本均数围绕总体均数,中间多两边少,左右基本对称,呈近似正态分布 样本均数之间变异明显小于原始变量值之间的变异二、总体分布形态和样本含量对样本均数的抽样分布会产生何种影响?在服从正态分布的总体中进行随机抽样,样本均数的分布服从近似正态分布在不服从正态分布的总体中进行随机抽样,当样本量较小时,样本均数的分布呈非正态分布,当样本量足够大时(如n30),样本均数的分布近似服从正态分布三、标准差S与标准误Sx之间的区别和联系(样本)区别:(1)意义:S描述一组变量值的离散程度,并可以作为总体标准差的点估计;Sx描述样本均数间的离散程度,并且是样本均数标准误的点估计(2)应用:S标准差越小,说明变量值围绕均值分布越紧密,均数的代表性越好 估计变量值的分布1-范围;Sx标准误越小,说明样本均数和总体均数差异越小,用样本均属估计总体均数的可靠性越大用 估计总体均数的1-置信区间(3)与n的关系:n越大,样本标准差S越稳定;n越大,标准误Sx越小联系:都是描述变异程度的统计指标n一定时,同一组资料,S越大,Sx越大控制方法:(S)个体差异或自然差异,不能通过统计方法来控制,(S)增加样本量可减少 标准误三、t分布特征t分布为一簇单峰分布曲线,V不同,曲线形状不同t分布以0为中心,左右对称t分布与V有关,V越小,t值越分散,t分布的峰部越低,两侧尾部翘得越高 当 ,随着V逐渐增大,t分布逐渐接近标准正态分布;当V趋向时,t分布趋近标准正态分布四、t分布曲线面积与模糊t值间关系 t界值表中一侧尾部面积称为单侧概率() 在相同自由度时|t|值增大,减小 相同时,单尾比双尾对应的值小18.评价可信区间估计的优劣准确度:可信度,即区间包含总体参数的理论概率大小,愈接近1愈好精确度:区间的宽度,区间愈窄愈好样本含量为定值时,上述两者相互矛盾 若只顾提高可信度,则可信区间会变宽五、标准正态分布(分布)和t分布有何不同?t分布为抽样分布,标准正态分布(分布)为理论分布t分布比标准正态分布的峰值低且尾部翘的高随着自由度的增大,t分布逐渐趋于标准正态分布,即当自由度 时,t分布就会完全成为标准正态分布六、均数的可信区间与参考值范围有何不同?七、点估计与区间估计(总体均数的估计)点估计 区间估计意义 直接用样本统计点代替总体参数 用统计量 和 确定一个有概率的区间,且该区间具有较大的置信度包含总体均数估计方法 以 作为总体均数 的估计值 已知时,用正态近似法 未知时,且n较小(如n50时)用t分布法 未知时,但n足够大时(如n50时)用正态近似法两总体均数差值与置信区间 八、试说明 与 的区别 是资料服从正态分布或近似正态分布时,95%的参考值范围与计算公式,该范围内包括了所计算的群体中95%的个体观察值 是总体均数95%置信区间(CI)的计算公式,是按95%的置信度估计总体均数所在的范围九、试说明 与 的区别两者都是在总体标准差已知的情况下得出的前者是从均数为,标准差为 的正态总体中进行随机抽样,95%的样本均数所在的范围;后者是总体均数95%的置信区间的计算公式,是按95%的置信度估计总体均数所在的范围前者是概率论的研究内容,从已知总体总体进行随机抽样,研究样本均数的抽样分布规律,后者是统计学研究的内容,用样本均数和标准误推断总体均数十、置信区间有哪两个要素,在使用时要注意什么?(一)置信区间的两个要素:可信度和精准性1可靠度:用1-表示,1-越大,置信区间越宽,说明用此区间估计总体参数的可靠度越高2.精确性:反映为置信区间的宽度,表示区间估计的精度。区间越窄,精度越高(二)注意事项1.精确性与变异的变异度大小,样本含量以及1-的取值有关2.当样本误差确定时,可靠度和精准性是相互制约的,要想提高可靠度,可取较小的值,则必定会使置信区间变宽导致精准度下降,故不能笼统的以为98%置信区间比95%置信区间好,一般常用95%置信区间,认为它能较好的兼顾可靠度和精确性3.可靠度和精确性是相互矛盾的两个方面,参数的置信区间估计的要旨是:充分利用样本所提供的信息,做出尽可能可靠而精确的估计。补充:总体均数的置信区间的含义:按预先给定的概率,确定的包含未知总体均数的可能范围,实际上一次抽样算得的置信区间可能包含总体均数,也可能不包含,但可以说当=0.05时,95%CI估计正确的概率为0.95,估计错误的概率小于或等于0.05,说明我们对95%CI包含总体均数的信任程度总体均数为95%置信区间的含义可理解为:如果重复100次抽样,每次抽样含量均为n,每个样本均按 构建置信区间,则在此100个置信区间中,平均有95个包含总体均数,5个不包含总体均数。第六章 假设检验一、假设检验的原因和目的原因:由于个体差异的存在,即使从同一总体中严格随机抽样,各样本均数间会有差异,这种差异产生的原因有且只有两种可能: 分别所代表的总体均数相同,由于抽样误差造成了样本的差异,差别无显著性 分别所代表的总体均数不同,差别有显著性目的:假设检验的目的就是通过对样本均数的比较来判断各总体均数是否相等,通过假设检验,可回答样本均数间的差异是由于抽样误差造成的还是总体均数造成的不同二、假设检验的基本思想:反证法:根据研究目的建立假设 ,先假设 是正确的再分析样本提供的信息是否支持 ,即在 成立条件下计算检验统计量,获得相应P值,根据P值大小来判断。小概率事件原理:小概率事件(P0.05)在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑 的正确性,认为 成立,该结论的可能犯5%的错误。三、假设检验中,一般当P0.05时,则拒绝 ,理由根据是什么?P值是从 规定的总体随机抽得等于及大于(或、和等于及小于)现有样本获得的检验统计量值(如t或)的概率。当P值,则不拒绝 ,无统计学意义,尚不能认为不同或不等。五、怎样正确选用单侧检验和双侧检验?单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;若尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更能得出有差别的结论,但应慎用。六、假设检验的一般步骤建立检验假设:假设样本来自某一特定总体,根据所对应实际问题建立原假设 及备择假设 确定检验水准:确定最大容许误差选定检验方法与计算检验统计量:计算样本与总体的偏离程度计算与统计量对应的P值作出结论:反证法思想小概率原理,判断是接受 还是拒绝 。七、假设检验应注意的问题要有严密的研究设计不同资料应选用不同的检验方法正确理解significance:差别有统计学意义认为两总体或多个总体参数有差别 差别无统计学意义尚不能认为两总体或多个总体参数有差别结论不能绝对化:假设检验推断作出的结论具有概率性,故不能绝对化在报告结论时,最好列出检验统计量的值,尽量写出具体P值,而不简单写成P60且n260)的两本均数的比较PS:当样本含量较大时,两种检验方法计算得到的检验统计量t值和Z值 相等十九、什么是假设检验的功效?有什么意义?1-称为假设检验的功效(Power),其含义是:当所研究的总体与 确有差别时,按检验水平能够发现它(拒绝 )的概率。如果1-=0.90,则意味着当 不成立时,理论上在100次抽样中,在的检验水平上平均有90次拒绝 。一般情况下,对于同一检验水准,功效大的加盐方法更可取。影响检验功效的因素:总体参数个体差异(标准差)样本量检验水准。当总体参数的差异越大,个体差异(标准差)越小,样本量越大,检验水准越大,检验功效越大。二十、配对设计有哪些形式第一种情况主要在实验研究中,研究者将受试对象按某些特征(如性别、年龄等可能对研究结果有影响的因素,也称混杂因素)配成对子,再随机分配每个对子中的每个个体至两个不同的处理因素或统一处理因素两个不同水平中去第二种情况是将每份被测样本一分为二,再随机分配至不同的方法求测第三种情况是自身配对,每个受试对象在因素处理之前和处理后的比较第一种情况又称异源性配对,第二三种情况又称同源性配对二十一、拟合优度 检验注意事项P164(方积乾的) P238(贺佳的)第七章 方差分析一、方差分析是用于研究何种数据与统计方法?用于定量变量资料,可用于比较两个及两个以上均数的差别各样本是相互独立的随机变量,均服从正态分布各样本的总体方差相等,即方差齐性二、方差分析与基本思想是什么?总离均差平方和以及总自由度怎么算?(一)基本思想是指根据实验设计类型把全部观察值间的差异(总变异)按设计和需要分解成两个或多个组成部分,总自由度也分解成相对应的几个部分再分析。分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。除随机误差作用外,每一个部分的差异可由新因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素作用加以解释,通过比较不同变异来源的均方,借助F分布做出统计推断,从而推断各种研究因素对试验结果有无影响(二)总变异以及总自由度的计算三、t检验和方差分析研究与应用条件有何异同相同点:各样本是相互独立的随机样本,均服从正态分布各样本的总体方差相等,即方差齐性对同一资料,两独立样本t检验等价于完全随机设计资料与方差分析且有F= 对同一资料,配对样本t检验等价于随机 组设计资料与方差分析且有F= 不同点:T检验用于两样本的均数的比较方差分析可对两个以上的样本均数进行比较实际应用中,两样本均数比较常用t检验,多个样本均数比较则用方差分析四、完全随机设计资料的方差分析中 、 各表示什么意义? 表示组间变异,指各处理组样本均数大小不等,是由处理因素(如果有)的和随机误差造成的 表示组内变异,指各处理组内变异值大小不等,是由随机误差造成的五、随机区组设计与完全随机设计的区别?(含义不同,总变异的分解不同)(一)完全随机设计是指特定完全同质的受试对象随机分配到各个处理组,再观察其实验效应,是最常见的两水平或多水平的实验设计方法,样本量可以相等也可以不相等。(二)随机区组设计又称配伍组设计,是指将受试对象按性质(如动物的窝别、年龄等非实验因素)相同或相近者组成b个区组(配伍组),再将每个区组中的受试对象随机分配到k个处理组中,随机区组设计将资料按区组和处理组两个方向进行分组,在b个区组和k个处理组中保证了各组内受试对象齐同可比,即减少组间误差,提高检验效率六、数据变换在资料处理中起到什么作用?资料不满足方差分析条件时,处理方法之一就是数据变换,对于明显偏高,正态性和方差不齐的资料,通过适当的数据变换可以近似的满足假定条件,便于进行方差分析。七、对两组配对设计资料的比较,如果满足差值服从正态分布的条件,则可用配对t检验,那么,此时可用随机区组的方差分析写?两组配对设计资料,若差值服从正态分布的条件,则可用配对t检验和随机区组的方差分析进行检验它们在双侧检验的时候是等价的,但对于单侧检验,配对t检验是可以做的,随机区组的方差分析则不能配对t检验与随机区组设计的方差分析对于满足条件的同一资料,其检验统计量存在如下关系: =F八、随机区组设计的实验资料,如果用随机区组设计的方差分析检验区组效应,其结果为无统计学意义,请问:能否用完全随机设计的方差分析?随机区组设计的实验资料,若用随机区组设计的方差分析检验区组效应,结果无统计学意义,对该资料而言是不能用完全随机设计的方差分析进行统计分析的因为 完全随机设计的方差分析要求资料各组独立,而随机区组设计各组间是不独立的,所以即便区组效应无统计学意义,也不能改变其随机区组设计的检验方式。九、多组资料样本均数 比较能用t检验吗.?(方差分析后为什么不能直接作两两比较t试验?)不能。因为拥挤学的结论是在假设 成立的情况下,根据现有样本提供的信息做出的概率性评估,无论拒绝或不拒绝都有可能犯错误若有n组样本均数进行比较,采用两两t检验,则共需作 次比较,每次比较犯I型错误的概率是0.05,每次比较均不犯I型错误的概率是 0.05因此,多个均数两两比较不宜用t检验做两两比较十、为什么在方差分析的结果为拒绝 ,接受 之后,多个样本均数的两两比较要用多重比较?方差分析的备择假设 是g个总体均数不全相等,拒绝 ,接受 ,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。十一、方差分析中的F检验为何是单侧检验?方差分析中检验统计量F值的计算通常是用某部分的均方(如处理因素、交互效应等)除以误差的均分,其中,坟墓误差部分的均方仅含随机因素的作用么因此算得的F值从理论上讲应大于或等于1,而不会小于1,所以方差分析中3F界值采用单侧检验的界值。十二、是否一定要方差分析发现有统计学意义后,再作均数间的两两比较?一般认为,当方差分析发现有统计实际上,这种任意方差分析属于 计划的事后比较而LSD-t检验,Dunmelt-t检验和Tukey HSD检验的多重比较就没有必要事先进行方差分析,均数间两两比较的方法很多,在分析实际资料时,有可能出现以下两种情况:方差分析有统计学意义,而两两比较均无统计学意义 方差分析无统计学意义,而两两比较中某些均数间有统计学意义对于这两种情况如界值在检验水准附近,则下结论时应特别谨慎,通常应增大样本量后再作分析和推断十三、SNK-q检验与Dunmelt-t检验有何联系与区别?(一) 联系均为多重比较方法均可用于方差分析后进一步进行多个样本均数间的两两比较(二) 区别SNK-q检验主要用于探索性研究适合于多个样本均数的事后两两比较Dunmelt-t检验主要用于事先有明确假设的证实性研究,适合于多个处理组与对照组的比较十四、若采用两两比较的t检验,则其检验 准和两样本均数之差标准误作将何调整?若直接采用两两比较的t检验,会增大犯I类错误的概率,若比较次数为m,每次检验水准为,则从理论上讲,此时犯第I类错误的累计概率为 。明显高于原有检验水准。若要作两两比较的t检验,则应减小其检验水准,可采用Bonfferon方法或Sida-k方法进行调整同时两样本均数之差标准无的计算应当采用多个样本的权据而不仅仅是被比较两组的权据十五、多个样本均数的两两比较法LSD-t检验:一对或多对专业上有特殊意义样本均数间的比较Dunmelt-t检验:各实验组与一个对照组样本均数的多重比较SNK-q检验:多个样本均数两两的全面比较十六、析因设计的三个效应单独效应:其他因素的水平固定时,同一因素不同水平间的差别主效应:某一因素不同水平间的平均差别交互效应:某因素的各单独效应随另一变化而变化的情况。没有交互效应时,单独效应等于主效应十七、重复测量资料的变异分解SS总=十八、配对设计与前后测量设计的比较配对设计:两种处理作用于配对的两个体可以对两个个体同时观测两个个体的实验观测结果相互独立对差数用配对资料t检验推论两种处理有无差别前后测量设计:一种处理作用于一个个体同一个个体两个不同时间的观测两个不同时间观测结果常不互相独立对差数用配对资料t检验方法处理有无作用,处理前后的相关与回归分布十九、重复测量设计与随机区组设计重复测量:处理因素在区组间随机分配区组内各时间点固定,不能随机分配 区组内实验单位彼此不独立随机区组:处理因素在区组内随机分配各区组内实验单位彼此独立第八章 卡方检验一、说明 检验的用途推断两个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别推断配对设计下两组频数分布的概率是否相同多个样本率比较的 分割多个样本率比较的趋势检验两个分类变量之间有无关联性频数分布拟合优度检验两个率的等效检验二、比较两个独立样本频数分布的 检验和比较两个配对样本频数分布的 检验在设计、资料整理、假设检验率方面的区别是什么?(一)设计方面前者针对的是“两独立样本”,行合计是事先固定的后者实质上是一组样本,即使可以看成两个样本,也是“两个互不独立的样本”,样本量都是n,是固定的,而行合计和列合计都是事先不确定的(二)资料整理四格表形式不同。 书P151表8-2 P157表8-8(三)假设检验前者采用Pearson 检验或Fisher确切概率法进行检验后者采用McNemar配对 检验或对应的确切概率法三、如果实验效用会导致资料表示,欲比较两组总体效应间差别有无统计学意义,为什么不能用 检验?试举例说明当 检验显示差别有统计学意义时,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同四、为什么有些四格表(或RC表)必须要计算确切概率?因为只有在大样本时,检验统计量 才近似服从 分布,样本量不够大时,如果n40,且T1时尚可以进行校正,如果样本量很小, 检验量不适用了,只能计算确切概率五、四格表的 检验与检验有何异同?(一)相同点凡可用检验进行的两个率的比较的资料,都可用四格表的 检验,两者是等价的,且有 (二)不同点检验可进行单侧检验,而四格表 检验率用于双侧检验两个率比较的检验进一步计算可得出两个率之差的可信区间,并可以根据专业知识判断两个率之差是否有实际意义,而四格表的 检验不能进行两个率之差的区间估计四格表的 检验可用于配对四格表资料的关联性检验检验常用于大样本,而 检验可用于大样本或小样本六、四格表资料的 检验应用条件有哪些?当n40且所有的T5时,可用非校正的 检验公式当n40但有1T5时,需要用四格表资料的 检验的连续性校正公式当n40或T1时,不能采用四格表资料的 检验,应用确切概率法当 检验所得的概率P时,应改用Fisher确切概率法绝对权同质(见“十一”)七、分析四格表资料时,通常在什么情况下需使用Fisher确切概率法?当四格表资料的n40或T5时,用 检验的基本公式 或四格表资料 专用公式 当n40但有1T5时,用四格表资料 检验的校正公式 或 或改用四格表资料的Fisher确切概率法当n40,或T1时,用四格表资料的Fisher确切概率法,若资料满足两样本率检验的条件,也可用检验3.对配对设计的四格表资料,若检验两种方法的检测结果有无差别时,当(b+c)40时, 当(b+c)10,n2-n110时采用检验,这时检验属于参or非参?为什么?属于非参数检验因为这时的检验是比较例数较小组秩和与总体均数n1(n+1)/2的差别,而秩和T不是参数,其比较的仍是总体的分布而不是总体的参数两组比较的秩和检验,当n很大时,可利用秩和T的分布随n增大渐进正态分布的性质,进行检验,此时利用的并不是原始数据,而是经秩变换后的数据,故仍属非参五、两组或多组等级资料平均效能的比较为什么不用 检验而应用秩和检验?若采用 检验,则只能说明组间的疗效构成有无差别,而不能说明组间的平均疗效有无差别,因此应选用秩和检验。 检验没有考虑到有序的因素,有序分类变换顺序后,卡方值是不变的,而秩和利用了有序信息通过排秩的方法,可以推断总体间等级强度差别六、非参数检验的基本思想是什么?当总体分布类型未知或总体分布不符合多数检验的应用条件时,如何利用数据所包含的信息呢?一组数据最基本的信息是次序,将数据按大小次序排列,每个数据在整个数据中相应的位置和次序,称为该数据的秩在一定假设下,这些秩和其统计量的分布都是可以求出来的,且与原来的总体分布无关,可以进行所需要的统计推断29.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?因为在不同对比组,不取平均秩次会加大或减少某一组的秩和;在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。6.随机区组设计多个样本比较的Friedman M检验,备择假设 如何写?为什么? 写为多个总体分布位置不全相同 不能写为多个总体分布不全相同。因为Friedman M检验对于多个总体分布的形状 差别不敏感,只对其位置差别敏感4.总体有n个秩次1,2n。若n个秩中有相同秩(如1,2,4,4,4,6,7n),其均数和方差是否会改变?均数不改变。方差改变,变小。2.什么是秩转换的参数检验,它适用于哪些情况?秩转换的非参数检验是将数值变量从小到大或等级从弱到强转换成秩后,再计算检验统计量,其特点是:假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。适用于:不满足正态性和方差齐性的小样本计量资料分布不知是否正态的小样本资料一端或两端是不确切数值的资料等级资料七、参数检验和非参数检验的区别何在,各有何优缺点(一)区别原理:1.参数检验在理论上要求样本来自给定分布的总体,且该总体分布依赖于若干参数,它是对总体参数( )或总体方差( )等总体参数的比较,计算检验统计量时用的是样本数据本身。2.非参数统计其对总体分布不作严格限定,不受总体分布的限制,又称任意分布检验,其直接对总体分布位置做检验,计算检验统计量时用的是样本数据的秩次,这样会损失很多信息PS:一般而言,符合参数检验应用条件的资料应尽可能用参数检验的方法,只有当不符合时,才选用非参数检验的方法适用范围:1.参数检验要求资料满足特点性质,如:相互独立、正态、方差齐性等2.非参数检验见“二”(二)优缺点1.参数检验优点:充分利用原始数据信息在符合参数检验条件时,检验效能较高可针对参数进行推断缺点:对数据有特定的分布要求,适用范围较窄分析条件苛刻计算量大2.非参数检验优点:适用范围广方法简单,计算简便易于理解和掌握对资料要求不高缺点:损失了原始数据的信息若对符合参数检验条件的资料用非参数检验会降低检验效能如需检验出同样大小的差异,非参数检验往往需要更大的样本含量第十章 两变量关联性分析一、为什么要做r和b的假设检验?b:即使从总体回归系数等于0的总体中作随机抽样,由于抽样误差的存在,其样本回归系数b也不一定全为0,。因此,求得一个样本回归系数时,首先,需考虑线性方程是否成立?并进行回归系数是否为0的检验。以推断自变量x与因变量y间是否有直线关系存在r:假定从总体相关系数b=0的总体中随机抽样,由于存在抽样误差,所得样本相关系数r不一定全为0,因此求得一个样本相关系数r后,仍需进行总体相关系数b是否为0的假设补充:因为有两种可能性会造成样本相关系数r或回归相关系数b不等于0,一种是抽样误差,一种是本质差,因此,当得到一个不等于0的r或b时,不能立即下结论说x变量与y变量之间存在直线相关关系或直线回归关系,必须先做假设检验,再下结论二、应用直线先行相关分析时应注意哪些问题?1.进行相关分析前,应绘制散点图,当散点分布有直线趋势时,才宜作相关分析,另外散点图能提示资料有无异常点,当有异常点时慎用相关。2相关分析要求两变量为服从正态分布的随机变量,因此,当有一个变量的数值为认为选定时,莫作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论