卫生统计学2赵耐青_第1页
卫生统计学2赵耐青_第2页
卫生统计学2赵耐青_第3页
卫生统计学2赵耐青_第4页
卫生统计学2赵耐青_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 实验设计学习要点1.实验性研究的3个要素:处理因素、研究对象和实验效应。2.实验性研究的3个基本原则:对照原则、随机原则和重复原则。3.完全随机设计的随机化实现。4.配对设计中的配对条件选择。5.随机区组设计的随机化实现。6.了解交叉设计的特点和特征。7.了解析因设计对研究对象的要求和优缺点。8.了解样本含量的估计所涉及的信息。9.了解临床试验的特殊性。习题一、是非题1.在进行实验设计时,设置排除标准其目的是为了保证样本中的个体的同质性。因此,排除标准项目应尽量多些,可以保证研究结论的可靠性。( )2.随机区组设计能匹配混杂因素,但不宜匹配过多,否则样本的代表性会产生问题。( )3.正

2、确估算样本含量既可以节约资源,也可防止因样本含量过少,出现“假阴性”。( )4.为了解某种新感冒药的疗效,对照使用安慰剂,从伦理学角度考虑可采用交叉设计进行研究。( )5.如果是作总体参数的估计,计算所需样本含量的必备条件中,可以不考虑的是容许误差。( )二、选择题1.实验设计要求效应指标应满足精确性,即准确度和精密度。准确度指观察值与实际值接近的程度,其差值属 ;精密度指观察值与其均数的接近程度,其差值属于 。A.随机误差 系统误差 B.系统误差 随机误差C.随机误差 随机误差 D.系统误差 系统误并2.作假设检验时所需样本含量的计算必备条件是 。A. B. C. D. 以上都不对3.采用配

3、对设计的主要目的是 。A.减少样本含量 B.减少混杂因素对结果的影响C.提高统计检验的功效 D.有利于统计分析4.已知A、B、C都是3水平因素,且根据预试验得知:A×B、B×C不可忽视。若希望试验次数尽可能少一些,试验设计时最好选择 。A.拉丁方设计 B.正交设计C.析因设计 C.交叉设计5.下列研究设计类型中既能全面均衡地分析各因素的不同水平的效应,又能获得各因素间的交互作用的是 。A.交叉设计 B.配对设计C.随机区组设计 D.析因设计三、简答题1.实验性研究的特征是什么?研究对象在干预前是否来自同一总体?2.在实验研究中设计对照的目的是什么?3.实验设计中为什么要遵循

4、随机化的原则?4.临床试验设计中为什么要采用盲法?有哪几种盲法?各有何特点?5.完全随机设计与随机区组设计有什么不同?参考答案及注释一、是非题1.错。过多地排除标准会使样本失去代表性,并且研究结果失去推广价值。2.对。不宜匹配过多,否则样本的代表性会产生问题。3.对。样本量太小使Power太小以致假阴性的概率较高;反之样本量过大,检验效能很高,其能分辨的差异超过了有背景意义的差异。4.错。感冒通常1周左右基本上痊愈了,交叉设计至少需要两个阶段治疗法期以及一个清洗期,因此1周不能安排两个阶段治疗期,更不容许当中有清洗期,违反伦理。5.错。样本量估计的最重要的因素是参数估计的容许误差。二、选择题1

5、.选B。准确度指观察值与真实值的差异,可以通过提高测量手段减小的,故属于系统误差;精密度是指观察值与其均数的差异属于个体误差,属于随机误差。2.选A。作假设检验时所需样本含量的计算需要知道第一类错误的概率,第二类错误的概率,标准差S和允话误差。3.选B。配对主要是通过混杂因素的配对,减少甚至消除混杂因素对结果的影响。只有确实存在混杂效应,并且配对因素正好是该混杂因素时,配对才能提高检验效能。4.选B。正交设计的目的就是尽可能减少最少的试验次数,其他研究设计都不能减少最少的试验次数。5.选D。析因设计是全面分析各个因素不同水平的效应,包括交互作用效应。三、简答题1.实验性研究的特征是什么?研究对

6、象在干预前是否来自同一总体?实验性研究的特征是平行对照、随机化分组、重复性和均衡性。研究对象在干预前是来自同一总体,只是实验组给予某种干预,而对照组给予另一种干预或不给予干预。2.在实验研究中设计对照的目的是什么?由于实施随机分组和干预前,试验组和对照组的对象来自同一群体,设立对照可以使试验组和对照组除了干预措施不同外,其他因素出现在两组的概率是相同的,即使有些因素是对效应指标有影响的,也不会影响干预效应的评价,因此设立对照具有很好的可比性,从而正确地评价干预措施是否有效。3.实验设计中为什么遵循随机化的原则?在实验设计时,随机分组可以保证受试对象在实验组和对照组均衡一致、具有可比性,受试对象

7、进入实验组和对照组的机会应相同,使得不可控制的因素在处理组和对照组间影响较为均匀,并可归于实验误差中。另外,实验组和对照组在实验因素无效应的前提下,组间实验效应的差异遵循抽样误差的规律,从而可以根据样本对总体进行统计推断。随机化原则还包括随机化抽样,即总体中的个体被抽取进入样本的机会相同,随机抽样使样本具有代表性,从而使实验结论具有普遍意义。4.临床试验设计中为什么要采用盲法?有哪几种盲法?各有何特点?临床试验设计采用盲法是为了避免来自病人、医生和评定者的偏性,是防止偏倚的重要措施。有单盲、双盲和三盲。单盲:只有病人或医师不知道自己用的是哪一种药。单盲可避免来自病人或医师的心理影响所产生的的偏

8、倚。双盲:病人以及治疗和评定的医生都不知道哪一个病人用的是哪一种药。需要第三方来负责安排和控制整个试验。可避免研究者和研究对象的主观影响所产生的偏倚。三盲:指研究者和病人不知道用药的分组情况,而且负责资料收集和分析的人员也不知道用药的分组情况。可更为客观地评价实验结果。5.完全随机设计与随机区组设计有什么不同?完全随机是将同质的对象随机分配到各处理中,观察其实验效应,各组样本含量可以相等也可以不等。随机区组设计是将受试对象按一定的条件组成区组(或配伍组),每个区组中的个受对象分别随机分配到个处理中去,因此各区组内受试对象与处理组数相等。随机区组设计每个组内的个受试对象具有较好的同质性,增加了组

9、间均衡性,与完全随机设计相比,能减少误差、提高实验效率。但在出现缺失数据时,完全随机设计仍可进行分析,随机区组设计分析则较为复杂。第九章 方差分析学习要点1.方差分析(analysis of variance,ANOVA)的基本思想是根据不同的研究设计进行变异分解。常用的方差分析有完全随机设计的方差分析,随机区组设计的方差分析,析因设计的方差分析和重复测量资料的方差分析。其中完全随机设计的方差分析和析因设计的方差分析要求各个观察资料之间是独立的;随机区组设计的方差分析要求各个随机区组之间的观察资料是独立的,允许随机区组内的观察资料是不独立的;重复测量资料的方差分析要求每个研究对象之间的观察资料

10、是独立的,允许同一对象不同时间点观察的资料是不独立的。2.完全随机设计的方差分析本质上是单因素方差分析(one-way,ANOVA)。完全随机设计的方差分析的变异分解,除以相应自由度,得到对应的均方,其中组内均方,可以理解为多组的合并方差。大小仅与抽样误差有关,与H0是否成立无关。当H1为真时,MS组间较大或很大,较大或很大。当H0为真时,MS组间较小或很小且MS组间大小仅与抽样误差有关,并且。要求每组资料分别服从正态分布(或残差服从正态分布)并且方差齐性。残差。3.随机区组设计的方差分析的变异分解,除以相应自由度,得到对应的均方其中。数值大小仅与随机抽样的误差大小有关,与H0是否成立无关。当

11、H1为真时,较大或很大,较大或很大。当H0为真时,较小或很小,仅与抽样误差有关,并且。其中残差,要求残差服从正态分布,方差齐性。4.析因设计方差分析同样可以分解为,作相应的假设检验,要求残差服从正态分布,方差齐性。有交互作用时,检验主效应是没有背景意义的。5.重复测量的方差分析同样可以分解为要求协方差阵满足球形对称,其本质上就是复杂情况下的方差齐性问题。6.多个样本的均数的两两比较:可以选用SNK,Dunnett,Bonfferoni等方法。Bonfferoni方法的结果最为保守,但可靠性较好并且适应用面广。习题一、是非题1.完全随机设计方差分析要求多组资料都服从某一个正态分布且资料独立和方差

12、齐性。( )2.随机区组设计的方差分析要求残差服从正态分布。( )3.随机区组设计的方差分析中,误差均方一定小于处理组间均方。( )4.方差分析用F界值表中的界值,即是F分布的第97.5百分位数。( )5.析因设计的数据分析,如果存在A因素和B因素的交互作用,但A因素和B因素的主效应都有统计学意义,则可认为A因素B因素对效应指标都有作用。( )二、选择题1.完全随机设计的多组计量资料用方差分析和Kruskal-Wallis(K-W)检验两种方法作检验,请问下列说法正确的是 。A.用方差分析犯第一类错误的概率较小B.若资料满足方差分析的条件,则用方差分析比K-W检验的检验效能要低C.若资料满足方

13、差分析的条件,则用方差分析比K-W检验的检验效能要高D.由于是同一资料,两种方法检验效能是一样的2.下面的说法错误的是 。A.完全随机设计方差分析的无效假设H0是否成立与组内平均变异有关B.完全随机设计方差分析的无效假设H0是否成立与组间平均变异有关C.完全随机设计方差分析的组内平均变异与资料的随机误差有关D.完全随机设计方差分析的组内平均变异与资料的样本量大小无关3.当只有两个处理组时,用方差分析与检验两种方法作检验,下列说法正确的是 。A.组内均方正好是检验中的两个样本均数差值的标准误B.组内均方正好是检验中的两样本均数差值的标准误平方C.组内离均差平方和正好是D.组内均方正好是检验中的合

14、并方差4.随机区组设计方差分析中,为推断处理因素是否起作用,所查F临界值表中的分母自由度为 自由度。A.处理组 B.区组 C.误差 D.总5.下列方差分析两两比较方法中,最为保守的方法是 。A.Dunnett法 B.SNK法 C.LSD法 D.Bonfferoni法三、问答题1.方差分析的基本原理是什么?其适用条件是什么?2.对于两组配对设计资料的比较,如果满足配对差值服从正态分布的条件,则可用配对检验进行统计分析。请问,这时可以用随机区组设计的方差分析进行检验吗?若可以,配对检验与随机区组设计的方差分析在这种条件下是等价的吗?它们有什么样的关系?3.随机区组设计的实验资料,如果用随机区组设计

15、的方差分析检验区组效应,其结果为无统计学意义,请问:能否用完全随机设计的方差分析进行统计分析。4.多组资料的样本均数比较能用检验吗?为什么?5.简述方差分析两两比较方法的SNK法、Dunnett法及Bonfferoni法及其各自的特点。参考答案及注释一、是非题1.错。要求每组资料分别服从正态分布,资料独立和方差齐性。2.对。随机区组设计的方差分析不存在每组资料服从正态分布,而是残差服从正态分布,残差的方差齐性。3.错。当没有处理效应差异时,处理效应检验统计量服从F分布,由F分布图可知,检验统计量F完全有可能1,即完全有可能。4.错。虽然方差分析是双侧检验(由H1,可知),但其检验的界值是单侧的

16、,所以界值是F分布的第95百分位数。5.对。二、选择题1.选C。统计检验的第一类错误的概率均为,所以两种方法的第一类错误的概率是相同的,但方差分析的检验效能一般高于Kruskal-Wallis检验。2.选A。组内变异描述了组内的变异情况,与组间变异无关,所以完全随机设计方差分析的无效假设H0是否成立与组内变异无关。3.选D。因为组内均方可以表示为:。当。4.选以。,故分母的自由度为误差的自由度。5.选D。可以证明Bonfferoni法最为保守。三、简答题1.方差分析的基本原理是什么?其适用条件是什么?方差分析的基本原理是把全部个体观察值间的变异(总变异),按照研究设计的类型,分解成几个部分,包

17、括:处理变异和随机误差变异(对应离均差平方和)。将处理因素的平均变异与平均随机误差变异(对应均方差),构造统计量F值。由于处理变异包含不同处理可能造成的差异和随机误差的变异,所以若处理因素没有产生差异,则检验统计量F服从F分布。方差分析的适用条件是:各次观察独立、各组分别服从正态分布(或残差服从正态分布)、各总体方差相等。2.对于两组配对设计资料的比较,如果满足配对差值服从正态分布的条件,则可用配对检验进行统计分析。请问,这时可以用随机区组设计的方差分析进行检验吗?若可以,配对检验与随机区组设计的方差分析在这种条件下是等价的吗?它们有什么样的关系?两组配对设计资料,若差值服从正态分布的条件,则

18、可用配对检验和随机区组的方差分析进行检验。它们在双侧检验的时候是等价的,但对于单侧检验,配对检验是可以做的,随机区组的方差分析则不能做。配对检验与随机区组设计的方差分析对满足条件的同一资料,其检验统计量存在如下关系:。3.随机区组设计的实验资料,如果用随机区组设计的方差分析检验区组效应,其结果为无统计学意义,请问:能否用完全随机设计的方差分析进行统计分析。随机区组设计的实验资料,若用随机区组设计的方差分析检验区组效应,结果为无统计学意义,对该资料而言是不能用完全随机设计方差分析进行统计分析。因为完全随机设计方差分析要求资料各组独立,而随机区组设计各组间不独立的,所以即便区组效应无统计学意义,也

19、不能改变其随机区组设计的统计检验方法。4.多组资料的样本均数比较能用检验吗?为什么?不能。因为统计学的结论是在假设H0成立的情况下,根据现有样本提供的信息作出的概率性的结论,即无论拒绝或不拒绝H0都有可能犯错误。若有4组样本均数进行比较,采用两两检验,则共需作次比较,每次较犯第一类错的概率是0.05,不犯第一类错误的概率为(1-0.05)=0.95,每次比较均不犯第一类错误的概率是0.9512=0.54036,则犯第一类错误的概率约主1-0.54036=0.45964>>0.05。由此可知多个样本均数两两比较时不宜用检验作两两比较。5.简述方差分析两两比较方法的SNK法、Dunff

20、eroni法及其各自的特点。SNK法属多重极差检验,其检验统计量为,值计算公式如下:常用于研究探索性的每两个均数之间的比较。Dunnett法,是多个实验组与一个对照组的样本均数进行比较,检验统计量为,计算公式为:Bonfferoni法其实质和特点是对检验水准进行调整,即则是需要比较的次数,为处理组数。按调整后的检验水准进行两两比较,经多次比较后犯第一类错误的累积概率不超过原有水平。Bonfferoni法是两两比较方法中最为保守的方法,一般用于确定性、验证性研究和下结论较谨慎的研究。第十章 基于秩次的非参数检验学习要点1.配对符号秩检验适用于配对设计的配对间比较的连续型资料,要求各个配对之间的观

21、察资料是独立的,但允许配对内的观察资料不独立。适合配对检验的资料也适用于配对符号秩检验,区别在于配对检验要求配对的差值服从正态分布或样本量很大,而配对符号秩检验并不要求配对差值的正态性。要特别注意上述两种方法的无效假设和备选假设是不同的,并且配对符号秩检验的Power低于配对检验。2.两组独立样本资料的秩和检验适用于连续型资料或有序分类资料的比较,并且仅对资料的独立性有要求,对资料的正态性和方差齐性均无要求,所以满足独立性而没有满足正态性或方差齐性的两组资料比较可以用两组独立样本资料的秩和检验。要特别注意成组检验与两组独立样本的秩和检验的无效假设和备选假设的差异,并且两组独立样本秩和检验Pow

22、er低于成组检验。3.多组独立样本资料的秩和检验适用于连续型资料或有序分类资料的比较,并且仅对资料的独立性有要求,对资料的正态性和方差齐性均无要求,所以满足独立性而没有满足正态性或方差齐性的多组资料比较可以用多组独立样本资料的秩和检验。要特别注意完全随机设计的方差分析与多组独立样本的秩和检验的无效假设和备选假设的差异,并且多组独立样本秩和检验Power低于完全随机设计的方差分析。4.随机区组设计资料的秩和检验(Friedman检验)适用于随机区组设计的连续型资料或有序分类资料的比较,并且仅要求区组之间的资料是独立的,对资料的正态性和方差齐性均无要求,所以满足区组之间独立而没有满足正态性或方差齐

23、性的随机区组设计资料的比较可以用随机区组设计的秩和检验。要特别注意随机区组设计的方差分析与随机区组设计的秩和检验的无效假设和备选假设的差异,并且随机区组设计秩和检验的Power低于随机区组设计的方差分析。5.当多组资料比较有统计学差异时,应进一步作两两比较,特别要注意根据研究问题校正检验水准。6.在统计检验中,存在选择检验方法是否和正确和选择方法优劣的问题。如果不满足检验或方差分析的资料选择检验或方差分析,则这是选择方法错误,特别配对设计的资料选用成组设计的检验方法是错误的;如果满足检验和方差分析条件的资料选用对应设计类型的秩和检验方法,这是没有选最优的方法,但不能选择错误。习题一、是非题1.

24、符合检验条件的数值变量资料如果采用秩和检验,第一类错误的概率往往会增大。( )2.完全随机设计两样本比较的秩和检验中,当相同的数据在同一组时,可以求平均秩次,也可不求平均秩次,但仍需按相同秩校正。( )3.成组非参数检验对资料没有严格的要求,所以在进行两组数值变量资料比较时,可直接采用秩和检验。( )4.按等级分组的资料作秩和检验时,如果用H值而不用校正后的Hc值,则会降低检验效能Power。( )5.配对设计的符号秩检验,若T值在界值范围内,则P值小于相应的概率。( )二、选择题1.以下对非参数检验的描述哪一项是错误的 。A.不依赖于总体的分布类型B.不使用样本实际测量值构造统计量进行检验C

25、.检验效能低于参数检验D.一般犯第二类错误的概率小于参数检验2.多个样本比较的秩和检验结果P0.05,则统计结论是 。A.这些样本所来自的总体分布不全相同B.多个总体均数不全相等C.任意两个总体均数均不相等D.这些样本所属总体分布都不相同3.随机抽取了8名汞作业工人的尿液,每个对象的尿液一分为二,分别用两种方法检测尿汞含量(单位:mg/L),欲比较两种方法检查的平均尿汞含量有无差别(表10-1),首先应考虑 。 表10-1 两种方法检测的尿汞含量编号 1 2 3 4 5 6 7 8离子交换法 0.940 0.408 0.010 0.023 0.723 0.382 0.035 0.020 蒸馏法

26、 0.051 0.612 0.030 0.020 0.789 0.424 0.014 0.015A.用配对检验B.用配对资料符号的秩和检验C.资料符合配对检验还是配对秩和检验的条件D.配对检验或配对秩和检验均可4.随机区组(b个区组,个处理因素)设计资料的秩和检验在秩和的计算应为 。A.将所有观察对象混在一起由小到大编秩1,2,分别计算每个区组的秩和B.将所有观察对象混在一起由小到大编秩1,2,分别计算每个处理组的秩和C.分别将每个处理组中的观察对象进行编秩1,2,计算每个处理组的秩和D.分别将每个区组中的观察对象进行编物1,2,计算每个处理组的秩和5.完全随机设计两独立样本比较秩和检验的基本

27、思想是H0为真时 。A.两组的秩和相等B.两组的秩和相差不会相差很大C.两组的平均秩次相等D.每组的秩和应在其期望值附近三、简答题1.非参数检验的基本思想是什么?2.非参数检验和参数检验的主要区别是什么?非参数检验的适用范围有哪些?3.两组或多组等级资料平均效应的比较为什么不用检验而应用秩和检验?4.对于研究目的相同的同一资料,用参数检验和非参数检验结果不一致时,该怎么办?5.当样本含量较大时,两样本比较的秩和检验可以计算Z统计量,能否认为此时的Z检验就是参数检验?四、统计计算题1.以下是测得的铅作业与非铅作业工人的血铅值()请问两组工人的血铅值有无差别?铅作业工人 0.62 0.87 0.9

28、7 1.21 1.64 1.08 0.46 1.24非铅作业工人 0.26 0.29 0.33 0.40 0.48 0.36 0.52 0.89 1.12 0.622.为研究果糖二磷酸钠治疗新生儿缺氧、缺血性脑病的疗效,将患者随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞二磷胆碱。治疗效果分为无效、有效和显效3种结果,见表10-2。比较果糖二磷酸钠和胞二磷胆碱的疗效是否相同? 表10-2 观察组与对照组的疗效比较组别 显效 有效 无效 合计 观察组 58 44 18 120 对照组 56 43 35 134 合 计 114 87 53 2543.将未达到性成熟的雌性大鼠18只,按体重

29、、窝别等配成6个区组,分别注射剂量为0.64鼠、1.64鼠和2.46鼠促性腺激素,每天1次,连续注射3天后将其杀死,取同卵巢称重。试验结果见表10-3: 表10-3 不同剂量组卵巢重量处 理 第1组 第2组 第3组 (注射剂量:) (0.64) (1.64) (2.64) 卵巢重量 24.17 26.06 21.21 (mg) 28.71 48.63 49.36 27.47 30.58 45.61 27.03 28.64 47.17 19.25 31.25 23.90 35.86 59.61 50.03问3种不同剂量促性腺激素对大鼠卵巢增重效果是否有差异?4.表10-4是尸解时称得的左、右肾的

30、重量,问左、右肾重量有无不同?表10-4 16例尸解标本左、右肾的重量(g)编号 左肾 右肾编号 左肾 右肾 1 170 150 2 155 145 3 130 120 4 115 100 5 235 222 6 125 115 7 130 1208 105 100 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 14015 95 100 16 130 120参考答案及注释一、是非题1.错。因为第1类错误与选择统计检验方法无关,与研究者设定检验水准有关。犯第1类错误的概率为。2.对。因为同一组资料而言,求秩和不会受此影响

31、,只要按相同秩校正就可以了。3.错。成组秩和检验要求资料是独立的。另外秩和检验的检验效能Power较低,如果资料符合检验条件,尽可能用检验为好。4.对。因为对于同样的样本资料,HHc,等级资料的tie较多,所以统计量H与Hc差异会较大,故会明显降低检验效能Power。5.错。界值范围内表示对于检验水准,H0为真情况下的T在范围,所以这个范围是不拒绝H0的范围,故。二、选择题1.D。犯第2类错误的概率一般大于参数检验。2.A。多个样本比较的秩和检验的备选假设H1:这些样本所来自的总体分布不全相同。3.C。因为配对检验的Power要高于配对符号检验的Power,但配对检验要求配对差值符合正态分布,

32、故首先考虑资料是否符合配对检验条件。4.D。随机区组设计,应分别对每个区组的资料从小到大进行编秩,比较处理之间的秩和差异。5.D。当H0为真时,两个样本来自同一的总体,每个数据的期望秩为/2,因此对于样本量为的样本期望秩和为/2,。在H0为真时样本的秩和应在其期望秩和/2附近;当在H1为真时,样本的秩和在大多数情况下远离其期望秩和/2,故当秩和远离其期望秩和/2,并超出其界值范围时,则可以拒绝H0。三、简答题1.非参数检验的基本思想是什么?非参数检验的基本思想:当总体分布情况未知或总体的分布不符合参数检验的条件时,如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每

33、个数值在整个数据中相应的位置和次序,称为该数据的秩。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。2.非参数检验和参数检验的主要区别是什么?非参数检验的适用范围有哪些?参数检验在理论上要求样本来自给定分布的总体,且该总体的分布依赖于若干参数。它是对总体均数或总体方差等总体参数的比较,计算检验统计量时用的是样本数据本身。非参数检验对总体分布形式不作任何假定,检验的目的是对总体分布进行比较,计算检验统计量时用的是样本数据的秩次,这样会损失很多信息。因此,能用参数检验的问题尽量用参数检验解决,只有当资料不满足参数检验的条件时,才考虑选用非参数检

34、验。非参数检验的适用范围:偏态分布资料或分布类型不明资料。各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性的资料。等级资料。个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。3.两组或多组等级资料平均效应的比较为什么不用检验,其结果只能回答组间的疗效构成有无差别,而不能说明组间的平均疗效有无差别,所以,比较组间平均效应应采用秩和检验。4.检验研究目的相同的同一资料,用参数检验和非参数检验结果不一致时,该怎么办?当非参数检验结果和参数检验结果不一致时,既不能一律认为参数检验的结果一定正确而否定非参数检验的结果,也不能认为哪种检验方法得出的结论有显著性差异就以该种统计方法的结果为依据,

35、此时应结合数据的分布特征进行判断。以完全随机设计两样本定量资料的比较为例,假如数据来自正态分布且方差齐,应以参数检验的结果为准;若数据明显偏态且经变量变换后仍不满足正态性要求时,应选择非参数检验的结果。一般而言,符合参数检验条件的资料要尽量选用参数检验的方法,只有当参数检验的条件得不到满足时,才选用非参数检验的结果。5.当样本含量较大时,两样本比较的秩和检验可以计算Z统计量,能否认为此时的Z检验就是参数检验?当样本含量较大时,在H0为真时,秩和T经变换后服从标准正态分布,两样本比较的秩和检验可以计算Z统计量,利用标准正态分布对假设作出检验,但它仍属非参数检验的范畴,因为其比较的仍是总体的分布而

36、不是总体参数。四、统计计算题1.题目见前。采用两独立样本的秩和检验:T=104.5,P<0.05,铅作业工人和非铅作业工人血铅含量不同,结合铅作业工人的平均秩次高于非铅作业工人,可以认为铅作业工人血铅含量高。2.题目见前。采用完全随机设计两样本比较的秩和检验,结果:Zc=1.677,P=0.094,根据本研究尚不能认为果糖二磷酸钠和胞二磷胆碱的疗效不同。3.题目见前。从设计类型上,本例是随机区组设计;从资料类型上,是个定量资料,首先行正态性检验,结果表明,第2组和第3组不满足正态性,因此选用随机区组设计的秩和检验,结果:x2=6.333,P=0.042,说明不同剂量的促性腺激素对雌性大白

37、鼠卵巢增重效果不同。4.题目见前数据不满足正态性条件,故采用配对资料的符号秩和检验,T=39.5,P>0.05,说明左右肾重量差异无统计学意义。第十一章 两个变量的关联性分析学习要点1.线性相关描述两个变量线性伴随变化的紧密程度。通常用Pearson积差相关系数刻画样本相关系数。要注意:样本相关系数的大小与样本量有关,特别当n=2时,样本相关系数为±1或0或不存在,所以不能简单地根据样本相关系数的大小作为总体相关系数的估计值。2.秩相关描述两个变量伴随变化的紧密性,与伴随变化幅度大小没有太强的联系,但与有没有伴随变化有关系。通常用Spearman相关系数刻画秩相关。其本质就是对

38、两个变量分别编秩,用两个变量的秩分别代入Pearson相关系数公式中,便得到Spearman(秩)相关系数。3.通常相关系数的统计推断为,所以当统计检验的P小于检验水准a时,只是可以推断两个变量存在某种关联性,即使样本相关系数较接近1或-1,也不能推断两个变量相等或相同。Pearson相关系数的统计检验要求x和y服从双正态分布。4.分类变量的关联性统计检验是检验两个变量有无关联性,通常用Pearson x2进行检验。两个关联紧密程度可以用Pearson列联系数刻画,但Pearson列联系数r的取值范围为。习题一、是非题1.Pearson相关系数的显著性检验,若结论为不拒绝H0,可以认为两变量间

39、无关系。( )2.在同样样本量的情况下,Pearson相关系数越接近1(P<0.05),说明两变量间直线关系越密切。( )3.计算列联系数时两随机变量不能为无序分类资料。( )4.越大(P<0.05),说明X对Y的影响幅度越大。( )5.,意味着X对Y之间的因果关系成立。( )二、选择题1.下列式中可出现负值的是( )。A. B. C. D. 列联系数2.直线相关系数的假设检验,其自由度为( )。A. n B. n-1C. n-2 D.2n-13.计算积差相关系数要求( )。A. 应变量Y是正态变量,而自变量X可以不满足正态的要求B. 自变量X是正态变量,而应变量Y可以不满足正态的

40、要求C. 应变量Y是定量指标,而自变量X可以是任何类型的数据D. 两变量都要求为满足正态分布规律的随机变量4.两组资料进行相关性分析,一个r0.01,v1>r1>r0.05,v1,,另一个r2>r0.01,v2,,可认为_。A.第1组资料两变量关系密切B.第2组资料两变量关系密切C.很难说哪一组变量关系密切D.5.欲也解20岁以上居民眼睛的晶状体混浊程度与年龄的相关关系,收集如下资料(表11-1),应计算_。表11-1晶状体混浊程度与年龄间的关系年龄(岁)晶状体混浊程度+合计20205664431530140986029840160125132417合计50528923610

41、30A.积差相关系数 B.秩相关系数C.列联系数 D.B和C均正确三、简答题1.r、rs和列联系数的应用条件有何不同?2.应用线性相关分析时应注意哪些问题?3.线性相关分析的基本步骤是什么?4.关联性分析的x2检验与两个或多个频数分布比较的x2检验的设计和意义有什么区别?5.线性相关分析中绘制散点图的目的是什么?能否用散点图来代替相关系数?四、统计计算题1.下表(表11-2)为大鼠进食量与其体重增量,试分析两者之间的相关关系。表11-2 大鼠进食量与其体重增量鼠号12345678910进食量(g)800690750780820940770900720860增量(g)16514115216116

42、81901501881371792.为研究冠以病与眼底动脉硬化的关系,收集了如下资料(表11-3)。问两者是否存在一定的关系?表11-3冠心病诊断结果与眼底动脉硬化级别的关系眼底动脉硬化级别冠心病诊断结果合计正常可疑冠心病032010633670125878516131143115合计47839255423.为研究肺癌患者p53基因型和HOGGI基因型的关系,研究者收集了124肺癌患者手术标本,采用PCR-RFLPR的方法测得它们的基因型如下(表11-4),分析p53基因型HOGGI的基因型有无关联?表11-4 124肺癌患者p53基因型和HOGGI基因型HOGGI基因型P53基因型合计野生型

43、杂合型突变型野生型14221349杂合型20181351突变型105924合计4445351244.为研究运动时间与心率的关系,研究者随机抽取16名成年男性,随机分到4组,接受相同程度的体育运动,但各组运动时间不同(10min,20min,30min,40min),于运动前和运动后测量心率如下(表11-5):表11-5各组运动前后心率(次/min)10min20min30min40min运动前运动后运动前运动后运动前运动后运动前运动后62806810583145761437090711186011068139759380135731398015078100691106613061128研究者首

44、先计算了各组运动后心率的增加值,以运动时间为横坐标,以心率的增加值为纵坐标,绘制了散点图,发现有线趋势近而计算了相关系数,r=0.949,p<0.05,认为运动时间和心率之间有较强的正相关关系。还有人以运动时间和各组心率的平均增加量(10,90.75),(20,117),(30,128.5),(40,140)4对数据进行线性相关分析,结果为:r=0.975,p<0.05,与前者得出了相同的结论。你认为上述分析方法正确吗?为什么?本资料可进行哪些统计分析?其意义何在?参考答案及注释一、是非题1.错。不拒绝HO表明没有充分证据可以说明两个变量之间存在线性相关性。2.对。因为越大,的95

45、%置信区间的边界离0越远。3.错。4.错。不能说明X与Y的某种对应关系。5.错。相关性不能推断因果关系。二、选择题1.选B。 2. 选C。 3.选D。 4.选C。 5.选B。三、简答题1.r、rs和列联系数的应用条件有何不同?r:双变量正态分布资料。rs:两个变量为连续型或有序分类,容许资料不服从正态分布。列联系数:双向无序资料或单项有序资料。2.应用线性相关分析时应注意哪些问题?(1)相关分析前应绘制散点图,当两变量X、Y有线性趋势时,才能进行线性相关分析;(2)相关分析适用于双变量正态分布的资料,否则需进行变量变换或采用其他计算方法;(3)当一个变量的数值人为选定时不能做相关分析;(4)分

46、层资料盲目合并容易引起假象,应当特别注意;(5)相关关系不同于因果关系。3.线性相关分析的基本步骤是什么?(1)首先是绘制散点图,看有无线性趋势和异常点;(2)计算相关系数;(3)对相关系数进行假设检验;(4)计算相关系数的置信区间。4.关联性分析的x2检验与两个或多个频数分布比较的x2检验的设计和意义有什么区别?关联性分析的x2检验与两个或多个频数分布比较的x2检验计算公式相同,但设计和意义不同,作关联性分析的资料是一份随机样本,同时按两种属性分类;两个或多个频数分布比较的x2 检验中,一个变量是分组变量,是事先设定好的,另一个是随机变量,是不能进行关联性分析的。5.线性相关分析中绘制散点图

47、的目的是什么?能否用散点来代替相关系数?绘制散点图的主要目的有两个:一是粗略地看两变量间有无线性趋势;二是看有无异常点。散点图是不能够替代相关系数的,它只能帮助我们定性地判断有无线性趋势,不能够定量地分析相关性的强弱,更不能据此判断相关是否有统计意义。四、统计计算题1.题目见前。大鼠进食量与其体重增量服从双变量正态分布,散点图显示有线趋势。因此计算积差相关系数,r=0.976,p<0.001,说明大鼠进量与其体重增量间的线性关系成立。2.题目见前。计算秩相关系数,rs=0.288,p<0.001,说明冠心病诊断结果与眼底动脉硬化级别呈正相关系。3.题目见前。Pearson列联系数r

48、=0.190,p=0.327,表明没有足够证据可以推断肺癌患者p53基因型和HOGG1是有关联的。4.题目见前。上述两种分析方法均不正确,因为运动时间是研究者事先决定的,不是随机变量。而相关分析要求资料服从双变量正态分布。该种设计类型的资料可以进行单因素方差分析(如果符合“正态性”和“方差齐性”)或完全随机设计多样本比较的秩和检验(当“正态性”和“方差齐性”得不到满足时),其意义在于比较不同运动时间心率增加量是否不同。第十二章 简单回归分析学习要点1.简单线性回归模型:y=0+1x+;总体直线回归方程:;样本直线回归方程:式中a和b分别是根据样本资料拟合直线回归方程所得到的0和1的估计值,是固

49、定x的情况下的总体均数的估计值并称为预测值,是误差,假定N(0,2)。2.线性回归模型要求资料在固定x的情况下,y服从正态分布或残差e(的估计值)满足正态性和方差齐性(即残差e不随着x增大而呈现离散变大或变小的趋势),并且e不随x变化而呈趋势性变化。即线性回归模型对资料的假定:线性,独立、正态性和等方差性。3.简单回归模型中的回归参数估计方法及其标准误Sb的计算。4.回归系数的假设检验,相关系数检验与回归系数检验的等价性(tb=tr),解释相关系数r的意义。5.区分总体回归线的95%置信区间与个体Y预测值的95%区间估计的意义。6.了解残差分析。7.了解非线回归。8.掌握线性回归与线性相关的关系。习题一、是非题1.直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互线性随变化关系。( )2.对同一资料,如相关分析算出的r值越大,则回归分析算出的b也越大。( )3.对同一资料,对r与b分别作假设检验,可得tr=tb 。 ( )4.利用直线回归估计X值所对应的Y值的均数置信区间时,增大残差标准差可以减小区间长度。 ( )5.如果直线相关系数r=0,则直线回归的SS残差必等于0。 ( )二、选择题1.直线回归中,如果自变量X乘以一个不为0或1的常数,则有_。A.截距改变 B.回归系数改变C.两者都改变 D.两者都不改变2.有直线回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论