统计学方法的分类与选择-重点知识_第1页
统计学方法的分类与选择-重点知识_第2页
统计学方法的分类与选择-重点知识_第3页
统计学方法的分类与选择-重点知识_第4页
统计学方法的分类与选择-重点知识_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计方法的分类和选择,(1)根据研究设计类型选择分析方法,(2)两组之间的比较应采用组比较设计中的组比较设计、t检验或X2检验。多组比较应采用方差分析、行列表X2检验或层次分析法。(2)配对(自己实验前后)设计这种类型的设计需要根据匹配的T检验、X2检验和匹配的病例对照研究方法进行数据分析。(3)重复测量设计这种设计方法是在给定一个处理因子后,在不同时间重复测量一个效应变量的变化。为了评价接种后生物制品的免疫效果,在接种后2周、4周、6周和8周测定抗体滴度,即这种类型的设计。对于这种设计类型的数据,应采用重复测量方差分析方法来分析数据。(4)多因素设计如果研究设计中有多个自变量,可以根据因变量的性质选择合适的多因素分析方法。如果自变量是数值变量,可以考虑多元回归分析法和协方差分析法。如果是分类变量,可以选择逻辑回归分析法、判别分析法和聚类分析法。根据变量的类型,选择分析方法来区分和澄清要研究的因变量和自变量具有重要的流行病学和生物统计学意义。首先,它有助于选择要研究的变量,并对问卷的设计有指导作用。其次,数据分析阶段可以指导数据分析方法的选择和模型的建立。如果因变量是分类变量,分类变量的分析方法,如卡方检验和逻辑回归分析,经常被考虑。如果因变量是数值变量,考虑应用数值变量的分析方法,如t检验、方差分析、协方差分析、多元回归等。同时明确自变量和因变量可以建立正确的统计分析模型。因变量应该放在模型的左侧,自变量放在模型的右侧。例如,为了评估不同治疗方法(口服药物、胰岛素注射和饮食控制)对糖尿病患者的治疗效果(血糖水平),需要在分析期间调整患者的性别、年龄和病程的影响。这种情况的治疗需要协方差分析。当使用SAS进行分析时,血糖水平(因变量)应放在模型的左侧,而治疗方法或其他协变量(性别、年龄和病程)应放在模型的右侧。另一个例子是分析脂蛋白(a)与冠心病发生的关系。如果冠心病是一个因变量,脂蛋白(a)是一个自变量。这种关系不可逆转。不同变量类型的数据分析方法选择,不同研究设计和数据类型的数据分析方法选择,数据分析程序,数据转换,1)大多数非正态数据变量转换的统计分析方法都是基于数据的正态分布。如果数据不符合正态分布,则不能应用parametrictest方法。只有非参数测试方法可以应用,而非参数方法不是对原始数据的测试,如秩和检验就是非参数测试方法之一。它是对原始数据进行排序的测试,可能会丢失数据信息,降低测试效率。在分析数值变量时,必须根据统计分析方法/统计分析公式的限制性使用条件对数据进行“条件”检验,如正态性检验和方差齐性检验。许多统计软件都有方便的正态性检验和方差齐性检验功能,如SAS软件。如果测试数据不符合使用条件,则需要对数据进行变量转换。如果转换后的数据满足条件,可以应用参数测试方法。否则,只能应用非参数测试方法。数据变量转换的方法很多,可以根据数据的分布特点选择合适的数据转换方法。常用的方法包括对数变换(2)分类变量到虚拟变量的转换如果分类变量是二元的和连续的,它们的原始数值可以直接应用。然而,对于名义尺度,因为在进行不同的分析(包括多元分析、逻辑回归、考克斯回归等)时,类别之间没有顺序关系。),原始计算机不能用来输入数值,变量转换是必要的。也就是说,将变量转换成(水平数字1)虚拟变量,然后将这些新转换的变量放入多因素模型中。T检验的应用条件,两组数据的比较1样本比较小(n50)2样本来自正常总体3两样本总体方差同一性当两个样本的方差不一致时可以采用T检验、变量变换或秩和检验。方差分析的应用条件,上述两组数据的比较1样本是独立的随机样本;每个样本应该来自正常人群;3要求所有样本具有相同的总体方差。多个样本平均值之间的二比二比较,纽曼-凯尔斯检验,也称为学生-纽曼-凯尔斯(SNK)检验,也称为Q检验。最小显著差异检验。在协方差分析和定量分析中,当比较两个或两个以上样本的平均数时,不仅需要使用假设检验来判断差异在统计上是否不同,还需要考虑它们之间是否存在混合因素(协变量)。如果协变量存在,它们应该通过协方差分析来修正。协方差分析是定量变量分析中控制混杂因素的重要手段。影响观察指标的其他非研究因素(混杂因素)在统计分析中也被称为协变量。考虑协变量影响的方差分析是协方差分析。协方差分析是解决上述问题的一种分析方法。它结合线性回归和方差分析来检验两个或两个以上修正平均数之间没有差异的假设。通常,线性回归方法用于找出各组因变量和协变量之间的定量关系,以在假设协变量相等时获得校正系数,然后使用方差分析来比较校正平均值之间的差异。协方差分析的条件是:1每个样本来自一个方差相同的正态总体2所有组的线性回归系数是相同的,而不是0。协方差分析判别步骤:1、正态和方差齐性检验;(2)判断协变量和因变量之间是否存在线性关系;3.判断各组回归线是否平行。线性回归和相关的区别和关系,多元线性回归的基本概念,事物之间的相互关系往往是多方面的,在许多情况下有多个自变量影响相应的变量y。多元线性回归的目的是用一个多元线性回归方程来表达多个自变量和一个因变量之间的关系。标准偏回归系数表明,当其他自变量固定时,xi平均改变一个单位,y平均改变两个单位。多元线性回归的应用条件如下:1 .独立性:观察对象相互独立。2.线性:自变量和因变量之间的关系是线性的。3.正态性:当自变量取不同的值时,因变量的分布是正态的。4.方差齐性:当自变量取不同值时,因变量的总体方差相等。5.当条件不满足时,可以转换自变量。例如,为了比较自变量对因变量的影响,不能使用偏回归系数,因为偏回归系数的单位不同。偏回归系数必须标准化为没有单位的标准偏回归系数。在消除不同单位的影响后,标准偏回归系数的绝对值越大,自变量对因变量的影响越大,但差异是否具有统计学意义也必须进行检验。(2)各偏回归系数的显著性检验:f检验和t检验。1.计算截距和每个偏回归逐步回归分析的计算方法,在可选的自变量Xi中,根据其对y的影响,将自变量从大到小逐个引入方程,引入每个自变量进行显著性检验,只有当其显著时才引入,当新的自变量进入方程时,也检验方程中的原始自变量,将影响最小且退化为不显著的自变量从方程中逐个去除。因此,在逐步回归的每一步(引入变量或消除变量称为一步)之前和之后,必须进行显著性检验,以确保方程在引入新变量之前只包含显著的独立变量。这是一步一步进行的,直到方程中包含的自变量是显著的,并且没有新的显著自变量可以引入方程。逐步回归分析在医学研究中的应用及应注意的几个问题?等式1的“最优”问题实际上是选择自变量以获得具有最佳拟合效果的多元回归方程。最佳子集回归是选择一个自变量,使回归方程最适合,而逐步回归是选择一个自变量,这是有意义的因变量。应根据研究目的选择合适的方法。逐步回归主要用于病因学探索、临床疗效分析和控制等医学领域。3线性回归模型应注意正态性、方差的同质性和独立性,因变量必须是随机变量等。4如果所选变量明显与专业理论的实际问题不符,首先检查数据中是否有异常点,自变量之间是否存在共线性,数据输入是否有误等。并根据专业知识做出合理解释。逐步回归在分析大量因素时,可以先进行聚类分析,然后再进行逐步回归。一般情况下,以变量值的5 10倍为观察单位为宜。逻辑回归分析的基本思想,回忆:线性回归分析需要因变量,因变量y,连续型服从正态分布,胆固醇含量,自变量x,数值型与y有线性关系,年龄,舒张压,亚型变量是医学研究中经常遇到的,如:两个分类变量:生存与死亡,疾病与无疾病,有效与无效感染和未感染多分类有序变量:疾病程度(轻度,中度,重度),疗效(治愈,显著效果,改善,无效)多分类无序变量:手术方法(A,B,C),手术方法这个回归分析问题不能依赖于线性回归模型,因为因变量的假设被破坏了。你能找到y=f(x)模型的另一种形式来描述分类变量y和x之间的相关性吗?因为从数学的角度来看,没有函数x取任何值,y只取1和0。即转换为分析概率变量p与x之间的关系,其中y取一定值,不能直接分析变量y与x之间的关系,逻辑回归模型,分类逻辑回归分析、 根据数据类型:无条件逻辑回归分析(组数据)条件逻辑回归分析(匹配病例对照数据)根据因变量数量:二元逻辑回归分析多值逻辑回归分析根据自变量数量:单变量逻辑回归分析多元逻辑回归分析,逻辑回归分析数学模型,1,单变量逻辑回归模型,使y为变量1,0和x为风险因素; P=p(y=1|x),则二元变量y相对于变量x的单变量逻辑回归模型为:其中和是待估计的未知参数或回归系数。该模型描述了y取某一值(其中y=1)的概率p与自变量x 2之间的关系。多元逻辑回归模型使y 1,0变量,x1,x2,xk k k风险因素;P=p (y=1 | x1,x2,xk),然后是变量y相对于变量x1,x2,xk是:另一种形式的逻辑回归模型,wh假设检验得到每个参数的估计值后,并不意味着每个因素都与因变量相关。模型中只应保留对因变量有影响的因素。因此,需要逐个测试方程中的每个变量,排除对因变量没有影响的因素,并测试拟合的模型。即采用似然比检验方法,通过逐步回归筛选自变量,最终得到具有统计显著性的logistic回归方程。这个过程非常复杂,是由计算机完成的。医学中经常需要匹配的病例对照研究。所谓配对病例对照研究是指将每个病例与一个(1:1)或几个(1:M)具有相似性别、年龄或其他条件的对照进行配对,然后分析和比较病例组和对照组以前接触致病因素的经历。用于分析配对病例对照研究数据的统计分析方法通常采用条件逻辑回归分析。条件逻辑回归分析的数学模型和分析原理与无条件逻辑回归分析相似。因为参数的估计公式涉及条件概率理论,所以称为条件逻辑回归分析。条件逻辑回归分析、逻辑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论