医学统计学(第3版)课件 第二十二章 其他多变量分析方法简介_第1页
医学统计学(第3版)课件 第二十二章 其他多变量分析方法简介_第2页
医学统计学(第3版)课件 第二十二章 其他多变量分析方法简介_第3页
医学统计学(第3版)课件 第二十二章 其他多变量分析方法简介_第4页
医学统计学(第3版)课件 第二十二章 其他多变量分析方法简介_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二十二章其他多变量分析方法简介医学统计学主要内容2主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67主要内容3主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12数学模型及几何意义3常规计算步骤4主成分个数的确定5实例分析6模型应用7基本概念一、课程目标掌握基本概念熟悉主要用途了解分析过程,并能运用SPSS软件进行分析二、基本概念在医学领域研究中,通常需要对含有多个变量的数据进行分析寻找规律。多变量大数据集无疑会提供丰富的信息,但也增加了计算量和问题分析的复杂性。另外由于变量间可能存在的相关性,使得统计分析数据反应的信息有一定的重叠。基于以上原因,人们自然希望寻找一种合理的方法,在减少分析指标的同时,尽量减少原始指标包含信息的损失,以达到对所收集数据进行全面分析的目的。主成分分析是设法将原始变量重新组合成一组新的互相无关的综合指标,同时根据实际需要从中取出几个较少的综合指标尽可能多地反映原来众多指标的信息的统计方法,也是数学上用来降维的一种方法。三、数学模型及几何意义

三、数学模型及几何意义

三、数学模型及几何意义

三、数学模型及几何意义

三、数学模型及几何意义

三、数学模型及几何意义

四、常规计算步骤假设收集到的原始数据共有n例,每例测得p个指标的数值,记录如下表形式:表1原始数据表样品号观测指标12n四、常规计算步骤步骤

1原始数据标准化

步骤

2求变量间相关矩阵R

四、常规计算步骤步骤

3求矩阵R的特征值和特征值对应的特征向量

四、常规计算步骤步骤

4计算主成分的贡献率以及累积贡献率

步骤

4确定主成分个数,计算主成分得分,并解释各主成分意义五、主成分个数的确定

六、实例分析表230例乙肝患者的4项肝功指标的测定值样品号观测指标1230六、实例分析利用SPSS软件分析,可得如下结果(表20-1,表20-2,表20-3,表20-4):六、实例分析六、实例分析六、实例分析七、模型应用1对原始指标进行综合:以互不相关的较少的综合指标反应众多变量提供的信息2将非独立变量转化为独立变量,解决多元共线性问题3可用于判别归类:计算主成分后,如果各主成分的专业意义较为明显,可利用主成分得分来对样本归类4计算主成分得分,以贡献率为权重,构造综合评价函数,借助多指标从多维度对医学现象或事物进行综合评价主要内容24主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12数学模型3常规计算步骤4公因子个数的确定5因子旋转及因子得分6因子分析与主成分分析的异同7基本概念一、课程目标掌握基本原理,以及因子分析与主成分分析之间的区别与联系熟悉主要用途了解分析过程,并能运用SPSS软件进行分析二、基本概念因子分析的概念起源于20世纪初KarlPearson和CharlesSpearmen等人关于智力测验的统计分析。目前已广泛应用于行为科学、社会科学、产品管理学、运筹学及其它具有大量数据的领域。因子分析就是从研究指标相关矩阵内部的依赖关系出发,寻找隐含在多变量数据中无法直接观察到的公因子的一种多元统计分析方法。基本思想是:因子分析是主成分分析的推广,也是一种降维方法。从分析多个可观测原始指标的相关关系入手,找出支配这种相关关系的有限个不可观测的潜变量,用这些潜变量来产生和解释原始指标之间的相关性。也就是说,因子分析实际上就是一种探讨潜变量是怎样影响原始观测变量的方法。潜变量也称为综合因子或公共因子。三、数学模型矩阵形式如下:

三、数学模型

三、数学模型

四、常规计算步骤假设收集到的数据共有n例,每例观测对象测得p个指标的数值,记录如下表形式:表1原始数据表样品号观测指标12n四、常规计算步骤步骤

1原始数据标准化步骤

2求变量间相关矩阵R步骤

3求变量间约相关矩阵R*四、常规计算步骤步骤

4求矩阵R*所有大于零的特征值及对应的特征向量步骤

5计算因子载荷阵A及公因子表达式五、公因子个数的确定

六、因子旋转及因子得分(一)因子旋转因子分析的主要目的是寻找有实际意义的公因子,但由前面介绍的估计方法所求出的公因子有时其代表性并不很突出,容易使公因子的实际意义模糊不清,不便于解释。为了使新的公因子意义更加明确,需要使每个变量在诸公因子的载荷向两极分化,在一个公因子上的载荷尽量大,而在其它公因子上尽量小。换言之,使每个变量在公因子上的负荷变异最大。可通过原公因子“坐标系”的旋转来实现。按不同的原则求得变换矩阵,相应地就有不同的旋转方法。常用的是方差最大法。该法通过旋转使每一公因子上因子载荷的平方向0和1两极分化,造成尽可能大的差别,以使各公因子尽可能支配不同的原始指标,从而使各公因子具有较为清晰的专业意义。六、因子旋转及因子得分(二)因子得分

七、因子分析与主成分分析的异同1分析重点不一致:主成分分析侧重于综合原始变量的信息,且主成分得分可以准确计算;而因子分析则关注于解释原始变量之间的关系,各公因子得分只能进行估计。2方法不同:主成分的求解较简单,只需求出协方差阵(或相关阵)的特征值和特征向量,就可算出主成分得分,进而完成分析;而因子分析分为确定因子载荷、因子旋转及计算因子得分三步。七、因子分析与主成分分析的异同方法学原理上:两种方法之间并没有本质差别,只是因子分析在主成分分析的基础上进行了推广,这就是为什么因子分析的主成分解与主成分分析的结果完全一致的原因。39主要内容主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12基本思想3软件实现4实例分析5分析过程一、课程目标理解结构方程相关的基本概念理解结构方程相关的主要用途了解分析过程,解读结果二、基本思想

结构方程模型是一种复杂的因果关系模型,可以把潜变量和观测变量有效地结合起来,处理观测变量与潜变量以及潜变量之间的关系。近20年来,随着统计软件的完善,结构方程模型在心理学、社会学、行为科学以及医学等领域中得到了越来越广泛的应用。在国外,结构方程模型在医学研究领域主要被用在两个方面:一方面是用来验证某种理论假设的结构是否成立,如分析某一量表的结构效度;另一方面是用来分析各个潜变量之间的因果关系。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释

结构方程模型是一种验证性的分析方法,虽然可以探索一些现象,但是最终还是要回归到对研究者所想了解的事情的肯定和证明。所以模型需要首先依据已有的经验或者理论知识建立假设模型,结构方程模型间各显变量(或观测指标)与潜变量之间关系的呈现,需要依靠理论来建立,之后将理论所呈现的假设以结构方程模型的形式加以表达,一般以路径图符号来勾画出有关变量之间的关系。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释一个典型的结构方程模型,用来描述智力与学业水平的关系示意图。图中圆框为潜变量(latentvariables),方框为观测指标(observableindicators)。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释

也叫模型确认,也就是实际数据必须满足模型估计的需要,对于每个未知参数皆可以导出一个唯一的估计值,若无法满足此要求,那么就无法对模型进行正确的估计。模型识别是结构方程模型中一个重要步骤,很多对结构方程模型理论不清楚的研究者常会忽略这一步。如果方程中的自由参数有一个不能由观测数据估计得到,则方程为不可识别;如果都能得到,则为可以识别,可以识别分为正好识别和过度识别。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释正好识别(Just-Identified):在正好识别的情况下,模型中的自由参数数量等于样本数据中可自由估计的信息量。这意味着模型的参数可以完全由样本数据确定,没有冗余的参数。这是理想的情况,但在实际研究中比较少见。过度识别(Over-identified):在过度识别的情况下,模型中的自由参数数量多于样本数据中可自由估计的信息量。这种情况下,模型拥有冗余的参数,但通过适当的约束条件和模型修正,可以使模型与观测数据相符。过度识别模型通常需要引入额外的限制条件,如等式约束或将某些参数设为零,以提高模型的可识别性。三、分析过程模型识别模型设定模型估计模型评价和修正模型解释在有了一个模型之后,就要设法求出模型的解,其中主要是模型参数的估计。在结构方程中,目标是求参数使得模型隐含的协方差矩阵与样本协方差矩阵“差距”最小。在诸多参数估计方法中,较常用的是极大似然法(ML),很多研究表明ML对样本与峰态的变化上比较不敏感,比较稳定且较精确。广义最小二乘法(GLS)估计需要好的理论界定模型,在理论与经验的良好的配合下可以允许小样本的估计。加权最小二乘法(WLS)对观测变量分布的偏度和峰度要求不严,多元正态分布的假设可以放松,但是也需要好的界定模型,并且在大样本下才能表现好的估计。三、分析过程模型识别模型设定模型估计模型评价和修正模型解释还有其他一些方法可以用于结构方程模型的参数估计,具体包括:稳健最小二乘法(RobustLeastSquares,RLS):稳健最小二乘法通过考虑异常值和非正态分布等因素,提供对参数估计的鲁棒性。它可以减少异常值对估计结果的影响,并对非正态分布数据提供相对稳健的估计。牛顿-拉夫逊算法(Newton-Raphsonalgorithm):这是一种迭代优化算法,用于最大化似然函数或最小化模型的误差函数。它通过不断更新参数估计值来逼近最优解。广义矩估计法(GeneralizedMethodofMoments,GMM):广义矩估计法基于矩条件,通过选择合适的矩条件来估计模型参数。它可以处理非线性模型和具有异方差性的数据。马尔可夫链蒙特卡洛(MarkovChainMonteCarlo,MCMC)方法:MCMC方法利用随机模拟技术,通过从后验概率分布中抽取样本来估计模型参数。这种方法在贝叶斯结构方程模型中常被应用。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释

模型评价即对理论假设模型和实际模型之间的吻合程度进行评价。首先要看参数与理论假设模型的关系是否合理,比如出现负方差、相关系数超过1或者有太大的标准误都说明出现了不合理的估计结果,则无论所获得的适配度多么的良好都是错误的。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释一些拟合指数:卡方拟合度检验(Chi-squaretestofmodelfit):卡方统计量(χ²)用于衡量观测数据与理论模型之间的差异。在理想情况下,卡方值应为非显著,即不拒绝原假设。但卡方值受样本量的影响,因此需要考虑其他拟合指数进行综合评估。广义拟合指数(Goodness-of-FitIndex,GFI):GFI度量模型的拟合程度,其取值范围在0到1之间。较高的GFI值表示模型与数据的拟合较好,一般取值>0.90。根均方误差逼近度(RootMeanSquareErrorofApproximation,RMSEA):RMSEA度量模型与观测数据之间的差异。较低的RMSEA值表示模型与数据的拟合较好,一般取值<0.10。规范拟合指数(NormedFitIndex,NFI):NFI是一个综合的拟合指数,其取值范围在0到1之间。较高的NFI值表示模型与数据的拟合较好,一般取值>0.90。增量拟合指数(IncrementalFitIndex,IFI)和规范的增量拟合指数(NormedIncrementalFitIndex,NNFI):这两个指数衡量模型的改进相对于零模型(nullmodel)的程度。较高的IFI和NNFI值表示模型的改进较大,一般取值>0.90。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释

模型评价即对理论假设模型和实际模型之间的吻合程度进行评价。首先要看参数与理论假设模型的关系是否合理,比如出现负方差、相关系数超过1或者有太大的标准误都说明出现了不合理的估计结果,则无论所获得的适配度多么的良好都是错误的。可通过一些拟合指数进行模型适配度分析:三、分析过程模型设定模型识别模型估计模型评价和修正模型解释

模型修正:预先的理论假设模型常出现统计拟合不满意的情况,这就需要对原来的假设进行修改和完善,因此可以说结构方程模型也具有探索性功能。如果要对模型进行修正,删掉或增加某条路径,理论还是要忠于统计资料的数据。若变量数目不多时,为慎重地修改模型,一般只修正一条路径,再经重新验证后进行评价,如不满意再进行修改,直到满意为止。并且在修正模型之前要分析模型不合适的原因是由于模型建构有问题,还是数据有问题。如果是数据有问题,比如数据的极端异常或缺失,都应该先对数据进行处理再考虑是否需要修正。三、分析过程模型设定模型识别模型估计模型评价和修正模型解释

模型解释是指对一个合理的拟合后模型的统计结果进行解释。利用模型中的非标准化系数与标准化系数,来判断哪一个参数的影响力比较大,哪一个参数的影响力比较小。四、软件实现

LISREL由结构方程模型开创者开发。AMOS有画图功能,增加了使用者的便捷性和趣味性,

通过图形直接求模型的解。EQS、SAS、SPSSRlavaan程序包提供结构方程模型的相关功能五、实例分析为了解某胃部疾病的影响因素,以及该胃部疾病对于生活质量的影响,故以调查问卷的形式分别随机抽样调查了15000例有代表性的样本,调查问卷内容包括年龄、性别、身高、体重、吸烟、饮酒、运动频率、家族史等19项样本基本人口学和社会学信息,另外调查了SF-36生活质量调查问卷。

该研究分析过程为:首先研究者根据临床理论及相应参考文献,和传统分析方法分出的相关危险因素综合建立理论模型,确定潜变量(包括人口特征、社会特征、生活习惯、自我评价和家族史、胃病评分以及SF-36的8个维度)之后,利用LISREL8.3软件进行模型和实际调查数据的拟合性检验,采用极大似然法对模型进行估计。五、实例分析模型拟合出之后,对模型进行评价和修正,本研究共通过六次修正,第六次拟合模型可作为最终模型进行解释。六次拟合结果见表21.10。五、实例分析

通过最终模型示意图22.1可知,该胃病的影响因素分为3个方面,分别是“人口社会学特征(RK)”“生活状态特征(SH)”和“家族史”。其中“生活状态特征(SH)”对该胃部疾病的影响最大(0.19),其次是“家族史(JZS)”(0.14),“人口社会学特征(RK)”对该胃部疾病的影响最小(0.06)。患有该胃部疾病的患者对躯体疼痛(BP)维度影响最大(0.25),其次为总体健康感(GH),对心理方面虽然也存在影响,但是小于生理方面,首先影响患者的精神健康(MH)方面(-0.10),其次影响患者的生命活力(VT)方面(-0.07)。58主要内容主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12基本思想3

4系统聚类法5常用统计量-距离系数d逐步聚类法6实例分析7一、课程目标理解聚类分析相关的基本概念了解聚类分析的主要用途运用SPSS软件进行聚类分析二、基本思想聚类分析是一种以“物以类聚”思想将未知类别的事物进行分类的统计学方法。聚类分析可以分为两种类型:一种是对样品聚类,例如对同一种疾病的患者,可以根据各自不同的临床表现,把患者客观地分为不同的类型(如轻型、一般型和重型)。另一种是对指标聚类,如在研究某一专家诊断疾病所依据的各种指标时,可以通过聚类分析,把全部的依据(指标)客观地归纳为不同的类别。样品聚类和指标聚类虽然在名称和概念上完全不同,而实际的统计学计算方法是完全一致的,只不过把数据矩阵进行了转置而已。三、常用统计量-距离系数d

计算出所有n个样品两两之间的距离系数之后,便可得到下面的距离系数矩阵:三、常用统计量-距离系数d标准正态差变换

经变换后的新数据为:经过变换后的新值具有平均值为0、方差为1

的性质,是一个无量纲的变量。极差变换

经变换后的新数据为:经过这样变换后的新值也在0

与1

之间变化,而且消除了不同变量量纲的影响。在聚类分析中,可以选用下面两种标准化方法。除了运用距离系数之外,还可以运用相关系数来描述p维空间中n个样品两两之间的相互关系,即相关系数,其计算公式为:

五、系统聚类法基本思想:先将n个样品各自看成一类,然后选择相似程度最大的样品对归为一类,再选择相似程度次大的样品对归为一类。在进行归类过程中:①若两样品在已经形成的类中没有出现过,则成立一个新类;②若两样品中有一个是在已经形成的类中出现过,则另一样品加入该类;③若两样品分别出现在已经形成的两个类中,则把这两类归并为一大类;④若两样品都在同一类中出现,则这一对样品就不再归类了。这样反复进行直到对所有样品都归类完毕为止,形成一个分类系统。六、逐步聚类法逐步聚类法中最常用的一种是k-means法,其基本原理是:首先选择若干个初始凝聚点,根据与各凝聚点的距离将每个样本归入到与该样本最近的凝聚点所代表的初始类中,再以初始类的“重心”(均值向量)作为新的凝聚点重新将样本归类,重复以上过程,直至所有样品的归类与上一步相同为止。七、实例分析现有某小学15名三年级男生六个项目的智力测验(常识、数学、理解、填图、积木和译码)得分资料,试作聚类分析。本资料为小样本数据,采用系统聚类法分析。SPSS进行系统聚类分析的操作为:Analyze→Classify→HierarchicalCluster在弹出的对话框左侧的变量列表中单击选择分析变量,将变量选入到“Variables”变量列表中,本例将“常识”、“数学”、“理解”、“填图”、“积木”、“译码”选入“Variables”框中。在“Cluster”框中选择“Cases”表示进行样品聚类。在“Display”框中选择“Statistics”和“Plots”表示输出统计量和作图。单击“Plots”,选中“Dendrogram”,表示做系统聚类图,然后单击“Continue”。单击“OK”完成。七、实例分析表21.11表示聚类过程。表中Stage、Cluster

Combined、Coefficients、StageClusterFirst、Appears、NextStage分别表示聚类步骤编号、样品归类情况(每个聚类步骤归为一类的两个样品或新类编号)、距离系数、归类的两个样品第一次出现类编号、下一个聚类步骤。七、实例分析图21.2表示15名男生逐步聚为一类的过程。根据这一聚类分析结果,结合学生的智力得分情况,可把这15名学生分为三类:第一类为智力优异型,有3个学生,他们的编号为7、12、15的学生;第二类为智力均衡型,包括10个学生,他们的编号分别是1、2、3、5、6、8、9、10、11、14;第三类为智力欠发达型,也只有2个,即编号为4、13的学生。主要内容70主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12基本思想34实例分析5Fisher判别分析法逐步聚类法6实例分析7Bayes判别分析法一、课程目标理解判别分析相关的基本概念了解判别分析的主要用途运用SPSS软件进行判别分析二、基本思想判别分析是在已知总体分类的基础上,根据样本资料,运用统计学方法,建立关于指标的判别函数和判别准则,以此判定事物类别的多元统计分析方法。判别分析常用的方法有两种,Fisher判别分析法和Bayes判别分析法。Fisher判别常用于二类判别,以距离为判别准则,即样本与哪一类的距离最短就归属与哪一类;Bayes判别法常用于多类判别,以概率为判别准则,即样本属于哪一类的概率最大就归属哪一类。判别函数可纳入所有指标变量,也可采用逐步法选择对判别函数贡献大的指标进入模型。判别函数判别样本归类的能力大小很大程度上依赖于指标的选取,可以结合专业知识和经验,同时借助统计方法筛选指标变量。三、Fisher判别分析法:原理

三、Fisher判别分析法:原理

三、Fisher判别分析法:确定判别临界值

三、Fisher判别分析法:判别效果评价

可采用误判概率P来衡量判别效果,P=P(1|2)+P(2|1),即将第二类误判成第一类的条件概率与将第一类误判成第二类的条件概率之和。一般要求判别函数的误判概率P

小于0.1或0.2。可在建立判别函数前将样本随机分成两个部分,各占总样本含量的85%和15%,前者用于建立判别函数,后者用于计算误判概率,验证判别函数。也可顺序剔除一个样品,用余下的n-1个样品建立判别函数,,重复上述过程,计算误判概率,即所谓的刀切法或交叉核实。四、Bayes判别分析法

四、Bayes判别分析法

Bayes判别分析法常以错判率和后验概率错误率评价判别准则的可靠性。错判率估计采用回代法,计算被错判的样本数所占比例,后验概率错误率在回代过程和判别新样本时均可以估计。要保证判别函数的判别效能较好,首先原始数据的分类要明确可靠;其次,筛选的指标变量对判别函数贡献较大;最后,错判率和后验概率错误率要较小。五、实例分析

五、实例分析单击“DefineRange”,定义分组变量的最小值和最大取值,分别输入“Minimum”和“Maximum”后面的文本框中。单击“Continue”。单击“Statistics…”,选中“FunctionCoefficients”框中的“Fisher’s”,单击“Continue”。选中“UseStepwiseMethod”,表示采用逐步回归筛选分析变量。单击“Classify…”,在“PriorProbabilities”框中选择“Computefromgroupsizes”;在“Display”框中选择“Summarytable”和“Leave-one-outclassification”;在“UseCovarianceMatrix”框中选择“Withingroups”。单击“Continue”。单击“OK”完成。五、实例分析

五、实例分析左表为分别采用回代法和刀切法考核判别效果。回代法显示有1例原1类被错判为2类,有2例原2类被错判为1类,1例原2类被错判为3类,故错判3例,总体符合率为83.3%;刀切法显示有1例原1类被判断为2类,有2例原2类被判断为1类,有2例原2类被错判为3类,故错判4例,总体符合确率为79.2%,判别效果较好。主要内容84主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12数学模型3常规计算步骤4判断是否存在高水平效应5模型优点6注意7基本概念一、课程目标掌握基本概念熟悉模型的主要用途和适用条件了解分析过程,并能运用SPSS软件进行分析二、基本概念多水平模型(multilevelmodel)是基于方差分析理论与多元统计分析相结合而提出的统计模型,将传统模型中的随机误差项分解到与数据层次结构相应的水平上,可有效处理传统多元统计方法难以分析的具有多层次结构特征的数据。多水平数据的基本形式乡(镇)12n村12…村民m112…m212…mn以流行病学调查中按照乡(镇)、村进行多阶段分层随机抽样研究为例,所得数据具有乡(镇)、村和个人三个层次结构。在多水平数据中,常存在组内相关性问题,当观察相互独立、方差齐性及正态分布的假设不成立时,传统统计分析方法(如普通最小二乘法和方差分析等)的有效性和统计特性均会受到影响,从而最终的统计推断结论将可能偏倚。二、基本概念三、数学模型水平1模型:(一)多水平线性回归模型水平2模型:组合模型可表述为:三、数学模型水平1模型:(二)分类离散数据多水平模型水平2模型:组合模型可表述为:三、数学模型水平1模型:(三)重复测量数据多水平模型水平2模型:组合模型可表述为:四、常规计算步骤步骤

2拟合零模型(即空模型)即不含任何自变量的模型,这是多水平模型分析的基础,用于判断是否有必要考虑数据的多水平结构,只有通过零模型判断数据存在显著相关性,多水平结构不能忽略,才有必要继续多水平分析,否则用常规的多因素分析方法即可。步骤

1确定效应类型及协方差结构因素效应类型:固定效应与随机效应协方差结构:简单结构、复合对称、一阶自回归、Toeplitz相关结构、带状主对角结构、空间幂相关、无结构。在实际分析中,方差协方差结构远远不止这七种,多达三十余种,须谨慎选择。四、常规计算步骤步骤

4模型估计最大似然法(ML)限制性最大似然估计(REML):SAS、SPSS默认步骤

5结果解释步骤

3筛选自变量从逻辑上讲是先在空模型基础上引入高水平解释变量,再引入低水平解释变量。另外我们还应通过模型比较不断调整模型。五、判断是否存在高水平效应

六、模型优点多水平分析的主要优点:可以同时对个体特征与背景特征的效应予以估计。无需独立性假定,可有效地处理非独立数据所引起的参数标准误偏差。可有效处理缺失数据。可分析用于纵向数据的分析,获取结局变量随时间变化的发展趋势在模型固定或随机部分引入任何水平上所测量的协变量,能够探讨各水平单位的特征对反应变量的影响,以及对反应变量在高水平单位甚至是低水平单位之间变异的影响,即这些特征是否可以解释这些变异。在调整低水平单位甚至高水平单位的各种特征后,可对高水平单位的残差估计进行排序和比较,用于识别极端高水平单位,并将其选出作进一步的个案调查,有助于探讨详细的因果机制。这是多水平分析的另一个重要特点。七、注意需要注意的是,多水平模型拟合过程比较复杂,须同时考虑随机效应变量的选取,方差协方差结构的选择,自变量筛选,以及结果的解释等诸多方面。如果想线性混合效应模型能较为理想地适合数据产生机制,那么,最为主要的关键在于选择合适的方差协方差结构,为参数标准误提供无偏估计,有效地减少假阳性结果。主要内容97主成分分析1因子分析2结构方程3聚类分析4典型相关分析判别分析5多水平模型67目录课程目标12实施步骤34实例分析基本思想一、课程目标掌握基本概念熟悉主要用途了解分析过程,并能运用SPSS软件进行分析第七节典型相关分析典型相关分析(canonicalcorrelationanalysis),用于研究两组变量之间相关关系的一种多元统计分析方法。100两个随

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论