多元分析常用统计量与均向量统计推断.doc_第1页
多元分析常用统计量与均向量统计推断.doc_第2页
多元分析常用统计量与均向量统计推断.doc_第3页
多元分析常用统计量与均向量统计推断.doc_第4页
多元分析常用统计量与均向量统计推断.doc_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析方法一、多元分析常用统计量例1.1 调查某地16岁中学生12名,其身高、体重和胸围资料见下表。表1.1 12名16岁中学生身高、体重和胸围测量资料编号身高(cm)体重(kg)胸围(cm)1171.058.581.02175.065.087.03159.038.071.04155.345.074.05152.035.063.06158.344.575.07154.844.574.08164.051.072.09165.255.079.010164.546.071.011159.148.072.512164.246.573.0单变量时,对每个变量分别计算和。多变量时,则计算每个变量的均数、方差以及变量间的协方差。为了清晰表达多变量间的关系,常用矩阵(matrix)表示。构成矩阵的每个数据称为元素(element)。这里称为均向量、方差协方差矩阵。1. 均向量(means vector)将各变量的均数用矩阵形式排列,称为均向量。如本例均向量为三维列向量: 其转置向量为三维行向量:更一般地:观测对象12n 则样本均向量为:2. 方差协方差矩阵(简称协方差矩阵或协差阵)本例:第1个变量方差为:本例共三个方差第1个变量与第2个变量的协方差为: 本例共三个协方差。为了全面反映这三个变量本身的变异和三个变量间的协变异,可将其方差和协方差用矩阵形式排列,称方差协方差矩阵,简称协差阵。记为V(See P.2)。显然,。即协差阵为对称阵。常给出矩阵的左下半,称为下三角阵。一般地,如n个观察单位测量了m个变量,则样本协差阵为维的对称阵。记为: 其中:对角线上为各变量的方差:,对角线两侧为变量间的协方差:,可见,方差为协方差的特例,或协方差为更一般的形式。3. 离均差平方和与离均差积和矩阵(离差阵)将各变量的离均差平方和与离均差积和用矩阵排列,该矩阵称为离差阵(SSCP)。用SS或L表示。与V的关系为:或4. 相关系数矩阵(相关阵)与的相关系数为:变量本身的相关系数为1,因此:将各变量间的相关系数用矩阵形式排列,称相关阵。记为R(See P.3)。一般地,n个观察对象有m个变量,则有维的样本相关阵:其中: 如事先对每个变量做标准化变换,则变换后变量的协差阵等于原变量的相关阵。5. 总体均向量与协差阵用 m 表示总体均向量,记为 用表示总体协差阵,维的总体协差阵记为其中,为第i个变量的总体方差,为第i个变量与第k个变量的总体协方差。二、均向量的统计推断1. 多元T检验(Hotelling检验)(1) Student-t检验的简单回顾 检验一样本是否来自某已知总体设有某正态总体N,现有一大小为n的样本,其均数和标准差分别为和S。是总体均数的估计值。问此样本是否来自均数为的总体?,检验水准为t服从于自由度为n -1的t分布。,在水准拒绝;,在水准上不拒绝。在成立的条件下,也可根据F分布作出统计推断。此时,。 检验两样本是否来自同一总体设两样本来自两个具有公共方差的总体和 ,两样本有关指标分别为和。,检验水准为t服从于自由度为的t分布。如,在水准上拒绝; 如,在水准上不拒绝。在成立的条件下,此时,在许多医学问题中,做假设检验时(如检验两样本是否来自同一总体时)所依据的指标可能不只一个。例如:儿童生长发育:身高、体重、头围、胸围血压: 收缩压、舒张压甲状腺功能: 血脂: 总胆固醇、甘油三酯风湿或类风湿: 血沉、抗“O”、WBC计数编号血沉()抗“O”()WBC()风湿: 1 2 类风湿: 1 2 若仍用t检验,有几个问题:(1) 重复进行t检验,增加犯I型错误的概率。(2) 忽略了变量间的相互联系。(3) t检验结果不一致时,难以下一个综合结论。例如,本例只有出现下列情况之一,才可作出明确判断: 两组间的差别均有统计学意义,且大小趋势一致(三项指标都是值越大,病情越差); 两组间各指标的差别均无统计学意义。反之,出现下列情况之一,则难以得出明确结论: 两组间各指标的差别具有统计学意义,但趋势不一致; 两组间有些指标差别有统计学意义(趋势一致或不一致),有些指标差别无统计学意义。配对设计的均向量检验检验一样本是否来自均向量为的m元正态总体。假定有一大小为n的样本,各观察了m个变量的值,其数据格式为:观测单位变量12n可计算得样本均向量,协差阵V,检验水准为计算检验统计量:式中,是列向量的转置,为V的逆阵。与F存在一定关系,可由算出F根据的F分布作出推断。此外,在n较大时,近似服从自由度为m的分布,即:。 ,则在水准上拒绝,可认为此样本不是来自总体。 ,在水准上不拒绝,尚不能认为此样本不是来自总体。检验是t检验的推广或t检验为检验的特例(当m =1时,两者等价)。事实上,统计量与t统计量有极为相似的形式:改写为:两边平方,整理:在多变量时,为样本均向量,为总体均向量,样本协差阵V。例2.1 差值的均向量 差值的协差阵V。先计算离差阵:除以n -1(14),得协差阵(See P.9) ,结论为:将三个指标综合起来分析,可以认为胸腺素治疗前后免疫功能有改变。(但分别作t检验,IgA的下降没有统计学意义)成组设计两样本的均向量检验检验两样本是否来自同一多元正态总体,即检验两样本所代表的两总体均向量差别有无统计学意义。设大小为和的两个样本,它们来自两个具有公共协差阵的m元正态总体和。检验假设为。编号变量 样本A 1 2 样本B 1 2 先计算两样本的均向量和,它们分别为从样本A和B算得的各变量的均数,以列向量表示 计算合并的协方差V。先分别求出两样本的离差阵和。相加得合并的离差阵SS,再除以。即为合并的协差阵V(See P.11)。当时,F服从的F分布,当较大时,F近似服从自由度为m的分布。因此: 或,则在水准上拒绝; 或,在水准上不拒绝。将检验公式和t检验公式相比较,它们亦具有相似的形式:例2.2 (See P.11),两个指标综合起来分析,两组患者间的贫血程度没有差别。分别作t检验的结果为,Hb的差异有统计学意义,但RBC的差异无统计学意义。2多元方差分析一元方差分析的简单回顾多元方差分析(MANOVA)基本思想与一元方差分析是一致的。在一元方差分析中,是对SS的分解,在多元方差分析中,是对离差阵的分解。两者自由度的分解完全一致。应用条件亦相同,即正态性、方差齐性、独立性。多元方差分析的变异分解(离差阵的分解)变异来源离差阵df组间 组内总 g示组数,g1、2、G,此例g1,2,3。 示第g组的样本量,此例:。 示第g组第j个个体的观测向量,此例:。 示第g组的均向量,此例:。 示全体总均向量,此例:。统计量:表示Wilks提出的Lambda统计量它表示组内变异(随机误差)在总变异中所占的比例。若很小,提示组间变异B大于随机误差W,此时有理由怀疑的成立。故可根据的分布进行统计推断。但分布较复杂,在变量数和比较组数不多时,可将转变为F分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论