




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多变量统计描述,均数向量与离差矩阵,均数向量与离差矩阵,协方差矩阵,相关矩阵,多元正态分布及检验,多元正态分布,在许多医学问题中,当作均值的假设,检验时所依据的指标可能不止一个,例如,当比较两组风湿性与类风湿性,关节炎患者的病情程度时,就不能仅,只用一个指标,如采用血沉、抗,O,白细胞计数三个指标,则数据呈下列,格式,编号,血沉,X1,抗,O,X2,白细胞数,X3,A,1,2,3,N1,B,1,2,3,N2,这三项指标都是测得值越高病情越重,如果采用,t,检验法对每个指标作检验,则只有出现下列情,况之一时,才能作出明确判断,1,两组间三指标均有差异,且大小趋势一致,2,两组间各指标均无差别,且
2、,P,较大于,0.05,反之,如果出现下列情况之一,就难以得出,结论,1,两组指标虽有显著差别,但趋势不一。或无,显著差别,但,P,接近,0.05,2,两组间有些指标有显著差别,有些却无显著,差别,多元正态分布,定义,P,维正态分布定义:对随机变量,X=(X,1,X,2,X,P,的密度函数是,称之为多元正态分布,简记为,1,2,1,2,2,1,2,X,X,i,p,f,X,e,x,p,p,p,N,下面以二维正态分布介绍,1,1,1,1,1,n,i,i,x,E,X,X,n,2,1,2,2,2,n,i,i,x,E,X,X,n,1,2,1,2,11,1,11,1,i,i,x,x,n,D,X,S,n,2
3、,2,2,2,22,2,22,1,i,i,x,x,n,D,X,S,n,1,2,1,2,12,21,1,2,21,1,i,i,i,i,x,x,x,x,n,Corr,X,X,S,n,1,2,1,2,1,2,12,21,11,22,12,2,2,1,2,2,2,i,i,i,i,i,i,i,i,x,x,x,x,n,r,x,x,x,x,n,n,协方差阵与逆阵,11,12,21,22,22,21,1,2,12,11,11,22,12,1,12,2,2,11,22,12,11,22,1,11,12,21,22,S,S,S,S,22,21,1,2,12,11,11,22,12,1,S,S,S,S,S,S,S,
4、样本协方差阵与逆阵,二维正态分布密度函数可写成,12,12,2,11,22,2,2,1,1,2,2,1,1,2,2,12,2,11,22,11,22,1,2,1,1,exp,2,2,1,f,x,x,x,x,x,x,图,1,两个二元正态分布,11,22,12,0,且,11,22,12,0.75,且,多元正态分布的性质,1,有限个多元正态的线性组合为多元正,态分布,2,一个多元正态分布的所有子集分布有,一个多元正态分布,3,零协方差意味着相应的随机变量是独,立的,4,分量的条件分布是正态分布,多元正态性的判定,通常对多元正态分布的判断采用对边缘,分布的判断,即:若对多元变量,X,而言它,所有的一元
5、分布都是正态分布的话,就,认为,X,是多元正态分布,此时很少出现非,正态的多元数据集,多元正态均值检验,至少存在,使,0,H,1,2,k,L,1,H,i,j,i,j,统计量的构造,组间协方差阵,组内协方差阵,总协方差阵,1,k,B,n,X,X,X,X,1,1,1,n,k,K,j,j,j,E,X,X,X,X,A,1,1,n,k,j,j,j,T,X,X,X,X,B,E,维尔克斯,Wilks,统计量(分布,E,E,T,E,B,1,0,两两比较的统计量,2,1,ij,i,j,i,j,D,X,X,E,X,X,2,1,i,j,ij,i,j,N,k,m,n,n,D,F,N,k,m,n,n,一组资料(单样本,
6、对于单变量且服从正态分布资料的样本,与总体的比较,变形,0,0,X,n,X,t,S,S,n,m,m,2,2,0,0,t,n,X,S,X,m,m,当为多元资料时,此公式推广为,Hoteling,其中,为样本均数向量,为样本协方差阵,总体均,数向量,当,成立时,2,T,2,0,0,T,n,X,S,X,m,m,X,S,0,m,0,H,2,1,2,1,n,m,F,T,df,m,df,n,m,n,m,例,1,如随机抽取某单位,5,名有冠心病的成年男,性,测量其甘油三脂,mmol/L,,总,胆固醇,mmol/L,,和高密度脂蛋白,胆固醇,mmol/L,含量,已知某单位,正常成年男性的甘油三脂、总胆固醇,和
7、高密度脂蛋白胆固醇的均数是,1.02,mmol/L,2.73 mmol/L,和,2.04mmol/L,问该单位冠心病成年男,性的血脂与正常成年男性有无差别,1,1.02,X,2,2.73,X,3,2.04,X,样,本,号,甘油,三脂,总胆,固醇,高密度脂蛋白,胆固醇,1,2,3,4,5,1.78,0.67,0.56,0.66,0.21,0.83,0.96,0.83,1.12,0.16,1.01,0.84,0.39,1.03,0.40,计算,0,0.776,0.780,0.574,X,m,骣,桫,0.35,0.08,0.24,0.08,0.13,0.21,0.24,0.20,0.36,S,轾,犏
8、,犏,犏,犏,犏,臌,1,17.51,47.59,38.30,47.59,182.86,134.32,38.30,134.32,103.60,S,轾,犏,犏,犏,犏,犏,臌,2,0,0,17.51,47.59,38.30,0.776,5,0.776,0.780,0.574,47.59,182.86,134.32,0.780,38.30,134.32,103.60,0.574,295.743,T,n,X,S,X,m,m,轾,骣,犏,犏,鬃,犏,犏,桫,犏,臌,2,1,2,5,3,295.743,1,5,1,3,3,2,n,m,F,T,n,m,df,df,两组比较,对于单变量且服从正态分布资料的两
9、样,本的比较,变形,1,2,2,1,2,1,2,c,X,X,t,n,n,S,n,n,2,2,1,2,1,2,1,2,1,2,c,n,n,t,X,X,S,X,X,n,n,当为多元资料时,此公式推广为,Hoteling,其中,为样本均数向量,为样本协方差阵,为合并,样本协方差阵,2,T,2,1,1,2,1,2,1,2,1,2,c,n,n,T,X,X,S,X,X,n,n,1,2,X,X,1,2,S,S,c,S,1,1,2,2,1,2,1,1,1,2,c,S,n,S,n,S,n,n,轾,臌,2,1,2,1,2,1,2,1,2,1,2,1,n,n,m,F,T,n,n,m,df,m,df,n,n,m,当,
10、较大时,F,近似服从自由度为,m,的,分布,1,2,n,n,2,c,编号,实验组,编号,对照组,体重,kg,身长,cm,体重,kg,身长,cm,1,2,3,4,5,6,3.05,4.10,3.50,3.64,3.60,4.00,50,50,53,50,52,55,7,8,9,10,11,12,13,3.20,3.00,3.00,3.35,2.60,3.15,3.55,50,46,45,47,50,50,52,例,2,计算,1,2,1,2,3.65,3.15,0.50,51.67,48.57,3.10,X,X,X,X,轾,轾,轾,犏,犏,犏,犏,犏,犏,臌,臌,臌,1,2,0.142,0.245
11、,0.098,0.258,0.245,4.267,0.258,6.619,S,S,轾,轾,犏,犏,犏,犏,臌,臌,1,1,2,2,1,2,1,2,1,1,1,2,1.300,2.773,1,1,5,6,2.773,61.049,6,7,2,11,0.118,0.252,0.252,5.550,c,S,n,S,n,S,n,n,S,S,轾,臌,轾,犏,创,犏,臌,轾,犏,犏,臌,1,9.371,0.426,0.426,0.200,c,S,轾,犏,犏,臌,2,1,1,2,1,2,1,2,1,2,9.371,0.426,0.50,42,0.50,3.10,0.426,0.200,3.10,13,9.5
12、0,c,n,n,T,X,X,S,X,X,n,n,轾,轾,犏,犏,犏,犏,臌,臌,2,1,2,1,2,1,2,1,10,9.50,4.32,2,10,2,22,n,n,m,F,T,df,df,n,n,m,SAS,计算程序,proc,glm,class gr,model y1 y2=gr,contrast gr1 vs gr2 gr,1,1,0,contrast gr1 vs gr3 gr,1,0,1,contrast gr2 vs gr3 gr,0,1,1,anova h=gr,run,协方差分析,以前介绍的方差分析可用于两组或多组均数间,的比较,其处理因素一般是可以控制的。方差,分析要求各比较
13、组除了所施加的处理因素不同,外,其他对观察指标有影响得因素齐同或均衡,即要求控制对观察指标有影响的其它因素。在,实际工作中,有时有些因素无法加以控制,或,由于实验设计的疏忽、实验条件的限制等原因,造成对观察指标有影响的个别因素未加控制或,难以控制。此时用方差分析不合适,应考虑用,协方差分析,实例,为研究三种饲料,A1,A2,A3,对猪催肥效果,用每种饲料喂养,8,头猪,实验用猪的初始,体重未控制。喂养一段时间后观察小猪,的增重,所得资料如下表,试分析三种,饲料对猪催肥效果是否相同,三组小猪的初始体重与增重,kg,A1,A2,A3,x1 y1 x2 y2 x3 y3,15 85 17 97 22
14、 89,13 83 16 90 24 91,11 65 18 100 20 83,12 76 18 95 23 95,12 80 21 103 25 100,16 91 22 106 27 102,14 84 19 99 30 105,17 90 18 94 32 110,协方差分析中称需比较的因素为因子称,影响观察指标,需排除其影响的数量因,素为协变量,按方差分析的不同设计类型,相应地,有不同的协方差分析,协变量也可是一,个或多个。以下我们主要介绍最简单的,协方差分析,完全随机设计且只有一个,协变量的协方差分析,基本思想,是将线性回归与方差分析相结合的一种方法,将那些定量变量,X,未加控制或
15、难以控制的因,素)对,Y,的影响看做协变量,建立应变量,Y,随,协变量,X,变化的线性回归关系,并利用这种回,归关系把,X,值化为相等后,再进行各组,Y,修正,均数间比较地假设检验,其实质就是从,Y,的总,离差平方和中扣除协变量,X,对,Y,的回归平方和,对残差平方和作进一步分解后在进行方差分析,以更好地评价各种处理的效应,三种检验,1,检验饲料,A,与初始体重,x,间是否存在交,互作用。、因为若两者有交互作用,则,意味着在,x,的不同取值下,A,对观察值的作,用不同,即可能对,x,的某些取值,A1,的效,果最好,而对,x,的另一些取值,A2,的效果,最好,因而撇开,x,谈,A,的主效应无多大
16、意,义。相应的检验假设是,A,与,x,的交互效应,为,0,三种检验,2,若,A,与,x,间无交互作用,则进一步检验,初始体重,x,与增重,y,间是否存在线性关系,若不存在线性关系,则不能用协方差分,析比较三组均数间的差别。因为协方差,分析是利用协变量,x,与观察指标,y,间的线,性回归扣除,x,对,y,的影响。相应的检验假,设为,x,与,y,间的回归系数为,0,三种检验,3,若,x,与,y,间存在线性关系,则进一步在,扣除,x,对,y,影响的条件下,检验三组均数,差别是否有显著性。相应的检验假设为,三个总体均数相等,这三个检验中,第一、第二个检验不属,于协方差分析范围,若已知因子,A,与协变,
17、量,x,无交互作用,则第一个检验可以不作,若已知,x,与,y,间有线性关系,则第二个检,验也可不作,第三个检验真正属协方差,分析范畴,是必不可少的,4,若三组均数差别有统计意义,则需进,一步估计修正均数。所谓修正均数,是,指若三组的协变量相等(即扣除协变量,影响后),相应的,y,的均数。修正均数,Y,的计算公式为,i,i,i,Y,y,bx,bx,i,Y,i,y,i,x,其中,为第,i,组的修正均数,为第,i,组,y,的均数,为第,i,组,x,的均数,x,为所有,x,的总均数,b,为,y,与,x,的回归系数,模型,1,1,ij,ij,i,x,ij,i,y,a,i,a,j,n,L,L,i,a,0,
18、i,i,a,ij,2,0,N,其中,是,y,的总均数,描述因子,A,的第,i,水平的作用,描述协变量,x,与观察变量,y,间关系的回归系数,是误差项,服从,总,组内,公共,xx,xy,yy,l,l,l,xxk,xyk,yyk,l,l,l,xxt,xyt,yyt,l,l,l,总变异,v=N-1,总剩余误差,v=N-2,2,SS,x,X,总,2,xy,e,yy,xx,l,SS,SS,SS,l,l,总,回,组内剩余误差,消除,X,的影响,v=N-2k,公共剩余误差,v=N-k-1,修匀均数,v=k-1,2,xyk,e,yyk,xxk,l,SS,SS,SS,SS,l,l,总i,回i,组内,2,xyt,
19、yyt,e,xxt,l,SS,l,l,共,c,e,SS,SS,SS,组内,1,1,c,e,SS,K,F,SS,N,K,共,SAS,计算程序,proc,glm,class gr,model inw=weight gr weight*gr /ss3,run,proc,glm,class gr,model inw=weight gr / solution ss3,lsmeans gr /stderr pdiff,run,应用条件,注意事项,例,1,某实验鼠体重,g,与增加体重,g,的,测定值见下表,问如何分析两组增加体重是,否有差异,A,B,C,体重,g,增加体重,g,体重,g,增加体,重,g,体重,g,增加体重,g,15.00,13.00,11.00,12.00,12.00,16.00,14.00,17.00,85.00,78.00,64.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学中的热力学定律及其应用及试题及答案
- 家具行业设计中的需求预测与趋势分析试题及答案
- 教师教育教学反思对学生长远发展的影响探讨试题及答案
- 环境化学基本内容试题及答案
- 新疆喀什地区本年度(2025)小学一年级数学部编版摸底考试(下学期)试卷及答案
- 江西省九江市本年度(2025)小学一年级数学统编版课后作业(上学期)试卷及答案
- 教学辅助资源使用反思试题及答案
- 商业数据面试题及答案
- 市场营销知识试题及答案
- 安全管理在施工现场的重要性试题及答案
- 广西来宾市兴宾区2024-2025学年七年级上学期期中生物学试题(含答案)
- 河道保洁应急服务
- 酱香型白酒堆积发酵异常的研究现状与展望
- 歌曲《wake》中英文歌词对照
- 房屋永久居住权合同范本
- 义务教育(音乐)课程标准(2022年版)解读
- DB+3309+T+106-2024人力资源和社会保障数据分类分级规范
- 主观幸福感量表SWB
- 2024年新正电工技术服务限公司招聘273人(内蒙古)高频难、易错点500题模拟试题附带答案详解
- 2024秋期国家开放大学《可编程控制器应用实训》一平台在线形考(形成任务7)试题及答案
- 电子政务概论-形考任务5(在线测试权重20%)-国开-参考资料
评论
0/150
提交评论