R_多元统计分析上机讲义全_第1页
R_多元统计分析上机讲义全_第2页
R_多元统计分析上机讲义全_第3页
R_多元统计分析上机讲义全_第4页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.专业整理 .应用多元统计分析R实验上机讲义. 学习帮手 .专业整理 .应用多元统计分析 .4Applied Multivariate Statistical Analysis. .4第一章绪论 .4第二章矩阵 .42.1矩阵的建立 .42.2矩阵的下标 (index) 与子集 ( 元素 ) 的提取 .62.3矩阵四则运算 . .72.3.1矩阵的加减运算 . .72.3.2矩阵的相乘 . .82.3.3矩阵的求逆 . .82.4矩阵的其他一些代数运算 .82.4.1求转置矩阵 . .82.4.2提取对角元素 . .82.4.3矩阵的合并与拉直 .82.4.4方阵的行列式 .92.4.5矩阵的

2、特征根和特征向量 . .92.4.6其它函数 . .92.5矩阵的统计运算 . .112.5.1求均值 . .112.5.2标准化 . .112.5.3减去中位数 . .11第三章多元正态分布及参数的估计 . .123.1绘制二元正态密度函数及其相应等高线图. .123.2多元正态分布的参数估计 . .143.2.1多元正态总体的相关量 . .143.2.2极大似然估计 . .14第四章多元正态总体参数的假设检验 . .154.1几个重要统计量的分布 . .154.2单总体均值向量的检验及置信域. .164.2.1均值向量的检验 .164.2.2样本协方差阵的特征值和特征向量.174.3多总体

3、均值向量的检验 .174.3.1两正态总体均值向量的检验 . .174.3.2多个正态总体均值向量的检验- 多元方差分析 .194.4协方差阵的检验 .204.4.2多总体协方差阵的检验 . .204.5独立性检验 .204.6正态性检验 .21第五章判别分析 .225.1距离判别 .225.1.1马氏距离 . .225.1.2两总体的距离判别 . .225.1.3多个总体的距离判别 . .265.2贝叶斯判别法及广义平方距离判别法.26. 学习帮手 .专业整理 .5.2.1先验概率 ( 先知知识 ) .265.2.2广义平方距离 . .265.2.3后验概率(条件概率). .275.2.4贝

4、叶斯判别准则 . .275.3费希尔( Fisher )判别 .29第六章聚类分析 .306.2距离和相似系数 .306.2.1距离 .316.2.2数据中心化与标准化变换.316.2.3相似系数 .316.3系统聚类法 .316.4类个数的确定 .346.5动态聚类法 .366.7变量聚类方法 .36第七章主成分分析 .377.2样本的主成分 . .387.3主成分分析的应用 . .39第八章因子分析 .428.3参数估计方法 . .428.4方差最大的正交旋转 . .458.5因子得分 .45第九章对应分析方法 . .46第十章典型相关分析 . .48. 学习帮手 .专业整理 .应用多元统

5、计分析Applied Multivariate Statistical Analysis第一章 绪论在实际问题中, 很多随机现象涉及到的变量不是一个,而是经常是多个变量,并且这些变量间又存在一定的联系。我们经常需要处理多个变量的观测数据,如果用一元统计方法,由于忽视了各个变量之间可能存在的相关性,一般说来, 丢失信息太多, 分析的结果不能客观全面反映数据所包含的容,因此,我们就需要用到多元统计的方法。多元统计分析(Multivariate Statistical Analysis)也称多变量统计分析、多因素统计分析或多元分析, 是研究客观事物中多变量 ( 多因素或多指标 ) 之间的相互关系和多

6、样品对象之间差异以及以多个变量为代表的多元随机变量之间的依赖和差异的现代统计分析理论和方法。 多元统计分析是解决实际问题的有效的数据处理方法。随着电子计算机使用的日益普及,多元统计统计方法已广泛地应用于自然科学、社会科学的各个方面。第二章 矩阵矩阵即是二维的数组,它非常的重要,以至于需要单独讨论。由于矩阵应用非常广泛, 因此对它定义了一些特殊的应用和操作,R 包括许多只对矩阵操作的操作符和函数。2.1 矩阵的建立在 R 中最为常用的是用命令matrix( )建立矩阵,而对角矩阵常用函数diag( )建立。例如 X X,1,21,112,11 X X,1,2,31,1002,0103,001 d

7、iag(2.5, nr = 3, nc = 5),1 ,2 ,3 ,4 ,51,2.50.00.0002,0.02.50.0003,0.00.02.500. 学习帮手 .专业整理 . X - matrix(1:4, 2) #等价于 X X,1 ,21,132,24 rownames(X) colnames(X) Xc d a 1 3 b 2 4 dim(X) 122 dimnames(X)11 a b21 c d注意:循环准则仍然适用于 matrix( ) ,但要求数据项的个数等于矩阵的列数的倍数 , 否则会出现警告。矩阵的维数使用c( )会得到不同的结果( 除非是方阵 ),因此需要小心。数据

8、项填充矩阵的方向可通过参数byrow 来指定 ,其缺省是按列填充的( byrow=FALSE), byrow=TRUE表示按行填充数据。再看几个例子: X X,1 ,2 ,3 ,41,13132,2424 X X X,1,21,132,24 X X,1,2,3 ,4. 学习帮手 .专业整理 .1,12342,1234因为矩阵是数组的特例 ,R 中数组由函数 array() 建立 , 因此矩阵也可以用函数 array( )来建立,其一般格式为: array(data, dim, dimnames)其中 data 为一向量,其元素用于构建数组;dim为数组的维数向量(为数值型向量);dimname

9、s为由各维的名称构成的向量(为字符型向量) , 缺省为空。看几个例子: A A,1 ,2 ,31,1352,246 A A,1 ,2 ,31,1312,242 A A,1 ,2 ,31,1352,2462.2 矩阵的下标 (index) 与子集 ( 元素 ) 的提取矩阵的下标可以使用正整数、负整数和逻辑表达式,从而实现子集的提取或修改。考查矩阵 x x,1 ,2 ,31,1352,246? 提取一个元素 x2,21 4? 提取若一个或若干个行或列 x2,21 4 x2,1 2 4 6. 学习帮手 .专业整理 . x,2134 x,2,drop=FALSE,11,32,4 x,c(2,3),dr

10、op=FALSE ,1 ,21,352,46? 去掉某一个或若干个行与列 x-1,1 2 4 6 x,-2 ,1 ,21, 1 52,26? 添加与替换元素 x,3 x,1,2,31,13NA2,24NA xis.na(x) x,1,2,31,1312,2412.3 矩阵四则运算矩阵也可以进行四则运算 ( “+”、“ - ”、“* ”、“ / ”,“ ” ) ,分别解释为矩阵对应元素的四则运算。在实际应用中,比较有实际应用的是矩阵的相加,相减,相乘和矩阵的求逆。矩阵的加减运算一般要求矩阵形状完全相同( dim 属性完全相同) ,矩阵的相乘一般要求一矩阵的列维数与另一矩阵的行维数相同,而矩阵要求

11、逆的话,一般要求它为一方阵。2.3.1矩阵的加减运算若 A,B 为两个形状相同的矩阵,两矩阵的和为C, R中表达式为:C-A+B两矩阵的差为D, R中表达式为:D-A-B. 学习帮手 .专业整理 .矩阵也可以与数进行加减,A+5 表示 A 中的每个元素加上5。2.3.2矩阵的相乘操作符 %*% 用于矩阵相乘。若矩阵 A 的列数等于矩阵 B 的行数,矩阵 A 乘以矩阵 B 表示为:A%*%B注: X*Y 表示两个矩阵的逐元相乘,而不是X 和 Y 的乘积。2.3.3矩阵的求逆若矩阵 A 为一方阵, 矩阵的逆可以用下面的命令计算:solve(A)。操作符 solve( )可以用来求解线性方程组:Ax

12、=b,解为 solve(A,b)在数学上,用直接求逆的办法解x X diag(X)114事实上, diag( )的作用依赖于自变量,diag ( vector )返回以自变量(向量)为主对角元素的对角矩阵;diag ( matrix )返回由矩阵的主对角元素所组成的向量;diag ( k)( k为标量)返回k 阶单位阵。2.4.3 矩阵的合并与拉直函数 cbind ()把几个矩阵横向拼成一个大矩阵,这些矩阵行数应该相同;函数rbind()把几个矩阵列向拼成一个大矩阵,这些矩阵列数应该相同。(如果参与合并的矩阵比其它矩阵行数少或列数少,则循环不足后合并。)例如: m1 m1,1 ,21,112,

13、11 m2 m2. 学习帮手 .专业整理 .,1 ,21,222,22 rbind(m1, m2) ,1 ,21,112,113,224,22 cbind(m1, m2) ,1 ,2 ,3 ,41,11222,11222.4.4 方阵的行列式求方阵的行列式使用det( ):X X,1 ,21,132,24 det(X) 1 -22.4.5矩阵的特征根和特征向量函数 eigen( ) 用来计算矩阵的特征值和特征向量。这个函数的返回值是一个含有 values 和 vectors 两个分量的列表。命令A A$values1 5.3722813 -0.3722813$vectors,1,21,-0.5

14、657675 -0.90937672,-0.8245648 0.41597362.4.6 Matrix facilitesIn the following examples, A and B are matrices and x and b are a vectors.Operator or FunctionDescriptionA * B. 学习帮手 .专业整理 .Element-wise multiplicationA%*%BMatrix multiplicationA %o% BOuter product. ABcrossprod(A,B)crossprod(A)AB and AA re

15、spectively.t(A)Transposediag(x)Creates diagonal matrix with elements of x in the principal diagonal diag(A)Returns a vector containing the elements of the principal diagonal diag(k)If k is a scalar, this creates a k x k identity matrix. Go figure.solve(A, b)Returns vector x in the equation b = Ax (i

16、.e., A-1b)solve(A)Inverse of A where A is a square matrix.ginv(A)Moore-Penrose Generalized Inverse of A.ginv(A) requires loading the MASS package.y-eigen(A)y$val are the eigenvalues of Ay$vec are the eigenvectors of Ay-svd(A)Single value decomposition of A.y$d = vector containing the singular values

17、 of Ay$u = matrix with columns contain the left singular vectors of A y$v = matrix with columns contain the right singular vectors of A R - chol(A)Choleski factorization of A. Returns the upper triangular factor, such that RR = A.y apply(X, MARGIN, FUN)其中 X为参与运算的矩阵 , FUN为上面的一个函数或“ +”、“ - ”、“ * ”、“ ”

18、( 必须放在引号中 ) , MARGIN=1表示按列计算, MARGIN=2表示按行计算。我们还用到 sweep( ) 函数,命令 sweep(X, MARGIN, STATS, FUN)表示从矩阵 X中按 MATGIN计算 STATS,并从 X中除去 (sweep out)。2.5.1求均值 m apply(m, MARGIN=1, FUN=mean) #求各行的均值1 -0.3773865 0.3864138 0.2052353 apply(m, MARGIN=2, FUN=mean) #求各列的均值1 0.3386202 0.7320669 -0.4624578 -0.32254602.

19、5.2标准化 scale(m, center=T, scale=T)2.5.3减去中位数 row.med sweep(m, MARGIN=1, STATS=row.med, FUN=” - ”). 学习帮手 .专业整理 .第三章 多元正态分布及参数的估计3.1 绘制二元正态密度函数及其相应等高线图书上 例2.2.2 ,时的二元正态密度函数及其等高线图:x-seq(-3,3,by=0.1)y-xf-function(x,y,a=1,b=1,r=0)a1=sqrt(a)b1=sqrt(b)d=1-r*rd1=sqrt(d)*a1*b1z=1/(2*pi*d1)*exp(-x*x/a-y*y/b+2*r*x*y/(a1*b1)/(2*d)z Xn ln Xn A m A S R x n p u0 ln x0 xm mm a ai=solve(a) dd=xm%*%ai%*%t(xm) d2=(n-1)*dd t2=n*d2; f f,11, 2.904546 fa fa1 3.196777 b b,11, 0.06492834 beta beta1 0.3616381取检验水平为0.05 ,由尾概率值p=0.064928340.05=,可得相容;同样由. 学习帮手 .专业整理 .F=2.9045463.196777=Fa ,也可得相容。在这种情况下,可能犯第二类错误,概率为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论