数学实验04-多元统计基本概念_第1页
数学实验04-多元统计基本概念_第2页
数学实验04-多元统计基本概念_第3页
数学实验04-多元统计基本概念_第4页
数学实验04-多元统计基本概念_第5页
已阅读5页,还剩43页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析简介多元统计分析:通过对多个随机变量观测数据的分析,来研究变量之间的相互关系以及解释这些变量内在的变化规律。一元统计分析一个随机变量的 统计规律多元统计分析多个随机变量之间的 相互依赖关系及内在统计规律性多元统计分析应用: 经济学、工业、农业、医学、教育学、生态学、地质学、社会学、考古学、环境学、气象、文学等许多领域多元统计分析主要内容:1、多元正态总体的参数估计和假设检验2、常用的处理多元数据的统计方法: 1)聚类分析 2)判别分析 3)主成分分析 4)因子分析 5)多重多元回归分析等等第一章多元统计中的基本概念第一节 基本概念第二节 多元正态分布第三节 多元统计中的常用分布第一

2、节基本概念 1.随机向量 Def1:将p个随机变量 的整体称为p维随机向量,记作 。分布函数离散型:分布律连续型:密度函数分布密度函数满足分布密度函数应满足的两个条件? Def2:设 是p维随机向量,称由它的q(qp)个分量组成的子向量 的分布为 的边缘分布,相对的把 的分布称为联合分布。 边缘分布函数和边缘分布密度可由联合分布和联合密度确定。 Def3:若p个随机变量 的联合分布等于各自的边缘分布的乘积,则称 是相互独立的。 2.随机向量的数字特征 (1)数学期望其中,均值向量具有如下性质:(2)协方差矩阵 设 称为X的协差阵。 若X的协差阵存在,且每个分量的方差大于0,则称随机变量X的相关

3、阵为 ,其中为相关系数。 设标准离差阵为则有称X和Y的协差阵为:协差阵具有如下性质:(试证之)多元分析的任务分析各变量之间的关系,推断总体的性质为一维随机变量为多维随机变量(随机向量)3.多元总体 多元分析研究具有多个(如p个)属性(指标)的对象组成的总体-多元总体。 从总体中任意抽出一个对象(总体单元),其p个属性的值为多元总体多维随机变量(随机向量)可能取值的全体。观测矩阵(随机)(样本资料阵)4.多元样本的相关概念从多元总体中随机抽取n个个体。i.i.d. 简单随机样本多元分析的 研究对象(1) 样本平均值样本平均值是n个样本点的重心(2) 样本离差阵样本均值和样本离差阵的矩阵表示:(3

4、) 样本协差阵(4) 样本相关阵 -样本相关系数非负定矩阵第二节多元正态分布1. 多元正态分布若随机向量 的分布密度函数为则称 服从p维正态分布。记作:其数学期望与协方差矩阵分别为: 其中 为对称正定矩阵, 特例1(一元正态分布)则 特例2 (二元正态分布)设则 2. 多元正态分布的常用性质分布?第三节 多元统计中的常用分布 在一元统计中,卡方分布、t分布和F分布在参数估计和假设检验中起着非常重要的作用。在多元统计中,他们分别发展为Wishart分布、Hotelling-T2分布和Wilks分布,在多元参数估计和假设检验中占有非常重要的地位。 1、Wishart分布(1) Wishart分布由

5、Wishart在1928年推导出来。(2) Wishart分布的性质2、Hotelling-T2分布(2) Hotelling-T2分布的性质3、Wilks分布多元正态总体下的假设检验问题。附 录 指标:定量;定性 类型: 间隔尺度:用连续的量来表示 ,如长度,重量等;若存在绝对零点,又称比例尺度; 有序尺度:没有明确的数量表示,只是划分一些等级,等级间有次序关系,如产品分上中下三等,有次序关系,但无数量表示。 名义尺度:既无数量表示,又无次序关系,如某物体有红黄白三种颜色,回答问卷中是与否等等。 一、 三种数据类型 二、 距离1. 距离的概念(描述样本间差异程度的量)2. 距离的定义 定义如

6、果第i号样本 和第j号样本 的函数 满足i) 当且仅当 时 ;ii) 对一切iii)则称 是一种广义距离。如果进一步还满足iv)则称 是一种距离。 3. 欧几里德距离(欧氏距离)欧氏距离的性质) 平移不变性 将每个坐标 加上一个常数 后,任何二点之间的距离保持不变。) 对正交变换的不变性) 如果将每个点的坐标都增加C倍,点间距离也增加C倍。缺点与测量单位有关,不同属性之间的差别等同看待。4. 马氏距离(Mahalanobis) 设X是原始数据矩阵,S是其协方差矩阵,则马氏距离定义为马氏距离的性质) 平移不变性) 对任意可逆线性变换的不变性 设 为可逆矩阵,若对任何一个点 做变换而得到一个新的点

7、 ,这个变换叫可逆线性变换。 由标准化数据和中心化数据计算出的两点间的马氏距离相同,且与测量单位无关。进一步,作可逆变换后仍旧不变。缺点夸大了变化微小的变量的作用。5. B模距离 设X是原始数据矩阵,B是一个正定矩阵,则B模距离定义为说明 时为欧氏距离, 时为马氏距离。 当各变量对区分样本有不同作用时,可以给各变量以不同权重。这时可取B为 B矩阵元素的作用-权重。(根据专业知识或用统计方法来确定。)特别,当q=1时,即为绝对距离:当q=无穷大时,即为 切比雪夫距离:7. 注释 可根据实际问题的要求,自己定义所需要的距离。 样本单元之间的差异大小还可以用相似系数来表示。6.明氏(Minkowski)距离当q=2时,即为 欧氏距离三、 相似系数1. 概述 如果第i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论