多元统计分析-第三章 多元正态分布_第1页
多元统计分析-第三章 多元正态分布_第2页
多元统计分析-第三章 多元正态分布_第3页
多元统计分析-第三章 多元正态分布_第4页
多元统计分析-第三章 多元正态分布_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#D(XIX,X)=16.58<30.53二D(X)2'452D(XX,X)=23.71<39.86二D(X)31453利用条件协方差阵可以求出X和x的偏相关系数。ij定义3.8.:若X(2)给定时,X和X的偏相关系数为ijor=j.q+1,…,pij.q+1,…pooii.q+1,…,pj.q+1,…,p例6中,设X⑵=(X4,X5),则-0.64r12.45=-0.038<16.7^16.58--0.64r12.45=-0.038<16.7^16.58-3.87r13.45<16.72<23^-0,194r23.4510.71=0.540(二)独立性定理3.3:设X=G,…,X)〜N(r,工),工〉0,将X,卩,工做如下剖析1ppX二_X⑴一,卩二r⑴,工二「工11…工1.1kX(k)r(k)k1…工kk其中,X(j):Sx1,卩(j):Sx1,工:SxS(j二1,2,k),则X⑴,…,X(k)相互独jjjjjj立,当且仅当工..二0时,对于一切i丰j。ij第四节多元正态分布的参数估计在多元统计分析中,通常假定被研究的对象服从多元正态分布,但分布中的参数卩和Y往往是未知的,一般的做法是通过样本指标对总体的参数进行估计。一、多元样本的概念设从多元总体中随机抽取n个个体X,X,…,X,若X,X,…,X相互独(1)(2)(n)(1)(2)(n)

立,且与总体同分布,则称X,X,…,X为该总体的一个多兀随机样本。每个(1)(2)(n)X=(X,X,…,X)(a=1,2,…,n)称为一个样品,X•为第a个样品对第j个指标(a)a1a2apaj的观测值,显然每个样品都是P维向量,将n个样品对P个指标都进行观测,得到如下一个随机矩阵(观测矩阵、样本资料阵):X=—X11X21X12X22…X—1P…X.2P=-X'「(1)X,(2)XX…XX,n1n2np(n)一旦样本观测值取定,随机矩阵就是一个数据矩阵。多兀分析中的很多方法就是运用各种手段从观测矩阵出发去提取有关信息。值得注意的是:1、多元样本中的每个样品,对p个指标的观测值往往是有相关关系的,但不同样品之间的观测值一定是相互独立的。2、多元分析所处理的多元样本观测数据一般都属于横截面数据,即在同一时间不同空间上的数据。二、多元样本的数字特征定义3.9:设X,X,…,X为来自p元总体的样本,则TOC\o"1-5"\h\z(1)(2)(n)1、样本均值向量为:X=11X,X,…,X)n(a)i2pa二12、样本离差阵为:s=工(x-X)(x-Xy(a)(a)pxpa=1(X-(X-X)2

al1_(X-X)(X-X)a22a11(X-X)(X-X)…a11a22(X-X)2…a22(X-X)(X-X)a1_1ap_p(X-X)(X-X)a22appa=1(X-X)(X-Xa=1(X-X)(X-X)1s11s21aps12s22a1s1ps2p(X-X)(X-X)…appa22(X-X)2appsp1sp2spp()jpxp3、样本协差阵为:V=1S=1工(XpxV=1S=1工(Xpxpnna=1(a)(a)ijpxp三、卩和工的最大似然估计及基本性质通过样本来估计总体参数叫参数估计,参数估计有各种不同的方法,各有其适用的场合。这里用最常用的且具有很多优良性质的最大似然法给出卩和工的估计量。设X,X,…,X来自于正态总体N(卩,工)样本容量为n的样本,每个样本观察(1)(2)(n)pp个指标,根据样本资料阵,用最大似然估计法求出卩和工的估计量分别为:1

工二亠S

n—1卩和口工的估计量具有如下性质1、E(X)=卩,即X是卩的无偏估计;TOC\o"1-5"\h\z1n—11E(—S)=工,即一S不是工的无偏估计,nnnE(」S)=工,即丄S是工的无偏估计;n—1n—12、X、丄rS分别是卩和工的有效估计;n—13、X、-S或丄S分别是卩和工一致估计。nn—1第五节X和S的抽样分布一、样本均值向量X的分布1、正态总体设X〜N(卩,Z),X,…X是从总体中抽到的一个样本,则样本均值X的分布p(1)(n)服从正态分布,即X〜N(卩丄工)n2、非正态总体在实际问题中,总体分布能够作正态近似的毕竟是少数,更多的总体分布不能用正态近似,甚至我们对总体的情况一无所知,这时,可借助中心极限定理,给出X的抽样分布。

中心极限定理:X…X是来自总体X的一个样本,该总体有均值卩和有限协方(1)(n)差阵Z,则当样本容量“很大且n相对于p也很大时,样本平均数的分布近似于正态分布,即X〜N(卩,-工)n二、样本离差阵S的分布样本均值向量的分布服从正态分布,样本离差阵的分布服从怎样的分布呢?为解决这一问题,现给出维希特(Wishart)分布。维希特分布是统计学家Wishart在1928年推导出来的,维希特(Wishart)分布是用这位统计学家的名字命名的。定义3.10:设X=(XX…,X)'〜N(卩,工)(a二1,2,…,n),且(a)a1a2appax、X、、…X,、相互独立,则由X组成的随机矩阵:TOC\o"1-5"\h\z(1)(2)(n)(a)W二工XX'(a)(a)a=1的分布称为非中心Wishart分布,记为:其中,Z=£卩『,卩=(卩,卩,卩),卩为非中心参数,当卩=0时称为中aaaa1a2anaaa=1心Wishart分布,记为W(n,工)。p当p=1时,Y=b2,此时有叫(〃,02)=Q2X2(n),可见Wishart分布是X2分布在p维正态情况下的推广。Wishart分布的基本性质:1、设X=(X,X,…,X)'〜N(R,工)(a=1,2,…,n),且X,…,X(a)a1a2appa(1)(n)相互独立,则样本离差阵S=皿相互独立,则样本离差阵S=皿a=1(a)-X)(X(a)-X)'〜WP(n-1,工)。2、若S〜W(n,工)(i=1,…,k),且相互独立,则£s〜W(£n,工)iPiipii=1i=13、若X〜W(n工),C为非奇异矩,则CXC'〜W(n,C工C')PppxpPxP第六节上机操作

利用Excel的宏功能可以很方便的实现随机向量协方差阵和相关系数矩阵的计算。在利用描述统计宏功能之前,首先要加载“宏”方法是:在Excel的“工具”菜单下,点击“加载宏”出现加载宏对话框,在该对话框中,用鼠标选择可用的加载宏,确定后,在“工具”菜单下出现了“数据分析”在数据分析对话框中,就可以实现随机向量协方差阵和相关系数矩阵的计算。图3-1加载宏对话框一、协方差阵的计算在Excel中实现以本章的例3.4为例加以说明。第一步:在Excel中输入数据。图3-2数据输入第二步:在“工具”菜单下,单击“数据分析”选项,在出现数据分析对话框,如图3-3所示。图3-3数据分析对话框

第三步:在“分析工具”中选择“协方差”,确定后出现如图3-4的对话框。图3-4协方差对话框第四步:在协方差对话框的“输入区域”输入数据区域“2:E32”,在输出选项中选择“输出区域”并输入“f2”,表示在f2单元格输出计算结果。待确定后,即可得出计算结果如图3-5所示。图3-6协方差的计算结果二、相关系数矩阵的计算在Excel中实现相关系数在Excel中实现的步骤如同协方差阵在Excel中实现,这里从略。三、均值阵(向量)的计算在SPSS中实现利用SPSS数据分析软件计算随机向量的均值阵的比Excel方便一些。(一)SPSS软件的简单介绍。SPSS的数据录入和统计运算有窗口式和编程式两种。窗口式直观,与Excel的界面风格相同,为一般用户所熟悉,在这种方式下,可以实现绝大部分的统计运算和处理,后者则为高级用户所知晓,通过它可以进行更为复杂或特殊的计算。本书仅在窗口方式下进行操作运算。建立SPSS数据文件的第一步就是定义变量,现仍以本章的例3.4为例加以说明。进入SPSS界面后,可以发现它有DataView(数据视窗)和VariableView(变量视窗)两个界面。单击VariableView来到变量视窗,如图3-7。

图3-7SPSS的变量视窗在Name(变量名称)下输入“公司名称”单击Type(变量类型),出现如图3-8的变量类型对话框。图3-8变量类型对话框在所列的Numeric(数值型)、Comma(带逗号的数值型)、Dot(带圆点的数值型)、Scientificnotat(科学计数法)、Data(日期型)、Dollar(带美元符号的数值型)、Custumcurrency(自定义型)、String(字符串型)中,一般场合多使用Numeric和String。由于公司名称要用汉字表示,所以,选择变量是String,按OK即可。而主营业务利润、营业利润、利润总额和净利润皆为Numeric的变量类型。图3-9变量窗口对话框的内容输入对话框的Width(数据宽度)和Decimal(小数点位数)的缺省值分别为8和2,但可以改变数据宽度和小数点位数。接着可以定义Lable(变量标签),因为SPSS的变量名长度为8个标准字符(4个汉字),因此,为了醒目和阅读的需要,可给出变量名更具体的说明,它就是变量标签。

定义变量的下一个重要环节就是Values(变量值标签)。变量值标签实际上就是数据本身的含义,如果变量是主营业务利润,其涵义自然就靠输入的数值大小来表达,但若是性别之类的变量,如“性别”,为了录入方便,就可以用“1”代表“男性”“0”代表女性,此时就需要定义变量值标签,单击该变量名称后面的“Values”单元格,出现图3-10对话框。图3-10ValueLabels对话框在上方的Value框中输入1,在下方的Value中输入男性,单击“Add”,在大方框中就出现1=“男性”,照此定义0=“女性”如果需要改变或删除,单击大方框中的输入结果,分别选择“Chang”和“Remove”即可。如果已经定义了变量值标签,在菜单“View”下选择“ValueLable”起用变量值标签即可。此外,定义变量还有Missing(缺失值)、Columns(变量的显示宽度)、Align(数据的对齐格式)和Measure(变量的测量尺度)等内容,一般按缺省即可。定义好变量后,把SPSS界面切换到DataView,输入数据后即可进入分析。当然,如果有现成的文档,比如Excel.(*.xls)等可直接或略作修改后调用。(二)随机向量均值阵在SPSS中实现第一步:定义变量、输入数据。图3-11SPSS的数据窗口第二步:沿着“Analyze—DescriptivesStatistics—Descriptives”进入如图3-12对话框。图3-12Descriptives对话框

第三步:将Descriptives对话框左列的四个指标移动到Variable窗口,单击Options,出现如图3-13对话框。图3-13Descriptives:Options对话框第四步:在DescriptivesOptions对话框中勾住Mean,单击Continue,返回到Descriptives对话框,单击OK,就可得出如图3-14的计算结果,图3-14计算结果输出表四、相关系数矩阵的计算在SPSS中实现相关系数矩阵的实现步骤是沿着“Analyze—Correlate—Bivariate”进入到BivariateCorrelations对话框,如图3-15。将左列大个指标移到右列Variables窗口,选择CorrelationCoefficients下的Pearson项,单击OK即可得出如图3-16的计算结果。图3-15BivariateCorrelations对话框

匚叵I区IftOutputI-SP35匚叵I区IPali-E^l¥lmXnuvtJorThah口Cv«plbEUtLlitai-efitii^oh也】p事旧|列Bd由團J旅虚I创刮JjMM8SS□-囹DA£Chplk«.二唸诞卜轲Mobs□-囹DA£Chplk«.二唸诞卜轲MobsLyC^Mripti阳NFirrt口S-3<andAlkr£怕TfcloSn*t«LyCan-AhDDTr;Com編tion*主站赶利同〔万兀)壬1'|丙i:丹兀;i*t.r万兀)苗禾彌王富业的掘町1上PbbtsoiCornsLstian1.A25*073*'9lg.(2-taled).000.□an.□a口N31313131营和润〔万元)PearsonCorgiatton.◎沖1.船".MS"Gq.i:2-tdkd).om.WOWON31313133利彳绘通〔万兀)pft=rsonCctfelarton.925'1.036*M.QCO.K0.MD313131降和临丙兀〕PaasafiCareLatton.日73*.9S2*.936*1aig.i;2-«*?d;i.□□□.000.□anM31313131障CorRetationis环■匚arelationtsiorifc^ntAthe001level*|SFSSl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论