注册 |

微信扫一扫登录

x

人人文库网 > 教育资料 > 考试试卷 > 应用多元统计分析课后答案朱建平版.pdf

应用多元统计分析课后答案朱建平版.pdf

预览图

编号：47112096 类型：共享资源大小：744.30KB 格式：PDF 上传时间：2020-01-28 上传人：u****c IP属地：浙江

6
积分

版权申诉

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

关键词：: 应用多元统计分析课后答案建平

资源描述：: 应用多元统计分析课后答案朱建平版 2 1 试叙述多元联合分布和边际分布之间的关系解多元联合分布讨论多个随机变量联合到一起的概率分布状况的联合分布密度函数是一个p维的函数而边际分布讨论是的子向量的概率分布其概率密度函数的维数小于p 2 2设二维随机向量服从二元正态分布写出其联合分布解设的均值向量为协方差矩阵为则其联合分布密度函数为 2 3已知随机向量的联合密度函数为其中求 1 随机变量和的边缘密度函数均值和方差 2 随机变量和的协方差和相关系数 3 判断和是否相互独立 1 解随机变量和的边缘密度函数均值和方差所以由于服从均匀分布则均值为方差为同理由于服从均匀分布则均值为方差为 2 解随机变量和的协方差和相关系数 3 解判断和是否相互独立和由于所以不独立 2 4设服从正态分布已知其协方差矩阵为对角阵证明其分量是相互独立的随机变量解因为的密度函数为又由于则则其分量是相互独立 2 6 渐近无偏性有效性和一致性 2 7 设总体服从正态分布有样本由于是相互独立的正态分布随机向量之和所以也服从正态分布又所以 2 8 方法1 方法2 故为的无偏估计 2 9 设是从多元正态分布抽出的一个简单随机样本试求的分布证明设为一正交矩阵即令所以且有所以独立同分布又因为因为又因为所以原式故由于独立同正态分布所以 2 10 设是来自的简单随机样本 1 已知且求和的估计 2 已知求和的估计 2 解之得第三章 3 1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤其基本思想和步骤均可归纳为第一提出待检验的假设和H1 第二给出检验的统计量及其服从的分布第三给定检验水平查统计量的分布表确定相应的临界值从而得到否定域第四根据样本观测值计算出统计量的值看是否落入否定域中以便对待判假设做出决策拒绝或接受均值向量的检验统计量拒绝域均值向量的检验在单一变量中当已知当未知作为的估计量一个正态总体协差阵已知协差阵未知两个正态总体有共同已知协差阵有共同未知协差阵其中协差阵不等协差阵不等多个正态总体单因素方差多因素方差协差阵的检验检验检验统计量 3 2 试述多元统计中霍特林分布和威尔克斯分布分别与一元统计中t分布和F分布的关系答霍特林分布是t分布对于多元变量的推广而若设且与相互独立则称统计量的分布为非中心霍特林T2分布若且与相互独立令则 2 威尔克斯分布在实际应用中经常把统计量化为统计量进而化为统计量利用统计量来解决多元统计分析中有关检验问题与统计量的关系统计量及分别任意任意1 任意任意2 1任意任意 2任意任意 3 3 试述威尔克斯统计量在多元方差分析中的重要意义答威尔克斯统计量在多元方差分析中是用于检验均值的统计量用似然比原则构成的检验统计量为给定检验水平查Wilks分布表确定临界值然后作出统计判断第四章 4 1 简述欧几里得距离与马氏距离的区别和联系答设p维欧几里得空间中的两点X 和Y 则欧几里得距离为欧几里得距离的局限有在多元数据分析中其度量不合理会受到实际问题中量纲的影响设X Y是来自均值向量为协方差为的总体G中的p维样本则马氏距离为D X Y 当即单位阵时 D X Y 即欧几里得距离因此在一定程度上欧几里得距离是马氏距离的特殊情况马氏距离是欧几里得距离的推广 4 2 试述判别分析的实质答判别分析就是希望利用已经测得的变量数据找出一种判别函数使得这一函数具有某种最优性质能把属于不同类别的样本点尽可能地区别开来设R1 R2 Rk是p维空间R p的k个子集如果它们互不相交且它们的和集为则称为的一个划分判别分析问题实质上就是在某种意义上以最优的性质对 p维空间构造一个划分这个划分就构成了一个判别规则 4 3 简述距离判别法的基本思想和方法答距离判别问题分为两个总体的距离判别问题和多个总体的判别问题其基本思想都是分别计算样本与各个总体的距离马氏距离将距离近的判别为一类两个总体的距离判别问题设有协方差矩阵相等的两个总体G1和G2 其均值分别是1和 2 对于一个新的样品X 要判断它来自哪个总体计算新样品X到两个总体的马氏距离D2 X G1 和D2 X G2 则 X D2 X G1 D2 X G2 X D2 X G1 D2 X G2 具体分析记则判别规则为 X W X X W X 0 多个总体的判别问题设有个总体其均值和协方差矩阵分别是和且计算样本到每个总体的马氏距离到哪个总体的距离最小就属于哪个总体具体分析取可以取线性判别函数为相应的判别规则为若 4 4 简述贝叶斯判别法的基本思想和方法基本思想设k个总体其各自的分布密度函数假设k个总体各自出现的概率分别为设将本来属于总体的样品错判到总体时造成的损失为设个总体相应的维样本空间为在规则下将属于的样品错判为的概率为则这种判别规则下样品错判后所造成的平均损失为则用规则来进行判别所造成的总平均损失为贝叶斯判别法则就是要选择一种划分使总平均损失达到极小基本方法令则若有另一划分则在两种划分下的总平均损失之差为因为在上对一切成立故上式小于或等于零是贝叶斯判别的解从而得到的划分为 4 5 简述费希尔判别法的基本思想和方法答基本思想从个总体中抽取具有个指标的样品观测数据借助方差分析的思想构造一个线性判别函数系数可使得总体之间区别最大而使每个总体内部的离差最小将新样品的个指标值代入线性判别函数式中求出值然后根据判别一定的规则就可以判别新的样品属于哪个总体 4 6 试析距离判别法贝叶斯判别法和费希尔判别法的异同答费希尔判别与距离判别对判别变量的分布类型无要求二者只是要求有各类母体的两阶矩存在而贝叶斯判别必须知道判别变量的分布类型因此前两者相对来说较为简单当k 2时若则费希尔判别与距离判别等价当判别变量服从正态分布时二者与贝叶斯判别也等价当时费希尔判别用作为共同协差阵实际看成等协差阵此与距离判别贝叶斯判别不同距离判别可以看为贝叶斯判别的特殊情形贝叶斯判别的判别规则是 X W X X W X lnd 距离判别的判别规则是 X W X X W X 0 二者的区别在于阈值点当时二者完全相同 4 7 设有两个二元总体和从中分别抽取样本计算得到假设试用距离判别法建立判别函数和判别规则样品X 6 0 应属于哪个总体解即样品X属于总体第五章 5 1 判别分析和聚类分析有何区别答即根据一定的判别准则判定一个样本归属于哪一类具体而言设有n个样本对每个样本测得p项指标变量的数据已知每个样本属于k个类别或总体中的某一类通过找出一个最优的划分使得不同类别的样本尽可能地区别开并判别该样本属于哪个总体聚类分析是分析如何对样品或变量进行量化分类的问题在聚类之前我们并不知道总体而是通过一次次的聚类使相近的样品或变量聚合形成总体通俗来讲判别分析是在已知有多少类及是什么类的情况下进行分类而聚类分析是在不知道类的情况下进行分类 5 2 试述系统聚类的基本思想答系统聚类的基本思想是距离相近的样品或变量先聚成类距离相远的后聚成类过程一直进行下去每个样品或变量总能聚到合适的类中 5 3 对样品和变量进行聚类分析时所构造的统计量分别是什么简要说明为什么这样构造答对样品进行聚类分析时用距离来测定样品之间的相似程度因为我们把n个样本看作p维空间的n个点点之间的距离即可代表样品间的相似度常用的距离为一闵可夫斯基距离 q取不同值分为 1 绝对距离 2 欧氏距离 3 切比雪夫距离二马氏距离三兰氏距离对变量的相似性我们更多地要了解变量的变化趋势或变化方向因此用相关性进行衡量将变量看作p维空间的向量一般用一夹角余弦二相关系数 5 4 在进行系统聚类时不同类间距离计算方法有何区别选择距离公式应遵循哪些原则答设dij表示样品Xi与Xj之间距离用Dij表示类Gi与Gj之间的距离 1 最短距离法 2 最长距离法 3 中间距离法其中 4 重心法 5 类平均法 6 可变类平均法其中是可变的且 1 7 可变法其中是可变的且 1 8 离差平方和法通常选择距离公式应注意遵循以下的基本原则 1 要考虑所选择的距离公式在实际应用中有明确的意义如欧氏距离就有非常明确的空间距离概念马氏距离有消除量纲影响的作用 2 要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法如在进行聚类分析之前已经对变量作了标准化处理则通常就可采用欧氏距离 3 要考虑研究对象的特点和计算量的大小样品间距离公式的选择是一个比较复杂且带有一定主观性的问题我们应根据研究对象的特点不同做出具体分折实际中聚类分析前不妨试探性地多选择几个距离公式分别进行聚类然后对聚类分析的结果进行对比分析以确定最合适的距离测度方法 5 5试述K均值法与系统聚类法的异同答相同 K 均值法和系统聚类法一样都是以距离的远近亲疏为标准进行聚类的不同系统聚类对不同的类数产生一系列的聚类结果而K 均值法只能产生指定类数的聚类结果具体类数的确定离不开实践经验的积累有时也可以借助系统聚类法以一部分样品为对象进行聚类其结果作为K 均值法确定类数的参考 5 6 试述K均值法与系统聚类有何区别试述有序聚类法的基本思想答 K均值法的基本思想是将每一个样品分配给最近中心均值的类中系统聚类对不同的类数产生一系列的聚类结果而K 均值法只能产生指定类数的聚类结果具体类数的确定有时也可以借助系统聚类法以一部分样品为对象进行聚类其结果作为K均值法确定类数的参考有序聚类就是解决样品的次序不能变动时的聚类分析问题如果用表示个有序的样品则每一类必须是这样的形式即其中且简记为在同一类中的样品是次序相邻的一般的步骤是 1 计算直径 D i j 2 计算最小分类损失函数 L p l k 3 确定分类个数k 4 最优分类 5 7 检测某类产品的重量抽了六个样品每个样品只测了一个指标分别为1 2 3 6 9 11 试用最短距离法重心法进行聚类分析 1 用最短距离法进行聚类分析采用绝对值距离计算样品间距离阵 0 1 0 2 1 0 5 4 3 0 8 7 6 3 0 10 9 8 5 2 0 由上表易知中最小元素是于是将聚为一类记为计算距离阵 0 3 0 6 3 0 8 5 2 0 中最小元素是 2 于是将聚为一类记为计算样本距离阵 0 3 0 6 3 0 中最小元素是于是将聚为一类记为因此 2 用重心法进行聚类分析计算样品间平方距离阵 0 1 0 4 1 0 25 16 9 0 64 49 36 9 0 100 81 64 25 4 0 易知中最小元素是于是将聚为一类记为计算距离阵 0 16 0 49 9 0 81 25 4 0 注计算方法其他以此类推中最小元素是 4 于是将聚为一类记为计算样本距离阵 0 16 0 64 16 0 中最小元素是于是将聚为一类记为因此第六章 6 1 试述主成分分析的基本思想答我们处理的问题多是多指标变量问题由于多个变量之间往往存在着一定程度的相关性人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息当第一个组合不能提取更多信息时再考虑第二个线性组合继续这个过程直到提取的信息与原指标差不多时为止这就是主成分分析的基本思想 6 2 主成分分析的作用体现在何处答一般说来在主成分分析适用的场合用较少的主成分就可以得到较多的信息量以各个主成分为分量就得到一个更低维的随机向量主成分分析的作用就是在降低数据维数的同时又保留了原数据的大部分信息 6 3 简述主成分分析中累积贡献率的具体含义答主成分分析把个原始变量的总方差分解成了个相互独立的变量的方差之和主成分分析的目的是减少变量的个数所以一般不会使用所有个主成分的忽略一些带有较小方差的主成分将不会给总方差带来太大的影响这里我们称为第个主成分的贡献率第一主成分的贡献率最大这表明综合原始变量的能力最强而的综合能力依次递减若只取个主成分则称为主成分的累计贡献率累计贡献率表明综合的能力通常取使得累计贡献率达到一个较高的百分数如85 以上 6 4 在主成分分析中原变量方差之和等于新的变量的方差之和是否正确说明理由答这个说法是正确的即原变量方差之和等于新的变量的方差之和 6 5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别答从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的从协方差矩阵出发的其结果受变量单位的影响主成分倾向于多归纳方差大的变量的信息对于方差小的变量就可能体现得不够也存在大数吃小数的问题实际表明这种差异有时很大我们认为如果各指标之间的数量级相差悬殊特别是各指标有不同的物理量纲的话较为合理的做法是使用R代替对于研究经济问题所涉及的变量单位大都不统一采用 R代替后可以看作是用标准化的数据做分析这样使得主成分有现实经济意义不仅便于剖析实际问题又可以避免突出数值大的变量 6 6 已知X 的协差阵为试进行主成分分析解 0 计算得当时同理计算得时易知相互正交单位化向量得综上所述第一主成分为第二主成分为第三主成分为 6 7 设X 的协方差阵 p 为 0 p 1 证明为最大特征根其对应的主成分为证明为最大特征根当时所以第七章 7 1 试述因子分析与主成分分析的联系与区别答因子分析与主成分分析的联系是两种分析方法都是一种降维简化数据的技术两种分析的求解过程是类似的都是从一个协方差阵出发利用特征值特征向量求解因子分析可以说是主成分分析的姐妹篇将主成分分析向前推进一步便导致因子分析因子分析也可以说成是主成分分析的逆问题如果说主成分分析是将原指标综合归纳那么因子分析可以说是将原指标给予分解演绎因子分析与主成分分析的主要区别是主成分分析本质上是一种线性变换将原始坐标变换到变异程度大的方向上为止突出数据变异的方向归纳重要信息而因子分析是从显在变量去提炼潜在因子的过程此外主成分分析不需要构造分析模型而因子分析要构造因子模型 7 2 因子分析主要可应用于哪些方面答因子分析是一种通过显在变量测评潜在变量通过具体指标测评抽象因子的统计分析方法目前因子分析在心理学社会学经济学等学科中都有重要的应用具体来说因子分析可以用于分类如用考试分数将学生的学习状况予以分类用空气中各种成分的比例对空气的优劣予以分类等等因子分析可以用于探索潜在因素即是探索未能观察的或不能观测的的潜在因素是什么起的作用如何等对我们进一步研究与探讨指示方向在社会调查分析中十分常用因子分析的另一个作用是用于时空分解如研究几个不同地点的不同日期的气象状况就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律 7 3 简述因子模型中载荷矩阵A的统计意义答对于因子模型因子载荷阵为与的协方差为若对作标准化处理因此一方面表示对的依赖程度另一方面也反映了变量对公共因子的相对重要性变量共同度说明变量的方差由两部分组成第一部分为共同度它描述了全部公共因子对变量的总方差所作的贡献反映了公共因子对变量的影响程度第二部分为特殊因子对变量的方差的贡献通常称为个性方差而公共因子对的贡献表示同一公共因子对各变量所提供的方差贡献之总和它是衡量每一个公共因子相对重要性的一个尺度 7 4 在进行因子分析时为什么要进行因子旋转最大方差因子旋转的基本思路是什么答因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释但有时直接根据特征根特征向量求得的因子载荷阵难以看出公共因子的含义这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的也很难对因子的实际背景进行合理的解释这时需要通过因子旋转的方法使每个变量仅在一个公共因子上有较大的载荷而在其余的公共因子上的载荷比较小最大方差旋转法是一种正交旋转的方法其基本思路为 A 其中令的第列元素平方的相对方差可定义为最大方差旋转法就是选择正交矩阵使得矩阵所有m个列元素平方的相对方差之和达到最大 7 5 试分析因子分析模型与线性回归模型的区别与联系答因子分析模型是一种通过显在变量测评潜在变量通过具体指标测评抽象因子的统计分析方法的模型而线性回归模型回归分析的目的是设法找出变量间的依存数量关系用函数关系式表达出来因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和即该模型可用矩阵表示为而回归分析模型中多元线性回归方程模型为其中是常数项是偏回归系数是残差因子模型满足 1 2 即公共因子与特殊因子是不相关的 3 即各个公共因子不相关且方差为1 4 即各个特殊因子不相关方差不要求相等而回归分析模型满足 1 正态性随机误差即残差 e服从均值为 0 方差为的正态分布 2 等方差对于所有的自变量x 残差 e的条件方差为且为常数 3 独立性在给定自变量x的条件下残差e的条件期望值为0 本假设又称零均值假设 4 无自相关性各随机误差项e互不相关两种模型的联系在于都是线性的因子分析的过程就是一种线性变换 7 6 设某客观现象可用X 来描述在因子分析时从约相关阵出发计算出特征值为由于所以找前两个特征值所对应的公共因子即可又知对应的正则化特征向量分别为 0 707 0 316 0 632 及 0 0 899 0 4470 要求 1 计算因子载荷矩阵A 并建立因子模型 2 计算共同度 3 计算第一公因子对X 的贡献解 1 根据题意 A 建立因子模型为 2 3 因为是从约相关阵计算的特征值所以公共因子对X的贡献为第八章相应分析 8 1 什么是相应分析它与因子分析有何关系答相应分析也叫对应分析通常意义下是指两个定性变量的多种水平进行相应性研究其特点是它所研究的变量可以是定性的相应分析与因子分析的关系是在进行相应分析过程中计算出过渡矩阵后要分别对变量和样本进行因子分析因此因子分析是相应分析的基础具体而言式表明Zuj为相对于特征值的关于因素A各水平构成的协差阵的特征向量从而建立了相应分析中R型因子分析和Q型因子分析的关系 8 2试述相应分析的基本思想答相应分析是指对两个定性变量的多种水平进行分析设有两组因素A和B 其中因素A包含r个水平因素B包含c个水平对这两组因素作随机抽样调查得到一个的二维列联表记为要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示相应分析即是通过列联表的转换使得因素A 和因素B具有对等性从而用相同的因子轴同时描述两个因素各个水平的情况把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上从而得到因素A B的联系 8 3 试述相应分析的基本步骤答 1 建立列联表设受制于某个载体总体的两个因素为和其中因素包含个水平因素包含个水平对这两组因素作随机抽样调查得到一个的二维列联表记为 2 将原始的列联资料K kij r c变换成矩阵Z zij r c 使得zij对因素A 和列因素B具有对等性通过变换得 3 对因素B 进行因子分析计算出的特征向量及其相应的特征向量计算出因素B的因子 4 对因素A 进行因子分析计算出的特征向量及其相应的特征向量计算出因素A的因子 5 选取因素B 的第一第二公因子选取因素A 的第一第二公因子将B因素的c个水平 A因素的r个水平同时反应到相同坐标轴的因子平面上上 6 根据因素A和因素B各个水平在平面图上的分布描述两因素及各个水平之间的相关关系 8 4在进行相应分析时应注意哪些问题答要注意通过独立性检验判定是否有必要进行相应分析因此在进行相应分析前应做独立性检验独立性检验中因素和因素是独立的因素和因素不独立由上面的假设所构造的统计量为其中拒绝区域为应该注意几个问题第一这里的是原始列联资料通过相应变换以后得到的资料阵的元素说明与统计量有着内在的联系第二关于因素和因素各水平构成的协差阵和这里表示矩阵的迹第三独立性检验只能判断因素和因素是否独立如果因素和因素独立则没有必要进行相应分析如果因素和因素不独立可以进一步通过相应分析考察两因素各个水平之间的相关关系

内容简介：: -

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：应用多元统计分析课后答案朱建平版.pdf
链接地址：https://www.renrendoc.com/p-47112096.html

官方联系方式

网站客服

网站客服

侵权投诉

1:下载资料失败解决办法

2:不支持迅雷下载,请使用浏览器下载

3:不支持QQ浏览器下载,请用其他浏览器

4:下载后的文档和图纸-无水印

5:文档经过压缩，下载后原文更清晰

点击下载此资源

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ：2881952447

copyright@ 2020-2025 renrendoc.com 人人文库版权所有联系电话：400-852-1180

备案号:蜀ICP备2022000484号-2 经营许可证: 川B2-20220663 川公网安备: 51019002004831号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知人人文库网，我们立即给予删除！