




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章典型相关分析 2 要点 典型相关分析的数学表达方式 假定条件 典型相关系数的数学含义 典型变量系数的数学含义 简单相关 复相关和典型相关的意义 典型相关的应用 一 什么是典型相关分析及基本思想 通常情况下 为了研究两组变量的相关关系 可以用最原始的方法 分别计算两组变量之间的全部相关系数 一共有pq个简单相关系数 这样又烦琐又不能抓住问题的本质 如果能够采用类似于主成分的思想 分别找出两组变量的各自的某个线性组合 讨论线性组合之间的相关关系 则更简捷 在解决实际问题中 这种方法有广泛的应用 如 在工厂里常常要研究产品的q个质量指标和p个原材料的指标之间的相关关系 也可以是采用典型相关分析来解决的问题 如果能够采用类似于主成分的思想 分别找出两组变量的线性组合既可以使变量个数简化 又可以达到分析相关性的目的 例家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系 调查了70个家庭的下面两组变量 分析两组变量之间的关系 变量间的相关系数矩阵 y2 y3 y1 x2 x1 典型相关分析的思想 首先分别在每组变量中找出第一对线性组合 使其具有最大相关性 9 然后再在每组变量中找出第二对线性组合 使其分别与本组内的第一线性组合不相关 第二对本身具有次大的相关性 u2和v2与u1和v1相互独立 但u2和v2相关 如此继续下去 直至进行到r步 两组变量的相关性被提取完为止 r min p q 可以得到r组变量 二 典型相关的数学描述 考虑两组变量的向量 其协方差阵为 一 想法 其中 11是第一组变量的协方差矩阵 22是第二组变量的协方差矩阵 是X和Y的其协方差矩阵 如果我们记两组变量的第一对线性组合为 其中 所以 典型相关分析就是求 1和b1 使 uv达到最大 二 典型相关系数和典型变量的求法 在约束条件 下 求a1和b1 使 uv达到最大 令 13 利用柯西不等式有 参看1 8 4式 14 记m为 12的秩 则 记为 相应的特征向量为 其余的零特征根对应的向量为 15 由特征向量可以构成一个正交矩阵T 有 16 若取 则 17 相应的特征向量为 a1和b1分别构成了第一组变量和第二组变量的第一对典型变量的系数 18 第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分 那么这部分的信息不够 则还可以在剩余相关中提取第二对典型变量 在以下的约束条件下 19 求 令 则 约束条件等价于 20 21 当取 这时uk和vk达到最大值 k 称它为第k个典型相关系数 称ak和bk为第k对典型变量系数 22 相应的特征向量为 ak和bk分别构成了第一组变量和第二组变量的第k对典型变量的系数 23 注 有相同的特征根 而可以验证 根据线性代数的思想 下列矩阵 24 方法二根据数学分析中条件极值的求法 引入Lagrange乘数 求极值问题 则可以转化为求 的极大值 其中 和 是Lagrange乘数 将上面的3式分别左乘和 将左乘 3 的第二式 得 并将第一式代入 得 的特征根是 相应的特征向量为 将左乘 3 的第一式 并将第二式代入 得 的特征根是 相应的特征向量为 结论 既是M1又是M2的特征根 和是相应于M1和M2的特征向量 至此 典型相关分析转化为求M1和M2特征根和特征向量的问题 第一对典型变量提取了原始变量X与Y之间相关的主要部分 如果这部分还不能足以解释原始变量 可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数 在剩余的相关中再求出第二对典型变量和他们的典型相关系数 设第二对典型变量为 在约束条件 求使达到最大的和 30 例家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系 调查了70个家庭的下面两组变量 分析两组变量之间的关系 31 变量间的相关系数矩阵 三 典型变量的性质 1 同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的 Y组的典型变量之间是相互独立的 因为特征向量之间是正交的 故 2 不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为 36 同对则协方差为 i 不同对则为零 3 原始变量与典型变量之间的相关系数 原始变量相关系数矩阵 X典型变量系数矩阵 y典型变量系数矩阵 40 42 43 例家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系 调查了70个家庭的下面两组变量 分析两组变量之间的关系 44 变量间的相关系数矩阵 49 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0 9866和0 8872 可以看出u1可以作为消费特性的指标 第一对典型变量中v1与Y2之间的相关系数为0 9822 可见典型变量v1主要代表了了家庭收入 u1和v1的相关系数为0 6879 这就说明家庭的消费与一个家庭的收入之间其关系是很密切的 第二对典型变量中u2与x2的相关系数为0 4614 可以看出u2可以作为文化消费特性的指标 第二对典型变量中v2与Y1和Y3之间的分别相关系数为0 8464和0 3013 可见典型变量v2主要代表了家庭成员的年龄特征和教育程度 u2和v2的相关系数为0 1869 说明文化消费与年龄和受教育程度之间的有关 51 4 各组原始变量被典型变量所解释的方差 X组原始变量被ui解释的方差比例 X组原始变量被vi解释的方差比例 y组原始变量被ui解释的方差比例 y组原始变量被vi解释的方差比例 54 5 简单相关 复相关和典型相关之间的关系 若p 1且q 1 则x和y的典型相关就是简单相关 若p 1或q 1 则x和y的典型相关就是复相关 55 五 样本典型相关系数 在实际应用中 总体的协方差矩阵常常是未知的 类似于其他的统计分析方法 需要从总体中抽出一个样本 根据样本对总体的协方差或相关系数矩阵进行估计 然后利用估计得到的协方差或相关系数矩阵进行分析 由于估计中抽样误差的存在 所以估计以后还需要进行有关的假设检验 56 1 假设有X组和Y组变量 样本容量为n 假设 X1 Y1 X2 Y2 Xn Yn 观测值矩阵为 57 58 2 计算特征根和特征向量求M1和M2的特征根 对应的特征向量 则特征向量构成典型变量的系数 特征根为典型变量相关系数的平方 59 对两组变量x和y进行典型相关分析 采用的也是一种降维技术 我们希望使用尽可能少的典型变量对数 为此需要对一些较小的典型相关系数是否为零进行假设检验 H0经检验被拒绝 则应进一步检验假设 典型相关分析的基本思想 首先分别在每组变量中找出第一对线性组合 使其具有最大相关性 然后再在每组变量中找出第二对线性组合 使其分别与本组内的第一线性组合不相关 第二对本身具有最大相关性 如此下去 直至两组变量的相关性被提取完为止 本例想利用我国1999年城镇居民的家庭收入来源和消费性支出的数据了解我国居民消费构成及主要影响因素分析所用的数据来自 中国统计年鉴 2000 我国居民消费构成及主要影响因素 收入指标 X1 可支配收入X2 实际收入X3 国有单位职工收入X4 集体单位职工收入X5 其他经济类型职工收入 X6 转移收入支出指标 Y1 消费性支出Y2 食品Y3 衣着Y4 交通和通讯Y5 医疗和保健Y6 娱乐 教育 文化服务Y7 居住 序号典型相关系数典型变量10 990174U1 0 9989X1 0 0595X2 0 0776X3 0 0489X4 0 0931X5 0 0074X6V1 1 3263Y1 0 0270Y2 0 0005Y3 0 0769Y4 0 0717Y5 0 2031Y6 0 0219Y 20 868704U2 4 8668X1 0 1264X2 1 9585X3 0 3299X4 1 4095X5 2 6453X6 V2 4 4920Y1 2 5421Y2 1 2480Y3 0 4621Y4 1 0443Y5 0 8610Y6 0 0586Y7 由累计贡献率得知 第一组和第二组变量的累计贡献率已达到了97 56 而且 这两组的系数和方差与其他组相比要大得多 即只需要前两组变量就已经可以解释全部信息的97 56 在第一对典型变量中 U1主要受可支配收入的影响 V1主要受消费性支出的影响 可见实际收入对消费支出的影响远小于可支配收入的影响 居民消费主要依据其可支配收入而定 第二对典型变量中 U2主要受国有单位职工收入 其他经济类型职工收入和转移收入的影响 V2主要受食品 衣着 医疗和保健的影响 64 在此 可见我国集体单位的职工收入还不能够与国有甚至是其他经济类型的单位这职工收入相比 这也从一个侧面放反映了集体单位规模等方面的现状 再有就是我国居民食品和衣着方面的支出仍占了总支出的大部分 反映了我国居民总体收入水平还不够高 其次 医疗保健支出的比例比较大是可喜的 说明我国居民已经可以把部分精力放在了自己身体的调养上来 全国居民的总体健康状况在上升之中 让我们担忧的是在教育方面的支出所占比例太小 不符合现今世界发展对教育程度的要求 科技是第一生产力 如何提高国民的科技文化知识水平是当今的一大重点 在当代激烈的竞争中 没有知识的支撑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年西班牙语DELEC27级阅读训练试卷
- 2025年室内装饰设计师(高级)考试试卷:室内设计中的环保材料
- 2025年事业单位招聘考试建筑类综合能力测试实战试题卷
- 2025年事业单位招聘考试教育类专业知识试卷(教育政策法规与教育未来)
- 2025年西式面点师实操考核试卷(实操面点制作文化传承与发展)
- 2025年物业管理员(中级)职业技能鉴定模拟试题及答案
- 2025年物流师(初级)职业技能鉴定试卷中的物流企业战略规划案例分析
- 2025年特种设备安全管理人员考试安全设施与防护案例分析试卷
- 2025年事业单位招聘考试公共基础知识真题模拟精讲试卷
- 2025年外贸跟单员职业资格考试试卷:外贸跟单员国际贸易法律法规更新试题
- 2025年汽车驾驶员(技师)考试试题及答案(含答案)
- 胰腺炎的营养治疗与护理
- 江西省上饶市2024-2025学年七年级下学期期末语文试题
- 2025年小学生环保科普知识竞赛题库及答案
- 2025至2030年中国乙醇行业市场全景调研及发展趋向研判报告
- 设备易损配件管理制度
- 叉车维修方案(3篇)
- 颅内感染诊疗指南
- 儿童腺病毒肺炎
- 2025至2030中国UV打印机行业市场现状分析及竞争格局与投资发展报告
- 2025至2030中国氢化可的松口服片行业项目调研及市场前景预测评估报告
评论
0/150
提交评论