统计专业实验-实验3_第1页
统计专业实验-实验3_第2页
统计专业实验-实验3_第3页
统计专业实验-实验3_第4页
统计专业实验-实验3_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆工商大学数学与统计学院 统计专业实验统计专业实验 课程课程 实验报告实验报告 实验课程 实验课程 指导教师 指导教师 专业班级 专业班级 学生姓名 学生姓名 学生学号 学生学号 2 实实 验验 报报 告告 实验项目实验项目实验三实验三 多元正态总体检验多元正态总体检验 实验日期实验日期实验地点实验地点 实验目的实验目的 1 掌握单一多元正态总体均值的检验 2 掌握两个多元正态总体均值向量的检验 区分协差阵是否相等 3 掌握多元方差分析的思想和操作 实验内容实验内容 1 检验 2008 年西部 9 个省区城镇居民大类消费与全国平均水平有无显著差异 2 分析我国上市公司电力 煤气及水生产供应行业和房地产行业在经营绩效 净资产收益率 总资产报酬率 资产负债率和总资产周转率 方面是否存在 明显差异 抽样数据见 上市公司效绩指标 xls 3 一套生产线同时产出三种产品 分析温度和时间对总体产出率的影响 以及 温度和时间对不同产品产出率的影响 数据见 三种产品产出率 sav 实验思考题解答 实验思考题解答 1 对协差阵未知时 在相等和不等 n m 两种情况下 两个正态总体均值向量检验有 何差异之处 答 先假设协差相同但未知 n m 和 n 不等于 m 的两种情况下 F 值会有变化 但是不影响检验结果 最终还是 F 大于 F 临界值 拒绝原假设 再假设协差不等 在 n m 和 n 不等于 m 的两种情况下 F 值无变化 F 值大于 F 临界值 所以仍是拒绝原假设 2 对协差阵不等 n m 的两个正态总体均值向量检验其基本思想如何 与单总体均值 向量检验有何联系 答 建立 由于协差不等 且 n m 故检验统计量为 211210 HH 其中 Z X Y S 为 Z 的离差阵 给出检验水平 1 pnpFZSZ p npn F 得到临界值 将计算得到的 F 值与 F 临界值比较 如果 F 大于 F 临界值 则拒绝原假 设 这与单总体均值向量检验的步骤大致相同 只是计算公式 所得到的统计量不同 其基本思想是一致的 3 实验运行程序 基本步骤及运行结果 实验运行程序 基本步骤及运行结果 实验实验 1 1 假设检验问题是 H0 西部 9 个省区城镇居民大类消费与全国平均水平有显著差异 H1 西部 9 个省区城镇居民大类消费与全国平均水平无显著差异 首先在所给的表格中选取食品 衣着等 8 个总体指标 将其他不是西部的城市删掉 计算出西部的地区各个指标的平均值和西部个指标与全国水平的差值 就得到一张 关于西部地区在这 8 个指标上的具体数据 然后用公式 s MMULT TRANSPOSE X Z X Z 就 可以求得离差阵 s 用公式 s 1 MINVERSE S 便得到离差阵的逆矩阵 接着计算出 T 平 方统计量 公式 T 2 n n 1 MMULT MMULT Z Z0 S 1 TRANSPOSE Z Z0 用公式将 T 平方统 计量转化为 F 统计量 F n p n 1 p G15 最后通过查表得到 F 的临界值 pnpF F0 05 8 3 8 8452 F 5 3618 所以拒接原假设 即西部地区的消费与全国相比没有显著性差异 实验实验 2 2 n 13 m 15 n 不等于 m 设两组样本来自正态总体 X 和 Y 且两组样本相互独立 协差阵相等但未知 假设检验问题 211210 HH 由于有共同未知协差阵 故检验统计量为 4 1 2 1 2 2 pmnpFT pmn pmn F 其中 n a aa n a aa aa YYYYSXXXXS SSS XXSXX mn mn mnT 1 2 1 1 21 1 2 2 1 1 分析资料对应的 n 11 m 15 p 4 2 利用函数 AVERAGE 计算 X 的各指标的平均值 即得到 X 的平均值向量转置矩阵 Mx 同理计算 Y 的平均值 既得 Y 的平均值向量转置矩阵 My 计算差值阵 X Y 得 YXd 3 计算 X 的离差阵 输入公式 MMULT TRANSPOSE X Mx X n a aa XXXXS 1 1 Mx 计算 Y 的离差阵 输入公式 MMULT TRANSPOSE Y My Y n a aa YYYYS 1 2 My 计算 21 SSS 4 计算 S 的逆矩阵 输入公式 MINVERSE S 5 计算统计量 T2 n m 2 n m n m MMULT MMULT d S 1 TRANSPOSE d 计算统计 量 F n m 2 p 1 n m 2 p I6 6 计算临界值 取显著水平 a 0 05 F0 05 FINV 0 05 p n m p 1 数据如下 7 分析 由上可知 F 统计量大于 F0 05 临界值 所以拒绝原假设 即我国上市公司电 力 煤气及水生产供应行业和房地产行业在经营绩效 净资产收益率 总资产报酬率 资产负债率和总资产周转率 方面存在明显差异 5 实验实验 3 3 思路 提出零假设 选择检验统计量 计算检验统计量的观测值及概率 p 值 给 出显著性水平做出假设 假设检验问题 H0 不同温度和时间对产品产出率没有显著影响 H1 不同度和时间对产品产出率有显著影响 1 温度和时间对总体产出率的影响 操作 选择菜单 Analyze General Linear Model Univariate 再分别选择 总产出 率 到随机变量框中 选择 温度 时间 到控制变量框中 得到结果如下 TestsTests ofof Between SubjectsBetween Subjects EffectsEffects Dependent Variable 三种产 品和 Source Type III Sum of SquaresdfMean SquareFSig Corrected Model 1891 703a8236 463 2 194E3 000 Intercept53314 186153314 186 4 948E5 000 温度 480 6862240 343 2 230E3 000 时间 328 8682164 434 1 526E3 000 温度 时间 1082 1504270 537 2 511E3 000 Error 9709 108 Total55206 85918 Corrected Total 1892 67317 a R Squared 999 Adjusted R Squared 999 可以看出 观测变量的总变差为 1892 673 它被分解为四个部分 分别由温度不 同引起的变差 480 686 和时间引起的变差 328 868 由不同温度和时间交互作用引起的 变差 1082 150 由随机因素引起的变差 0 97 这些变差除以各自的自由度后 得到各 自的均方 F 统计量以及对应的 p 值 显然 温度 时间 温度 时间的 F 值对应的概率 p 值都为 0 都小于 0 05 所以 拒绝原假设 即不同温度和不同时间对产品总产率都有显著影响 2 温度和时间对产品 1 的影响 基本操作 选择菜单 Analyze General Linear Model Univariate 再分别选择 产 6 品 1 到随机变量框中 选择 温度 时间 到控制变量框中 其结果如下 TestsTests ofof Between SubjectsBetween Subjects EffectsEffects Dependent Variable 丹参素 mg g Source Type III Sum of SquaresdfMean SquareFSig Corrected Model 78 381a89 798 4 120E3 000 Intercept420 1131420 113 1 767E5 000 温度 26 824213 412 5 640E3 000 时间 28 478214 239 5 988E3 000 温度 时间 23 07945 770 2 427E3 000 Error 0219 002 Total498 51518 Corrected Total 78 40217 a R Squared 1 000 Adjusted R Squared 999 可以看出 观测变量的总变差为 78 402 它被分解为四个部分 分别由温度不同引 起的变差 26 824 和时间引起的变差 28 478 由不同温度和时间交互作用引起的变差 23 079 由随机因素引起的变差 021 这些变差除以各自的自由度后 得到各自的均方 F 统计量以及对应的 p 值 显然 温度 时间 温度 时间的 F 值对应的概率 p 值都为 0 都小于 0 05 所以 拒绝原假设 即不同温度和不同时间对产品总产率都有显著影响 3 温度和时间对产品 2 的影响 基本操作 选择菜单 Analyze General Linear Model Univariate 再分别选择 产 品 2 到随机变量框中 选择 温度 时间 到控制变量框中 结果如下 TestsTests ofof Between SubjectsBetween Subjects EffectsEffects Dependent Variable 原儿茶醛 mg g Source Type III Sum of SquaresdfMean SquareFSig 7 Corrected Model 3 092a8 387 828 262 000 Intercept10 982110 982 2 353E4 000 温度 1 4702 735 1 575E3 000 时间 1 0592 529 1 135E3 000 温度 时间 5634 141 301 619 000 Error 0049 000 Total14 07918 Corrected Total 3 09617 a R Squared 999 Adjusted R Squared 997 由上可以看出 观测变量的总变差为 3 096 它被分解为四个部分 分别由温度不 同引起的变差 1 470 和时间引起的变差 1 059 由不同温度和时间交互作用引起的变差 563 由随机因素引起的变差 0 004 这些变差除以各自的自由度后 得到各自的均方 F 统计量以及对应的 p 值 显然 温度 时间 温度 时间的 F 值对应的概率 p 值都为 0 都小于 0 05 所以 拒绝原假设 即不同温度和不同时间对产品总产率都有显著影响 4 温度和时间对产品 3 的影响 基本操作 选择菜单 Analyze General Linear Model Univariate 再分别选择 产 品 3 到随机变量框中 选择 温度 时间 到控制变量框中 结果如下 TestsTests ofof Between SubjectsBetween Subjects EffectsEffects Dependent Variable 没育得碱产出率 Source Type III Sum of SquaresdfMean SquareFSig Corrected Model 1219 538a8152 442 1 294E3 000 Intercept42885 442142885 442 3 641E5 000 温度 251 8582125 929 1 069E3 000 时间 138 791269 396 589 208 000 温度 时间 828 8894207 222 1 759E3 000 Error1 0609 118 Total44106 04018 8 Corrected Total 1220 59817 a R Squared

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论