




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本章目标 1 理解方差分析的概念2 知道方差分析解决什么样的问题3 掌握单因素和多因素方差分析的原理4 会利用Minitab对实际问题进行方差分析5 能够对方差分析的结果作出解释 返回目录 方差分析的引入 续一 方差分析 ANOVA analysisofvariance 能够解决多个均值是否相等的检验问题 方差分析是要检验各个水平的均值是否相等 采用的方法是比较各水平的方差 返回目录 方差分析的引入 续三 方差分析实际上是用来辨别各水平间的差别是否超出了水平内正常误差的程度观察值之间的差异包括系统性差异和随机性差异 返回目录 方差分析的引入 续四 观察值 期望值 差距 总离差 组内方差 组间方差 水平1 水平2 返回目录 7 2怎样得到F统计量 返回目录 怎样得到F统计量 水平间 也称组间 方差和水平内 也称组内 方差之比是一个统计量 实践证明这个统计量遵从一个特定的分布 数理统计上把这个分布称为F分布 即 注意 组间方差 SSB 组内方差 SSw 总方差 SST F 组间方差 组内方差 返回目录 方差分析的前提 不同组样本的方差应相等或至少很接近 水平1 水平2 水平1组内方差远远超过两水平组间方差 我无法分离这两种差别 返回目录 检验方差是否一致 在方差分析之前 我们可利用Minitab对数据作方差一致性检验 Minitab能够读取的数据格式与上表给出的格式不同 我们必须把数据转化为Minitab能够理解的形式 具体做法是 将所有变量值输入工作表的第一列 对因素进行编码 按照一定的顺序编为1 2 3 输入后面几列 对本例 先将素质测评的得分输入工作表列一 三个分支分别编码为1 2 3 对应于变量值填入第二列 返回目录 给出假设 因素是方差分析研究的对象 在这个例子里 两个变量分别是分支机构位置和员工素质测评分数 这里分支机构的位置就是一个因素 因素中的内容就称为水平 该因素中有三个水平 即机构的不同位置 学过第5章的知识后 我们可以给出下面的假设 返回目录 相关分析是研究事物的相互关系 测定它们联系的紧密程度 揭示其变化的具体形式和规律性的统计方法 是构造各种经济模型 进行结构分析 政策评价 预测和控制的重要工具 相关关系度量工具 返回目录 符号 r 0正相关 r 0负相关 测定两变量是否线性相关 返回目录 相关系数的检验 统计量t遵从t n 2 分布 将r变换成t后 可以用t检验方法检验 0是否成立 返回目录 1 一元线性回归模型拟合优度的评价 判定系数 R2 是对回归模型拟合优度的评价 总偏差 回归偏差 剩余偏差 返回目录 2 一元线性回归模型的显著性检验 回归系数b的检验 1 提出假设 H0 0 H1 02 确定显著性水平 3 计算回归系数的t值 4 确定临界值 双侧检验查t分布表所确定的临界值是 t 2 和 t 2 单侧检验所确定的临界值是 t 5 做出判断 返回目录 当样本量n 30 用t检验 当样本量n 30 t分布接近于标准正态分布Z 所以可以用正态分布代替 系数检验的方法选择 返回目录 1 提出假设 H0 R2 0 H1 R2 02 计算检验统计量3 比较做出判断 回归模型整体的F检验 返回目录 8 6一元线性回归模型的Minitab实现 例8 2 某家电集团1989年至1998年10年的广告费支出与销售量的资料如下表所示 试根据此资料确定销售量y与广告费支出x的是否存在线性关系 并进行模型分析 返回目录 结果输出 返回目录 常见的可线性化的曲线回归方程 返回目录 常用的非线性函数的线性变换法 下面是我们常用的4种线性变换法 分别举例进行说明 其他的非线性方程也可以以此类推 得到相应的线性形式 1 倒数变换 例如 双曲线模型令 将其代入得2 半对数变换 例如 对数函数令 代入得 返回目录 常用的非线性函数的线性变换法 续 3 双对数变换 例如 幂函数两边取对数的变换得 令代入得 4 多项式变换 如二元二次多项式令代入得 返回目录 回归分析的一般程序 定性和定量分析相结合正确选择变量 返回目录 9 1多元线性回归分析的基本理论 多元线性回归是简单线性回归的推广 指的是多个因变量对多个自变量的回归 MultivariateRegression 最常用的是一个因变量对多个自变量的回归 返回目录 多元线性回归模型的性质 例 二元线性回归模型 b2 假定x2固定时x1每变动1个单位引起的y的增量 b3 假定x1固定时x2每变动1个单位引起的y的增量 是x1和x2共同变动引起的y的平均变动 反映一组自变量与因变量的平均变动关系 是给定x1 x2计算得到的估计值 是y的实际值的数学期望 返回目录 一 拟合程度的评价调整可决系数式中 n是样本容量 k是模型中回归系数的个数 调整可决系数的特点 9 4多元线性回归模型的检验 返回目录 二 多元线性回归模型的显著性检验 回归系数b的检验1 提出假设 H0 j 0 H1 j 02 确定显著水平 3 计算回归系数的t值 式中 是的标准差的估计值 按下式计算 式中 是 X X 1的第j个对角线元素 S2是随机误差项方差的估计值 返回目录 二 多元线性回归模型的显著性检验 续一 4 确定临界值 双侧检验查t分布表所确定的临界值是 t 2 和 t 2 单侧检验所确定的临界值是 t 5 做出判断 拒绝域 拒绝域 接受域 双侧检验图示 返回目录 回归方程的显著性检验具体的方法步骤回归模型方差分析表F统计量 二 多元线性回归模型的显著性检验 续二 返回目录 例9 1 在研究某超市顾客人数y与该超市促销费用x1 超市面积x2 超市位置x3之间关系时 选取变量如下 y 某超市某一周六顾客人数 千人 x1 该超市上周促销所花的费用 万元 x2 该超市的面积 百平方米 x3 超市所处位置 0表示市区 1表示郊区 按照y变量排序后的原始数据是 多元回归案例分析 返回目录 输入数据见图 直接回归法 返回目录 输出结果 返回目录 若我们上面的预测方程不显著 但确实知道其中几个变量存在着一定的线性关系 我们也可以运用逐步回归的方法对变量进行分析处理 逐步回归实现 返回目录 返回目录 SS factor 的自由度是 SS error 的自由度是 ComputingDegreeofFreedom自由度的计算 One WayANOVAPrinciplesOne WayANOVA的原理 DOFofSS total SS total 的自由度是 DOFofSS factor DOFofSS error One WayANOVAPrinciplesOne WayANOVA的原理 RegressionAnalysis Oxygenpurity versusHydrocarbon TheregressionequationisOxygenpurity 74 3 14 9Hydrocarbon PredictorCoefSECoefTPConstant74 2831 59346 620 000Hydrocar14 9471 31711 350 000S 1 087R Sq 87 7 R Sq adj 87 1 AnalysisofVarianceSourceDFSSMSFPRegression1152 13152 13128 860 000ResidualError1821 251 18Total19173 38 Example1A MinitabSessionWindow例1A Minitab的对话窗口 TheF testshowsthatthe87 7 explainedbytheregressionrelationshipisstatisticallysignificant F测试显示测定系数87 7 具备统计显著性 87 7 ofthevariabilityinyvaluesisexplainedbytherelationshiptoHydrocar 与Hydrocar的关系解释了y值87 7 的变异 R2 1meanstheregressionequationprovidesaperfectfitforthesampledata R2 1表示回归等式与抽样数据完全吻合 CoefficientofDetermination R2测定系数 R2定义 Thecoefficientofdetermination R2istheamountofthevariationinythatisexplainedbytheregressionline 测定系数 R2是由回归线代表y中变异数量 SSR Si Yi Y 2SSE Si Yi Y 2SST Si Yi Y 2SST SSR SSE InfluentialObservations具有影响的数据点 InfluentialObservationsareObservationsthat 具有影响的数据点包括下列现象1 lieoutsideofgeneralpatternsofthedataset在正常数据模式以外的数据significantlyinfluencetheregressionresults i e significantlychangetheslopeory intercept 强烈影响回归结果的数据 也就是显著改变斜率或y轴截取值 Theseobservationsarenotnecessarilybad thereforeyoumaynotneedtocensorthem 这些现象并不一定是坏现象 因此你不一定要删除他们 However theyshouldbeidentifiedandtheirimpactevaluatedbeforeanalyzingtheregressionresults 不管怎样 在分析回归结果之前应该识别这些数据点并评估其影响 InfluentialObservations具有影响的数据点 InfluentialObservations Outliers具有影响的数据现象 界外点 Outliers界外点Observationsthathavelargeresidualvalues 具有很大的残差数值的现象数据 InfluentialObservations LeveragePoints具有影响的数据现象 杠杆点 LeveragePoints杠杆点ExtremehighvaluesintheX directionandaccountforahighproportionofthesumofsquares X方向的高数值数据 它对于平方占有很高的比例 InfluentialObservations具有影响的现象数据 a b c d e f HowToHandleOutliers界外点的处理方法 Wecanremoveoutlierpointsundertwosituations 对于如下两种情况 可以取消界外点 Thereisagoodreasonfornotincludingintheanalysis e g inputerror 对不将其纳入分析中有合理的解释 例如 输入错误 2 Thesepointswillmakereasonableinterpretationoftheregressioninvalid 若纳入这些数据 会令回归分析的合理的解释失效 ANOVAtableforLinearRegression线性回归方差分析表SourceDFSum
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年房地产项目合作合同协议
- 出资合伙三方协议书7篇
- 煤矿气隙水沟设计规范
- 安全工作方案
- 人事信息化与知识共享
- 员工股权激励协议模板合集
- 地方性砷中毒:多因素解析与生物标志物探寻
- 地形简化中不确定性因素剖析与优化模型构建研究
- 地基GPS观测在雪厚度与表面温度变化估计中的应用与探索
- 地域文化视域下黑河市鄂伦春民俗文化主题公园设计研究
- 金缕玉衣教学课件
- 岗前安全教育培训考试题及答案解析
- 冲孔灌注桩施工方案
- 化工中级职称答辩试题
- 弹簧-锥形弹簧的计算
- 五牌一图制作
- 管理系统中计算机应用详细课件
- 喀斯特地貌(全套课件)
- 2019人教版高中英语选择性必修一UNIT 3 Fascinating Parks 单词表
- 水中总氯的测定方法确认实验报告(HJ586)
- GB/T 15566.8-2007公共信息导向系统设置原则与要求第8部分:宾馆和饭店
评论
0/150
提交评论