




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
许多实际问题往往需要对数据进行统计分析,建立合适的模型。Excel2007的统计函数和数据分析工具则为人们提供了一个强有力的统计分析工具。,第10章 数理统计及应用,数理统计的基本概念 描述性统计 假设检验 方差分析 回归分析,第10章 数理统计及应用,Excel 2007 能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括: 函数 数据分析工具,第1节 数理统计的基本概念,描述性统计分析主要包括两类: 数据集中趋势分析,表示数量的中心位置 (平均数、中位数) 数据的离散程度分析,表示数量的变异程度 (极差、标准差) 两者相互补充,共同反映数据的全貌。,第2节 描述性统计,总体均值的检验: 单个样本的假设检验(统计函数) 大样本(Z 检验 )、小样本(t 检验 ) 成对观测值的假设检验(数据分析工具) t 检验(平均值的成对二样本分析 双样本等方差、双样本异方差) 方差检验: F检验 Z 检验(方差已知),第3节 假设检验,1 方差分析的基本概念 方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们的主要内容包括单因素方差分析、双因素方差分析。,第4节 方差分析,下面我们用一个简单的例子来说明方差分析的基本思想:,第4节 方差分析,【 例 】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表。试分析饮料的颜色是否对销售量产生影响。,检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同 设1为无色饮料的平均销售量,2粉色饮料的平均销售量,3为橘黄色饮料的平均销售量,4为绿色饮料的平均销售量,也就是检验下面的假设 H0: 1 2 3 4 H1: 1 , 2 , 3 , 4 不全相等 检验上述假设所采用的方法就是方差分析,方差分析的应用条件 (1) 可比性,若资料中各组均数本身不具可比性则不适用方差分析。 (2) 正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。 (3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。,第4节 方差分析,方差分析的步骤: 提出假设 构造检验统计量 统计决策,第4节 方差分析,2 单因素方差分析 若只考虑一个因素对试验指标的影响,而且用方差进行分析,这种方法被称为单因素方差分析(analysis of variance)方差分析简称“ANOVA”,该方法的主要目的是通过试验数据分析推断因素A对试验指标影响是否显著,即当因素A、不同水平时试验指标有无显著差异。,第4节 方差分析,2 单因素方差分析,第4节 方差分析,(Excel 基本结构),F的函数,当p 时,拒绝原假设H0,平方和,均方,因素影响,误差,显著性水平的临界值F ,若FF ,则拒绝原假设H0 ,否则接受原假设H0 。,3 双因素方差分析 许多实际问题中,对试验指标的影响不仅仅只有一个因素,可能需要同时考虑几个因素对试验指标的影响。这种同时分析多个因素对试验指标的影响作用大小并且使用方差进行问题分析的方法称为多因素方差分析,特别是若只考虑两个因素被称为双因素方差分析,第4节 方差分析,双因素方差分析(无重复) (一个例子),【例】有四个品牌的彩电在五个地区销售,为分析彩电的品牌(因素A)和销售地区(因素B)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据,见下表。试分析品牌和销售地区对彩电的销售量是否有显著影响?,双因素方差分析(无重复) (提出假设),对因素A提出的假设为 H0: m1=m2=m3=m4 (品牌对销售量没有影响) H1: mi (i =1,2, , 4) 不全相等 (品牌对销售量有影响) 对因素B提出的假设为 H0: m1=m2=m3=m4=m5 (地区对销售量没有影响) H1: mj (j =1,2,5) 不全相等 (地区对销售量有影响),双因素方差分析(无重复),结论: FA18.10777F3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响 FB2.100846 F3.2592,接受原假设H0,说明销售地区对彩电的销售量没有显著影响,双因素方差分析(有重复),【例】有一牧草栽培实验,因素A为品种,因素B为收获期,重复数为6,其产量(吨/公顷)如下表。试分析品种、收获期和交互作用产量是否有显著影响?,双因素方差分析(有重复) (提出假设),对因素A提出的假设为 H0: m1=m2=m3 (品种对产量没有影响) H1: mi (i =1,2,3) 不全相等 (品种对产量有影响) 对因素B提出的假设为 H0: m1=m2=m3=m4 (收获期对产量没有影响) H1: mj (j =1,2,4) 不全相等 (收获期对产量有影响),双因素方差分析(有重复) (提出假设),对因素A和因素B交互作用提出的假设为 H0: ij=0, (i =1,2,3, j =1,2,4) (品种和收获期的交互作用对产量没有影响) H1: 至少有一个 ij 0 , (i =1,2,3, j =1,2,4) (品种和收获期的交互作用对产量有影响),双因素方差分析(有重复),23,第5节 回归与相关,回归分析的基本概念 使用Excel 2007 函数进行回归分析 使用数据分析工具进行回归分析,24,5.1 回归分析的基本概念,一、问题的提出,25,5.1 回归分析的基本概念,二、回归分析的基本概念 回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。,26,5.1 回归分析的基本概念,三、回归分析的主要内容 1、从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法 2、对这些关系式的可信程度进行检验,27,5.1 回归分析的基本概念,三、回归分析的主要内容 3、利用所求的关系式对某一生产过程进行预测或控制 回归分析的应用是非常广泛的,使用Excel 2007进行回归分析十分方便(图表、函数、工具)。,28,5.2 使用函数进行回归分析,Excel提供了9个函数用于建立 回归模型和回归分析,29,5.2 使用函数进行回归分析,30,5.2 使用函数进行回归分析,一元线性回归分析常用的函数: 1、INTERCEPT 功能:利用已知的x值与y值计算直线与y轴的截距 语法: INTERCEPT(Y数据区域,X数据区域) 2、SLOPE 功能:返回线性回归模型的斜率 语法:SLOPE(Y数据区域,X数据区域) 3、RSQ 功能:返回线性回归模型的判定系数 语法: RSQ(Y数据区域,X数据区域) 4、 FORECAST 功能:根据线性回归模型返回一个预测值 语法: FORECAST(预测点,Y数据区域,X数据区域),31,5.2 使用函数进行回归分析,例如:”家家有房”开发公司准备开发房产,但是要想开发房产必须要拿到建筑许可证,经过调查研究发现:建筑许可证数量主要与该地区人口的密度有关,调查结果见表。试建立一个能反映许可证颁发数量与人口密度之间的关系的回归模型,并预测当人口密度为7000时许可证的颁发数量,32,5.3 使用工具进行回归分析,例如:”家家有房”开发公司经过调查研究发现:建筑许可证颁发数量既与该地区人口的密度有关,也与自由房屋的均值有着密切的关系,同时与平均家庭收入也有关系,现要求建立一个模型,用来预测建筑许可证的颁发数量,并给出当每平方英里的人口密度为7000,自由房屋的均值为300,平均家庭收入为800千元时,预测出建筑许可证的颁发数量是多少?,33,5.3 使用工具进行回归分析,步骤1:单击“数据”选项卡,选择“分析”组中“数据分析”按钮,则打开“数据分析”对话框,选择“回归”,弹出“回归”对话框,34,5.3 使用工具进行回归分析,步骤2:单击“确定”按钮,弹出“回归”对话框,35,5.3 使用工具进行回归分析,步骤3:单击“确定”按钮,得回归分析结果,回归方程的显著性检验(步骤),2、计算检验统计量F,3、确定显著性水平,找出临界值F 4、作出决策:若FF ,拒绝H0;若FF ,接受H0,1、提出假设 H0:12p=0 线性关系不显著 H1:1,2,p至少有一个不等于0,回归系数的显著性检验(步骤),3、确定显著性水平,并进行决策 tt,拒绝H0; tt,接受H0,1、提出假设 H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系) 2、计算检验的统计量 t,38,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分: 回归统计表 回归统计表包括以下几部分内容: Multiple R(复相关系数R):又称为相关系数,用来衡量变量x和y之间相关程度的大小 R Square(复测定系数R2):用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果,39,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分: 回归统计表 回归统计表包括以下几部分内容: Adjusted R Square(调整后的R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型,用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果,40,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分: 回归统计表 回归统计表包括以下几部分内容: 标准误差:用来衡量拟合程度的大小,也用于计算与回归相关的其他统计量,此值越小,说明拟合程度越好 观测值:用于估计回归方程的数据的观测值个数,41,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分: 方差分析表 方差分析表的主要作用是通过F检验来判断
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《手术室医院感染控制课件》
- 电视购物与多渠道融合营销考核试卷
- 纤维板制造原理考核试卷
- 人工智能在风险评估中的自然语言处理应用考核试卷
- 计划生育技术服务在灾害应急中的应对措施考核试卷
- 《出血性疾病课件概述》
- 数字智慧方案5425丨莆田港务集团5G智慧港口项目建设方案
- 2019-2025年材料员之材料员专业管理实务自我提分评估(附答案)
- 2025年基金从业资格证之证券投资基金基础知识真题练习试卷A卷附答案
- 海上风电运维船安全
- 短语结构类型(七年级下)
- 厂区保洁服务投标方案【2024版】技术方案
- 中国近现代史考点归纳
- 高考志愿填报指导高考志愿填报指南
- 中国文化概要智慧树知到期末考试答案章节答案2024年温州大学
- 制作的最好的GRR分析表
- 淄博市2024届高三二模历史试题卷(含答案)
- MOOC 人力资源管理-暨南大学 中国大学慕课答案
- MOOC 动物学-华中农业大学 中国大学慕课答案
- (2024年)中华人民共和国环境保护法全
- 中医护理-生活起居的护理内容
评论
0/150
提交评论