第5章市场调查数据的数理推断分析_第1页
第5章市场调查数据的数理推断分析_第2页
第5章市场调查数据的数理推断分析_第3页
第5章市场调查数据的数理推断分析_第4页
第5章市场调查数据的数理推断分析_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场调查数据的数理推断分析第 5章1 本章主要介绍利用 Excel 进行数据推断的方法,包括参数估计、假设检验、方差分析、相关和回归分析。所使用的函数为 RAND。本章简介本章重点重点、难点参数估计,假设检验,相关和回归分析。本章难点使用数据分析工具进行数据推断分析。25.3 总体参数假设检验5.2 总体参数估计本章目录5.1 随机抽样5.4 方差分析5.5 相关和回归分析35.1.2 使用随机数生成函数实现随机抽样5.1.1 利用 EXCEL数据分析功能实现随机抽样5.1 随机抽样45.1.1 利用 EXCEL数据分析功能实现随机抽样实现随机抽样有两种方法:1 利用 Excel 数据分析功能实现随机抽样。2 使用随机数生成函数实现随机抽样。例 5-1 图 5-1 是 80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下: 第一步:选择 “工具 ”菜单下 “数据分析 ”中 “抽样 ”功能,打开 “抽样 ”对话框,如图 5-2 所示。例 5-1 图 5-1 是 80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下: 第二步:设置相关参数,如图 5-2 所示,单击 “确定 ”按钮。8利用 Excel“ 数据分析 ” 提供的抽样功能抽取的样本存在以下问题: 12随机抽样采用的是可放回抽样,因此,总体中的每个数据都可以多次被抽中,所以样本中的数据一般都会有重复现象。经过筛选,抽样结果避免了重复,但最终所得样本数量可能少于所需数量,因而要根据经验适当调整在数据样本选取时的数量设置,以使筛选后的样本数量满足要求。 3尽管高级筛选可以对重复抽样情况进行修补,但抽样结果只能输出所需数目的所抽选项,其他相关信息需要利用其他辅助手段得到,给后继数据分析带来困难。5.1.2 使用随机数生成函数实现随机抽样利用随机数函数 RAND()进行随机抽样上例数据利用 RAND函数抽样的操作步骤为:1 第一步:增加字段 “ 生成随机数 ” 和 “ 随机数排序 ” 。23 第二步:在单元格 F2 中输入公式 “ =RAND()” ,并复制到单元格区域 F3:F81,得到一列动态随机数。如图 5-5 所示。 第三步:选择单元格区域 F2:F81,单击鼠标右键,选择 “复制 ” ,移动光标到单元格 G2,再次单击鼠标右键,选择 “ 选择性粘贴 ” ,在出现的对话框中选择 “ 数值 ” 并单击 “ 确定 ” ,得到一列静态随机数。4 第四步:选择单元格区域 A1:G81,选择 “ 数据 ”“ 排序” ,以 “ 随机数排序 ” 为主要关键字排序。在排序结果中根据所需样本数目,即可以进行进一步数据推断。5.2.2 均值区间估计5.2.1 参数估计概述5.2 总体参数估计5.2.3 比率区间估计115.2.1参数估计概述 参数估计是指用样本指标(也称为统计量)来估计未知的总体指标(也称为总体参数) 。最常见的是用样本平均数估计总体均数、用样本比率估计总体比率。 点估计也称为定值估计,是以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。 区间估计是给出总体未知参数的可能变动范围,即区间,并用一定的概率保证区间包含总体未知参数,即根据统计量和标准误差推断总体指标的可能范围。5.2.2均值区间估计正态总体 区间估计 说明总体方差已知为样本均值, n为样本容量, 为已知总体标准差, 为正态分布临界值总体方差未知容量 30S为样本标准差 ,其他 符号意义同上容量 30为 t 分布临界值,其他符号意义同上例 5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, ( 1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 ( 2)总体方差未知,估计 80 名学生数学平均分 95%的置信区间。具体的操作步骤如下: 第一步:建立均值区间估计计算表,如图 5-7 所示。15例 5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, ( 1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 ( 2)总体方差未知,估计 80 名学生数学平均分 95%的置信区间。具体的操作步骤如下: 第二步:总体方差已知的区间估计:在单元格 B24 中输入已知总体标准差 “10” ,在单元格 B25中输入置信水平 “95%” ,在单元格 B26 中输入样本容量 “ 20 ”,在单元格 B23 中输入公式“=AVERAGE(C2:C21)” ,计算样本均值;在单元格 B27 中输入公式“=ABS(NORMSINV(1-B25)/2)” ,计算正态分布临界值;在单元格 B28、B29 中分别输入公式 “=B23-B27*B24/SQRT(B26)” , “=B23+ B27*B24/SQRT(B26)” ,计算均值区间的下限和上限。例 5-2 假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据, ( 1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。 ( 2)总体方差未知,估计 80 名学生数学平均分 95%的置信区间。具体的操作步骤如下: 第三步:总体方差未知的区间估计:在单元格 D25 中输入置信水平 “95%” ,在单元格 D26 中输入样本容量 “20” ,在单元格 D23 中输入公式“=AVERAGE(C2:C21)” ,计算样本均值;在单元格 D24 中输入公式“=STDEV(C2:C21)” ,计算样本标 准差;在单元格 D27 中输入公式“=TINV(1-D25, D26-1)” ,计算 t 分布临界值;在单元格 D28、 D29中分别输入公式 “=D23D27* D24/SQRT(D26)” , “=D23+D27*D24/SQRT(D26)” ,计算均值区间的下限和上限。5.2.3比率区间估计比率在大样本情况下,服从正态分布分布,比率的区间估计为:例 5-3 某市区随机调查了 300 名居民户,其中 6户拥有等离子电视机,估计该地区等离子电视机 95%的置信区间。具体的操作步骤如下: 第一步:建立比率区间估计的计算表,如图 5-8所示。 第二步:在单元格 B4 中输入公式“=B3/B2” ,计算样本比率;在单元格 B7中输入公式“=ABS(NORMSINV(1-B6)/2)” ,计算正态分布临界值。 第三步:在单元格 B8、 B9 中分别输入公式 “=B4-B7*SQRT (B4*(1-B4)/B5)” , “=B4+B7*SQRT(B4*(1-B4)/B5)” ,计算比率置信区间下限和上限。 5.3.2 一个总体参数假设检验5.3.1 假设检验概述5.3 总体参数假设检验5.3.3 两个总体参数假设检验205.3.1假设检验概述 1.假设检验 假设检验是推断分析的另一项重要内容,它与参数估计类似,但角度不同。参数估计是利用样本信息推断未知总体参数,而假设检验是先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。假设检验有参数检验和非参数检验两种。 逻辑上运用反证法,统计上依据小概率事件不可能发生这一原理。5.3.1假设检验概述 2.原假设与备择假设 统计是对总体参数的具体数值所作的陈述。在假设检验中,有原假设与备择假设。原假设是研究者想收集证据予以反对的假设,又称 “ 零假设 ” ,用符号表示为 H 0 。之所以用零来修饰原假设,是因为原假设的内容总是没有差异或没有改变,或变量间没有关系等。关于样本统计量,如样本均值或样本均值之差的零假设,是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或者是否相等。 备择假设也称 “ 研究假设 ” ,是研究者想收集证据予以支持的假设,表示为 H1 。5.3.1假设检验概述 3.双侧检验与单侧检验 如果备择假设没有特定的方向性,并含有符号 “” ,这样的检验称为双侧检验或双尾检验(图 5-9) 。 如果备择假设具有特定的方向性,并含有符号 “ ” 或 “ ” 的假设检验,称为单侧检验或单尾检验。备择假设的方向为 “ ” ,称为左侧检验(图 5-10) . 备择假设的方向为 “ ” ,称为右侧检验(图 5-11) 。 图 5-9双侧假设检验 图 5-10 左侧假设检验 图 5-11右侧假设检验5.3.1假设检验概述 4.显著性水平 在假设检验中,把拒绝 H0 所犯的错误称为弃真错误(或 类错误) ,发生的概率设为 ,也称显著性水平; 把接受不真实的 H0 所犯的错误,称为取伪错误(或 类错误) ,发生的概率设为 , 两者之间的关系是: 大, 就小; 小, 就大,一般力求在控制 的前提下减少 。显著性水平 的通常取值有 0.1、 0.05、 0.001 等。 如果犯 类错误损失更大,为减少损失, 值取小;如果犯 类错误损失更大, 值取大。确定了 ,就确定了临界点。 5.3.1假设检验概述 5.检验统计量与拒绝域 检验统计量是根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。 标准化检验统计量(点估计量假设值) 点估计量的标准差,是对样本估计量的标准化结果,即原假设 H0 为真时,点估计量的抽样分布。双侧检验的拒绝域如图 5-9 所示,左侧检验的拒绝域如图 5-10 所示,右侧检验的拒绝域如图 5-11所示。 图 5-9双侧假设检验 图 5-10 左侧假设检验 图 5-11右侧假设检验5.3.1假设检验概述 6. 假设检验的步骤 根据已知总体与样本陈述原假设和备择假设。 确定一个适当的检验统计量,并利用样本数据算出其具体数值。 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域。 将统计量的值与临界值进行比较,作出决策。 统计量的值落在拒绝域内,拒绝 H ,否则不拒绝 H 。也可以直接利用 P 值作出决策, P 值 ,拒绝 H 。5.3.2一个总体参数假设检验 双侧检验 左侧检验 右侧检验假设形式 H0: 0H1: 0H0: 0H1: 0H0: 0H1: 0检验统计量 大样本未知 , , 已知, 小样本未知 , , 已知, 统计量与临界值决策准则 统计量 临界值 统计量 -临界值 统计量临界值P值决策准则 P ,拒绝 H0表 5-2 一个总体均值检验类型1.一个总体均值检验例 5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: ( 1)学生数学平均分是否为 80 分, ( 2)学生数学平均分是否低于 80 分, ( 3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第一步:建立如图 5-12所示的总体均值检验表。 第二步:在单元格区域 B7:D8,B15:D16 设置检验形式。其中, ( 1)为双侧检验, ( 2)为左侧检验, ( 3)为右侧检验。在单元格 B4 输入例 5-2 计算样本标准差。例 5-4 利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验: ( 1)学生数学平均分是否为 80 分, ( 2)学生数学平均分是否低于 80 分, ( 3)学生数学平均分是否不高于 80 分。具体的操作步骤如下: 第三步:总体方差已知的情况下,在单元格区域 B10:D10 分别输入公式 “=NORMSINV(1B9/2)” , “=NORMSINV(B9)” , “=NORMSINV(1B9)” ,计算三种检验临界值。 在单元格 B11 中输入公式“=(B280)/(B3/SQRT(20)” ,计算检验统计量。例 5-4 利用例 5-1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论