




免费预览已结束,剩余44页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第10章数理统计及应用 本章内容 通过实例 介绍如何使用Excel2007统计函数和数据分析工具进行数据统计分析与预测 包括描述性统计 假设检验 方差分析和回归分析等教学目标 掌握利用Excel函数和数据分析工具进行统计分析与预测的基本方法 数理统计是一门对客观不确定现象进行数据搜集 整理和分析的科学 其目的是了解客观情况 探索数据内在结构及现象之间的规律性 是通过某事物的一部分 样本 来估计事物全部 总体 的特征的 数理统计方法也就是以样本的特征对未知总体做出合乎逻辑的推论 得到对事物客观本质的和规律性的认识 Excel2007能够支持范围广泛的统计计算任务 提供工程和科学统计的基本能力 其中包括函数和数据分析工具 第1节数理统计的基本概念 按功能划分统计函数的种类包括 1 频数分布处理 2 描述统计量计算 3 概率计算 4 参数估计 5 假设检验 6 卡方检验 7 相关 回归分析 第1节数理统计的基本概念 80个统计函数 第1节数理统计的基本概念 Excel软件中提供了15个数据分析工具 1 统计绘图 制表 2 描述统计量计算 3 参数估计 4 假设检验 5 方差分析 6 相关 回归分析 7 时间序列分析 8 抽样 9 数据变换 第1节数理统计的基本概念 第1节数理统计的基本概念 首先单击 Office按钮 然后单击 Excel选项 单击 加载项 然后在 管理 框中 选择 Excel加载宏 单击 转到 在 可用加载宏 框中 选中 分析工具库 复选框 然后单击 确定 确定后 数据 选项卡中增加了 数据分析 子项 第1节数理统计的基本概念 在进行数据分析的时候 一般首先要对数据进行描述性统计分析 DescriptiveAnalysis 以发现其内在的规律 再选择进一步分析的方法 描述性统计分析要对调查总体所有变量的有关数据做统计性描述 主要包括数据的频数分析 数据的集中趋势分析 数据离散程度分析 数据的分布 以及一些基本的统计图形 预处理 提前准备 第2节描述性统计 数据的集中趋势分析是用来反映数据的一般水平 常用的指标有平均值 中位数 众数 几何平均值 调和平均数等作用 指出一数据资料内变量的中心位置 标志着资料所代表性状的数量水平和质量水平 作为样本或资料的代表数与其它资料进行比较 2 1数据集中趋势分析 平均数算术平均数 average 调和平均数 harmean 几何平均数 geomean 2 1数据集中趋势分析 几何平均可用于平均比率的计算 这里变化比率是在相等长度的时间区间内给出的 如果样本观测值包含某种倒数 则可用调和平均 特别地 调和平均可用于以不同的速度通过各路段 求总的平均速度 或在各种条件下 求不同密度的流体的平均密度的计算 调和平均数某人从C到B的平均速度为30km h 沿同一路线返回时平均速度为60km h 求整个往返行程的平均速度为多少 用Excel调和平均数求解 HARMEAN 30 60 40即40km h 2 1数据集中趋势分析 几何平均数一雇员在连续三年内的年薪增长率分别为6 10 和12 这里增加的百分数是在上一年的薪金基础上计算的 求其三年内的年薪平均增长率 用Excel几何平均数求解 GEOMEAN 1 06 1 1 1 12 1 0930所以 薪水的年平均增长率为9 3 2 1数据集中趋势分析 中位数 MEDIAN 2 1数据集中趋势分析 中位数是样本的50 分位点 它受极端数值的干扰很小 如果加入一个很大的干扰值 中值数仅可能有很小的移动 几何均值和调和均值同算术平均值一样 对极端数值也较敏感 它们主要用于数据为对数正态分布或偏斜程度较大时 下例显示上述几种统计量对极端数值的敏感程度A1 A7 111111100 geomean A1 A7 1 9307 harmean A1 A7 1 1647 average A1 A7 15 1429 median A1 A7 1 2 1数据集中趋势分析 几何均值 调和均值 算术平均值 中位数 集中趋势数据类型测度指标布形状是否整理众数分类变量钟形分布顺序变量U形分布是数值型变量J形分布中位数顺序变量数值型变量钟形分布是数值平均数数值型变量钟形分布均可 2 1数据集中趋势分析 小结 算术平均数 调和平均数 几何平均数 不同的数值平均数计算方法 根本原因在于个体量与总量的不同对应关系总量 个体量 如一个班同学的总成绩是每个同学的成绩之和 总量 个体量 如 十一五 期问经济的总发展速度 就等于期间各年的经济发展速度连乘积 算术平均数和调和平均数是平均指标的两种表现形式 是由于我们所掌握的资料不同而采用的不同的计算方法 2 1数据集中趋势分析 小结 数据的离散程度分析主要是用来反映数据之间的差异程度 常用的指标有极差 方差 标准差 四分位数间距等作用 描述变量分布的差异程度 衡量和比较均值指标的代表性高低 为抽选样本单位数提供依据 2 2数据离散程度分析 极差 为样本最大与最小值之差 是描述数据分散程度最简单的度量 但如果数据中出现了极端数据 极端数据有可能就是最大值或最小值 因此极差对极端数据非常敏感 标准差和方差是常用的分散程度度量 它们对于正态分布的样本是最优的 但它们对极端数据也是较敏感的 偏离数据整体的一个极端数据可能会使它们的值急剧增大 2 2数据离散程度分析 样本方差为了度量其变异程度 对含有n个观测数x1 x2 xn的样本 可以用样本方差反映其变异程度 样本方差的定义公式为 Excel函数公式 2 2数据离散程度分析 VAR x1 x2 x1 x2 为对应于总体样本的1到255个参数 样本标准差方差的定义虽然能够反映变量变异程度 但由于离均差取了平方值 使得它与原始数据和单位都不相适应 需要将方差开方还原 方差的标准根值就是标准差 样本标准差的定义公式 Excel函数公式 2 2数据离散程度分析 STDEV x1 x2 x1 x2 为对应于总体样本的1到255个参数 下例显示上述几种统计量对极端数值的敏感程度A1 A7 111111100 max A1 A7 min A1 A7 99 stdev A1 A7 37 4185 极差 标准差 2 2数据离散程度分析 2 2数据离散程度分析 设有甲乙两人 对同一名患者采耳垂血 检查红细胞数 万 mm3 每人数五个计数盘 得结果为 甲480490500510520乙440460500540560 若让你就评价两人的检验技术的好坏 你如何评价 2 2数据离散程度分析 设有甲乙两人 对同一名患者采耳垂血 检查红细胞数 万 mm3 每人数五个计数盘 得结果为 甲480490500510520乙440460500540560两人计数的均数都是500 能说两人的检验技术相同吗 不能 因为甲的计数结果比较密集 而乙的分散 因此甲的检验精度显然比乙的高 可以用极差来衡量 甲计数的极差为520 480 40 乙的为560 440 120 可见乙的计数较甲的波动大 2 2数据离散程度分析 设有甲乙两人 对同一名患者采耳垂血 检查红细胞数 万 mm3 每人数五个计数盘 得结果为 甲480490500510520乙440460500540560 10 2描述统计 偏度偏度 Skewness 反映一组数据的频数分布曲线的高峰是偏左 偏右还是居中 公式 如果g1 0为负偏峰 表示曲线高峰偏右 长尾向左 负 方向延伸 g1 0表示曲线对称 g1 0为正偏锋 表示曲线高峰偏左 长尾向右 正 方向延伸 已知某地区某时段的平均温度 求出这段时间这些温度的偏度 数据如图所示 这一地区温度的偏度为 在单元格A12中 键入 SKEW B2 B11 等于 0 3187 由于偏度值小于零 表示曲线高峰偏左 10 2描述统计 峰度公式 峰度 Kurtosis 反映一组数据的频数分布的高峰是平阔峰 正态峰还是尖峭峰 0表示曲线高峰尖且陡峭 为尖峭峰 例10 10数据 这一地区温度的峰度为 在单元格A12中 键入 KURT B2 B11 等于 1 005 由于峰度值小于零 表示曲线高峰平坦 为平阔峰 10 2描述统计 10 2 3描述统计工具1 描述统计工具功能用于生成对输入区域中数据的单变量分析 提供数据趋中性和易变异等有关信息 10 2描述统计 10 2 3描述统计工具2 操作步骤用鼠标点击工作表中待分析数据的任一单元格 选择 工具 菜单的 数据分析 子菜单 用鼠标双击数据分析工具中的 描述统计 选项 出现 描述统计 对话框 如下图所示 10 2描述统计 10 2 3描述统计工具 10 2描述统计 10 2 3描述统计工具3 结果说明描述统计工具生成统计指标 如右图所示 第3节假设检验 假设检验是统计推断的基本问题之一 主要是确定关于样本总体特征的判断是否合理的过程 先对总体的参数 或分布形式 提出某种假设 然后利用样本信息判断假设是否成立的过程 假设检验的基本思想和原理假设检验的步骤总体均值的检验 假设检验的过程 首先对几个必要的名词作简要的解释 零假设 即初始判断H0 0 50 H0 0H0 0 50 备选假设 也称对立假设 H1 0 50 H1 0假设检验是在H0成立的前提下 从样本数据中寻找证据来拒绝H0 接受 H1 如果证据不足 则只能不拒绝H0 暂且认为H0正确 第3节假设检验 提出假设 例题分析 提出假设 例题分析 首先对几个必要的名词作简要的解释 统计量 统计理论中用来对数据进行分析 检验的变量 根据样本观测结果计算得到的 并据以对零假设和备择假设作出决策的某个样本统计量根据不同的推断要求 可以构造不同的统计量t z F x2 第3节假设检验 显著性水平 在进行假设检验时应该事先规定一个小概率的标准 作为判断的界限 这个小概率标准称为显著性水平是一个概率值原假设为真时 拒绝原假设的概率被称为抽样分布的拒绝域表示为 常用的 0 05 0 01 0 10 由研究者事先确定 第3节假设检验 P值 P值是在H0成立前提下 比样本统计量更极端的概率如果P 则拒绝H0 接受H1如果P 拒绝H0的样本证据不足 就不拒绝H0 暂且认为H0成立根据统计推断结果 结合相应的专业知识 给出一个专业的结论 第3节假设检验 1假设检验的步骤 1 提出统计假设 零假设H0和备选假设H1 2 规定显著水平 3 选取样本统计量 4 在显著水平 下 算出统计量服从分布的临界值 确定假设参数的拒绝域 第3节假设检验 2参数的假设检验工具举例成对观测值的假设检验 均值假设检验 t检验 平均值的成对二样本分析双样本等方差 双样本异方差 Z检验方差检验 F检验 1 双样本的方差检验 F 检验双样本方差 分析工具通过双样本F 检验对两个样本总体的方差进行比较 例 公司生产某产品 现在分别从同一月份上旬和下旬产品中随意各取若干个 测定其质量指标 假设设备磨损是引起变化的唯一原因 问检验结果是否表明精度显著降低了 0 05 2 t检验 双样本等方差 双本异方差 双样本等方差分析工具可进行双样本t检验 此t检验假设两个数据集取自具有相同方差的分布 故也称作同方差t检验 可以使用此t检验来确定两个样本是否来自具有相同总体平均值的分布 双样本异方差分析工具可进行双样本学生t检验 此t检验假设两个数据集取自具有不同方差的分布 故也称作异方差t检验 当两个样本中有截然不同的对象时 可使用此检验 2 t检验 双样本等方差 双本异方差 例 今抽测甲班学生10人和乙班学生12人的跳高成绩 单位 cm 如下 试分析甲 乙两班的跳高成绩是否有差异 3 t检验 平均值的成对二样本分析 用以对两组成对数据进行均值是否相等的检验 实际工作中往往会遇到均值的成对比较 如采用新教育方法前后学生的成绩 进行体育疗法前后患者的血压等 当样本中的观察值存在配对关系时 可以使用 成对双样本t 检验 t检验 平均值的成对二样本分析 用以对两组成对数据进行均值是否相等的检验 实际工作中往往会遇到均值的成对比较 如采用新教育方法前后学生的成绩 进行体育疗法前后患者的血压等 当样本中的观察值存在配对关系时 可以使用 成对双样本t 检验 t检验 平均值的成对二样本分析 例 由纯化病毒A B两种处理方法得10组数据 试分析两种方法是否有差异 4 大样本的方差已知的双样本平均值检验 大样本指的是样本数量大于30 即默认为服从正态分布 可以用z检验 Excel 数据分析 工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国广电齐齐哈尔市2025秋招半结构化面试模拟30问及答案
- 白银市中石化2025秋招笔试模拟题含答案新材料与新能源岗
- 平凉市中石化2025秋招笔试模拟题含答案油品分析质检岗
- 昌吉回族自治州中石化2025秋招面试半结构化模拟题及答案油田工程技术岗
- 中国移动济宁市2025秋招网申填写模板含开放题范文
- 黄南藏族自治州中储粮2025秋招面试专业追问题库战略研究博士岗
- 博尔塔拉自治州中石化2025秋招笔试模拟题含答案市场营销与国际贸易岗
- 大唐电力内蒙古2025秋招计算机与信息专业面试追问及参考回答
- 中国移动石家庄市2025秋招计算机类专业追问清单及参考回答
- 2025年电动三轮车考试题及答案
- 部编版六年级年册《第五单元习作 围绕中心意思写》课件
- 测绘师《测绘管理与法律法规》知识点必考必练试题库200题(含详解)
- 网络传播概论(彭兰第5版) 课件全套 第1-8章 网络媒介的演变-网络传播中的“数字鸿沟”
- 顾建民高等教育学知识点总结【呕心沥血整理】
- 部编版教材一年级上册语文拼音《jqx》课件
- 清华大学实验室安全教育考试题库(全)
- 项目经理(总监)解锁申请表
- 物业管理存在的问题与对策
- 前列腺等离子电切术护理查房
- 儿童神经心理行为发育
- GB/T 4074.8-2009绕组线试验方法第8部分:测定漆包绕组线温度指数的试验方法快速法
评论
0/150
提交评论