




免费预览已结束,剩余93页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专业质量统计分析软件 MINITAB教程 酒钢不锈钢厂 第一章Minitab概要第二章管理数据第三章操作和计算数据第四章使用数据分析和质量工具第五章基本操作示例第六章做一个简单分析第七章高级Minitab第八章质量管理和改善第九章实验设计 目录 前言 MINITAB是为质量改善 教育和研究应用领域提供统计软件和服务的先导 是一个很好的质量管理和质量设计的工具软件 更是持续质量改进的良好工具软件 MINITAB统计软件为质量改善和概率应用提供准确和易用的工具 MINITAB被许多世界一流的公司所采用 包括通用电器 福特汽车 通用汽车 3M 霍尼韦尔 LG 东芝 诺基亚 以及SixSigma顾问公司 作为统计学入门教育方面技术领先的软件包 MINITAB也被4 000多所高等院校所采用 MINITAB总部位于统计eCollege PA USA 美国 在英国和法国设有办事处 在世界各地拥有分销商 MINITAB包括 基础和高级统计回归和方差分析时间序列演示质量的图表模拟和分布灵活的数据导入 导出和操纵SPC 统计过程控制 DOE 试验设计 可靠性分析多变量分析样本量和幂计算强大的宏语言MINITAB 系统要求运行windows95 98或者windowsNT tm 4 需要16MB内存 处理器为486或以上的个人计算机 如使用486处理器 特别建议采用数学协处理器 完全安装需要35MB的硬盘空间VGA或SVGA显示器 建议最小分辨率为800X600 需要CD ROM驱动器某些功能需要使用鼠标本教材主要着重于对MINITAB软件包的基本操作和运用 没有深入该软件的介绍和运用 更没有跟随新版软件的升级更新 这些需要使用者自己深入钻研 1 1Minitab系统操作环境简介1 2Minitab的工作步骤1 3关于Minitab的项目文件类型 第一章Minitab概要 Minitab系统操作环境简介 在MINITAB里进行数据分析时 需要使用各种窗口和工具 下面是MINITAB环境下各部分的简介 各MINITAB窗口作用 会话窗口显示诸如统计报表之类的输出文本 数据窗口在此可以输入 修改数据和查看每个工作表的数据列 信息窗口概括了每个打开的工作表 可以从下拉列表框中选择要查看的工作表 历史窗口记录了所用过的命令 图形窗口显示各种图形 一次最多只能打开15个图形窗口 会话窗口 数据窗口 状态条 图形窗口 快捷菜单 历史窗口 信息窗口 工具条 Minitab的工作步骤 章节标题主要内容2数据管理在数据窗口中输入和修改数据 从文件中导入数据或将数据以文件形式保存 生成规则数据 3操作和计算数据在数据窗口中对数据列进行操作 排序 分组和生成方程式 4运用数据分析从基本的统计到质量管理 运用一系列的分析和质量工具方式 5图形数据生成 修改图形 同时打印并且用各种格式保存图形 6管理会话窗 查看输出文本 并且改变输出文本格式 打印生成报告和用各种格式保存 进行一个典型的分析往往要经过很多步骤 以下六章讲的就是与此相关的基本分析步骤 每章节主要讲了那一步的一些基本 常见的分析内容 以下是各章节的列表及内容简述 打开 保存 关闭项目文件 打开一个新的项目文件 选择文件 新建 按Minitab项目 再按确定 打开一个已有的项目文件 选择文件 打开项目 打开一个已有的项目工作表 选择文件 打开工作表 保存一个项目文件 选择文件 保存项目 关闭一个项目文件 你必须打开一个新的项目文件 或一个已有的项目文件 或者退出 一个MINITAB项目文件包含了所有的工作 收集的数据 输出的文本 图形等 当保存一个项目文件时 所有的东西都保存下来了 但是一次只能打开一个项目文件 项目文件里的各种工作表 数据 工作表 图形等 可以单独进行处理 可以生成数据 图形 也可以从别的文件中通过拷贝的形式向一个项目文件添加数据和图形 项目文件里的大部分窗口的内容都能够单独保存和打印 也可以忽略某些工作表或图形 这样的话 这些工作表和图形便不会保存到项目文件中去 每当保存一个项目文件时 保存了以下一些内容 一 所有窗口的内容 其中包括 1 每个数据窗口的数据列 2 信息窗口中的常量 矩阵 3 会话窗口和历史窗口中的所有的文本 4 每个图形窗口 二 通过命令文件 项目说明生成的项目文件注解 三 通过命令文件 工作表说明生成的对每个工作表的注解 四 每个窗口的大小 位置和状态 Minitab的工作步骤 在对话框中输入变量MINITAB的对话框和其他软件的对话框没什么两样 其最大的特点就是变量列表框 出现在很多对话框中 变量列表框一般显示的是一些变量列名 常量或矩阵 凡是在能够输入变量的文本框中 均可以输入这些列表框中所显示的 变量列表框的优点是可以准确无误的选择变量名 一般指数据列名 变量列表框中的内容即当前工作表的列 矩阵 变量文本框只容纳列 当光标停于其中时 左边的变量列表框仅显示数据表中的各列 Minitab的工作步骤 在对话框中选择变量的几种方法 用鼠标选择一个变量1 点击需要填写变量的文本框 2 在变量列表框中用鼠标选择一个变量 然后双击此变量 用鼠标选择多个变量1 点击需要填写变量的文本框 2 点击变量列表框 3 点击某个变量 用鼠标拖画数个变量 或者按住Ctrl键点击不连续变量 用键盘选择一个变量1 按Tab键进入需要填写变量的文本框 2 按F2键 使得变量列表框被激活 3 使用上下箭头键 选择变量 4 再按F2键 将所选择的变量便出现在刚才被激活的文本框中了 2 1数据管理概要2 2在数据窗口中输入数据2 3生成规则数据 第二章数据管理 数据管理概要 1 数据保存在工作表中在MINITAB里 与特定的数据集有关的所有数据都包含在工作表中 一个项目文件允许有许多工作表 工作表的个数取决于计算机的内存大小 一个工作表可以包含三种数据类型 数值型 numeric 文本型 text 和日期 时间 date time 型 表现形式为 数据列 列 常量 constant 矩阵 矩阵 可以在多个窗口中察看数据 但大多时候都是在数据窗口中处理数据列 2 数据的三种类型 数值型 numeric 文本型 text 日期 时间型 date time 数值型数据由数字构成 如 1 2 3 5 文本型数据由以下几种构成 字母 数字 空格和特殊字母如 Testnumber4 日期 时间型数据可以是日期 如Jan 1 2000或者3 13 1999 时间 例如 09 30 22AM 也可以是二者均有 如 5 13 200009 30 25AM MINITAB将日期和时间以数字的形式存储 但是可以选择任意一种格式来显示 3 与数据有关的三个窗口A 数据窗口数据窗口中的内容即为工作表中的数据列 当打开了多个工作表时 每个工作表都有其自己的数据窗口 数据管理概要 注意 数据窗口不是电子表格尽管数据窗口有行和列 但它不像EXCEL那样的电子表格 它的单元格数量是有限的 而且单元格中的数值只能手工输入或者有命令生成 它不能包含有方程式 它的值不会随其他单元格的值变化而变化 例如 想要C3 C1 C2 首先必须用计算器计算C1 C2的值 如果改变C1的值 若不用计算器再计算的话 C3的值是不会改变的 换而言之 C3不随C1变而变 在每个数据窗口里 可以 察看处于工作表中的各列数据 输入数值并以多种方式修改 对数据列进行多种操作 包括 改变格式 字体 名字 宽度 注解和列的位置 例 打开文件 打开工作表 样本数据 市场调查 MTW 数据管理概要 此窗口对当前活动工作表的数据 数据列 常量 矩阵 进行了概括 可以对这些数据进行修改 B 信息窗口 C 会话窗口 打开文件 打开工作表 样本数据 酸 MTW 选择菜单 数据 显示数据 在要显示的列 常量 矩阵框中选入酸1酸2 点击确定 选择窗口 会话便能看见会话窗口中的如下内容 数据显示行酸1酸210 1230 10920 1090 11130 1100 11040 1090 110 如果是文本列 标志为T 日期列标志为D 其余列为数值型的列 在数据窗口中输入数据 在数据窗口中的一个单元格中输入数据 只要点击一下此单元格 然后输入数据 再回车 输入数据时 该列的数据会自动格式化 当往一空列输入数据时 Minitab会给该列分配一种数据类型 数值型 文本型或者日期 时间型 如果此数据类型不是数值型 Minitab也会在列号后面添加一个标识符加以区分 D表示日期 时间型数据 T表示文本型数据 每一列单元格一般表示一个变量 在数据窗口中输入数据 一 在一行 一列或者一块单元格中输入数据 1 输入一列数据a 点击数据方向箭头使之朝下b 输入数据 然后按Tab或者Enter键移动当前活动单元格 按Ctrl Enter组合键 当前活动单元格便跳到了下一列的顶部 注意 输入完一个值回车之后 当前活动单元格往下移动一格 数据方向箭头 2 输入一行数据a 点击数据方向箭头使之朝右b 输入数据 然后按Tab或者Enter键移动当前活动单元格 按Ctrl Enter组合键 当前活动单元格便跳到了下一行的顶部 注意 输入完一个值回车之后 当前活动单元格往右移动一格 数据方向箭头 在数据窗口中输入数据 3 输入一块数据a 选择一块区域 使之高亮度显示 b 输入数据 当前活动单元格仅仅在所选区域内移动 c 如果要取消所选区域 可以按箭头键或者用鼠标点击数据窗口的任何地方 二 生成规则数据 可以按照一定的规则生成数据 如 按顺序生成一简单数据集或按字母顺序生成一列数据 也可以生成规则的日期 时间型数据 最常见的就是在一列中按照一定的顺序生成数据 如 从1到100的所有整数 或者介于1到50之间的所有偶数 尤其是这一列中的每个数可以重复 或者整个队列的数据也可以重复 在变量设计分析中 当输入因子水平时 将数据或序列反复多次是非常有用和简便的 在数据窗口中输入数据 1 生成简单的数字集1 选择菜单 计算 产生模块化数据 简单数集 2 在将模块数据存储的文本框中 输入数据列名 此列既可以是新的列 也可以是已经存在的列 此列用来保存所生成的数据 3 在从第一个值 到最后一个值和步长 即增量 文本框中输入数字 4 若有必要 也可以在列出各项值的重复次数 每个值显示的次数 和列出各序列的重复次数 显示整个编列的次数 文本框中输入一个数字 2 生成规则数据的几个例子 结果 从1到100的所有整数 从第一个值 到最后一个值 步长 列出各项值的重复次数 列出各序列的重复次数 1 100 1 1 1 从10到1的所有偶数 10 1 2 1 1 1 0 5 0 4 0 3 0 2 0 1 0 5 0 1 0 1 1 11111222223333344444 1 4 1 5 1 11223344551122334455 1 5 1 2 2 3 1改变列的数据类型和格式3 2归类数据并生成相应的子工作表3 3叠加列3 4对数据进行替换3 3使用计算器 第三章操作和计算数据 改变列的数据类型和格式 进行分析之前 有时需要重新组织和安排输入到MINITAB里的数据 如 移动或者删除行和列 将一种数据类型转换成另一种数据类型 或者控制数据窗口中数据的显示方式 还可以基于原始变量之上再创建新的变量 可以合并两列 创建列的子列 一 改变列的数据类型和格式数据有三种类型 数值型 文本型 日期 时间型 一列只能包含一种类型的数据 可以给某一空列分配一种数据类型并且改变某一存在列的数据类型 一旦某一列已经有了一种数据类型的话 还可以为这列指定一种显示格式 当对此列的格式进行修改时 仅仅是改变了它的显示形式而已 并没有改变其真实值 例如 某一单元格有一个数 1 234567 如果你将其现实形式改成为只显示两位小数 数据窗口中的单元格会显示1 23 在图形窗口上那一点的显示也会为1 23 但是所有的计算都仍会使用1 234567 会话窗口的显示形式则由其所使用的分析命令语句决定 而不是数据窗口中的那种显示格式 1 改变列的数据类型 给一空列分配一种数据类型A 选择编辑器 格式列B 选择数字 文本 或时间 日期 改变一非空列的数据类型A 选择数据 更改数据类型B 选择要转换的数据类型 C 填完对话框 然后点击确定 改变列的数据类型和格式 2 改变数值型和日期 时间型的格式 改变数值列中数据的小数位数A 选择一列或多列 这些列必须是空列 无格式 或者以数值型格式存在 B 选择编辑器 格式列 数字C 选择数字格式 在固定小数文本框中 输入小数的位数 然后点击确定 改变日期 时间列的数据显示形式单个的日期 时间数值可以是日期 时间或者二者兼有 入下列数据是有效的格式 1 1 96 3 04PM 5 23 20005 30PMA 选择一列或者多列 这些列必须是空列 无格式 或者以日期 时间型格式存在 B 选择编辑器 格式列 时间 日期 C 从格式文本框中 选择一种格式 然后点击确定 归类并且生成相应的子工作表 二 将数据按不同类别归类并且生成相应的子工作表在一个比较大的数据集里面 经常需要对一组数据进行分析或生成图形 如 在某项调查中对女性聚焦 或聚焦于某一季度的销售额 对这些你感兴趣的数据 MINITAB能够另外生成一个子工作表来包含这些数据 可以基于某种条件来分类 或者对于指定的变量的所有组 分割一个工作表 1 按条件分类例 打开文件 打开工作表 样本库 市场数据 MTW 可以基于一个或多个条件对数据分类 如 按两种条件创建一个子集 季度销售额大于100并且季度广告费用小于15 符合这两个条件的数据行将复到一个新的工作表 原来的工作表仍然没有变动 按条件分类A 选择数据 子集化工作表 Minitab自动为新工作表给一个缺省名 但是可以随意改动 按Condition 归类并且生成相应的子工作表 B 在指定包括的行下面 选择匹配的行 然后点击条件 弹出一对话框 如图 C 在条件一栏 输入条件方程式 例如 想要创建只包含销售额大于100的子集 只要输入销售额 100 在此 可以根据条件 选择一系列数学函数 注意 如果在子集化工作表主对话框选择了指定不包括的行的话 上面的方程式所生成的子集包含的数据将会是销售额不大于100的数据 归类并且生成相应的子工作表 2 将一个变量按组分割成工作表在一个变量里 可以根据所有关键字将一个工作表分割成几组 例如 假设有一个关于销售额的工作表 有两列 销售额这一列为一个财政季度所有的收入 季度这一列即为季度 1 2 3 4 如果你是基于变量季度来分割工作表 MINITAB会生成四个工作表 第一季度的所有数据 第二季度的所有数据 等等 原来工作表内容不变 将一个变量按组分割成工作表A 选择数据 拆分工作表 如果选中了将缺失作为拆分的一个标准 假如在拆分变量文本框中的任意列含有空值 MINITAB会生成另外一个工作表 B 在按变量一栏 输入一列或多列 这些列即为分组条件 然后点击确定 如果选择了多列 对于这些列的每一种组合所得的数据 MINITAB都会为其生成一个新的工作表 例如 假设年这一列有两个数据 1991 1992 季度这一列有四个 1 2 3 4 如果在按变量中选择了年和季度 Minitab会生成8个工作表 1991年每个季度一个工作表 1992年每个季度一个工作表 叠加列 有时候需要将两列合并成一列以便用一条命令对其分析 Minitab能够快速容易的将一列数据叠加于另一列的数据前面 你可以将叠加后的数据用另一列存储而使原来的列保持不便 当叠加列的时候 可以生成一个脚标列标明叠加后的数据是来自于哪一列 脚标还可以用于以后重新分类数据或者生成图形 在图形里数据点因来源于不同的组 显示有所不同 或者将叠加后的数据还原 叠加列A 选择数据 堆叠 列 B 在堆叠以下列中 输入想要叠加的列 输入的第一列将会处于第二列之上 第二列叠加在第三列之上 C 在将堆叠的数据存储在一栏 输入一新列或者已经存在的列 输入一新列或者已经存在的列来存储脚标 对数据进行替换 可以将一个值转换成另外一个值 或者是将一定范围的值转换成另一个值 也可以将一种数值型的数据转换成另一数值型的数据 例如 把1 0到1 9之间的所有数变成1 文本转换成文本 文本转换成数字或者数字转换成文本 把数字型数据编码为文本型数据A 选择数据 编码 数字到文本 B 在列中的编码数据一栏 输入一列或者多列 C 在列中存储编码数据中 输入一个或者多个新的或已经存在的列 例如 假设没有叫做销售部门的列 当输入 销售部门 时 便会创建一个名称为销售部门的列 D 在位于原始值下方的第一个文本框中 输入一个数值 或者一定范围的值 如1 12表示从1到12 E 在新值下方的第一文本框中 输入想要转换成的值 F 另外 由此还可看出 一次可以转换8个数值 使用计算器 使用计算器可以快速的进行基本的算术运算和复杂的数学函数计算 结果可以保存在某一列中 使用计算器A 选择计算 计算器 B 在将结果存储在变量中 输入保存结果的列 C 表达式中选择变量和各自的函数 也可以通过手动输入表达式 1 例 打开文件 打开工作表 样本数据 脉搏 MTW2 选择计算 计算器3 在将结果存储在变量中 输入脉搏差 4 在表达式中 输入算式脉搏2 脉搏1 例子 使用计算器对列进行计算 使用计算器 5 点击确定后结果如所示 C2 C1 C9 脉搏2 脉搏1 脉搏差 1 88 64 24 2 70 58 12 3 76 62 14 4 78 66 12 5 80 64 16 6 84 74 10 7 84 84 0 4 1概要4 2描述性统计4 3置信区间和平均值测试4 4相关4 5回归4 6分散分析4 7表4 8质量控制 第四章使用数据分析和质量工具 概要 MINITAB提供了许多统计和图表技法来进行数据分析 常用的方法有 基本统计回归方差分析实验计划法管理图质量工具可靠度 残差分析多变量分析时间序列表非参数分析探测数据分析本章将会根据一个例子进行工序能力分析 其中包括 基本统计 描述性统计 一样本T检验 相关性回归 线性回归方差分析 单因子方差分析表格 交叉分组表管理图 X R图 描述性统计 MINITAB提供了两条命令 显示描述性统计和存储描述性统计 这两条命令对每一列进行了计算并且将统计结果存储下来了 这些结果可以从会话窗口中显示出来 显示描述性统计结果A 选择统计 基本统计量 显示描述性统计B 在变量文本框中 输入想要进行分析统计的数据列 C 另外 还可以选择按变量 可选 具体作用参见下例 和图形按钮 一个描述性统计的例子假如想要对参加脉搏测试的男 性别 1 女 性别 2 学生进行统计 1 打开文件 脉搏 mtw 2 选择统计 基本统计量 显示描述性统计 3 在变量一栏 输入体重 4 选中按变量并且在文本框中输入性别 然后点击确定结果如下 变量性别NN 平均值平均值标准误标准差最小值下四分位数中位数体重1570158 262 4718 64123 00145 00155 002350123 802 2613 3795 00115 00122 00变量性别上四分位数最大值体重1170 00215 002131 00150 00 结果解释在会话窗口中的这段文字对体重进行了描述性的统计 因为选中了按变量为性别 所以分别对男生 性别 1 女生 性别 2 进行了描述性统计 从结果可以看出 男生体重大于女生体重 注意 1 按变量的意思 按那个变量统计 是对每个关键值 如男和女 分别统计计算 2 图表按钮的作用是以图形 直方图 正态曲线的直方图 点图 盒式图 的方式表示统计结果 置信区间和平均值测试 Minitab提供了一些命令计算单样本或两样本的置信区间以及进行平均值检验 用于判断样本相对总体的差异 工序能力包括1Z 单样本z检验 单样本t检验 两样本t检验和t t配对检验 Minitab也提供了概率估计和概率差别的方法 另外 当你不知道所收集的数据是否服从正态分布时 MINITAB又提供了计算置信区间和对中央值进行假设检测的方法 数理统计知识 假设检验是统计决策中最常用的方法之一 Minitab提供了许多假设检验选项 其中包括t检验和方差分析 一般而言 假设检验假定初始声明为真 然后使用样本数据检验该声明 假设检验包括两个假设 原假设 以H0表示 和备择假设 以H1表示 原假设是初始声明 通常使用先前的研究或常识指定原假设 备择假设是可以相信为真实的内容 假设检验的决策过程可以基于给定检验的概率值 p值 如果p值小于或等于预先确定的显著性水平 水平 则否定原假设 并声明支持备择假设 如果p值大于 水平 则不能否定原假设 也不能声明支持备择假设 置信区间和平均值测试 下面是单样本t置信区间和平均值假设检验 假设服从正态分布 的一个例子 计算t置信区间和平均值检验A 选择统计 基本统计 1T单样本tB 在变量文本框中 输入包含样本的列 Minitab将对样本的每一列进行单个分析 C 以下二者中任选一项 若计算平均值的置信区间 选中汇总数据 若进行假设检验 选中进行假设检验 D 若想更进一步 还可以使用下面的选项 为置信区间指定一个置信度 缺省值为95 指定一个原假设检验值 缺省值为 0 通过选择小于 不等于 定义选择性假设 T置信区间的一个例子假设根据测得的样本数据 脉搏测验 想要得到平均值95 的t置信区间 1 打开文件脉搏 MTW 2 选择统计 基本统计 1T单样本t3 在变量文本框中 输入脉搏1 点击确定 会话窗口输出 TConfidenceIntervalsVariableNMeanStDevSEMean95 0 CI脉搏19272 8711 011 15 70 59 75 15 结果解释根据输出结果 估计其平均值为72 87 有95 的把握认为真值落在区间 70 95 75 15 相关 correlation 使用回归对成对变量计算相关系数和相关性 相关系数是衡量两个变量之间线性关系的程度 其值介于 1与 1之间 如果一个变量随另外一个变量减少而递增的话 那么相关系数为负值 相反的 如果这两个变量同时增加或同时减小 那么相关系数为正 计算两列的相关性A 选择统计 基本统计量 相关B 在变量文本框中 输入包含测量数据的列 MINITAB便会计算两两列之间的相关性 Pearson相关系数 r 评估两个连续变量是否线性相关 r 0代表的不是没有相关性 而是没有线性相关性 相关 相关性的一个例子假设要分析学生身高与体重的关系 1 打开文件脉搏 MTW 2 选择统计 基本统计 相关3 在变量文本框中 输入高度和重量 点击确定 会话窗口输出 体重和高度的Pearson相关系数 0 785P值 0 000 结果解释根据输出结果 相关值 相关系数 0 785 P值 0 000 表明身高与体重正相关 显示相关系数为零的假设检验的p值 越小相关性越大 回归 回归分析用于找出反应值 Y 与一个或者多个预测值 X 之间的关系 怎样做一个线性回归A 选择统计 回归 回归 B 在响应文本框中 输入包含反应值 Y 的列 C 在预测变量的文本框中 输入预测值 X 变量 回归 运行一个简单线性回归的例子假设想要找出体重与身高的关系1 打开文件脉搏 MTW2 选择统计 回归 回归3 在响应文本框中 输入重量 在预测变量中 输入高度 然后点击确定 回归分析 体重与高度回归方程为体重 205 5 09高度自变量系数系数标准误TP常量 204 7429 16 7 020 000高度5 09180 423712 020 000S 14 7920R Sq 61 6 R Sq 调整 61 2 方差分析来源自由度SSMSFP回归13159231592144 380 000残差误差9019692219合计9151284异常观测值拟合值标准化观测值高度体重拟合值标准误残差残差972 0195 00161 872 0833 132 26R2561 0140 00105 863 6234 142 38R4072 0215 00161 872 0853 133 63R8468 0110 00141 501 57 31 50 2 14RR表示此观测值含有大的标准化残差 结果解释P值等于0 表明体重是身高的一个显著性因子 R2等于61 6 表明此模型在反应值中所占的比率 方差分析 ANOVA 方差分析 ANOVA 与回归分析类似 它也是用来分析响应变量与一个或多个预测变量之间关系并为之建模的 但是 方差分析与回归有两方面的不同 预测变量是定性 类别 变量 并且不对关系的性质作任何假定 即模型不包括变量系数 MINITAB的ANOVA包括一次 二次或者更为复杂的ANOVA模型 等变量检验等 当按照单个变量进行分类时 一个一次ANOVA检验总体均值的相等性 下面我们举一个例子 说明当反应值数据在一列而区分总体的水平值在另一列时 怎样进行数据分析 如果你在工作表中将每个总体的数据置于不同的列 可以运用单因子命令 怎样做单因子方差分析A 选择统计 方差分析 单因子B 在响应中 输入包含反应值的列 C 在因子中 输入包含因子水平的列 一个单因子方差分析分析的例子1 打开文件脉搏 MTW2 选择统计 方差分析 单因子3 在反应值响应中 输入重量 在因子中 输入性别 4 点击图表 5 选中数据箱线图和残值正态图 点击确定两次后 会话窗内容如下 分散分析 ANOVA 结果解释分散分析输出结果和盒式图 box散点图 清楚地表明 女性和男性的体重是不一样的 F统计值比较大而p值比较小 表明男女存在统计上显著性差异 女性体重平均值的95 置信区间介限于118和130之间但是对于男性而言 95 置信区间介于155和162之间 单因子方差分析 体重与性别来源自由度SSMSFP性别1257552575590 800 000误差9025529284合计9151284S 16 84R Sq 50 22 R Sq 调整 49 67 平均值 基于合并标准差 的单组95 置信区间水平N平均值标准差 157158 2618 64 235123 8013 37 120132144156合并标准差 16 84 表 table 使用Minitab制表功能 可以将数据以表的形式归纳出来 或者对这些数据进行进一步的分析 也可以进行各种各样的统计 或者进行 2检验 也可以进行简单或者复杂的相应的分析 交叉表格可以显示一次 二次 多次表格数据 在这些表格里 包含常量 百分数 统计数据 例如平均 标准偏差 最大值以及相关变量 怎样创建一个统计表格A 选择统计 表格 交叉分组表和卡方 B 以下二者任选其一 对于原始数据 在类别变量中 输入两到十个包含原始数据的列 对于频率数据 a 在类别变量中 输入两到十个包含分类数据的列 b 选中频率位于并且输入包含频率数据的列 表 table 假设你要对不同程度吸烟者的数量及各所占比率进行统计 1 打开文件脉搏 MTW 2 选择统计 表格 交叉分组表和卡方 3 在类别变量中 输入抽烟和活动 4 选中列百分比然后点击确定 汇总统计量 抽烟 活动行 抽烟列 活动0123全部1100 0033 3331 1523 8130 4320 0066 6768 8576 1969 57全部100 00100 00100 00100 00100 00单元格内容 列 结果解释行表示抽烟变量 1表示经常吸烟者而2表示不常抽者 列表示水平程度 1 轻微 2 中等 3 许多 这里的0水平是因为测量者误输入 轻微抽烟者占1 3 抽烟量最大者占1 4 一个显示各列百分比的二次表的例子 质量控制 B 以下二者任选其一1 如果子集处于一列 选择在一列中 在子组大小中 输入子集尺寸或者子集标志列 2 如果子集处于行中 在输入一系列列 如果有必要 可以点击选项 可以作如下选择 如果对于 和 有一个目标值或者根据以前的数据知道这几个参数 则输入 的历史值 总体分布的平均值 和 总体分布的标准偏差 控制Minitab估计 和 值的方式 对于特殊原因做8个检验 当出现了偏移数据时 使用box cox转换 许多分析都需要正态性假设 如果数据为非正态 可以应用函数以使数据近乎正态 以便可以完成分析 质量控制 X R图的一个例子一制造车间制造金属固定件 需要估计其工序能力 目标值 2 4克 力求固件的重量变动最小 这些固件5个一包 随机选择20包画出X R图 估计他们的制造工序管理情况 1 打开文件FASTENER MTW 2 选择统计 控制图 子组的变量控制图 Xbar R3 在输入重量 在子组大小中 输入5 4 在均值中输入2 4 点击确定 质量控制 重量的Xbar控制图检验结果检验1 1个点 距离中心线超过3个标准差 检验出下列点不合格 10 结果解释特殊原因检验表明只有一包的平均重量处于规格下限以下 低于目标值3个标准偏差 3 但是又注意到许多点落在中心线以下 表明此工序生产的固件经常低于目标值 质量工程师还得进行另外的特殊原因检验或者重估此工序 5 1事例背景5 2打开一个工作表5 3从键盘输入数据5 3输入规则数据5 4描述性统计计算5 5算术运算5 6生成散点图5 7计算相关系数 第五章基本操作示例 事例背景 实验背景克隆是单个基因细胞从同一个体繁衍而来 研究人员发现一种单性克隆物 生长快而且质硬的树 这些树某天也许会当作一种能源而取代传统燃料 宾夕法尼亚州立大学的研究人员在两个不同的地方 种植了一些白杨树 一个地方在小溪旁 土质肥沃 灌溉系统好 另一个地方是山地 土壤干燥 呈现沙性 他们以厘米为单位测量直径 以米为单位测量高度 然后把它烘干 测量它的重量 研究人员想知道 他们能否根据直径和高度 预测它的重量 在这一章里 你可以知道怎样 一 打开一个工作表二 输入和编辑数据三 保存数据四 基本统计计算五 数学运算六 画数据图七 计算相关系数 打开一个工作表 步骤一 打开一个工作表当你打开Minitab时 便开始了一个新而且空的项目 可以通过多种方式向此项目里添加数据 但是最为普通的方式是打开一个工作表 只不过有一点要注意 打开工作表只是将数据拷贝到此项目里 对于项目里任何数据的变化都不会影响到原始数据 在这一节 使用的数据在文件白杨1 MTW里 1 选择文件文件 打开工作表 2 找到子目录样本数据 3 点击白杨1 MTW 打开 4 如果未见到数据窗口 按快捷键Ctrl D 这个工作表包含三个变量 分别为 直径 高度 重量 每个变量包含15个值 到目前为止只有这么多 从键盘输入数据 步骤二 从键盘输入数据到目前为止只有这么多数据 但是又从现场收集到了5行数据 需要通过键盘来输入 1 将光标放到第16行 数据窗口应当为下面式样 2 确保数据方向箭头向右 3 从左到右输入以下数据 1 522 90 074 515 270 791 182 20 033 174 930 443 334 890 52 Enter Enter Enter Enter Enter Enter Enter Enter Enter Enter Enter Ctrl Enter Ctrl Enter Ctrl Enter Ctrl Enter Ctrl 数据方向箭头 输入规则数据 步骤三 输入规则数据一般是在数据窗口中通过键盘输入数据 但是当数据按照一定的规则时 还有一个简便的办法输入 现在要创建一个新的变量来标明所测数据值是来自于土壤肥沃 排水系统好的地方 记为1 还是来自于干燥多沙的地方 记为2 这个新的变量叫做地块 将包含10个 1 然后是10个 2 选择计算 产生模块化数据 简单数集 保存数据于 在存储模块化数据在中输入地块 Minitab自动分配一个新的变量给第一个空列 在这里是C4 为了标明开始和结束顺序 在从第一个值中输入1 在到最后一个值中输入2 既然有10个1和10个2 在列出各项值的重复次数中 输入10 然后点击确定 新生成的数据如下 描述性统计计算 步骤四 描述性统计计算Minitab提供了许多基本统计方法进行数据分析 例如描述性统计 t检验 z检验以及相关性 对于两个不同地方的树 应当分别生成统计表对三个变量直径 高度和重量进行说明 选择统计 基本统计量 显示描述性统计 在变量列表框中 点击直径然后拖曳鼠标使直径 高度 重量高亮度显示 然后点击选择 选中按变量 输入地块 通过Minitab对不同地方的树在直径 高度 重量上分别生成统计结果 点击图表 5 选中数据箱线图 然后点击确定两次 描述性统计计算 描述性统计 直径 高度 重量 地块变量地块NN 平均值平均值标准误标准差最小值下四分位数中位数直径11002 5980 2900 9161 0602 1202 32021003 0280 4061 2841 1801 4883 250高度11004 0980 3491 1031 8503 5184 12021004 2550 3961 2542 2002 7754 865重量11000 30900 08000 25280 02000 15750 205021000 3990 1160 3660 0300 0630 380地块11001 00000 0000000 0000001 00001 00001 000021002 00000 0000000 0000002 00002 00002 0000变量地块上四分位数最大值直径13 2454 09024 0534 770高度14 8535 73025 1435 540重量10 46000 780020 6471 110 从盒式图可以判断出 地方2的树比地方1的树大 会话窗口的文本输出包含以下信息 在地方2三个变量都显示出比较大的平均值和中央值 而且 变量重量相对其尺寸来说有一个比较大的标准偏差 在地方2 最小重量只有0 03kg而最大值是1 11kg 这表明一部分白杨树生长得很好 可是其他的仅仅只是活着而已 算术运算 步骤五 进行算术运算现在的任务是估计树的重量 根据以前的工作 研究人员发现树的重量和直径平方与高度之积有关 手头有直径和高度的数据 利用计数器计算新的变量 计数器将输入的方程式结果计算出来并保存于指定的变量 1 选择计算 计算器 2 将新的变量命名为D2H 表示直径的平方与高之积 在存储结果在变量中 输入D2H 3 在表达式中 键入C1 2 C2 点击确定 计算结果显示如下 生成散点图 步骤六 生成散点图研究人员得出在重量与D2H之间存在一种关系 通过散点图 可以验证这一点 1 选择图表 散点图 2 在Y中 输入重量 3 在X中 输入D2H然后点击确定 图形窗口输出结果 由此可以看出 重量和D2H之间存在正的线性关系 也就是说 D2H增加的话 重量也同样增加 图上出现了一个不正常点 有一棵树只有很小的重量 但D2H值却相当高 现在将其忽略 但以后还得进一步检查 下一步是计算这二者的相关性并且将其量化 不规则点 计算相关系数 步骤七 计算相关系数从散点图知随着D2H增长 重量也同样增长 现在通过计算相关系数找出这两个变量的具体关联性 1 选择统计 基本统计量 相关 2 在变量中 输入重量和D2H 点击确定 会话窗口输出 相关 重量 D2H重量和D2H的Pearson相关系数 0 913P值 0 000相关系数是两个变量之间线性关系的度量 其值介于 1和 1之间 此处 相关系数为正的0 913 接近于1 从而把散点图中所表示的关系量化了 说明变量重量和D2H之间存在很强的线性关系 背景宾夕法尼亚州立大学的研究者们种植了成百上千的白杨树并且在一系列受控条件下让其生长 三年后 抽取一批为样本 以厘米为单位测量其直径 以米为单位测量其高度 千克为单位称其干重 前面知道 在干重与D2H之间存在相近的关系 但是到底是一种怎样的关系呢 这些快速生长 质地坚硬的树 将来某一天也许会作为燃料或者化学物质的一种选择 作为数据分析员 知道了直径和高度的测量值之后 能否可靠的预测出树的产量 步骤一 打开文件白杨2 MTW 步骤二 做一个简单的回归分析在上一个示例结尾 我们知道随着D2H增加 重量也增加 由D2H的值预测重量的一种方法是使用简单的回归命令 选择统计 回归 回归在响应中 输入重量 在预测变量中 输入D2H 不妨还做一系列残差分析图 以便找出潜在的问题 点击图形 做一个简单分析 在图中的残值下 点击标准 在残值图中 点击残值直方图和残值正态图 在残值与变量下 输入D2H 点击确定两次 Minitab便显示会话窗口中的文本 三个图形 回归分析 重量与D2H回归方程为重量 0 0196 0 00758D2H自变量系数系数标准误TP常量0 019610 045660 430 673D2H0 00758380 00079949 490 000S 0 129771R Sq 83 3 R Sq 调整 82 4 方差分析来源自由度SSMSFP回归11 51551 515589 990 000残差误差180 30310 0168合计191 8187异常观测值拟合值标准化观测值D2H重量拟合值标准误残差残差121261 11000 97560 07170 13441 24X15740 07000 57790 0374 0 5079 4 09RR表示此观测值含有大的标准化残差 子组极差 X表示受X值影响很大的观测值 Minitab显示了两个不规则的数据 12行和15行 进一步分析之前 首先要检查12行和15行是否包含了有效的数据 不规则点 步骤三 编辑数据按键Ctrl G找到第一个不规则点 选择编辑器 转到 在输入列和列名中 输入重量在输入行号中 输入12 点击确定 在数据窗口中 光标置于12行重量单元格 可以看出 重量和D2H看上去显得相当大 然后再检查原始记录 发现12号树生长很好 说明此数据正确 按照同样的方法 找到第15行 检查原始记录 发现这个数据错误 不是0 07 而是0 7 简单的重复一下前面的菜单选择 1 首先关闭所有图形窗口 2 选择统计 回归 回归 回归分析 重量与D2H回归方程为重量 0 0200 0 00829D2H自变量系数系数标准误TP常量0 019990 013651 460 160D2H0 00828970 000239034 680 000S 0 0387991R Sq 98 5 R Sq 调整 98 4 方差分析来源自由度SSMSFP回归11 81081 81081202 890 000残差误差180 02710 0015合计191 8379异常观测值拟合值标准化观测值D2H重量拟合值标准误残差残差121261 110001 064920 021420 045081 39X171070 790000 908580 01740 0 11858 3 42RR表示此观测值含有大的标准化残差X表示受X值影响很大的观测值 如果有一个比较好的模型并且对所有的统计假设都感到满意的话 那么可以直接抽取一部分作白杨树为样本 测量直径和高度 然后预测其重量 而不用把树砍下来再去称量 由此回归输出结果可以看出 在系数表中 D2H有一个比较高的T值和很小的P值 有足够的理由说明D2H和重量之间存在很强的关系 在变量分析表中比较大的F统计值和值比较小的P值将这种关系量化 R的平方 R Sq 以及R的调和平方 R Sq adj 的值都大于98 进一步证明D2H与重量之间存在很强的线性关系 响应变量变异中由其与一个或多个预测变量的关系所解释的百分比 一般而言 R2越大 模型与数据拟合得越好 R2始终在0与100 之间 它也被称为确定或多重确定 在多重回归中 的系数 在下最后结论之前 再看一下图表 从图表拟合值D2H知道变动并未呈现出常数 此即符合一个很重要的回归假设模型 在比较大的D2H值处 标准残差也比较大 基于时间因素 以后章节还要进一步讨论 步骤五 画一条合适的回归线下一步 画一个带回归线的散点图来看看那些测量的数据与回归线的接近程度 1 选择统计 回归 拟合线图 2 在响应 Y 中 输入重量 3 在预测变量 X 中 输入D2H 点击确定 输出结果如下 步骤六 通过Brush 刷 图形找特殊点图形上有一点 其D2H值很大 想知道这到底是一个什么样的点 Brush可以快速方便的找到这一点 1 选择编辑器 笔刷 2 在图形上将手状的图标圈住特殊点 特殊点便会显示出来 同时在数据窗口里相应的行上做一个标记 要找的点 刷板 背景从这些种植的树木中真正能预计到多少可以当作能源的材料呢 又怎样将产量最大化呢 为了将产量最大化 研究人员设计了一个实验来决定地点的不同 Site 和条件的不同 处理 这两个因素是怎样影响四年生白杨树的重量的 他们将树种植在两个地方 场地1和场地2 场地1土壤肥沃 湿润 而Site2干燥多沙 他们将这些树分成四种条件培育 处理1只是控制 无条件 处理2 施肥 处理3 灌溉 处理4 既施肥又灌溉 考虑到各种气候的影响 研究人员在第一年种植一半的树 第二年种植另外一半 从而获得两分数据 为了进行分析 需要对样本数据进行统计分析 步骤一 生成一个新的项目 文件 新建 点击Minitab项目 然后点击确定 步骤二 打开一个工作表1 文件 打开工作表 2 找到子目录样本数据 选择文件白杨3 MTW 点击确定 3 有两个窗口显示了关于此工作表的信息 此数据窗口包含7个变量 第七章高级Minitab 描述性统计 重量平均值下四分上四分变量NN 平均值标准误标准差最小值位数中位数位数最大值重量29801 0990 59410 255 99 0000 5971 6403 4556 930看看重量的最小值 很明显 重量不可能出现 99千克 事实上 在此 收集数据的时候 用 99表示已经死亡的树 如果把 99留在数据表中 那么所做的分析也是错的 事实上 刚才所做的描述性统计也受到了一定影响 平均值和中央值人为的偏低而标准偏差人为的偏高 需要将 99转换成空值 空值并不影响统计分析的结果 在MINITAB中 空值用星号 代替 信息窗口 步骤三 生成描述性统计为了产量最大化 需要聚焦哪个因素对重量的影响最大 先看一下变量重量的描述性统计 选取统计基本量 显示描述性统计 在窗口变量中选取重量 步骤四 对数据进行替换MINITAB提供了许多数据操作工具 最常用的一个就是编码命令 它的作用是将一个数值用另一种形式的值表示 在这里 要把 99变成 空值的符号 1 选择数据 编码 数字到数字2 在列中的编码数据中 输入重量 3 在在列存储编码数据中 输入重量 这样将会用新值代替原有的值 4 在原始值中 输入 99 此即要改变的值 5 在新值一栏 输入星号 然后点击确定 在数据窗口变量重量栏中 可以看到所有出现 99的地方都被星号 代替 2 在变量中 输入寿命 点击确定 输出结果如下 离散变量计数 寿命寿命计数31474151N 298输出结果表明三年树龄的有147棵 四年树龄的有151棵 步骤五 数据表格在此实验中 每个年龄的树数量各是多少呢 使用表格命令可以帮你知道 1 选择统计 表格 单变量计数 步骤六 根据树龄分割数据表假设只要对四年生的树进行分析 下面是只对四年生的数据创建新的数据集的一种技巧 对四年生的树建立一个单独的数据表1选择数据 拆分工作表 2 在变量中 输入寿命 点击确定 Minitab将回根据寿
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年河北秦皇岛工业职业技术学院招聘专任教师3人模拟试卷及一套答案详解
- 2025年合肥肥西县中医院项目工作人员招聘2人考前自测高频考点模拟试题及一套完整答案详解
- 2025江苏南京六合科技创业投资发展有限公司招聘拟聘用人员考前自测高频考点模拟试题完整参考答案详解
- 2025江西省医疗器械检测中心招聘编制外工作人员2人模拟试卷附答案详解(典型题)
- 2025湖南长沙浏阳市审计局人员模拟试卷及答案详解(有一套)
- 2025福建福州长乐机场海关驾驶员招聘1人考前自测高频考点模拟试题带答案详解
- 2025江西省公路工程检测中心招聘2人考前自测高频考点模拟试题及答案详解(新)
- 广本安全培训课件
- 2025年配气机构:进排气门合作协议书
- 山西省【中职专业高考】2025年中职高考对口升学(理论考试)真题卷【交通运输大类】模拟练习
- (完整版)高中物理必修一第一章测试题及答案
- 抚州市崇仁县乡镇街道社区行政村统计表
- 部编版道德与法治五年级上册2学会沟通交流课件
- 施工单位 专业分包单位安全管理体系报审表
- 小儿支气管哮喘-羽课件
- 新北师大版二年级上册数学 课桌有多长 教学课件
- 管道沟槽开挖安全安全技术交底
- 《组织学与胚胎学》课件02细胞
- 教师资格证-综合素质-学生观
- 3食品用纸包装容器等制品食品相关产品生产许可实施细则
- 故障录波器与故障波形分析PPT通用课件
评论
0/150
提交评论