




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
6 导论 ZTE PGB103 V1 5 6 统计学基本概念 主要内容 1 波动 偏差 2 连续变量和离散变量 3 平均值 中位数 众数 极差 方差 标准偏差 4 正态曲线及中心极限定理 5 简单图表分析 6 样本容量与置信度及置信区间的关系 波动的型式与原因 任何过程都包含随机波动 由于一般或普遍原因造成的 和非随机波动 由于特殊原因造成的 时间 不合格产品率 非随机波动 历史水平 0 最佳水平 1 在 0 3 0 范围内的随机波动 在 1 3 1 范围内的随机波动 普遍原因 过程波动随时间推移是稳定的 可预测的 处于控制状态 原因 固有的或是自然的 例如 垂直向上空 先把硬币夹垂直 抛掷一枚硬币 统计硬币落地后每一面向上的次数 当抛掷次数很多时 每面向上的次数大约各占一半 只有微小差异 普遍原因 差异的原因 有风 每次抛掷动作有微小差异 地面不平整 等等 随机波动 特殊原因 过程波动无法预测 处于失控状态 原因 机器调整不当 原材料不合格 操作者本身 目标 检测和消除特殊原因 特殊原因 例如 同样是抛硬币 抛1000次 AB两面各自向上的次数却相差400多次 原因 操作者每次抛掷时 总时将硬币平放 且总是将正面朝上 然后抛出 非随机波动 数据的两种类型 连续 可变 数据 使用一种度量单位 比如英寸或小时 连续 可变 数据的例子 电压 电流 功率 时间 距离 重量 速度 离散 逻辑 数据 是类别信息 比如 合格 或 不合格 连续数据 离散数据 统计领域用下列方法处理波动 偏差 描述型统计 用图表或总结性的数字 均值 方差 标准偏差 来描述一系列数据 统计推断 当结果差异可能因为随机偏差或不能归属为随机偏差时所作的决定 假设检验 试验设计 收集并分析数据估计过程改变效果 数理统计的作用 总体和样本 总体 母体 它是提供数据的原始集团 是所要研究分析的对象的全部 总体可以是一批产品 由于一批产品的数量是有限的 故称为有限总体 也可以是一道工序所生产的所有产品 由于其源源不断的运行 甚至也包含今后的产品 故称为无限总体 样本 子样 抽样 试样 从总体中抽出一部分个体 总体中的这一部分个体称之为样本 它是直接被检测并提供数据的诸个体 连续数据的测量 如何描述数据的统计特性 measuresoflocation centraltendency居中程度 measuresofdispersion variation离散程度 描述数据的居中程度 Mean均值Median中位数Mode众数Quartiles四分位数 均值 中心值 均值 总体或样本的平均值 总体的中心值用 表示 样本的中心值用x表示 样本均值的计算公式如下 Themeanisthemostcommonmeasureoflocationorcenterofthedata 中位数 中位数 反应样本数据中间50 的数值 一系列数据由低到高排列后所得到的中间数 偶数 奇数 众数 在一个数据集中最频繁出现的值 众数 Themodeistheobservationthatoccursmostfrequentlyinthesample Themodemaybeunique ortheremaybemorethan1mode Sometimes themodemaynotexist Range极差Variance方差StandardDeviation标准偏差InterQuartileRange内四分位极差 描述数据的离散程度 离散程度的测量 用来判定一个数据集合离散程度或宽度的恒量尺度 极差 在一个样本中最大值与最小值的差值 极差 最大值 最小值即 R x max x min 方差 与中心值间距的平方和的平均值 总体的方差用 表示样本的方差用s2表示标准偏差 是方差的平方根 总体标准偏差由 表示样本标准偏差由s表示 大多数 但不是所有 数据是正态分布或钟形曲线 正态分布 在许多实际问题中 我们遇到的随机变量都受到为数众多的相互独立的随机因素的影响 而每一个因素的影响都是微小的 且这些影响是可以叠加的 例如 电灯在指定条件下的耐用时间受到原料 工艺 保管等条件的影响 而且每一种因素在正常情形下都是可以叠加的 具有上述特点的随机变量一般都可以认为是具有正态分布的随机变量 在现实生产生活中 我们所遇到实际问题大多数都属于具有正态分布的随机变量 因此在此我们重点讨论研究此类分布 正态分布简介 正态分布的特点 1 形态如钟 2 左右对称 3 于平均值处分布的频数最多 此外 越远离平均值 分布的频数也越少 正态分布的要素 1 平均值 决定正态分布曲线的中心位置 2 标准偏差 决定正态分布曲线的 宽窄 为何要研究正态分布 1 它是自然界的一种最基本的最普遍的法则 反应了事物内在的变化规律 2 它使我们得以将许多复杂的事物简化处理 3 它使我们得以通过少量抽样来把握全体 从而节省大量人力 物力 财力和时间 正态分布简介 正态检验为什么有用 许多统计检验 均值和方差的检验 都假定数据是正态分布的 正态检验用来判定该假定是否有效 何时用正态检验 当你分析数据并要计算基本统计值如Z值或假定正态性的统计检验如T 检验或方差分析 ANOVA 时 分布的正态性检验 如何做正态性检验 采用Minitab公司的专业统计软件MINITAB 如何做正态性检验 方法1 从Minitab的菜单选项里 选择 Stat BasicStatistics NormalityTest 打开数据文件 DOT BOX HISTOGRAM MTV 如何做正态性检验 从Minitab的菜单选项里 选择Stat BasicStatistics NormalityTest 我们可以看到下图的对话框 变量 选择一列数据用于X轴 正态检验 有3种类型 通常用Anderson Darlingtest 标题 用你自拟的题目取代默认的 单击OK 图形输出如下图 正态概率图 如何做正态性检验 如何做正态性检验 方法2 从Minitab的菜单选项里 选择 Stat BasicStatistics DisplayDescriptiveStatistics 打开数据文件 DOT BOX HISTOGRAM MTV 如何做正态性检验 从Minitab的菜单选项里 选择 Stat BasicStatistics DisplayDescriptiveStatistics我们可以看到下图的对话框 如何做正态性检验 结果显示 P Value大于0 05 判定数据的分布为正态分布 冒险概率 0 05 如何做正态性检验 显示在图上的总结包括添加了分布曲线的直方图和AndersonDarling正态检验的P值 显示在右上角 正态检验的通常规则当P值小于或等于0 05则认为样本数据的分布不同于标准的正态分布 相反 当P值大于0 05 则认为样本数据的分布与正态没有显著差异 进一步解释 正态性检验属于根据样本来检验关于总体分布的检验方法 属于数学中的非参数检验方法 对于正态检验 原假设为 H0 总体的分布与正态分布无显著差异 对立假设为 H1 总体的分布与正态分布有显著差异 其中P值代表判断总体数据分布和正态分布没有显著差异的可能性 上图表现了数据分布的直方图及分布曲线 从图中我们可以看出此图不是正态分布 结果说明 概率论基本概念 1 随机变量 根据试验结果对随机试验取什么值的变量 2 随机事件的频率 设随机事件A在n次试验中出现了r次 则称比值r n为这n次试验中事件A出现的频率 记作W A 即 W A r n3 概率的统计定义 随着试验次数n的增大 事件出现的频率r n在区间 0 1 上的某个数字p附近摆动 那么定义事件的概率为 P A p根据贝努里大数定理 在实际应用中 当试验次数很大时 便可以用事件出现的频率来代替事件发生的概率 中心极限定理 中心极限定理 在实际问题中 有许多随机变量 它们是由大量的相互独立的随机因素的综合影响所形成的 即可以表示成独立随机因素之和 这种随机变量往往近似地服从正态分布 这就是中心极限定理的客观背景 独立同分布的中心极限定理指出 设独立随机变量序列X1 X2 Xn 服从同一分布 并具有有限的数学期望和方差 则只要n充分大 不管Xi服从什么分布 近似地服从正态分布德莫佛 拉普拉斯定理指出 当n很大时 在n次独立重复试验中事件A发生地次数近似服从正态分布 从而服从二项分布的随机变量近似服从正态分布N np np 1 p 附 在不合格率为p的一大批产品中任取n件产品 那么取得不合格品的件数 服从二项分布 例1 总销售量 是许多许多经销商销售的总和 一个销售商可能不是正态分布 但总的销售量大致是正态分布的 例2即使单一产品高度不是正态分布 但是许多产品的堆积高度大致是正态分布 注意 不是所有数据服从正态分布 如何检验正态性 及数据非正态时如何办 中心极限定理 举例说明 Visualinterpretationthedataset Commongraphicaltoolstoillustrateadataset DotPlot散点图BoxPlot盒子图Histogram直方图 图形工具描述 散点图 DotPlot Thedotplotisusefulfordisplayingasmallbodyofdata 散点图更易分析样本容量较少的参数特性 Thelocationorcentraltendencyinthedatasetanditsspreadordispersionareeasilyidentified 散点图对单个样本数据的居中程度和离散程度都很容易看出来 Itcanalsobeusedincomparingtwoormoredatasets 散点图还可用于定性地比较两组样本或多组样本的数据之间有无显著差异 案例 某器件AM5003特性参数 电流增量 mA 批次A 4 5 7 3 4 8 6 2 8 7 5 1 3 5 5 4 4 6 3 8批次B 4 5 7 3 4 8 6 2 8 7 5 1 11 13 9 7 10 5 Minitab Graph Dotplot 散点图 DotPlot 打开数据文件 DOT BOX HISTOGRAM MTV 结论 散点图结果显示 批次A的电流增量比较集中 均值小 因此批次A的质量比较稳定 而批次B的电流增量比较分散 均值较大 性能较差 图形结果显示 散点图 DotPlot 批次A 批次B 盒子图 BoxPlot Nottobeusedwhensamplesizeislessthan10units 注意 当样本容量小于10时请勿采用 盒子图是比较样本数据间的分布差异 中心位置和分散大小 和散点图相近 都是用来分析样本数据的居中程度和离散程度 但比散点图更直观 更有效 异常点 75 数 3 4分位 Q3 Q1 Max Minimum Q1 1 5IQR Q3 Min Maximum Q3 1 5IQR 25 的数 1 4分位 Q1 中位数 1 2分位 Q2 注 盒子的高度 内四分位极差 IQR InterQuartileRange Q3 Q1 盒子图 BoxPlot 数据的中心50 盒子的高度 Minitab Graph Boxplot 盒子图 BoxPlot 打开数据文件 DOT BOX HISTOGRAM MTV 单个样本数据分析 图形结果显示 单个样本数据分析 盒子图 BoxPlot 盒子图 BoxPlot 打开数据文件 DOT BOX HISTOGRAM MTV 多个样本数据比较分析 盒子图 BoxPlot 图形结果显示 多个样本数据比较分析 直方图 Histogram Thehistogram agraphicalpresentationofthefrequencydistribution providesavisualimpressionoftheshapeofthedistributionofmeasurements 直方图 表征数据的概率分布 主要应用在了解数据分布的形状及形态 便于掌握数据的居中趋势 数据的分布等 X axis measurementscale 测量数据的区间划分 随着区间的调整 数据的形状分布略有不同 Y axis frequency orrelativefrequency scale 事件发生的频数 Nottobeusedwhensamplesizeislessthan50units 注意 当样本容量小于50时谨慎使用直方图 Minitab Graph Histogram 直方图 Histogram 打开数据文件 DOT BOX HISTOGRAM MTV 图形结果显示 直方图 Histogram 参数估计 1 点估计 对参数作定值估计 如用样本均值和样本方差作为总体的均值和方差的估计值 2 区间估计 点估计只是一种近似值 既没有反应这种近似值的精确度 又不知道它的误差范围 此时就引入了置信区间这个概念 它不仅能够反应点估计的误差范围 还能反应估计值落在该区间的概率即置信度 统计术语 置信度 置信度是指总体的均值与标准偏差有多大可能性落在以样本为基础计算出的置信区间中 工业行业一般采用95 的置信度 它意味着 总体的均值与标准偏差落在置信区间中的概率是95 总体的均值与标准偏差落在置信区间之外的概率 风险 是5 如果需要更高的置信度 99 置信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年幼儿园食堂食品加工规范计划
- 园林景观设计与规划方案
- 员工盗窃处罚通知书
- 2026年新能源国际合作与2025-2032年全球产业布局战略报告
- 班主任学业困境学生帮扶计划
- 5G时代下2025年文化与科技融合的短视频传播策略分析
- 建筑项目疫情防控管理措施
- 新晋仓库储存管理人员培训:基础知识与技能的全面提升
- 教学课件可以转发吗
- 2025年资源型城市绿色转型中的绿色建筑评价体系完善与应用报告
- 村级妇联半年工作总结
- 职业健康:放射卫生知识培训计划
- 数控安全培训课件
- 台球俱乐部工作管理制度
- 肉毒素中毒的治疗讲课件
- 蓝色简约风医学生职业生涯规划展示模板
- 土建安全员c类考试试题及答案
- 第四版(2025)国际压力性损伤溃疡预防和治疗临床指南解读
- 职业学校化妆课教案
- 《泡泡玛特营销策略问卷调查及消费者RFM分析案例综述》2000字
- DB32T 4772-2024自然资源基础调查技术规程
评论
0/150
提交评论