




已阅读5页,还剩110页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章配方设计中的数学方法 1随机变量及其分布 什么是随机变量 来看个例子 有一批产品共1000个 每个产品按质量可分为一等 二等和次品 分别用 1 2 和 0 表示 那么我们说这1000个减速器的等级构成一个母体 也叫总体 每个产品的等级是个体 其中 1 是721个 2 是213个 0 是66个 从母体中随意取得的一个个体 叫随机变量 记为X 那么上例中 随机变量的概率分布列是 从这个分布列可看出 随机变量X的概率分布与母体分布是相同的 以后把母体分布就称为是相应随机变量X的概率分布 P用分布列 分布密度 分布函数具体表示母体分布的数字特征指的是相应随机变量的数字特征 实际中 我们不可能对所有的母体元素都进行统计 因此只能进行随机抽样检查或分析 就是说从母体取得一部分的个体 这部分个体叫子样 随机抽取子样有两种方法 一种是重复抽样 取一样品后又放回 这种抽法则每一个随机变量都是独立同分布 且与母体分布相同 另一种情况是取一样品不放回 如母体无限 随机变量仍是独立同分布 如母体有限 就并非如此 如子样容量为n 相对于母体容量N很小 n N 0 1如随机子样用X X1 X2 Xn 表示 近似可看成独立同分布 同分布即指每一个随机变量分布都是母体分布 与母体分布相同 因此我们可通过研究子样的一些特点来推测或推导出母体函数分布的特征 以便于理解 2 子样分布 类似于母体分布 有三种形式 频数分布和频率分布 经验分布函数和直方图 2 1 子样频数和频率分布 例 从橡胶车间取7种规格产品 检查每种规格的次品数得到子样 0 3 2 1 1 0 1 把7个数从小到大依次排列 相同的数合并 得到下列频数表 上表称为子样频数分布 那么频率分布可用下表给出 2 2经验分布函数Rn x 定义 对任意实数x 子样值中小于或等于x的个数记为m x Rn x m x n n为子样容量 那么上例的经验分布函数表达式是 0 当x 02 7 当0 x 1R7 x 5 7 当1 x 26 7 当2 x 31 当x 3 因此 Rn x 可表示n次试验事件 X x 发生的概率 它与分布函数具有相同的性质 非降性 右连续 Rn 0Rn 1那么Rn x 与我们所关心的母体函数分布F x 有何关系呢 按W Glivenko定理 当n值很大时 Rn x 近似于F x 所以我们可以用Rn x 来近似理解F x 的性质 2 3直方图 进行N次独立实验 事件A发生的次数 0且 N 母体的数量指标是离散量 前面所说的两种方法都适合于离散型随机变量的表达 对于连续量 可用分布密度来表示 相应的子样 密度 需用直方图来表示 在母体分布密度图中 用曲边梯形面积来表示此区间的分布几率 同样在直方图中 用子样在直方图中一个区间的面积代表此区间上的频率 举例 测200个圆柱状橡胶件的直径 最小13 09 最大13 69 现把它们分成12个组 组距为0 05列表如下 为了使面积等于组频率 则纵坐标 频率 组距 若n愈大 直方图越接近于子样分布密度函数f x 的图像 那么分布密度f x 的性质 f x 0P a x b 对开区间成立 或左闭右开 或左开右闭 子样的重要数字特征 子样平均数 子样方差 作业 从母体中抽得容量为50的子样 其频数分布为 计算x和s2 3 正态分布 高斯分布 的分布密度 概率中其中 0 正态分布记为N u 2 举例 如u 0 1 f x 称为标准正态分布 记为N 0 1 其图像为过0轴 其分布函数记为 x 数值可查表 正态分布性质 有顶峰 有对称轴 x或x时y区间上的部分占总面积的68 3 区间上的部分占总面积的99 5 区间上的部分占总面积的99 7 证明可用积分计算 也可查表验证 从上面的解释中我们可了解到 对一个随机变量来说 分布函数F x 才是它最完善的描述 但在实际情况下 我们并不需要知道全部的概率性质 只需要知道这个随机变量x的几个特征数字 能反映该变量的变化值的集中位置和离散度就够了 其中最常用的数字特征是数学期望和方差 4 数学期望和方差 4 1数学期望E X 表示的是随机变量在数轴取值的集中位置 它说明随机变量x的值大多出现在哪里 可以说E X 是随机变量的平均值 但这一平均值概念与算术平均值概念不同 离散型随机变量的E X 连续型用分布密度f x 代表E X 4 2方差 用来衡量随机变量对E X 的离散程度 DX E X E X 2随机变量与E X 之差的平方的数学期望 DX E X2 E X 2离散型 连续型 数学期望的性质 E C C 其中C为常数 E CX CE X E X Y E X E Y 推广X Y相互独立 E XY E X E Y 方差性质 D C 0D CX C2D X 若X Y相互独立 D X Y D X D Y 推广 前面介绍了数学期望和方差的概念及性质 我们来看一下 正态分布的数学期望是什么 令 得E X u同样可算出D X 2 那么对于f x 只要知道u 2 即E X 和D X 就可以画出其曲线 正态分布表示为 往往需要对其进行标准化 如令 则随机变量Y服从标准正态分布 表示为 N 0 1 大家可计算E Y 0 D Y 1 如 5 三种重要抽样分布 三种重要抽样分布 分布 t分布 F分布 它们在作统计判断时经常使用 先来看一下正态母体的子样平均数 5 1正态母体中的的分布 设x1 x2 xn是独立同分布随机变量 且每个随机变量服从正态分布 则平均数是否服从 大家可以用前面所学的计算一下 5 2分布 设x1 x2 xn是独立同分布随机变量 且每个随机变量服从标准正态分布N 0 1 则随机变量的分布密度是 x 00 x 0是伽玛函数在处的值 这种分布称为自由度为n的分布 记为 性质 设两个变量和相互独立 的自由度为n1 的自由度为n2 则是自由度为n1 n2的变量 那么定义中的是 自由度为1 1 2 总共为n 补充 自由度简单说就是试验观测个数减去加在上面的约束条件 如 子样方差只有一个约束条件 自由度为n 1 那么分布的密度图象是 可以看出n取不同值时有不同图像 若对于给定 0 1 存在使 则称为的上侧分位数 以后在参数估计和假设检验中常用到 从横排看 取值越大 越小 从纵排看 n越大 越大但是当n 45时 值从表中查不到 如何解决这一问题 先看一条性质 由中心极限定理 当时 也就是说性质 设随机变量x服从自由度为n的分布 则对任意x有此性质证明当n很大时 近似服从标准正态分布 即自由度n很大的分布近似于正态分布N n 2n 再看当n 45时如何计算 按上侧分位数定义 因而 令若Y服从标准正态分布N 0 1 对于任意给定的 式中的可以查表得到 为标准正态分布的上侧分位数 则例 要求 由 0 05 查 1 645则 5 3t分布 设随机变量x服从标准正态分布N 0 1 随机变量Y服从自由度为n的分布 且X与Y相互独立 则的分布密度为这种分布称为自由度为n的t分布 记为t n 分布的密度图象为令t n 为t分布的上侧分位数 从图中可以看出当为标准正态分布 因此n 45的t n 可查表 n 45时可查正态分布的值 t n 5 4F分布 设X和Y分别服从自由度为n1 n2的分布 且与X与Y相互独立 则 分布密度为0 z 0这种分布叫第一自由度为n1 第二自由度为n2的F分布 记为F n1 n2 其分布密度图象 有一重要性质 F服从F n1 n2 时 则服从F n2 n1 参数估计 我们进行一批实验 得到一些实验结果 数据 如测一物体长度其得到五个值 假定测定长度服从正态分布很容易我们会想到用实测值的和s2来做为参数值u和 2的估计值 估计方法有矩法估计 点估计 最大似然估计等等 这里不做逐一介绍 我们所关心的是我们所估计的值与这些参数到底相差多少 即检验它们的无偏性 先来下个定义 若参数 的估计量满足 则称是 的无偏估计量 而对于上例 和s2是否是u和 2的无偏估计 因此s2不是 2的无偏估计按E X 性质 2无偏估计 记为s 2Es 2 2 这里可看到 当n很大时 s 2 s2 前面我们所说的估计可以说是点的估计 而数理统计中的未知参数往往需要依靠一定的概率在一定范围内进行估计 这即是区间估计 例 已知某橡胶试片的300 定伸强度在正常情况下服从正态分布 且标准差 0 108 现测五个试片 其300 定伸是4 28 4 40 4 42 4 35 4 37 MPa 试以概率95 对母体平均u作区间估计 解 母体X的分布为正态 已知 已知 从母体中随机抽样得子样 X1 X2 Xn 要求以概率1 对母体平均u作区间估计 自然我们用来估计u 因为是其无偏估计 标准化给定概率1 0 1 存在使 则称为u的置信区间 对此题来讲 0 108 n 5 4 3641 0 95 查表 1 96 代入后P 4 269 u 4 459 0 95置信区间 4 269 4 459 置信概率0 95就是落在 4 269 4 459 区间上的概率是0 95 三 假设检验 假设检验对于今后要介绍的方差分析 回归分析相当重要 假设检验是小概率事件 小概率本身是不应发生或发生概率较小 如在假设情况下小概率发生 则假设不成立 假设检验可分为两类 参数假设检验 即母体的数字特征作假设 再从母体中取得子样检验此假设是否成立 分布假设检验 举例 某胶鞋厂检验鞋底 每只鞋底标准重量为500g 按以前生产经验标准差 为10g 每隔一定时间需要检查设备工作情况 现取10双 称得其重量为 g 495 510 505 498 503 492 502 512 497 506假定重量服从正态分布 试问这段时间设备工作是否正常 解 鞋底重量是一个正态母体 标准差 10 可假设母体平均数为500 如 k 确定常数 则设备工作正常 否则不正常 假设H0 u 500给定小概率 5 1 或10 有 若 0 05 则 1 96例中 502 则2 6 2 说明小概率事件没有发生 假设成立 即可以认为这段时间平均重量仍为500g 这个例子中 是已知的 若 未知 应将 换为s 则上式可换为 经证明T t n 1 可查表得上侧分位数的值 使从一次抽样的所得子样值计算出s 和的数值 若则拒绝H0 反之则接受 这种方法叫t检验 四方差分析 在实验中 影响性能因素复杂 我们往往需要知道哪些因素是主要的 如C B和S用量都会对胶料性能有影响 哪个是主要的 我们把这主要的因素就叫它对性能的影响是显著的 这一章将重点介绍方差分析 举例 实验中做耐油制品 测耐油时间 四种配方设计 取若干个作寿命试验 得如下数据 单位 小时 题意 共四个母体 从母体中分别取一子样 容量不等 本题考察配方方案对耐油寿命有无显著影响 即检验四个母体平均数是否相等 如相等 即无显著影响 现从这个例子抽象出一般数学模型 设r个正态母体Xi i 1 2 r Xi的分布为这里r个母体方差相等 在r个母体上作假设H0 u1 u2 ur 现独立从各母体中取出一个子样 列成下表 题的目的 用r个子样 检验上述假设是否成立 本题是 相等且已知 可用F检验法 检验任两母体平均数相等就可 但要做r 1次很繁 用离差分解法 组内平均 总平均 总离差平方和为 i i i 经分解得等式右边部分的前一半是QE 后一半是QA QE表示组内离差平方和 QA表示组间离差平方和 计算其中 i ui u i 1 2 r 是相互独立用F分布定义 令 为组内均方离差为组间均方离差 一次抽样若F F r 1 n r 说明小概率事件发生 拒绝H0 即认为有显著影响 如F F r 1 n r 则接受H0 无显著影响 计算F的方差分析表 i i 作业 对上例 给定 0 05 5 问是否有显著影响 F0 05 3 22 3 05F0 05 4 20 2 87F0 05 3 20 3 49 在这个例子中 假定 02是已知的 实际情况中 母体方差并不知道 检验母体平均数 假定母体X N u 2 2未知 在母体上作假设H0 u u0 u0已知 上例的u0 500可用t检验 给定 查表值 若成立则拒绝H0若不成立则接受H0 还有其它检验母体平均数的方法 比如u检验等等 这里就不逐一介绍了 而检验母体方差用检验 假设H0 0 02 02已知 还可对分布进行假设检验 这里也不介绍了 五实验数据的回归分析 对于R实验来讲 我们希望通过回归分析使得到的一批数据能较好地拟合出性能与各影响因子间的经验数学模型 这就需要用回归的方法 5 1多项式回归只要取得一组数据 xi yi 就可以拟合成一个较逼近实验曲线的多项式函数 这种方法对回归方程类型不易判断的情形很实用 对于一次多项式将通过两点 二次多项式将通过三点等 对于C B用量对硬度的影响 有10个点 可用一个唯一的一个9次多项式拟合 一般来说 我们采取连续最小二乘法去拟合次数为1 2 3 的多项式 直到找出一个适当次数的多项式为止 当然 我们总希望其次数少一些 如2次3次就可得到好的拟合效果 就不必再进行高次的了 先来了解一下最小二乘法的多项式回归方程 最小二乘多项式回归 给定一组数 xi yi i 1 2 n这是一元函数关系 先假定x和y之间是线性关系 即是一次的 定义为Y X 其中 N 0 2 分布在X固定的情况下 计算E Y 则E Y X 1 1 式是我们希望得到的函数关系式 这种情况是 0 但 不一定为0 计算及实验时 我们说 达最小时得到的 其中和不是 和 真值 而是估计值 因此我们的任务就是要计算出和 具体计算 作离差平方和使Q最小 即 2最小 来计算和 可令Q分别对和求偏导数 令一阶导数为0 经变形令或 代入原式则拟合的方程就得到了 叫经验回归方程如果x y不是线性关系 需进行二次多项式回归 一般来讲理论上所以再继续进行高次回归时 经验上有个标准 即 终止次数一般k 8 5 2一元线性回归 模型 与一次多项式回归是相同的相关系数 相关系数说明两变量之间的相关程度 通常用由上式可知 0 r 1 可分3种情况来说明 1 X与Y无线性关系 2 0 r 1 大多数情况 X与Y存在一定的相关性 r 0 是正相关 y随x单调增加 r 0则是负相关 r 越小 数据点越分散 3 r 1 所有点都在回归直线上 x y存在确定的线性关系 查相关系数表 与了样容量n及置信度有关 当n 10 0 05时则 r 0 632 说明在0 95的水平上 相关或说显著 r 0 765 在0 99水平上显著 相关系数与子样容量和置信度 有关 5 4一元非线线性回归 若实验数据 xi yi 画点图 如不是线性的 这就要先把它配上相应的曲线 再通过线性化按线性回归的方法计算出它们的系数 通常选取的曲线有6种类型 1 双曲线 2 幂函数曲线 其中x 0 a 0 3 指数曲线 其中a 0 4 倒指数曲线 其中a 0 5 对数曲线 6 S型曲线 举例 流变学中 混炼胶流动曲线为 b 1 此式不过原点的幂函数方程 令先求出c值 利用拉格朗日差值法 求出c后 将原式线性化 令 得 再用一元线性回归求出a b a和b确定后 牛顿流动指数n 5 5多元线性回归 实验中影响性能因素常常不只是一个 则需要进行多元线性回归 首先建立模型 为常数 这就称为p元线性回归模型 对随机变量作n次观测得n组观测值 0 0 p 为处理方便 用矩阵表示 令则 为计算 作离差平方和 0 p 将换为 最后用矩阵 逆矩阵 法可解出 回归显著检验 哪个变量对y重要 如影响不重要那么哪个因素前面的系数 j应为0 所以可以假设H0 j 0 然后再用F检验 多元非线性也是如此 可看参考书 5 6试验优化与设计方法 前面的几章我们介绍了如何对实验数据处理和模拟实验方程 这是实验后的工作 如果实验前所选择的实验点不恰当 那么计算的再精确也达不到预期的效果 因此实验点的选择非常重要 配方设计可分为单因素变量设计和多因素变量设计 一 单因素变量设计 平分法消去法黄金分割法kibonaci法分批试验法抛物线法 这里只介绍平分法 条件 如果每作一次试验 可根据结果来决定下次试验的方向 就可用平分法 例 选一R配方 要求硬度为70 确定C B用量 按经验先其试验范围为40 80份 由于硬度是C B用量的单调增函数 因此可用平分法 第一次 M 1 2 40 80 60 结果硬度小于70 应划去60以下的范围 第二次为1 2 60 80 70 如大于70 则划去70 80 如小于70则划去70以下 继续下去 直至得到最佳值 二 多因素配方设计 这里重点介绍等高线图形法 它表示当有两个或三个因素变量时 某一项性能指标变化规律的一种试验设计方法 这种方法简单 直观 2 1等高线原理 z为性能 如Z f x y 为空间曲面图形 且Z有最大值 其图形为 图中T点为最高点 即性能最高值 其在XOY平面上的投影为P点 如图任一平行于XOY平面的平面去截此面图形 再把所截曲线投影在XOY平面上 得曲线L1 则L1上任意一点所表达的性能值都是相同的 如用多个平面去截此曲线 并进行投影 则可得到多条曲线 如图中L2越往外 则性能越小 根据等高线这些特点 实验中如果我们能把两变量所影响的性能的相同点画出来 并把这些点用线连起来 画出等高线 则以等高线的变化就可得到此函数的变化规律了 2 2绘图方法 先对两因素来讲 按经验确定试验范围 如促进剂和活性剂对焦烧时间的影响 然后以中心点为圆心作圆 在圆周上取正多边形点 显然边数越多 试验精确度高 这里我们选择正五边形 加上中点p点 做6次试验得到焦烧时间值 分别标在各点上 然后将这几点与中心连线 并按性能来分 相同性能点的连上线 画出等高线图 50 如果我们需要焦烧时间30分钟 那么这么多点到底选哪一点呢 需要其它的性能等高线配合 如我要求300 定伸强度10MPa 可画出两因素300 定伸强度的等高线 其与30分钟曲线相等的点即为最佳点 如再配合其它性能测试 可得出一最佳实验点范围 上面我们介绍的是直角坐标等高线图作法 它适于两因素的试验方法 50 再看一个三角坐标等高线图 它适合于三元硫化促进剂和三元R并用体系 具体画法 取正三角形 每点表示不同变量 并且为100 将每边10等分 如实验中我们取10个点 包括中心点 则将得到的性能 焦烧时间 标上 如画焦烧时间13分钟的等高线 看12 6 14 6之间按比例找13分钟这一点 同样12 6 13 2之间 12 6 13 1之间 12 6 14 7之间得四点 并连结起来 得到等高线 2 3正交设计 给大家介绍一种重要的设计方法 正交试验设计 一种运用于多因素试验的重要而且有效的方法 它的主要特点 能大幅度减少实验次数 结论准确可靠 还分析因素间的相互作用 它能够很好地解决以下几个问题 1 影响性能的因素哪个重要 哪个不重要 2 同一因子下不同水平哪个重要 3 各因子依何水平搭配对性能影响显著 一 什么是正交试验设计 按正交表进行试验设计的方法 二 什么是正交表 我们来看这样一个表 这里我们需要了解的有 表达含义L 正交表4 实验次数2 两个水平 表中的1和2表示不同的水平 3 3个因素 因子 那么表示的是9次试验 3个水平 4个因素 的正交表列如下 这些表从手册上都可以查到查的原则是依据你选择实验的因子数和水平数来定 还有如其它的正交表 等 从正交表中可看出有两个重要的数字特征 1 每一列中 不同的数字出现的次数相等 2 任意两列中 将同一横行的两个数字看成有序数对时 每种数对出现的次数相等 正交表的这些性质决定了可用很少的试验数就可准确地进行试验 三 正交表运用原则 我们定义n 水平数 m 因素数 无交互作用时 试验次数 m n 1 有交互作用时 试验次数 m n 1 n 1 n 1 如24 其中只有一对因素有交互作用 则计算最大试验次数为4 2 1 2 1 2 1 5 如有两对有交互作用 为6次 拿24来讲在正交表中找不到与之相应的正交表 怎么办 应依据计算的实验次数小于并接近于所选正交表的试验次数原则来定 而且水平数要保持一致 所以应选L8 27 如选L32 237 实验数就太多了 选定表为L8 27 之后 还要安排表头 即如A B C D四种不同因素 哪个放在1 2 3 4的位置呢 顺序 不考虑交互作用 将重要的因素A B放在1 2列 然后由L8 27 的交互作用表 查得A B应放在第三列 应当说明的是 不同的正交表有它自身的交互作用表 接着把因子C放在4列 A C放于第5列 B C放于第6列 D放于第七列 这样表头就设计完了 接下来进行实验和数据分析 举例 考察S 促进剂 C B这三个因素对NR BR胶料的300 定伸强度的影响 同时考察交互作用 水平A促CZ0 70 9BS1 21 4CHAF ISAF14 4127 28计算最大试验次数 3 2 1 3 2 1 2 1 6L6 23 最接近的是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 监理师培训题库及答案
- 市委办遴选真题及答案
- 2025年机械实验设计试题及答案
- 智能3D建模大模型创新创业项目商业计划书
- 核桃坚果碎混合麦片生产创新创业项目商业计划书
- 橡胶工艺品创新创业项目商业计划书
- 外汇基础知识培训课件
- 林业艺术品创作销售创新创业项目商业计划书
- 2025年教育基地展示系统项目规划申请报告范文
- 外协车辆合同(标准版)
- JT-T-1258-2019港口能源计量导则
- 2024年急性胰腺炎急诊诊治专家共识解读课件
- (必会)中级《审计理论与实务》近年考试真题题库(300题)
- 食品安全与日常饮食智慧树知到期末考试答案章节答案2024年中国农业大学
- 烘焙与甜点制作
- T-CRHA 028-2023 成人住院患者静脉血栓栓塞症风险评估技术
- 线路光缆施工方案
- 弹塑性力学讲稿课件
- 心怀国防梦争做好少年中小学生国防教育日主题班会课件
- 《运动的快慢》速度、平均速度与瞬时速度课件
- 地基事故案例分析
评论
0/150
提交评论