




文档简介
第十六章 概率统计与随机过程第十六章 概率统计与随机过程 本章扼要的介绍了概率论的重要内容,除了介绍随机事件及其概率、随机变量和分布函数、随 机变量的数值特征、概率母函数、矩母函数和特征函数、大数法则和中心极限定理等基本概念外, 还介绍了正态分布表和概率纸的用途。 这一章着重的叙述了常用数理统计方法, 包括样本及其频率 分布、总体参数的区间估计、统计检验、方差分析、回归分析、正交实验设计、抽样检验、质量评 估(工序控制)等八个部分;最后简述了随机过程论的基本内容,突出了较为常用的马尔科夫过程 和平稳随机过程。 1 概率论概率论 一、 事件与概率 1.随机事件及其运算关系 随机事件 必然事件 不可能事件 在一定条件下,可能发生也可能不发生的试验结果称为 随机事件,简称事件,用 a , b , c ,表示。随机事件有两个特殊情况,即必然事件(在一定条件下, 每次试验都必定发生的事件)和不可能事件(在一定条件下,各次试验都一定不发生的事件) ,分 别记为和。 事件的运算关系 1 包含 当事件b发生时,事件a也一定发生, 则称a包含b或b包含于a中, 记作ab, 或ba。 2 等价 如果ab且ab,即事件a和b同时发生或不发生,则称a与b等价,记作a=b。 3 积 表示事件a和b同时发生的事件,称为a与b的积,记作ai b(或ab) 。 4 和 表示事件a或事件b发生的事件,称为a与b的和,记作ab(或a+b) 。 u 5 差 表示事件a发生而事件b不发生的事件,称为a与b的差,记作a b(或ab) 。 6 互斥 如果事件a与b不可能同时发生,即ab=,那末称a与b是互斥(或互不相容) 的。 7 对立 如果事件a与b互斥,又在每次试验中不是出现a就是出现b,即ab=i且 ab=,那末称b为a 的对立事件,记作b=ua。 8 完备 如果事件a1 ,a2 , , an在每次试验中至少发生一个,即 n aaauluu 21 0=, 则称a1,a2, ,an构成一个事件完备组。特别当a1 ,a2 , ,an又是两两互斥时,即aiiaj= (ij,i,j=1,2, ,n) ,就称a 1,a2 , ,an是两两互斥的事件完备组。 2、概率的几种定义 频率与概率 随机事件在一次试验中是否发生,固然是无法事先肯定的偶然现象,但当进行 多次重复试验,就可以发现其发生的可能性大小的统计规律性。具体说,如果在相同条件下进行 n 次重复试验,事件 a 出现了 v 次,那末事件 a 在 n 次试验中出现的频率 n 当 n 无限增大时呈现稳 定性。这一统计规律性表明事件 a 发生的可能性大小是事件本身所固有的、不以人们主观意志改 变的一种客观属性。事件 a 发生的可能性大小称为事件 a 的概率,记作 p(a)。当试验的次数 n 足 够大,可用事件的频率近似地表示该事件的概率,即 n v ap)( 概率的古典定义 设一个随机试验(不能事先准确的预言它的结果,而且在相同条件下可以 重复进行的试验)只有有限个不同的基本事件1 , 2 , ,n(基本事件也是一种事件,一般的 事件总是有几个基本事件共同组成的) ,每个基本事件都是等可能*的,基本事件的全体记作,称 它为基本事件空间,如果事件a由k (kn) 个不同的基本事件组成,那末规定a的概率p(a)为 n k ap=)( 不可能事件的概率规定为 0)(=p 概率的公理化定义 定义 1 设=,f|=aa,如果 f 满足下面条件: (i)f; (ii) 若af,则af(aa =); (iii) 对于任意f (n=1,2,),有 n a u = 1n n af 则称 f 是中的一个代数。 定义 2 设是)(faap代数 f 上的实值集函数,如果它满足条件: (i) 对任意af,有 0p(a)1; (ii) ; 1(=)p (iii) 对任意f(n=1 , 2 , ),a n a iiaj= ( ij ) 有 * (在应用中,往往当一种事件没有任何理由比另一事件更容易发生时,就认为这两个事件等可能) p( )=a u =1n a =1 ( n p n) 则称 p(a)为 f 上的概率测度,或简称概率。这时,称为基本事件,a(f)称为事件,f 是事件的 全体,p(a)称为事件 a 的概率, 称为概率空间。 3概率的基本性质 1 0p(a)1 2 p(必然事件)=p()=1 3 p(不可能事件)=p()=0 4 p(au b)=p(a)+p(b)p(ab) i 若 a , b 互斥,则 p(ab)=p(a)+p(b) u 若a1 , a2 , , an两两互斥,则 p()=p(a n aaauluu 21 1)+p(a2)+p(an)=1 5 若ab,则p(a)p(b) 6 若ab,则p(a)p(b)=p(ab) 7 对任意事件a,p(a)=1 (a) p 8 若a1 , a2 , , an是两两互斥的事件完备组,则 p( )=p(a n aaauluu 21 1)+p(a2)+p(an)=1 9 设anf,anan+1 , n=1,2,令a=i =1n an , 则 p(a)= (连续性定理) )(lim n n ap 4、概率的计算公式 条件概率与乘法公式 在事件 b 发生的条件下,事件 a 发生的概率称为事件 a 在事件 b 已发 生的条件下的条件概率,记作 p(a|b)。当 p(b)0 时,规定 p(a|b)= )( )( bp bapi 当 p(b)=0 时,规定 p(a|b)=0。由此得出乘法公式: p(a=p(b)p(a|b)=p(a)p(b|a) )bi p(a1a2an)=p(a1)p(a2|a1)p(a3|a1a2)p(an|a1a2an-1) (p(a1a2an-1)0) 独立性公式 如果事件 a 与 b 满足 p(a|b)=p(a),那末称事件 a 关于事件 b 是独立的。独立 性是相互的性质,即 a 关于 b 独立,b 一定关于 a 独立,或称 a 与 b 相互独立。 a 与 b 相互独立的充分必要条件是: p(ai b)=p(a)p(b) 如果事件a1 ,a2 , an中任意m个()都满足关系式 nm 2 m iii aaa, 21 l )( 11 = = m k i m k i kk apapi 称a1 , a2 , an是总起来独立的,简称为相互独立。 全概率公式 如果事件组b b 1 , b2 b ,满足 = ji bb i )(ji p(u)=1, p(b =1i i b b i)0 (i=1,2,) 则对于任意一事件 a,有 = = 1 )()|()( i ii bpbapap 如果b b i只有n个,公式也成立,此时右端只有n项相加。 贝叶斯公式 如果事件组b b 1 , b2 b ,满足 = ji bb i (ij) 1 1 = = u i i bp, 0)( i bp), 2 , 1(l=i 则对于任一事件 a(p(a)0),有 p(b b i |a)= =1 )|()( )|()( i ii ii bapbp bapbp 如果b b i只有n个,公式也成立,此时右端分母只有n项相加。 伯努利公式 设一次试验中某事件a出现的概率为p,则n次重复试验中事件a出现k次的概率 pn,k为 pn,k = p k n k(1 p)n-k (k=0,1,n) 式中为二项系数。 k n 当 n 和 k 都很大时,有近似公式 pn,k 2 1 2 2 x e 式中)1 (pnp=, npk x =。 泊松公式 当 n 充分大,且 p 很小时,有近似公式 pn,k ! k k e 式中= np。 二、 随机变量与分布函数 随机变量及其概率分布函数 每次试验的结果可以用一个变量的数值来表示,这个变量的 取值随偶然因素而变化,但又遵从一定的概率分布规律,这种变量称为随机变量,用,表示。 它是随机现象的数量比。 给定随机变量,它的取值不超过实数 x 的事件的概率 p(x)是 x 的函数,称为的概率分 布函数,简称分布函数,记作 f(x) ,即 f(x)=p()x () ip k 为在 k y=条件下离散型随机变量的条件分布。类似的,称 p( k y=| i x=)= i ik p p (0, k=1,2,) i p 为在 i x=条件下离散型随机变量的条件分布。 2 设(,)是二维连续型随机变量,其联合分布密度是f(x,y),在点y ,则称 0d),( tytf ()() = tytf tytf yxpyxf x d),( d),( 为在=y 条件下的条件分布函数,在点 x,则称 0d),( ttxf ()() = ttxf ttxf xypxyf y d),( d),( 为在x=条件下的条件分布函数。 3 如果(, 21 ,) n 的联合分布函数等于所有一维边缘分布函数的乘积,即 f(x1 , x2 , xn)= )()()( 2211nn xfxfxfl (它相当于p( 2211 ,xx,nxn)=)()( 11nn xpxpl那末称 21, , n 是相互独立的。 三、 随机变量的数字特征 数学期望(均值)与方差 随机变量的数学期望(或均值)记作e(或m) ,它描述了随 机变量的取值中心。随机变量(e)2的数学期望称为的方差,记作d(或var) ,而d的平 方根称为的均方差(或标准差) ,记作=d。它们描述了随机变量的可能取值与均值的偏差 的疏密程度。 1 若是连续型随机变量,其分布密度为p(x),分布函数为f(x),则(当积分绝对收敛时) e= =)(dd)(xfxxxxp d= =)(d)(d)()( 22 xfexxxpex 2 若是离散型随机变量,其可能取值为xk , k=1,2,,且p(=xk)=pk,则(当级数是绝对收敛 时) e = = 1k kkp x d=p 2 1 )( = k k ex k 均值与方差的几个公式 1 d=e 2-(e )2 2 ea=a , da=0 (a为常数) 3 e(c)=ce , d(c)=c2d(c为常数) 4 e()()eeeee+= 5 若1 , 2 , n为互相独立的n个随机变量,则 e(1+2+n)=e1+e2+en d(1+2+n)= )( 1, jji n ji i eee = 6 若1 , 2 , n为互相独立的n个随机变量,则 e(12n)=(e1)(e2)(en) d(1+2+n)=d1+d2+dn 7 若1 , 2 , n为互相独立的随机变量,且 k e=0, dk=(k=1,2,n)则随机变量 2 = = n k k n 1 1 的均值与方差分别为 n de 2 , 0 = 契贝谢夫不等式 对任一给定的正数,有 () 2 d ep 条件数学期望与全数学期望公式 设 f(x|b)是随机变量对事件 b 的条件分布函数,则 ()() =bxfxbed 称为(当积分绝对收敛时)对事件 b 的条件数学期望。若是连续型随机变量,其条件分布密度 为 p(x|b),则 ()()xbxxpbed = 若是离散型随机变量,其可能取值为x1 , x2 ,,则 () = k kk bxpxbe)( 若b b 1 , b2 ,bn b 是两两互斥的事件完备组,则有全数学期望公式 = = n k kk bebpe 1 )()( 中位数、众数与均值的关系 满足 p( 2 1 )m, p( 2 1 )m 的数 m 称为随机变量的中位数。换句话说,m 满足下面两式: p()()mpm p()()mpmqpqp n为正整数 np npq n qp)(+ n qp)(+ nit qpe)(+ 泊松分布 )(p =e x xp x p ! )( l, 2 , 1=x 为正整数 )1( e )1( t e e )1( it e e 几何分布 )(pg 1 )( = x g pqp l, 2 , 1=x 1, 0, 0=+qpqp p 1 2 p q q p 1 qe p t it it qe pe 1 负二项分布 ),(pab xx b qp x xa xp + = 1 )( l, 2 , 1 , 0=x 1, 0, 0=+qpqp a为正实数 p aq 2 p aq a q p 1 a t qe p 1 a it qe p 1 单点分布 )(c = = cx cx xp , 0 , 1 )( c为正整数 c 0 c ct e ict e 名称记号 概率分布及其定义域 参数条件 均值e方差 d 概率母函数 )(p 矩母函 数 )(t 特征函数 )(t 对数分布 )(pl x q p xp x l ln 1 )(= l, 2 , 1=x 1, 0, 0=+qpqp pp q ln p q q ln ln 1 2 + p a ln )1ln( p qet ln )1ln( p qeit ln )1ln( 超几何分布 ),(nmnh = n n x m xn mn xph)( , 0maxlmnnx+= ,minmn nmn,为正整数 nnnm0 ,0 m n ne= 2 ( 1 n mnm n nn n d = ie enmnmnf n n n mn t; 1;,()(+ = (为超几何函数) f 2、常用连续分布 名称记号 分布密度及其定义域 参数条件 均值e 方差d 矩母函数 )(t 特征函数 )(t 均布函数 ),(bau = bxax bxa ab xpu 或, 0 , 1 )( = cx cx ecx xp cx c+ 2 () t ect1 it eict1 对数正态分布 ),( 2 n l 0, 0 0 , , 2 1 )( 2 2 2 )(ln = x x x e x xp x ln 2 2 + e ) 1( 22 2 + ee 2 分布 (自由 度为 )n )( 2 n = 0, 0 0, 2 2 1 )( 2 1 2 2 2 x xex n xp xn n n为正整数 n 2n 2 )21 ( n t 2 )21 ( n it 分布 (自由 度为) t n )( 2 nt2 1 2 1 2 2 1 )( + + + = n t n x n n n xp n为正整数 0 (n1) 2n n )2(n n t n n t n n n 2 2 2 2 1 )( 2 ynn为诺依蔓函数 f分布(自由 度(m,n)) f(m,n) n n n ) 4( ) 4() 2( ) 2(2 2 2 + n nnm nmn = it m nnm f t ; 2 ; 2 )( 11 (库默尔函数) 威 尔 布 分 布 ),(mw m0, 位置参数 + + m am 1 1 1 ) 1 1 ( ) 2 1 ( 2 2 m m am + + 柯 西 分 布 ),(c 0, )( 1 22 p 2 数理统计方法 数理统计方法 一、 总体参数的估计 1、总体(母体)与样本(子样) 研究某个问题,它的对象的所有可能观测结果称为总体(或母体) ,记作。总体中抽 取一部分样品称为总体的一个样本(或子样) 。样本中样品的个数称为样本的大小 (或容量) 。,可以认为是大样本,否则称为小样本。 n xxx, 21 l 30n 数理统计方法就是应用概率论的结果,通过样本来了解和判断总体的统计特性的科学方 法。 2、 样本特征数与总体数字特征对照表 名 称 样本特征数 总体数字特征 均 值 = = n k k x n x 1 1 e= 方 差 = = n k k xx n s 1 22 )( 1 1 d= 2 标准差 = = n k k xx n s 1 2 )( 1 1 d= 变异系数 x s cv= = e d c 偏态系数 3 1 3 )( )2)(1(s xx nn n c n k k s = = 3 3 )( d cs= 峰态系数 4 2 1 2 4 1 4 2 )( )3)(2)(1( )32(3 )( )3)(2)(1( 32 s xx nnnn n s xx nnn nn c n k k n k k e + = = = 3 )( 2 4 = d ce 注意,1 当n较大时,取 = = n k k xx n s 1 22 )( 1 (有时称此为样本方差,而称表中的为样本修正方差) 2 s 2 s 3 1 3 )( 3 1 s xx n c n k k s = = 4 2 1 2 234 1 4 2 )( 6116 6 )( 116 2 s xx nnns xx nn n c n k k n k k e + + = = = 2 样本特征系数还有: 样本r阶原点矩 = n k r k x n 1 1 样本阶中心矩 = n k r k xx n 1 )( 1 样本中位数 1 2 1+n x (样本大小n为奇数) 样本均差 = n k k xx n 1 1 样本极差 k nk k nk xx 11 minmax 3、总体参数的点估计 记x1 ,x2 ,xn是从总体中取出的一个样本,可用样本的特征数来估计总体的数字特征。 其常用方法有以下两种: 矩法 矩法是用样本的r阶矩作为总体r阶矩的估值。具体步骤如下: 设的分布函数包含k个参数 k , 21 (其取值未知) , 记作),( 21k xf 。 假定 的k阶原点矩存在,它们自然是 k , 21 的函数,即 ),(d),( 2121k r krr xfxvvll = (r=1,2,k) 考虑总体的一个样本作出这一样本的r阶矩 n xxx, 21 r ,即 r =), 2 , 1( 1 1 krx n n i r i l= = 然后解方程组 ( r v), 21k = r (r=1,2,k) 记所得的解为 ),( ,),( 2211 1 nkkn xxxxxx = = 用分别作为 k , , 21 k , 21 的估值。 最大似然法 设总体的分布是连续型的,分布密度函数为),( 21k xp ,其中 k , 21 是待估计的未知参数。 对于给定的 n xxx, 21 使函数达到最大 值的,并用它们分别作为 ),( 21 1 k n i i xp = k , , 21 k , 21 的估值。 由于ln与在同一点()上达到最大值, 因此,引入函数 ),( 21 1 k n i i xp = ),( 21 1 k n i i xp = k , , 21 l( k , 21 )=ln=),( 21 1 k n i i xp = ,(ln 1 = n i i xp k , 21 ) 它称为似然函数。只要解方程组 0= i l (i=1,2,k) 就可以从中确定所要求的,它们分别称为参数 k , , 21 k , 21 的最大似然估计值。 如果总体的分布是离散型的,只要把上述似然函数中的),( 21ki xp 取为)( i xp=就 可以了。 例 正态总体的参数估计,假定已知总体遵从正态分布n(),但参数未知。现 在要用总体的n次观测值x , 2 2 , 1 , x2 , xn求 的最大似然估值。 2 , 解 因为总体的分布密度函数为 2 2 2 )( 2 1 ),( = x exp 因此,似然函数为 2ln 2 ln)( 2 1 ),( 1 2 2 n nxl n i i = = 解方程组 = = 0 0 l l 得 = = n i i x n x 1 1 = = n i i xx n 1 22 )( 1 容易检验确实使 2 , ),(l取到最大值。因此它们分别是的最大似然估值。 2 , 估值好坏的判别标准 1 无偏性 如果参数的估值 x( n 1 , x2 , xn)满足关系式 = n e 则称是 n 的无偏估值。 2 有效性 如果和都是参数 的无偏估值。 dd 则称比有效。进一步,如果固定样本的容量n,使极小值的无偏估值就称为 =d的 有效估值。 3 一致性 如果对任意给定的正数,总有 ()0 lim= n n p 则称的估值是一致的。 n 由契贝谢夫不等式(见1,三)易见,当 0 lim= r n n e 对某成立时,是0r n 的一致估值。 在实用中,往往应用这一充分条件来验证是否是 n 的一致估值。 例 总体分布 未知总体 参 数 总体参数估值 无偏性有效性 一致性 ),( ),( ),( ),( ),( ),( )( ), 1 ( 2 2 2 2 e n n n n bau p pb 2 2 2 2 , , , ,ba p xp = x= n xbxa= , 1 x= = = n i i x n 1 22 )( 1 = = n i i xx n 1 22 )( 1 = = n i i xx n 1 22 )( 1 1 x= 有 有 有 有 有 有 有 有 有 有 有 有 有 有 有 有 有 4、样本的频率分布 频率分布较完整地反映实验数据的变化规律。建立频率分布的步骤(设样本为x1 ,x2 , xn) 是: (1) 找出最大值与最小值,求得极差 ii xxrminmax=。 (2) 根据样本大小分组,通常大样本分成 1020 组,小样本分成 56 组,再根据组数k 和极差r决定组距c,如果按等距分组,则 c k r 。 (3) 确定分点(常取比原数据的精度高一位) 。 (4) 数出各组的频率 i 。 (5) 计算频率 n i (6) 画直方图(分点为横坐标,频率与组距之比为纵坐标) 。 (7) 如果变量是连续的,则描出光滑曲线,近似的代替总体的分布。 5、总体参数的区间估计 小概率原理 在一次试验中,概率很小(接近于零)的事件认为是实际上不可能发生 的事件;而概率接近于1的事件认为是实际上必然发生的事件。 置信区间与显著性水平 对总体参数(如)进行区间估计(即估计参数的取值 范围)时,如果对于预先给定的很小的概率 2 , ,能找到一个区间( 21, ),使得 )( 21 5=r10% 所以接受h0,即以10%的信度认为甲乙两人的 分析结果无显著差异. 符 号 检 验 表 n 1 5 10 25 (%) n 1 5 10 25 (%) n 1 5 10 25 (%) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0 0 0 0 0 0 1 0 0 1 0 0 1 1 0 1 1 2 0 1 1 2 0 1 2 3 1 2 2 3 1 2 3 3 1 2 3 4 2 3 3 4 2 3 4 5 2 4 4 5 3 4 5 6 3 4 5 6 3 5 5 6 4 5 6 7 4 5 6 7 4 6 7 8 5 6 7 8 5 7 7 9 6 7 8 9 6 7 8 10 6 8 9 10 7 8 9 10 7 9 10 11 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 7 9 10 11 8 9 10 12 8 10 11 12 9 10 11 13 9 11 12 13 9 11 12 14 10 12 13 14 10 12 13 14 11 12 13 15 11 13 14 15 11 13 14 16 12 14 15 16 12 14 15 17 13 15 16 17 13 15 16 18 13 15 16 18 14 16 17 19 14 16 17 19 15 17 18 19 15 17 18 20 15 18 19 20 16 18 19 21 16 18 20 21 17 19 20 22 17 19 20 22 17 20 21 23 18 20 21 23 18 21 22 24 19 21 22 24 19 21 23 25 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 20 22 23 25 20 22 24 25 20 23 24 26 21 23 24 26 21 24 25 27 22 24 25 27 22 25 26 28 22 25 26 28 23 25 27 29 23 26 27 29 24 26 28 30 24 27 28 30 25 27 28 31 25 28 29 31 25 28 29 32 26 28 30 32 26 29 30 32 27 29 31 33 27 30 31 33 28 30 32 34 28 31 32 34 28 31 33 35 29 32 33 35 29 32 33 36 30 32 34 36 30 33 34 37 31 33 35 37 31 34 35 38 31 34 36 38 32 35 36 39 注 表中数字表示对应于符号和n与显著性水平的符号限。 r 秩和检验法 此法比符号检验法的精度要高,能更好的利用数据提供的信息,并且不要求数 据“成对”.其步骤用例说明如下: 例 对用甲乙两种材料制成的产品进行寿命试验,得 甲 1610 1650 1680 1700 1750 1720 1800 乙 1580 1600 1640 1640 1700 问两种材料对产品质量的影响有无显著差异? 解 把上述数据从小到大排成下表: 秩 1 2 3 4 5 6 7 8 9 10 11 12 甲 乙 1610 1650 1680 1700 1720 1750 1800 1580 1600 1640 1640 1700 上表中第一行秩表示从小到大排列的序数,数据1700甲乙均有,排在8,9两个序位,其秩 按平均秩取为5 . 8 2 98 = + 。 统计假设检验步骤 过 程 分 析 (1) 假设h0 (2) 统计量 (3) 给出显著性水平 (4) 查出置信限 (5) 计算统计量 (6) 统计推断 当 ttt =aaey bxo 设x = x , y = ylg 则 xebay)lg(lg+= (x , y)在单对数坐标纸上成一直 线 xbaylg3+= o 设 yyxx=,lg 则 bxay+= (x , y)在单对数坐标纸上成一直 线 )0(4=aaey x b o 设 x x 1 = yylg= 则 xebay)lg(lg+= )0( 1 5 + = a bea y x o 设 x ex = y y 1 = 则 bxay+= caxy b += o 6 曲线与类型相同,只是在轴方 向上作了移动, 首先在给定的曲线上 取三点: , o 1 y ),(),( 2211 yxyx 213 (xxx = , 3 y ),则 321 2 321 2yyy yyy c + = c确定后,设 )lg( lg cyy xx = = 则 bxay+= 曲 线 类 型 化直线型的变量替换 caey bx += o 7 曲线与类型相同,只是在轴方 向上作了移动, 首先在给定的曲线上 取三点: o 2 y ),( 11 yx ),( 22 yx ), 2 ( 3 21 3 y xx x + = 则 321 2 321 2yyy yyy c + = 确定后,设 xxlg= )lg(cyy= 则 xebay)lg(lg+= )0, 0(8+ + =cac bax x y o 设 x x 1 = cy y = 1 则 bxay+= )0( 1 9 + =a bax y o 设 x x 1 = y y 1 = 则 axby+= = + + =010 dc ba d dcx bax y o 在曲线上取一点(x0 , y0) 设x = x 0 0 yy xx y = 则 bxay+= 用回归直线法, 从已给数据可定 出a和b cbxaxy+= 2 11o 在曲线上取一点(x0 , y0) 设x = x 0 0 xx yy y = 则 axaxby+=)( 0 曲 线 类 型 化直线型的变量替换 cbxax y + = 2 1 12o 设x = x y y 1 = 则可化为类型11 cbxaxy+= 22 13o 设x = x y = y2 则可化为类型11 cbxax x y + = 2 14o 设x = x y x y = 则可化为类型11 2 15 x c x b ay+= o 设 x x 1 = yy = 则可化为类型11 2 16 dxcxb aey + = o 设x = x yylg= 则 2 )lg()lg( lglg xedxec ebay + += 化为类型11 cxbe axy = o 17 若给定的x值构成以h为公差的 等差级数,则设 xxlg= (取值) ii xxlglg 1+ yylg= (取值) ii yylglg 1+ 而得直线型 bxehcy+=lg dxbx ceaey+= o 18 若给定的x值构成以h为公差的 等差级数,设u1= x+h , u2 = x+2h,其对应的y值为v1 ,v2 又设 y v y y v x 21 ,= 而得 dhbhdhbh eexeey+=)( 由此用回归直线法定出 b , d 后,再设 dxxdb yee =, )( 则得 ca+= 5、二元线回归 回归方程 对应自变量x1与x2的值 ynixx ii ), 2 , 1(, 21 l= 的值为, 于是 得到n个点,其回归方程为 ), 2 , 1(niyil= ), 2 , 1)(,( 21 niyxx iii l= 2211 xbxbay+= 式中为回归系数,它由下面方程决定: 21,b b =+ =+ 20222121 10212111 lblbl lblbl 这里 2 1 1 1 2 1 1 2 1111 1 )( = = n i i n i i n i i x n xxxl = = n i n i i n i ii x n xxxl 1 2 1 2 1 2 2 2 2222 1 )( = = = = n i i n i i n i ii n i ii xx n xx xxxxll 1 2 1 1 1 21 1 22112112 1 )( = = n i i n i i n i ii n i ii yx n yxyyxxl 11 1 1 1 1 1110 1 )( = = n i i n i i n i ii n i ii yx n yxyyxxl 11 2 1 2 1 2220 1 )( = = n i i x n x 1 11 1 = = n i i x n x 1 22 1 = = n i i y n y 1 1 而其中是为了简化计算所作的数据变换(不需整数化) ,即 ii xx 21 , 222111 ,axxaxx iiii = (1)式中的常数项 2211 xbxbya= 复相关系数和偏项关系数 00 l s r 回 = 称为复相关系数,式中 2 11 2 1 2 00 202101 1 )( = += = n i i n i i n i i y n yyyl lblbs回 这里如(2)所示。复相关系数r满足 2000,l l 10 r ,其意义与一元线性回归分析中的相关系数r 类似,用于衡量y与x1 , x2的线性关系的密切程度。 如果只要表示y与其中某一个变量(x1或x2)的相关关系,那末必须除去另一个变量的影响之 后再计算它们的相关系数,这称为偏相关系数。x1,y在除去x2的影响之后的相关系数称为x1,y对 x2的偏相关系数,记作,它可用普通的相关系数表示: 21 ,xyx r yxyxxx rrr 2121 , 22 , 221 2211 21 11 yxxx yxxxyx xyx rr rrr r = 同样的,对的偏相关系数表为 yx , 212 ,xyx r 22 , 112 1122 12 11 yxxx yxxxyx xyx rr rrr r = 剩余标准差 33 00 = = n sl n s s 回余 称为剩余标准差,其意义同一元线性回归分析中的剩余标准差s类似。 标准回归系数与偏回归平方和 在两因素x1 , x2之间关系不密切的情况下,可用下述方法 判断哪个因素是主要的。 1 00 11 11 l l bb = 00 22 22 l l bb = 称为标准回归系数,式中b1,b2为回归系数,l11, l22如(2)所示, l00如(4)所示。若 21 bb , 则表明在影响变量的两个因素中,x1是主要因素,x2是次要因素。 2 = 22 2 12 11 2 11 l l lbp = 11 2 12 22 2 22 l l lbp 称为偏回归平方和,式中b1 , b2为回归系数,l11,l12,l22如(2)所示。若p1p2,则表明是x1主要因素, x2是次要因素。 t值 , 1 1 s p t = s p t 2 2 = 分别称为x1 , x2的t值,式中s为剩余标准差,p1 , p2为偏回归平方和。若t值越大,则表明该因素 越重要。根据经验,当 ti1时,该因素xi对y有一定的影响;当ti2时,该因素xi看作是重要因素; 当ti 当 ff 时,认为回归 不显著,线性 相关不密切。 总平 方和 = 2 )(yys i n-1 标准回归系数与偏回归平方和 标准回归系数 00 l l bb ii ii = ), 2 , 1(mil= 偏回归平方和 ii i i c b p 2 = ), 2 , 1(mil= t值 s p t i i = ), 2 , 1(mil= 多元线性回归分析与二元的情况类似,但计算量较大,可借助电子计算机来完成。 五、正交试验设计 正交表与正交试验 正交表是根据组合理论,按照一定规律构造的表格,它在试验设 计中有广泛的应用。以正交表为工具安排试验方案和进行结果分析的试验称为正交试验。它 适用于多因素、多指标(试验需要考察的结果) 、多因素间存在交互作用(因素之间联合起作 用) 、 具有随机误差的试验。 通过正交试验, 可以分析各因素及其交互作用对试验指标的影响, 按其重要程度找出主次关系,并确定对试验指标的最优工艺条件。在正交试验中要求每个所 考虑的因素都是可控的。在整个试验中每个因素所取值的个数称为该因素的水平。 正交表的符号为,其中)( c a bll表示正交表;下标是正交表的行数,表示试验次数;c 是正交表的列数,表示试验至多可以安排的因素个数;b是表中不同数字的个数,表示每个 因素的水平数。例如,8 表示正交表中有 8 行,即安排试验的次数为 8 次;7 表示正交 表中有 7 列,试验至多可安排 7 个因素(包括交互作用的因素) ;2 表示每个因素只有两个水 平。这种正交表称为 2 水平型的正交表。 a )2( 7 8 l 又如,表示正交表中共有 12 行,4 列,其中有一列是 3 水平的,有 3 列是 2 水平的。它称为混合型的正交表,可用来安排因素水平不同的试验。 )23( 3 12 l 正交表的交互列 任意两列分别安排了两个因素之后,这两个因素的交互作用可用表 的其他列表示出来,称为交互列。交互列在 2 水平型正交表中只有一列,在 3 水平型正交表 中有两列,例如,任意两列的交互列是另外两列。通常低水平(水平数为 2 或 3)的 正交表有另外专表写出交互列,例如的交互列表,指出第 3 列与第 5 列的交互列即是 第 6 列等等。有些正交表,例如,任意两列的交互列都不在表内,对这样的正交表就 不能考虑因素间的交互作用了。 )3( 4 9 l )2( 7 8 l )2( 11 12 l 手册后面备有常用正交表。 )2( 7 8 l 的交互列表 1 2 3 4 5 6 7 列号 (1) 3 2 5 4 7 6 (2) 1 6 7 4 5 (3) 7 6 5 4 (4) 1 2 3 (5) 3 2 (6) 1 1 2 3 4 5 6 (7) 7 正交表的正交性 正交表具有正交性: 1 在任意一列中,每个水平的重复次数都相等,例如中每列的每个水平都重复 4 次。 )2( 7 8 l 2 任意两列中,同行数字(水平)构成的数对,包含着所有可能(该水平下)的数对, 而每个数对重复次数相等。例如在中任意两列构成的数对都包含着 3 水平下所有可能 的数对: (1,1) , (1,2) , (1,3) , (2,1) , (2,2) , (2,3) , (3,1) , (3,2) , (3,3) , 而且每个数对重复次数都等于 1。 )3( 4 9 l 由于正交性,使得所安排的正交试验,均衡分散,整齐可比。 试验方案的制定步骤与安排方法 1 步骤 (1) 确定试验中变化因素的个数及每个因素变化的水平。 (2) 根据专业知识或经验,初步分析各因素之间的交互作用,确定哪些是必须考虑的, 哪些是暂时可以忽略的。 (3) 根据试验的人力、设备、时间及费用,确定可能进行的大概试验次数。 (4) 选用合适的正交表,安排试验。 2 安排方法 (1) 在不考虑交互作用时,把因素逐个安排在正交表的任意列上,那末每次试验(对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中医诊断考试试题及答案
- 新工科背景下半导体材料课程教学评估与反馈机制的完善
- 民政遴选笔试真题及答案
- 高职医卫类专业群特色专业建设思路
- 合伙生意后续合同(标准版)
- 城市轨道交通概论课件 模块九 城市轨道交通安全管理-任务二
- 公司员工安全培训知识课件
- 楼顶防水的申请报告(3篇)
- 留守儿童协议合同(标准版)
- 经纪保密合同(标准版)
- 2025年江西省高考物理试卷真题(含答案及解析)
- 高三励志课件
- 河南省人民医院2025年护士规范化培训招生考试参考题库及答案解析
- 企业科技创新管理办法
- GB/T 37507-2025项目、项目群和项目组合管理项目管理指南
- 华为年度业务规划
- 男生青春期健康教育(我)
- 建设银行员工劳动合同
- 施工总包合同范本(费率版)
- 大钢模模板施工方案
- 船舶电路图图形符号
评论
0/150
提交评论