




已阅读5页,还剩89页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 实验设计的数学基础简介,第一节 统计学基础 第二节 线性代数基础 第三节 回归与分析,第一节 统计学基础,一、平均数、标准差与变异系数 二、显著性检验 三、方差分析 四、协方差分析,一、平均数、标准差与变异系数,(一)平均数:算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。 平均数的基本性质:(1)样本各观测值与平均数之差的和为零,即离均差之和等于零。(2)样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 对于总体而言,通常用表示总体平均数,有限总体的平均数为: 式中,N表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数作为总体平均数()的估计量,并已证明样本平均数 是总体平均数的无偏估计量。 1、算术平均数(arithmetic mean): 直接求算法和加权平均值法 2、中位数(median):将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。,3、众数(mode):出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M0。 4、几何平均数(geometric mean): n个观测值相乘之积开n次方所得的方根,称为几何平均数,记为G。 5、调和平均数(harmonic mean):各观测值倒数的算术平均数的倒数,称为调和平均数,记为H。,(二)标准差及变异系数,平均值只能反映效应的平均高低,而变异程度是另一个衡量效应的重要指标。 极差和离均差不能全面反映变异程度,后者有正负号,离均差之和为0。 离均差平方和除以自由度得到均方(mean square缩写为MS),又称样本方差,记为S2。S2= 相应的总体参数叫总体方差,记为2。对于有限总体而言, 统计学上把样本方差S2的平方根叫做样本标准差,记为S : 相应的总体参数叫总体标准差,记为 。在统计学中,常用样本标准差S估计总体标准差。 在样本服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(S)范围内;约有95.43%的观测值在平均数左右两倍标准差(2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(3S)范围内。也就是说全距近似地等于6倍标准差,变异系数:变异系数是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平均数的比值称为变异系数,记为CV。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 变异系数的计算公式为:,二、假设(显著性)检验,对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,检验这种假设是否成立,这一统计推断过程,称为假设检验。 (1)待检验假设或零假设记为H0,正在被检验的与相对立的假设H1称为备选假设或对立假设。 (2) 假设检验的依据小概率原理:小概率事件在一次试验中实际上不会发生。 (3) 假设检验的思路是概率性质的反证法。即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。,假设检验的程序及方法,1、假设检验程序 根据题意提出零假设H0(或相应备选假设H1)。 构造样本统计量并确定其分布; 给定显著性水平a,查表确定临界值,从而得出接受域和拒绝域; 由样本观测值计算出统计量的值; 作出判断:若统计量的值落入拒绝域则拒绝H0,若统计量的值落入接受域则接受H0。 2、假设检验的主要方法有: Z检验法、t检验法、c2检验法、F检验法。,t-检验,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。 (一)t-检验的基本步骤: 1)首先对试验样本所在的总体作假设,无效假设(null hypothesis), 记作H0:m1=m2或m1-m2 =0。无效假设是被检验的假设,通过检验可能被接受,也可能被否定。否定时可提出 备择假设(alternative hypothesis),记作HA:m1m2或m1-m20; 2)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率,继而查表找出其概率。 3)根据“小概率事件实际不可能性原理”否定或接受无效假设,根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设 : m1=m2 ,接受备择假设 :m1 m2 ,即认为:试验的处理效应是存在的。,在t-检验中,备择假设 包括了 m1 或 m2两种可能。 双侧t-检验:在 水平上否定域为 和 ,对称地分配在t分布曲线的两侧尾部,每侧的概率为a /2,这种利用两尾概率进行的检验叫双侧检验(two-sided test),也叫双尾检验(two-tailed test), 为双侧检验的临界t值。 单侧t-检验:这种利用一侧概率进行的检验叫单侧检验(one-sided test)也叫单尾检验(one-tailed test)。此时 为单侧检验的临界t值。显然,单侧检验的 =双侧检验的 。,(二)方差分析,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。 方差分析(analysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析,它在实验设计中应用十分广泛。 总体方差与已知值相等的统计检验2 检验法 两总体方差的统计检验检验法,方差分析的基本原理与步骤,线性模型与基本假定,设想每一个处理的观察响应值是一个随机变量,m是总均值,ai是第i个处理的唯一的参数(第i个处理效应),ei是随机误差,则: 是第i个处理的效应表示处理i对试验结果产生的影响。 效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity) 假设模型误差是独立的正态分布的随机变量,其均值为零,方差为s2,方差分析的基本步骤,(一)计算各项平方和与自由度。 (二)列出方差分析表,计算F值,与临界值比较,进行F检验。 (三)若F检验显著,则进行多重比较。多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法:包括q检验法和新复极差法)。表示多重比较结果的方法有三角形法和标记字母法。,例3,为了比较四种不同增溶剂对某药物的增溶效果,对加有四种增溶剂的处方进行了实验,结果如下表。,这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下: 矫正数 总平方和 处理间平方和 处理内平方和 总自由度 处理间自由度 处理内自由度 用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方Mse F=MSt/MSe=38.09/5.34=7.13*;根据df1=dft=3,df2=dfe=16查F表,得FF0.01(3,16) =5.29,P0.01,表明四种不同增溶剂的效果差异极显著,方差分析表,多重比较,F值显著或极显著,否定了无效假设,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。 有必要进行两两处理平均数间的比较,即多重比较(multiple comparisons)。以具体判断两两处理平均数间的差异显著性 多重比较的方法甚多,常用的有最小显著差数法(LSD法),最小显著差数法 (LSD法,least significant difference),此法的基本作法是:在F检验显著的前提下,先计算出显著水平为的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较。若LSDa时,则与在水平上差异显著;反之,则在水平上差异不显著。最小显著差数由下式计算。 (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列; (2)计算最小显著差数和; (3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。,例3的LSD法比较,单一自由度的正交比较,事先按照一定的原则设计好(k-1)个正交比较,将处理间平方和根据设计要求剖分成有意义的各具一个自由度的比较项,然后用F检验(此时df1=1),这就是所谓单一自由度的正交比较(orthogonal comparison of single degree of freedom),也叫单一自由度的独立比较(independent comparison of single degree of freedom)。单一自由度的正交比较有成组比较和趋势比较两种情况,后者要涉及到回归分析。,例4,某试验研究不同药物对腹水癌的治疗效果,将患腹水癌的25只小白鼠随机分为5组,每组5只。其中A1组不用药作为对照,A2、A3为用两个不同的中药组,A4、A5为用两个不同的西药组,各组小白鼠的存活天数如下表所示。,这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下: 矫正数 总平方和 处理间平方和 处理内平方和 总自由度 处理间自由度 处理内自由度 用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方Mse,这是一个单因素试验,其中k=5,n=5,按照前面介绍的方法进行方差分析,可以得到方差分析表,说明组间有显著差异。试验者还想了解:(1)不用药物治疗与用药物治疗;(2)中药与西药;(3)中药A2与中药A3;(4)西药A4与西药A5;相比结果如何?,首先将表中各处理的总存活天数抄于下表,然后写出各预定比较的正交系数Ci(orthogonal coefficient)。 各个比较的正交系数确定后,便可获得每一比较的总和数的差数Di,其通式为: 进而可求得各比较的平方和SSi,式中的n为各处理的重复数,本例n=5。 SS1+SS2+SS3+SS4正是处理间平方和SSt。这也就是说,利用上面的方法我们已将处理间具4个自由度的平方和再度分解为各具一个自由度的4个正交比较的平方和 查F值表,df1=1,df2=20时,F0.05(1,20) =4.35,F0.01(1,20) =8.10。所以,在这一试验的上述4个比较差异都极显著,协方差分析的意义,协方差分析有二个意义 , 一是对试验进行统计控制,二是对协方差组分进行估计。 为了提高试验的精确性和准确性 ,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。这时可利用x与y的回归关系, 将y都矫正为x相同时的值,于是x不同对y的影响就消除了。由于矫正后的y是应用统计方法将初始重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应估计更为准确。若 y 的变异主要由x的不同造成(处理没有显著效应),则各矫正后的处理间将没有显著差异(但原y间的差异可能是显著的)。若 y的变异除掉x不同的影响外, 尚存在不同处理的显著效应,则可期望各 间将有显著差异 (但原y间差异可能是不显著的)。此外,矫正后的 和原y的大小次序也常不一致。所以, 处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析(analysis of covariance)。,二、估计协方差组分 在两个相关变量线性相关性质与程度的相关系数的计算公式: 若将公式右端的分子分母同除以自由度(n-1),得,下一张,主 页,退 出,上一张,其中 是x的均方MSx,它是x的 方差 的无偏估计量; 是y的均方MSy,它是y的 方差 的无偏估计量;,称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即,与 均 积 相 应 的 总 体参 数 叫 协 方 差(covariance),记为COV(x,y)或 。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即 EMPxy= COV(x,y)。 于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:,相应的总体相关系数可用x与y的总体标准差 、 ,总体协方差COV(x,y)或 表示如下:,均积与均方具有相似的形式 , 也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。,在随机模型的方差分析中,根据均方MS 和期望均方 EMS的关系, 可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积 MP 和期望均积 EMP 的关系,可 得 到 不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。,协方差分析的计算步骤如下: (一)求x变量的各项平方和与自由度 1、总平方和与自由度 dfT(x)=kn-1=412-1=47,2、处理间平方和与自由度,=k-1=4-1=3,3、处理内平方和与自由度 (二)求y变量各项平方和与自由度 1、总平方和与自由度,2、处理间平方和与自由度 3、处理内平方和与自由度 (三) 求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度,=kn-1=412-1=47 2、处理间乘积和与自由度 =1.64,=k-1=4-1=3 3、处理内乘积和与自由度 平方和、乘积和与自由度的计算结果列于表103。 表103 x与y的平方和与乘积和表,(四) 对x和y各作方差分析 协方差分析表,(五) 协方差分析 1、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出y与x之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正y值以消去x不同对它的影响。然后根据校正后的y值来进行方差分析。如线性回归关系不显著,则无需继续进行分析。,回归分析的步骤如下: (1) 计算误差项回归系数,回归平方和,离回归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系数: 误差项回归平方和与自由度 dfR(e)=1,误差项离回归平方和与自由度 =85.08-47.49=37.59 (2) 检验回归关系的显著性 表 回归关系显著性检验表,F检验表明,误差项回归关系极显著,因此,可以利用线性回归关系来校正y,并对校正后的y进行方差分析。 2、对校正后的y作方差分析 (1)求校正后的y的各项平方和及自由度 利用线性回归关系对y作校正 ,并由校正后的y计算各项平方和是相当 麻烦的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。, 校正y的总平方和与自由度,即总离回归平方和与自由度 = - =47-1=46 校正y的误差项平方和与自由度,即误差离回归平方和与自由度 = - =44-1=43 上述回归自由度均为1,因仅有一个自变量x。, 校正y的处理间平方和与自由度 =57.87-37.59=20.28 (10-15) =k-1=4-1=3 (2) 列出协方差分析表,对校正后的y进行方差分析 查F值: =4.275(由线性内插法计算),由于F=7.63 ,P0.01,表明对于校正后的y不同处理间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。,表 协方差分析表,第二节 线性代数基础,1.矩阵的定义,定义1 由mn个数,(I=1,2, ,m ; j=1,2, ,n),排成的m行n列数表,称为m行n列矩阵,,简称为mn矩阵.记为,矩阵通常用大写的英文字母A,B,C等表示。,称,为矩阵A的第i行第j列元素。,(1)当m=1时,矩阵只有一行,称为行矩阵,即,(2)当n=1时,矩阵只有一列,称为列矩阵,即,(3)当m=n时,称A为n阶矩阵或n阶方阵。,例1.,设,则A是一个23矩阵,B是一个2阶方阵,,A的(2,3)元是1。,下面介绍几种常用的特殊矩阵:,(1) 元素全为零的矩阵称为零矩阵,记作O;,以外元素全为零的方阵,即形如,(2)主对角线上的元素不全为零,而主对角线,的矩阵称为,对角矩阵,记为,例如,(3)对角线上元素全为1的n阶对角矩阵:,称为n阶单位矩阵。,记为I,(4)形如,的方阵,称为上三角阵.,(5)形如,的方阵,,称为下三角矩阵。,(6)逆矩阵(或反矩阵):当矩阵AB的积为单位矩阵时,B称为A的逆矩阵,记做A-1 A可逆的条件是:A为方阵;A的行列式非0;,(7)矩阵的转置,把矩阵A的行相应转换为列,即xij转置为xji,得到的矩阵称之为A的转置矩阵,记为A。 在实验设计中,模型矩阵X,则XX称之为信息矩阵(information matrix)。为方阵,对主对角线对称。,(8)矩阵的行列式(Determinant),矩阵的行列式只是当矩阵为方阵时存在,是一个数,通常记做 ,对于22和33矩阵的行列式:,(9)正交矩阵:当矩阵A的转置矩阵与逆矩阵相等时,称为正交矩阵。 A=A-1,2.两个矩阵相等,定义2.若矩阵 A与矩阵B的所有对应的元素相等,则A=B。,3.矩阵的初等变换,定义3 下列三种变换称为矩阵的初等变换,1.对调矩阵的任意两行元素,记作,2.用数k,乘矩阵的某行所有元素,记作,3.用数k,乘矩阵中某行的每个元素后加到,另一行的对应元素上去,记作,将定义中的,“行”换成“列”,就得到矩阵的初等列变,换的定义,将“r”换成“c”,就得到列变换的表示方法.,矩阵的初等行变换与初等列变换,统称为矩阵的初等变换.,如果矩阵A经过有限次初等变换变成矩阵B,则称,矩阵A与B等价,记作,上述两个矩阵具有如下特点:,(1)每个台阶上只有一行;,(2)每个台阶的第一个数不等于零;,(3)台阶左下方的元素全为零。,具有以上三个特点的矩阵称为行阶梯形矩阵。,再观察以下两个阶梯形矩阵:,这两个阶梯形矩阵都具有如下特点:,(4)每个台阶上的第一个数都是1,,并且这些1,所在列的其它元素全为零。,具有特点(4)的行阶梯形矩阵称为行最简阶梯形矩阵。,定理 1.1.1,每个矩阵都可以经过有限次初等行变,换化为行阶梯形矩阵,进而化为行最简阶梯形矩阵。,例 2试用初等行变换将,化为行阶梯形,,进而化为行最,简阶梯形矩阵。,解,继续使用初等行变换,将B化为行最简阶梯形矩阵:,注:矩阵的初等变换是可逆的,4、矩阵的运算,加法和减法:行、列一致的矩阵可以进行加、减运算。 矩阵的乘法:AB两个矩阵相乘的条件是前者的列数与后者的行数相等,得到矩阵AB的行数为A的行数,列数为B的列数。其中新矩阵中的元素cij为A矩阵中第i行与B矩阵中第j列相应的元素的乘积之和: 矩阵的乘法有结合律,无交换律: (AB)C=A(BC) ABBA,第三节 回归分析,一、回归分析简介 二、线性回归 三、多元回归,一、回归分析简介,解析实验结果 RSM分析:通常是多项式 通常采用最小二乘法(Least squares regression),例1 表面活性剂对药物溶解度的影响,胆酸盐如胆酸钠、脱氧胆酸钠、甘胆酸钠等常可以在溶液中形成胶束,用于增溶。长链磷脂酰胆碱尽管不能自身形成胶束,但可以嵌合于胆酸盐胶束中形成混合胶束,这种混合胶束可以用于静脉注射,耐受性好。为了考察胆酸盐和卵磷脂对安定溶解度的影响,有人设计了一个析因设计。 表1 因素-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训班老师宿舍管理制度
- 公司车辆交接及管理制度
- 大型养老院安全管理制度
- 分公司财务资产管理制度
- 景区客运驾驶管理制度
- 乡镇卫生院规范管理制度
- 单位保洁制度与管理制度
- 办公室图书分类管理制度
- 团队分工及任务管理制度
- 公司员工热饭间管理制度
- 护理与风险防范课件
- 2025年高考安徽卷物理真题(解析版)
- 暑假安全家长会课件
- 新版2025心肺复苏术指南
- 2024年秋儿童发展问题的咨询与辅导终考期末大作业案例分析1-5答案
- TSG ZF001-2006《安全阀安全技术监察规程》
- DL∕T 796-2012 风力发电场安全规程
- 高压旋喷桩设备基础加固工程施工方案
- 毕业设计(论文)基于单片机的自动计数与装箱控制系统设计
- 土地利用现状分类2007与2017对照表
- 工业区厂房改造工程施工组织设计
评论
0/150
提交评论