




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、参数估计,数理统计问题:如何选取样本来对总体的种种统计 特征作出判断。,参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计(paramentric estimation)。,参数估计的类型点估计、区间估计,参数的估计量,设总体的分布函数为F(x,)(未知),X1,X2,Xn 为样本,构造一个统计量 来估计 参数,则称 为参数的估计量。,将样本观测值 代入 , 得到的值 称为参数的估计值。,参数的点估计,点估计的方法:数字特征法、矩法、极大似然法。,样本的数字特征法:以样本的数字特征作为相应总体 数字特征的估计量。,以样本均值 作
2、为总体均值 的点估计量,即,点估计值,点估计值,以样本方差 作为总体方差 的点估计量,即,例1 一批钢件的20个样品的屈服点(t/cm2)为 4.98 5.11 5.20 5.20 5.11 5.00 5.35 5.61 4.88 5.27 5.38 5.48 5.27 5.23 4.96 5.15 4.77 5.35 5.38 5.54 试估计该批钢件的平均屈服点及其方差。,解 由数字特征法,得屈服点及方差的估计值为,定义 设 为随机变量,若 存在,则称 为 的 阶原点矩,记作 ;若 存在,则称 为 的 阶 中心矩,记作,样本的 阶原点矩,记作,样本的 阶中心矩,记作,阶矩的概念,参数的矩法
3、估计,矩法估计:用样本的矩作为总体矩的估计量,即,若总体X的分布函数中含有m个参数1, 2, , m, 总体的k阶矩Vk或Uk存在,则,或,参数的矩法估计,或,矩法估计:用样本的矩作为总体矩的估计量,即,例2 设某总体X的数学期望为EX=,方差DX=2,X1, X2,Xn为样本,试求和2的矩估计量。,解 总体的k阶原点矩为,样本的k阶原点矩为,由矩法估计,应有,所以,结论:不管总体X服从何种分布,总体期望和方差 的矩估计量分别为样本均值、样本方差,即,估计值为,例3 设X1,X2,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。,解 (1)由于,(2)由于,所以参数和2的矩估计量为,所以
4、,得参数p的矩估计量为,例3 设X1,X2,Xn为总体X的样本,试求下列总体 分布参数的矩估计量。,解 (3)由于,所以参数的矩估计量为,可见:同一个参数的矩估计量可以不同。所以统计量 存在“优、劣”之分。,或,一阶矩,二阶矩,例4 设总体X服从1, 2上的均匀分布, 12,求 1, 2的矩估计量, X1,X2,Xn为X的一个样本。,解 由于,所以由矩法估计,得,解得,区间长度的矩估计量为,解 由于,所以由矩法估计,得,解得,所以,参数 的矩估计量为,例5 对容量为n的子样,求下列密度函数中参数 的 矩估计量。,参数的极大似然估计法,思想:设总体X的密度函数为f(x,),为未知参数,则 样本(
5、X1,X2,Xn)的联合密度函数为,令,参数的估计量 ,使得样本(X1,X2,Xn)落在观测 值 的邻域内的概率L()达到最大,即,则称 为参数的极大似然估计值。,参数的极大似然估计法,求解方法:,(2)取自然对数,其解 即为参数的极大似然估计值。,(3)令,(1)构造似然函数,若总体的密度函数中有多个参数1,2,n,则将 第(3)步改为,解方程组即可。,例6 假设(X1,X2,Xn)是取自正态总体N(,2) 的样本,求和2的极大似然估计量。,解 构造似然函数,取对数,续解,求偏导数,并令其为0,解得,所以,2的极大似然估计量为,与矩估计量 相同,估计量的评选标准,无偏性、有效性、相合性*、充
6、分性与完备性*,无偏估计量:设 是 的估计量,如果 则称 是 的无偏估计量(unbiased estimation),例题 设总体的数学期望EX和方差DX都存在, 证明:样本均值 、样本方差 分别是EX、DX的无偏估计。,例题 设总体的数学期望EX和方差DX都存在, 证明:样本均值 、样本方差 分别是EX、DX的无偏估计。,证明,证明,有 效 性,设 是 的无偏估计量,当样本容量n固定时,使 达到最小的 称为 的有效估计,比较:若 ,则 比 有效。,例如 及 (其中 )都是EX的无偏 估计,但 比 有效。,例如 及 (其中 )都是EX的无偏 估计,但 比 有效。,因为,算术平均几何平均,小 结
7、,参数估计的点估计方法,数字特征法:以样本均值、方差作为总体期望、方差 的估计量。,矩法估计:以样本k阶矩作为总体k阶矩的估计量。,或,作业 P130 1,2,4 预习 第三节 区间估计,区间估计,区间估计的思想,点估计总是有误差的,但没有衡量偏差程度的量, 区间估计则是按一定的可靠性程度对待估参数给出一个 区间范围。,引例 设某厂生产的灯泡使用寿命XN(,1002),现 随机抽取5只,测量其寿命如下:1455,1502,1370, 1610,1430,则该厂灯泡的平均使用寿命的点估计值为,可以认为该种灯泡的使用寿命在1473.4个单位时间左右, 但范围有多大呢?又有多大的可能性在这“左右”呢
8、?,如果要求有95%的把握判断在1473.4左右,则由U统计 量可知,由,查表得,置信水平、置信区间,设总体的分布中含有一个参数,对给定的,如果 由样本(X1,X2,Xn)确定两个统计量 1( X1,X2,Xn ), 2( X1,X2,Xn ), 使得P1 2=1- ,则称随机区间( 1 , 2 )为 参数的置信度(或置信水平)为1- 的置信区间。,1置信下限 2置信上限,几点说明,1、参数的置信水平为1-的置信区间( 1, 2) 表示该区间有100(1-)%的可能性包含总体参 数的真值。,2、不同的置信水平,参数的置信区间不同。,3、置信区间越小,估计越精确,但置信水平会降低; 相反,置信水
9、平越大,估计越可靠,但精确度会降 低,置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高(置信区间小),可靠程度也 高(1- 大)。如果不降低可靠性,而要缩小估计范 围,则必须增大样本容量,增加抽样成本。,正态总体方差已知,对均值的区间估计,如果总体XN(,2),其中2已知, 未知, 则取U-统计量 ,对做区间估计。,对给定的置信水平1-,由 确定临界值(X的双侧分位数)得的置信区间为,将观测值 代入,则可得具体的区间。,例1 某车间生产滚珠,从长期实践中知道,滚珠直径X 可以认为服从正态分布,从某天的产品中随机抽取6个, 测得直径为(单位:cm) 14.6,15.1,14.9,
10、14.8,15.2,15.1 (1)试求该天产品的平均直径EX的点估计; (2)若已知方差为0.06,试求该天平均直径EX的置信 区间:=0.05;=0.01。,解 (1)由矩法估计得EX的点估计值为,续解 (2)由题设知XN(,0.06),构造U-统计量,得EX的置信区间为,当=0.05时,,而,所以,EX的置信区间为(14.754,15.146),当=0.01时,,所以,EX的置信区间为(14.692,15.208),置信水平提高,置信区间扩大,估计精确度降低。,例2 假定某地一旅游者的消费额X服从正态分布 N(,2),且标准差=12元,今要对该地旅游者的平 均消费额EX加以估计,为了能以
11、95%的置信度相信这种 估计误差小于2元,问至少要调查多少人?,解 由题意知:消费额XN(,122),设要调查n人。,由,即,得,查表得,而,解得,至少要调查139人,正态总体方差未知,对均值的区间估计,如果总体XN(,2),其中,均未知,由,构造T-统计量,当置信水平为1-时,由,查t-分布表确定,从而得的置信水平为1-的置信区间为,例3 某厂生产的一种塑料口杯的重量X被认为服从正态 分布,今随机抽取9个,测得其重量为(单位:克): 21.1,21.3,21.4,21.5,21.3,21.7,21.4,21.3, 21.6。试用95%的置信度估计全部口杯的平均重量。,解 由题设可知:口杯的重
12、量XN(,2),由抽取的9个样本,可得,由,得,查表得,全部口杯的平均重量的置信区间为(21.26,21.54),P127例5与P126例3的比较:,解 由题设可知:平均消费额XN(,2),平均消费额的置信区间为(75.0464,84.9536),由,得,查表得,估计误差为,精确度降低,原因:样本容量减少,在实际应用中,方差未知的均值的区间估计 较有应用价值。,练习 假设某片居民每月对某种商品的需求量X服从正态 分布,经调查100家住户,得出每户每月平均需求量为 10公斤,方差为9,如果某商店供应10000户,试就居民 对该种商品的平均需求量进行区间估计(=0.01),并 依此考虑最少要准备多
13、少这种商品才能以99%的概率满 足需求?,解 由题设可知:平均需求量XN(,2),平均消费额的置信区间为(9.229,10.771),由,查表得,续解,要以99%的概率满足10000户居民对该种商品的需求,则最少要准备的量为,(公斤),最多准备,(公斤),正态总体均值已知,对方差的区间估计,如果总体XN(,2),其中已知,2未知,由,构造2-统计量,查2- 分布表,确定双侧分位数,从而得2的置信水平为1-的置信区间为,例题已知某种果树产量服从(218,2),随机 抽取6棵计算其产量为(单位:公斤) 221,191,202,205,256,236 试以95%的置信水平估计产量的方差。,解,计算,
14、查表,果树方差的置信区间为,正态总体均值未知,对方差的区间估计,如果总体XN(,2),其中2未知,由,构造2-统计量,当置信水平为1-时,由,查2- 分布表,确定双侧分位数,从而得2的置信水平为1-的置信区间为,例4 设某灯泡的寿命XN(,2), ,2未知,现 从中任取5个灯泡进行寿命试验,得数据10.5,11.0, 11.2,12.5,12.8(单位:千小时),求置信水平为 90%的2的区间估计。,解 样本方差及均值分别为,2的置信区间为(0.4195,5.5977),由,得,查表得,小 结,总体服从正态分布的均值或方差的区间估计,(1)方差已知,对均值的区间估计,假设置信水平为1-,构造U
15、-统计量,反查标准正态分布表, 确定U的双侧分位数,得EX的区间估计为,小 结,总体服从正态分布的均值或方差的区间估计,(2)方差未知,对均值的区间估计,假设置信水平为1-,构造T-统计量,查t-分布临界值表, 确定T的双侧分位数,得EX的区间估计为,小 结,总体服从正态分布的均值或方差的区间估计,(3)均值已知,对方差的区间估计,假设置信水平为1-,构造2-统计量,查2-分布临界值表, 确定2的双侧分位数,得2的区间估计为,小 结,总体服从正态分布的均值或方差的区间估计,(4)均值未知,对方差的区间估计,假设置信水平为1-,构造2-统计量,查2-分布临界值表, 确定2的双侧分位数,得2的区间
16、估计为,(1)方差已知,对均值的区间估计,构造U统计量,(2)方差未知,对均值的区间估计,构造T统计量,总体服从正态分布的对均值的区间估计,区间估计,(4)均值未知,对方差的区间估计,构造2统计量,(3)均值已知,对方差的区间估计,构造2统计量,总体服从正态分布的对方差的区间估计,区间估计,作业 P131 5,7,8,9,14,15* 预习 第10章 15节,假设检验,引 言,统计假设通过实际观察或理论分析对总体分布形式 或对总体分布形式中的某些参数作出某种 假设。,假设检验根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。,基本原则小概
17、率事件在一次试验中是不可能发生的。,基本概念,引例:已知某班应用数学的期末考试成绩服从 正态分布。根据平时的学习情况及试卷的难易程度,估 计平均成绩为75分,考试后随机抽样5位同学的试卷, 得平均成绩为72分,试问所估计的75分是否正确?,“全班平均成绩是75分”,这就是一个假设,根据样本均值为72分,和已有的定理结论,对EX=75 是否正确作出判断,这就是检验,对总体均值的检验。,判断结果:接受原假设,或拒绝原假设。,表达:原假设:H0:EX=75;备择假设: H1:EX75,基本思想,参数的假设检验:已知总体的分布类型,对分布函数或 密度函数中的某些参数提出假设,并检验。,基本原则小概率事
18、件在一次试验中是不可能发生的。,思想:如果原假设成立,那么某个分布已知的统计 量在某个区域内取值的概率应该较小,如果样本的观 测数值落在这个小概率区域内,则原假设不正确,所以, 拒绝原假设;否则,接受原假设。,拒绝域,检验水平,引例问题,原假设 H0:EX=75;H1:EX75,假定原假设正确,则XN(75,2),于是T统计量,可得,如果样本的观测值,则拒绝H0,检验水平,临界值,拒绝域,基本步骤,1、提出原假设,确定备择假设;,2、构造分布已知的合适的统计量;,3、由给定的检验水平,求出在H0成立的条件下的 临界值(上侧分位数,或双侧分位数);,4、计算统计量的样本观测值,如果落在拒绝域内,
19、 则拒绝原假设,否则,接受原假设。,两 种 错 误,第一类错误(弃真错误)原假设H0为真,而检验 结果为拒绝H0;记其概率为,即 P拒绝H0|H0为真= ,第二类错误(受伪错误)原假设H0不符合实际, 而检验结果为接受H0;记其概率为,即 P接受H0|H0为假= ,希望:犯两类错误的概率越小越好,但样本容量一定 的前提下,不可能同时降低和。,原则:保护原假设,即限制的前提下,使尽可能的小。,注意:“接受H0”,并不意味着H0一定为真;“拒绝H0” 也不意味着H0一定不真。,单个正态总体方差已知的均值检验,问题:总体XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,双边
20、检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,例1 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05),解 由题意可知:零件重量XN(,2),且技术 革新前后的方差不变2=0.052,要求对均值进行 检验,采用U检验法。,假设 H0:=15; H1: 15,构造U统计量,得U的0.05双侧分位数为,例1 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽
21、出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,平均重量是否仍为15克? (=0.05),解,因为4.91.96 ,即观测值落在拒绝域内,所以拒绝原假设。,而样本均值为,故U统计量的观测值为,计算机实现步骤,1、输入样本数据,存入C1列,2、选择菜单StatBasic Statistics1-Sample Z,3、在Variables栏中,键入C1,在Sigma栏中键入 0.05,在Test Mean栏中键入15,打开Options 选项,在Confidence level栏中键入95,在 Alternative中选择
22、not equal,点击每个对话框 中的OK即可。,显示结果中的“P”称为尾概率,表示,显示结果,(1)因为,所以拒绝原假设,(2)因为,所以拒绝原假设,(3)因为,所以拒绝原假设,结果分析,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,例2 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,技术革新后,零件的平 均重量是否降低?(=0.05),解 由题意可知:零件重量XN(,2),且技术 革新前后的方差不变2=0
23、.052,要求对均值进行 检验,采用U检验法。,假设 H0:=15; H1: 15,构造U统计量,得U的0.05上侧分位数为,单侧检验,因为 ,即观测值落在拒绝域内,所以拒绝原假设,即可认为平均重量是降低了。,而样本均值为,故U统计量的观测值为,例2 由经验知某零件的重量XN(,2),=15, =0.05;技术革新后,抽出6个零件,测得重量为 (单位:克)14.7 15.1 14.8 15.0 15.2 14.6,已 知方差不变,试统计推断,技术革新后,零件的平 均重量是否降低?(=0.05),解,计算机实现步骤,1、输入样本数据,存入C1列,2、选择菜单StatBasic Statistic
24、s1-Sample Z,3、在Variables栏中,键入C1,在Sigma栏中键入 0.05,在Test Mean栏中键入15,打开Options 选项,在Confidence level栏中键入95,在 Alternative中选择less than,点击每个对话框 中的OK即可。,显示结果,(1)因为,所以拒绝原假设,(2)因为,所以拒绝原假设,(3)因为,所以拒绝原假设,结果分析,单个正态总体方差未知的均值检验,问题:总体XN(,2),2未知,假设 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,例3 化工厂用自动
25、包装机包装化肥,每包重量服从正态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1),解 由题意可知:化肥重量XN(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。,假设 H0:=100; H1: 100,构造T统计量,得T的0.1双侧分位数为,解,因为0.05451.86 ,即观测值落在接受域内,所以接受原假设,即可认为这天的包装机工作正常。,而样本均值、均方差为,故T统计量的观测值为,例3 化工厂用自动包装机包装化肥,每包重量服从正态 分
26、布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1),例3的计算机实现步骤,1、计算T统计量的观测值,2、计算t-分布的上侧0.05分位数,3、显示k1,k2,分析结果,如果,MTB InvCDF 0.95 k2; SUBC T 8.,MTB let k1=(99.978-100)*sqrt(9)/1.212,MTBPrint k1 k2,,则接受原假设;,否则,拒绝原假设。,P142例5的计算机实现步骤,1、输入样本数据,存入C2列,2、选择菜单StatBas
27、ic Statistics1-Sample T,3、在Variables栏中,键入C2,在Test Mean栏中 键入750,打开Options选项,在Confidence level 栏中键入95,在Alternative中选择not equal,点击 每个对话框中的OK即可。,显示结果,(1)因为,所以接受原假设,(2)因为,所以接受原假设,(3)因为,所以接受原假设,结果分析,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,假设检验,单个正态总体方差已知的均值检验,问题:总体XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,双边检验
28、,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,单个正态总体方差未知的均值检验,问题:总体XN(,2),2未知,假设 H0:=0;H1:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,单个正态总体均值已知的方差检验,问题:总体XN(,2),已知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,拒绝域
29、,一个正态总体均值未知的方差检验,问题:设总体XN(,2),未知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,双边检验,例4 某炼铁厂的铁水含碳量X在正常情况下服从正态 分布,现对工艺进行了某些改进,从中抽取5炉铁水 测得含碳量如下:4.421,4.052,4.357,4.287, 4.683,据此是否可判断新工艺炼出的铁水含碳量的 方差仍为0.1082(=0.05)?,解 这是一个均值未知,正态总体的方差检验, 用2检验法,由=0.05,得临界值,假设,例4 某炼铁厂的铁水含碳量X在正常情况下服从正态 分布,现对工艺进行了某些改进,从中抽
30、取5炉铁水 测得含碳量如下:4.421,4.052,4.357,4.287, 4.683,据此是否可判断新工艺炼出的铁水含碳量的 方差仍为0.1082(=0.05)?,解,2统计量的观测值为17.8543,因为,所以拒绝原假设,即可判断新工艺炼出的铁水含碳量的方差不是0.1082,例4的计算机实现步骤,1、输入样本数据,存入C1列,3、计算2统计量的观测值,存入k2,2、计算样本的均方差,存入k1,MTBstdev c1 k1,MTB let k2=4*k1*2/0.108*2,4、确定临界值,MTB invcdf 0.025 c4; SUBC chisquare 4. MTB invcdf
31、0.975 c5; SUBC chisquare 4.,0.975,0.025,?,临界值,17.8543,观测值,拒绝原假设,作业 P160-P161 3、4、5、7、13 预习试验二,两个正态总体 的 假 设 检 验,单个正态总体方差已知的均值检验,问题:总体XN(,2),2已知,假设 H0:=0;H1:0,构造U统计量,由,U检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0为真的前提下,H0:=0;H1:0,H0:=0;H1:0,或,单 边 检 验,拒绝域为,拒绝域为,单个正态总体方差未知的均值检验,问题:总体XN(,2),2未知,假设 H0:=0;H1
32、:0,构造T统计量,由,T检验,双边检验,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定拒绝域,H0:=0;H1:0,H0:=0;H1:0,或,单边检验,拒绝域为,拒绝域为,单个正态总体均值已知的方差检验,问题:总体XN(,2),已知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,拒绝域,一个正态总体均值未知的方差检验,问题:设总体XN(,2),未知,构造2统计量,由,如果统计量的观测值,则拒绝原假设;否则接受原假设,确定临界值,或,2检验,假设,双边检验,有时,我们需要比较两总体的参数 是否存在显著差异。比如,两个农作物 品种的产量
33、,两种电子元件的使用寿命, 两种加工工艺对产品质量的影响,两地 区的气候差异等等。,引 言,两个正态总体的均值检验,已知 ,检验H0:,1、方差已知,检验均值相等,问题:,则,所以,,从而,当H0成立时,,对给定的检验水平 得H0的拒绝域:,U检验法,两个正态总体的均值检验,已知 ,检验H0:,1、方差已知,检验均值相等,问题:,解 假设:,因为:,所以接受H0假设,即认为 A、B两法的平均产量无统计意义。,例1 据以往资料,已知某品种小麦每4平方米产量(千克)的 方差为 。今在一块地上用A,B 两法试验,A 法设12个样本点,得平均产量 ;B 法设8个样本 点,得平均产量 ,试比较A、B两法
34、的平均产量 是否有统计意义。,两个正态总体的均值检验,2、方差未知,但两个总体的方差相等,检验均值相等,问题:,未知 ,但知 ,检验H0:,由P107 定理5.3,知,对给定的检验水平 得H0的拒绝域:,若 H0 成立,则,T检验法,两个正态总体的均值检验,2、方差未知,但两个总体的方差相等,检验均值相等,解 假设:,所以拒绝H0假设,即认为 A、B两种灯泡的平均寿命 有统计意义。,未知 ,检验假设H0:,若假设H0成立,则,对给定的检验水平 得H0的拒绝域:,及,两个正态总体的方差检验,问题:,由P109 定理5.4 ,知,F检验,例3 (P161 Ex20)测得两批电子器材的样本的电阻为:
35、 (单位:) 第一批:0.140 0.138 0.143 0.142 0.144 0.137 第二批:0.135 0.140 0.142 0.136 0.138 0.140 设这两批器材的电阻均服从正态分布,试检验 H0:,解 这是一个两正态总体的方差检验问题,用F检验法,由样本观测数据得,假设,所以,而,所以,接受原假设,即可认为两批电子器材的方差相等,例4 P161 14 对甲、乙两种玉米进行评比试验,得如下产量资料: 甲:951 966 1008 1082 983 乙:730 864 742 774 990 问这两种玉米的产量差异有没有统计意义?,解 先对方差作检验:,因为,所以可认为甲
36、、乙两种玉米的方差没有显著差异 即可认为,例4 对甲、乙两种玉米进行评比试验,得如下产量资料 甲:951 966 1008 1082 983 乙:730 864 742 774 990 问这两种玉米的产量差异有没有统计意义?,解:再对均值作检验:,因为已假设方差相等,故用 T 检验。,所以拒绝原假设 H20,即认为两种玉米的产量差异 有统计意义。,单因素试验 的方差分析,在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,然后对测试结果进行分析
37、,作出判断。方差分析就是分析测试结果的一种方法。,引 言,基 本 概 念,试验指标试验结果。,可控因素在影响试验结果的众多因素中,可人为 控制的因素。,水平可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。,单因素试验如果在一项试验中只有一个因素改变, 其它的可控因素不变,则该类试验称为 单因素试验。,引例,例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下:,灯泡的使用寿命试验指标,灯丝的配料方案试验因素(唯一的一个),四种配料方案(甲乙丙丁)四个水平,因此,本例是一个四水平的单因素试验。
38、,引 例,用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为 四个总体。假设X1,X2,X3,X4相互独立,且服从方差 相同的正态分布,即XiN(i,2)(i=1,2,3,4),本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立,我们的目的是通过试验数据来判断因素 A 的不同水平对试验指标是否有影响。,设 A 表示欲考察的因素,它的 个不同水平,对应的指标视作 个总体 每个水平下,我们作若干次重复试验: (可等重复也可不等重复),同一水平的 个结果,就是这个总体 的一个样本:,单因素试验的方差分析,单因素试验资料表,纵向个体间的差异称为随机误差(组内差异),由试验造成;横向个体
39、间的差异称为系统误差(组间差异),由因素的不同水平造成。,由于同一水平下重复试验的个体差异是随机误差,所以设:,其中 为试验误差,相互独立且服从正态分布,线性统计模型,单因素试验的方差分析的数学模型,具有方差齐性。,相互独立,从而各子样也相互独立。,首先,我们作如下假设:,即,令 (其中 )称为一般平均值。,称为因素A的第 个水平 的效应。,则线性统计模型变成,于是检验假设:,等价于检验假设:,显然有:,整个试验的均值,考察统计量,经恒等变形,可分解为:,其中,反映的是各水平平均值偏离总平均值的偏离程度。,如果H0 成立,则SSA 较小。,若H0成立,则,总离差平方和,见书P168,其中,这里
40、,反映的是重复试验种随机误差的大小。,表示水平Ai的随机误差; 表示整个试验的随机误差,若假设 成立,则,由P106定理5.1可推得:,将 的自由度分别记作,则,(记 ,称作均方和),(各子样同分布),则,(记 ,称作均方和),对给定的检验水平 ,由,得H0 的拒绝域为:,F 单侧检验,结论:方差分析实质上是假设检验,从分析离差平方和入手,找到F统计量,对同方差的多个正态总体的均值是否相等进行假设检验。单因素试验中两个水平的均值检验可用第七章的T检验法。,思考:为什么此处只做单侧检验?,(1)若 ,则称因素的差异极显著(极有统计意义),或称因素A的影响高度显著,这时作标记 ;,约 定,(2)若
41、 ,则称因素的差异显著(差异 有统计意义),或称因素A的影响显著,作标记 ;,(3)若 ,则称因素A有一定影响,作标记( );,(4)若 ,则称因素A无显著影响(差异无统计意义)。,注意:在方差分析表中,习惯于作如下规定:,简便计算公式:,其中,同一水平下观测值 之和,所以观测 值之和,例2 P195 2 以 A、B、C 三种饲料喂猪,得一个月后每猪 所增体重(单位:500g)于下表,试作方差分析。,解:,解:,不同的饲料对猪的体重的影响极有统计意义。,列方差分析表,例2的上机实现步骤,1、输入原始数据列,并存到A,B,C列;,2、选择StatANOVAone-way(unstacked),不
42、同的饲料对猪的体重的影响极有统计意义。,定理 在单因素方差分析模型中,有,如果H0不成立,则,所以,,即H0不成立时,,有大于1的趋势。,所以H0为真时的小概率事件应取在F值较大的一侧。,双因素试验方差分析,双因素试验的方差分析,在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。,例如:某些合金,当单独加入元素A或元素B时, 性能变化不大,但当同时加入元素A和B时,合金性 能的变化就特别显著。,统计学上把多因素不同水平搭配对试验指标的 影响称为交互作用。交互作用在多因素的方差分析 中,把它当成一个新因素来处理。
43、,我们只学习两个因素的方差分析,更多因素的 问题,用正交试验法比较方便。,无交互作用的双因素试验的方差分析,数学模型,假设某个试验中,有两个可控因素在变化,因素A有a个水平,记作A1,A2,Aa;因素B有b个水平,记作B1,B2,.Bb;则A与B的不同水平组合AiBj(i=1,2,a;j=1,2,b)共有ab个,每个水平组合称为一个处理,每个处理只作一次试验,得ab个观测值Xij,得双因素无重复实验表,双因素无重复(无交互作用)试验资料表,无交互作用的双因素试验的方差分析,线性统计模型,基本假设(1) 相互独立; (2) ,(方差齐性)。,其中,所有期望值的总平均,水平Ai对试验结果的效应,水
44、平Bj对试验结果的效应,试验误差,特性:,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,要分析因素A,B的差异对试验结果是否有显著 影响,即为检验如下假设是否成立:,总离差平方和的分解定理,仿单因素方差分析的方法,考察总离差平方和,可分解为:,称为因素A的离差平方和, 反映因素 A 对试验指标的影响。,称为因素B的离差平方和, 反映因素 B 对试验指标的影响。,称为误差平方和,反映试验误差对试验指标的影响。,可推得:,将 的自由度分别记作,,则,若假设 成立,则:,对给定的检验水平 ,,拒绝H01,即A 因素的影响有统计意义。,拒绝H02,即B 因素的影响有统计意义。,双因素(
45、无交互作用)试验的方差分析表,注意,各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。,双因素(无交互作用)试验的方差分析表,简便计算式:,其中:,例1 设甲、乙、丙、丁四个工人操作机器、各一天, 其产品产量如下表,问工人和机器对产品产量是否有显著 影响?,解 基本计算如原表,结论:工人对产品的产量有显著影响, 机器对产品的产量有极显著影响。,例1的上机操作,对应例1 的数据输入方式,原始数据,行因素水平,列因素水平,(A),(B),工人对产品产量有显著影响,而机器对产品产量的影响极显著。,有交互作用的双因素试验的方差分析,线性统计模型,基本假设(1) 相互独立; (2)
46、 ,(方差齐性)。,有检验交互作用的效应,则两因素A,B的不同水 平的搭配必须作重复试验。,处理方法:把交互作用当成一个新因素来处理, 即把每种搭配AiBj看作一个总体Xij。,观测值,总平均,因素A 的效应,因素B 的效应,交互作用 的效应,试验误差,有交互作用的双因素试验的方差分析,线性统计模型,其中,所有期望值的总平均,水平Ai对试验结果的效应,水平Bj对试验结果的效应,试验误差,交互效应,特性:,要判断因素A,B及交互作用AB对试验结果是否 有显著影响,即为检验如下假设是否成立:,总离差平方和的分解定理,仿单因素方差分析的方法,考察总离差平方和,可分解为:,SSA称为因素A的离差平方和
47、,反映因素 A 对试验指标的影响。 SSB称为因素B的离差平方和,反映因素 B 对试验指标的影响。SSAB称为交互作用的离差平方和,反映交互作用AB对试验指标的影响。SSE称为误差平方和,反映试验误差对试验指标的影响。,若“各因素、各水平及其交互作用的影响无统计意义”的假设 成立,则,则,可推得:,由 作右侧假设检验来考察各因素及因素 间的交互作用对试验指标的影响力.,双因素有重复(有交互作用)试验资料表,因素 A,因素 B,双因素(有重复)试验方差分析表,各离差平方和的计算公式参看出P180_181,这里,例3 P183 例题2,因素A(能量),因素 B(蛋白质),输入数据时,C2表示行因素
48、 水平,C3表示列因素水平。 第几次重复不必列明,软件 自会识别。,结果显示如P185,均0.01,饲料中能量的高低、蛋白质含量的不同 及两者的交互作用对鱼的体重的影响极 有统计意义。,各因素,各水平,各交互作用下的均值。,作业 P195 3 4(借助软件完成) 预习第三节 正交试验设计 及其统计分析,正交试验设计 及其统计分析,引言,试验设计是数理统计中的一个较大的分支,它的 内容十分丰富。我们简介正交试验设计。,正交试验设计是利用“正交表”进行科学地安排与 分析多因素试验的方法。其主要优点是能在很多试验 方案中挑选出代表性强的少数几个试验方案,并且通 过这少数试验方案的试验结果的分析,推断
49、出最优方 案,同时还可以作进一步的分析,得到比试验结果本 身给出的还要多的有关各因素的信息。,正交表是一种特别的表格,是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。,正交表的记号及含义,记号及含义,如,表示,?,表示各因素的水平数为2, 做8次试验,最多考虑7个 因素(含交互作用)的正 交表。,正交表的特点,1、正交表中任意一列中,不同的数字出现的次数相等;,表示:在试验安排中,所挑选出来的水平组合是均匀 分布的(每个因素的各水平出现的次数相同) 均衡分散性,2、正交表中任意两列,把同行的两个数字看成有序数 对时,所有可能的数对出现的次数相同。,表示:任意两因素的各种水平的搭配在所
50、选试验中出现 的次数相等 整齐可比性,这是设计正交试验表的基本准则,正交试验设计的基本步骤,确定目标、选定因素(包括交互作用)、确定水平;,2. 选用合适的正交表;,3. 按选定的正交表设计表头,确定试验方案;,4. 组织实施试验;,5. 试验结果分析。,例1 为了解决花菜留种问题,以进一步提高花菜种 子的产量和质量,科技人员考察了浇水、施肥、病害防 治和移入温室时间对花菜留种的影响,进行了四个因素 各两个水平的正交试验,各因素及其水平如下表:,解 第一步:选择适当的正交表,所以选用正交表,注:也可由试验次数应满足的条件来选择正交表。,若考虑A与B、A与C的交互作用,则,所以还可选用正交表,其
51、中:,由 确定。,是可求出的,而 是未知的,,当不考虑交互作用时:可取,故 N 不是唯一的。,试验次数N的确定原则,如三因素四水平 43 的正交试验至少应安排,次以上的试验。,如三因素四水平 43 并包括第一、二个因素的交互 作用的正交试验至少应安排的试验次数为,若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为,次以上的试验。,又如安排 的混合水平的正交试验至少应安排,所以一般地,有,第二步 表头设计查交互作用表,表示位于第二、第四列的两因素的交互作用要放于第六列。,注意:主效应因素尽量不放交互列。如A、B因素已放C1、C2列,则C 因素就不放C3列。,花菜留种的表头设计
52、,考虑交互作用AB和AC,则例1的表头可设计为,注:第6列为空白列,当随机误差列;也可把第7列 作空白列。一般要求至少有一个空白列。,按正交表 得试验方案:,只需将各列中的数字“1”、“2”分别理解为所填因素 在试验中的水平数,每一行就是一个试验方案。,第三步 按所选定的正交试验方案组织试验,记录试验 结果;,见P192 表8-22,第四步 分析正交试验结果,方法1 直观分析(极差分析),(1)计算极差,确定因素的主次顺序,第j列的极差,或,极差越大,说明这个因素的水平改变对试验结果的 影响越大,极差最大的那个因素,就是最主要的因素。,对例1来说,各因素的主次顺序为,(2)确定最优方案,如果不
53、考虑交互作用,则根据各因素在各水平下的 总产量或平均产量的高低确定最优方案;如果考虑交互 作用,则取各种搭配下产量的平均数,按优化标准确定 最优方案。,本例中,不考虑交互作用,在方案A1B2C2D2最优, 但交互作用AC是第三重要因素,所以需考虑A、C的搭 配对实验指标的影响,取AiBj的各种搭配的平均数,结 果是A1与C1 搭配最好,故本问题的最优方案为 A1B2C1D2。,方法2 方差分析法,基本思想与双因素方差分析方法一致:将总的 离差平方和分解成各因素及各交互作用的离差平方 和,构造F统计量,对各因素是否对试验指标具有 显著影响,作F检验。,要求:能利用MINITAB完成正交试验的方差
54、分析。,例1的上机操作,按正交表及试验结果输入数据。,不写C3 不写C5 要表明是交互作用,F1 表示该因子的影响力比试验 误差更小,不必理会,(严重无统计 意义)去掉这些因子,将它们造成的 微小差异归到试验误差中(软件会自 动处理),则可突显其它因子的影响。,去掉C1*C2,C6后再作方差分析。,由 P 值知,因素A(C1)的影响力最大, B ( C2 )次之, 再次之是交互作用A*C ( C1*C4 )。按此顺序,再根据各 相关因子各水平的均值确定最优组合。,选A1,选B2,在选A1的前题下选C1,最后,C6(D) 无统计意义,选那 一个水平都可以, 故得两最优组合: A1B2C1D1和A
55、1B2C1D2,作业,P198 6(利用软件MINITAB完成方差分析法) 预习:第九章 第一节,一元回归分析,在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:,相关关系问题,(1)确定性关系函数关系;,(2)非确定性关系相关关系;,相关关系表现为这些变量之间有一定的依赖关系,但这种关系并不完全确定,它们之间的关系不能精确地用函数表示出来,这些变量其实是随机变量,或至少有一个是随机变量。,相关关系举例,例如:在气候、土壤、水利、种子和耕作技术等条件基本相同时,某农作物的亩产量 Y 与施肥量 X 之间有一定的关系,但施肥量相同,亩产量却不一
56、定相同。亩产量是一个随机变量。,又如:人的血压 Y 与年龄 X 之间有一定的依赖关系,一般来说,年龄越大,血压越高,但年龄相同的两个人的血压不一定相等。血压是一个随机变量。,农作物的亩产量与施肥量、血压与年龄之间的这种关系称为相关关系,在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量。一般在讨论相关关系问题中,可控变量称为自变量,不可控变量称为因变量。,函数关系与相关关系的区别,相关关系,影响,的值,,函数关系,决定,的值,,因此,统计学上讨论两变量的相关关系时,是设法 确定:在给定自变量 的条件下,因变量 的 条件数学期望,不能确定。,回归分析的概念,研究一个随机变量与一个(或
57、几个)可控变量之间 的相关关系的统计方法称为回归分析。,只有一个自变量的回归分析称为一元回归分析;多 于一个自变量的回归分析称为多元回归分析。,引进回归函数,称为回归方程,回归分析主要包括三方面的内容,(1)提供建立有相关关系的变量之间的数学关系 式(称为经验公式)的一般方法;,(2)判别所建立的经验公式是否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著的;,回归分析的内容,(3)利用所得到的经验公式进行预测和控制。,一元线性回归模型,如果试验的散点图中各点呈直线状,则假设这批数 据的数学模型为,设随机变量Y依赖于自变量x,作n次独立试验,得n对观测值: 称这n对观测
58、值为容量为n的一个子样,若把这n对观测值在平面直角坐标系中描点,得到试验的散点图.,则,图 9-1,因此,其中 是与 无关的未知常数。,(9.1),一元线性回归模型,一般地,称如下数学模型为一元线性模型,而 称为回归函数或回归方程。,称为回归系数。,回归函数(方程)的建立,由观测值 确定的回归函数 ,应使得 较小。,考虑函数,问题:确定 ,使得 取得极小值。,这是一个二元函数的无条件极值问题。,回归方程的建立,令,回归方程的建立,记,表示对 的估计值,则变量 对 的回归方程为,简写为,最小二乘法,回归方程有效性的检验,对于任何一组数据 ,都可按最 小二乘法确定一个线性函数,但变量 与 之间是否真 有近似于线性函数的相关关系呢?尚需进行假设检验。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小镇规划面试题及答案
- 农民职称面试题及答案
- 园区护士考试题及答案
- 艾滋病和性健康教育讲座
- 企业员工防疫培训课件
- 绿化阳台土方案
- 健康火锅餐饮采购方案
- 无烟单位督察方案
- 景区营业应急预案方案
- 店铺拆迁方案
- 2025年军队文职人员(司机岗)历年考试真题库及答案(重点300题)
- 2025年小红书账号经营权转协议
- 《就业指导与礼仪》课件
- 数学竞赛辅导:《高中数学竞赛辅导班》教案
- 眼视光医学病例解析与现代治疗技术
- 初中语文教材结构分析课件
- 基于核心素养的单元整体教学设计
- 外协件检验流程
- 《浅析5G通信的军事应用》2300字
- 拖欠工程款上访信范文
- 2025四川成都市新都区事业单位招聘历年管理单位笔试遴选500模拟题附带答案详解
评论
0/150
提交评论