参数估计和假设检验.ppt_第1页
参数估计和假设检验.ppt_第2页
参数估计和假设检验.ppt_第3页
参数估计和假设检验.ppt_第4页
参数估计和假设检验.ppt_第5页
已阅读5页,还剩233页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2008年8月,第 4 章 参数估计和假设检验,2008年8月,第 4 章 参数估计和假设检验,4.1 抽样调查的基本概念 4.2 抽样估计的基本原理 4.3 参数估计 4.4 样本容量的确定 4.5 假设检验,2008年8月,4.1 抽样估计的基本概念,总体分布 样本分布 抽样分布,2008年8月,总体中各元素的观察值所形成的分布 分布通常是未知的 可以假定它服从某种分布,总体分布 (population distribution),2008年8月,总体分布(Population Distribution)是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。例如,当研究某一企业职工收入情况时,该企业全体职工的收入状况的频数分布,以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数,从不同角度综合描述了这一总体的分布特征。 我们往往是通过对构成总体的部分个体进行观察,即通过样本数据计算的统计量,例如样本均值、样本方差、样本偏态系数和样本峰度系数,以及样本的频数分布来推断总体参数,用样本分布来估计总体分布。,2008年8月,一个样本中各观察值的分布 也称经验分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布,样本分布 (sample distribution),2008年8月,样本分布(Sample Distribution)是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量。 样本中的个体都是来自于总体,具有总体的相关信息和基本特征,样本分布是总体分布的一个映象,一个缩影。当样本容量充分大时,样本分布趋近于总体分布。 样本分布是指某一个具体的样本中的个体数量特征。由于样本是随机抽取的,每一次抽取的样本中的个体不尽相同,每一个具体的样本分布也会与对应的总体分布存在或大或小的偏误,根据样本计算的统计量是随机变量。 (随机抽取的)样本的分布与客观的总体分布之间的误差,需要借助抽样分布概念。,2008年8月,样本统计量的概率分布 是一种理论概率分布 随机变量是 样本统计量 样本均值, 样本比例,样本方差等 结果来自容量相同的所有可能样本 提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据,抽样分布 (sampling distribution),2008年8月,抽样分布(Sampling Distribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。 抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。,2008年8月,抽样分布 (sampling distribution),2008年8月,样本容量与样本个数,(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。 (2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。,2008年8月,总体参数与样本统计量,(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。 (2)样本统计量:与总体参数对应的是样本统计量。,2008年8月,重复抽样与不重复抽样,(1)重复抽样:是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一次样本单位的抽取。 (2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一次抽样。,2008年8月,4.2 抽样估计原理,一、样本统计量的抽样分布 (一个总体参数推断时) (一)样本均值的抽样分布 (二)样本比例的抽样分布 (三)抽样方差的抽样分布,2008年8月,样本均值的抽样分布,2008年8月,容量相同的所有可能样本的样本均值的概率分布 一种理论概率分布 进行推断总体总体均值的理论基础,样本均值的抽样分布,2008年8月,样本均值的抽样分布 (例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。总体的均值、方差及分布如下,均值和方差,2008年8月,样本均值的抽样分布 (例题分析), 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,2008年8月,样本均值的抽样分布 (例题分析), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,2008年8月,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,总体分布,2008年8月,样本均值的抽样分布 与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为,方差为2/n。即XN(,2/n),2008年8月,中心极限定理 (central limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,2008年8月,中心极限定理 (central limit theorem),的分布趋于正态分布的过程,2008年8月,抽样分布与总体分布的关系,2008年8月,样本均值的数学期望 样本均值的方差 重复抽样 不重复抽样,样本均值的抽样分布 (数学期望与方差),2008年8月,样本均值的抽样分布 (数学期望与方差),比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n,2008年8月,均值的抽样标准误,所有可能的样本均值的标准差,测度所有样本均值的离散程度 小于总体标准差 计算公式为,2008年8月,样本比例的抽样分布,2008年8月,总体(或样本)中具有某种属性的单位与全部单位总数之比 不同性别的人与全部人数之比 合格品(或不合格品) 与全部产品总数之比 总体比例可表示为 样本比例可表示为,比例 (proportion),2008年8月,容量相同的所有可能样本的样本比例的概率分布 当样本容量很大时,样本比例的抽样分布可用正态分布近似 一种理论概率分布 推断总体总体比例的理论基础,样本比例的抽样分布,2008年8月,样本比例的数学期望 样本比例的方差 重复抽样 不重复抽样,样本比例的抽样分布 (数学期望与方差),2008年8月,样本方差的抽样分布,2008年8月,样本方差的分布,对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为 (n-1) 2分布,即,2008年8月,由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来 设 ,则 令 ,则 Y 服从自由度为1的2分布,即 当总体 ,从中抽取容量为n的样本,则,2分布 (2 distribution),2008年8月,分布的变量值始终为正 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自由度) 可加性:若U和V为两个独立的2分布随机变量,U2(n1), V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布,2分布 (性质和特点),2008年8月,c2)分布 (图示),2008年8月,二、 样本统计量的抽样分布 (两个总体参数推断时),(一)两个样本均值之差的抽样分布 (二)两个样本比例之差的抽样分布 (三)两个样本方差比的抽样分布,2008年8月,两个样本均值之差的抽样分布,2008年8月,两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差 方差为各自的方差之和,两个样本均值之差的抽样分布,2008年8月,两个样本均值之差的抽样分布,2008年8月,两个样本比例之差的抽样分布,2008年8月,两个总体都服从二项分布 分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似 分布的数学期望为 方差为各自的方差之和,两个样本比例之差的抽样分布,2008年8月,两个样本方差比的抽样分布,2008年8月,两个样本方差比的抽样分布,两个总体都为正态分布,即X1N(1,12)的一个样本, Y1,Y2, ,Yn2是来自正态总体X2N(2,22 ) 从两个总体中分别抽取容量为n1和n2的独立样本 两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1) F分布,即,2008年8月,由统计学家费舍(R.A.Fisher) 提出的,以其姓氏的第一个字母来命名则 设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则 称F为服从自由度n1和n2的F分布,记为,F分布 (F distribution),2008年8月,F分布 (图示), 不同自由度的F分布,2008年8月,4.3 参数估计,一、 参数估计的一般问题 二、 一个总体参数的区间估计 三、两个总体参数的区间估计,2008年8月,参数估计在统计方法中的地位,2008年8月,统计推断的过程,2008年8月,一、 参数估计的一般问题,(一)估计量与估计值 (二)点估计与区间估计 (三)评价估计量的标准,2008年8月,估计量与估计值,2008年8月,估计量:用于估计总体参数的随机变量 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值 的一个估计量 参数用 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 x =80,则80就是的估计值,估计量与估计值 (estimator & estimated value),2008年8月,点估计与区间估计,2008年8月,参数估计的方法,2008年8月,点估计 (point estimate),用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:用两个样本均值之差直接作为总体均值之差的估计 2. 没有给出估计值接近总体参数程度的信息 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,2008年8月,区间估计 (interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在7585之间,置信水平是95%,2008年8月,区间估计的图示,2008年8月,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - 为是总体参数未在区间内的比例 常用的置信水平值有 99%, 95%, 90% 相应的 为0.01,0.05,0.10,置信水平,2008年8月,由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,置信区间 (confidence interval),2008年8月,置信区间与置信水平,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,2008年8月,影响区间宽度的因素,1. 总体数据的离散程度,用 来测度 样本容量, 3. 置信水平 (1 - ),影响 z 的大小,2008年8月,评价估计量的标准,2008年8月,无偏性 (unbiasedness),无偏性:估计量抽样分布的数学期望等于被 估计的总体参数,2008年8月,有效性 (efficiency),有效性:对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效,2008年8月,一致性 (consistency),一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数,2008年8月,二、 一个总体参数的区间估计,(一)总体均值的区间估计 (二)总体比例的区间估计 (三)总体方差的区间估计,2008年8月,一个总体参数的区间估计,2008年8月,总体均值的区间估计 (正态总体、已知,或非正态总体、大样本),2008年8月,总体均值的区间估计 (大样本),1. 假定条件 总体服从正态分布,且方差() 已知 如果不是正态分布,可由正态分布来近似 (n 30) 使用正态分布统计量,总体均值 在1-置信水平下的置信区间为,2008年8月,总体均值的区间估计 (例题分析),【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95%,2008年8月,总体均值的区间估计 (例题分析),解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根据样本数据计算得: 总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44克109.28克之,2008年8月,总体均值的区间估计 (例题分析),【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间,2008年8月,总体均值的区间估计 (例题分析),解:已知n=36, 1- = 90%,z/2=1.645。根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为,投保人平均年龄的置信区间为37.37岁41.63岁,2008年8月,总体均值的区间估计 (正态总体、未知、小样本),2008年8月,总体均值的区间估计 (小样本),1. 假定条件 总体服从正态分布,且方差() 未知 小样本 (n 30) 使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,2008年8月,t 分布,分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,2008年8月,总体均值的区间估计 (例题分析),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间,2008年8月,总体均值的区间估计 (例题分析),解:已知N(,2),n=16, 1- = 95%,t/2=2.131。根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,2008年8月,总体比例的区间估计,2008年8月,总体比例的区间估计,1. 假定条件 总体服从二项分布 可以由正态分布来近似 使用正态分布统计量,3. 总体比例在1-置信水平下的置信区间为,2008年8月,总体比例的区间估计 (例题分析),【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知 n=100,p65% , 1-= 95%,z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35%,2008年8月,总体方差的区间估计,2008年8月,总体方差的区间估计,1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 总体方差 2 的点估计量为S2,且,4. 总体方差在1-置信水平下的置信区间为,2008年8月,总体方差的区间估计 (图示),2008年8月,总体方差的区间估计 (例题分析),【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表7所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间,2008年8月,总体方差的区间估计 (例题分析),解:已知n25,1-95% ,根据样本数据计算得s2 =93.21 2置信度为95%的置信区间为,该企业生产的食品总体重量标准差的的置信区 间为7.54克13.43克,2008年8月,三、 两个总体参数的区间估计,(一)两个总体均值之差的区间估计 (二)两个总体比例的之差区间估计 (三)两个总体方差比的区间估计,2008年8月,两个总体参数的区间估计,2008年8月,两个总体均值之差的区间估计 (独立大样本),2008年8月,两个样本均值之差的抽样分布,2008年8月,两个总体均值之差的估计 (大样本),1. 假定条件 两个总体都服从正态分布,1、 2已知 若不是正态分布, 可以用正态分布来近似(n130和n230) 两个样本是独立的随机样本 使用正态分布统计量Z,2008年8月,两个总体均值之差的估计 (大样本),1. 1、 2已知时,两个总体均值之差1-2在1- 置信水平下的置信区间为,1、 2未知时,两个总体均值之差1-2在1- 置信水平下的置信区间为,2008年8月,两个总体均值之差的估计 (例题分析),【例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立地抽取两个随机样本,有关数据如下表 。建立两所中学高考英语平均分数之差95%的置信区间,2008年8月,两个总体均值之差的估计 (例题分析),解: 两个总体均值之差在1-置信水平下的置信区间为,两所中学高考英语平均分数之差的置信区间为 5.03分10.97分,2008年8月,两个总体均值之差的区间估计 (独立小样本),2008年8月,两个总体均值之差的估计 (小样本: 12=22 ),1. 假定条件 两个总体都服从正态分布 两个总体方差未知但相等:1=2 两个独立的小样本(n130和n230) 总体方差的合并估计量,估计量X1-X2的抽样标准差,2008年8月,两个总体均值之差的估计 (小样本: 12=22 ),两个样本均值之差的标准化,两个总体均值之差1-2在1- 置信水平下的置信区间为,2008年8月,两个总体均值之差的估计 (例题分析),【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间,2008年8月,两个总体均值之差的估计 (例题分析),解: 根据样本数据计算得 合并估计量为:,两种方法组装产品所需平均时间之差的置信区间为 0.14分钟7.26分钟,2008年8月,两个总体均值之差的估计 (小样本: 1222 ),1. 假定条件 两个总体都服从正态分布 两个总体方差未知且不相等:12 两个独立的小样本(n130和n230) 使用统计量,2008年8月,两个总体均值之差的估计 (小样本: 1222 ),两个总体均值之差1-2在1- 置信水平下的置信区间为,2008年8月,两个总体均值之差的估计 (例题分析),【例】沿用前例。假定第一种方法随机安排12个工人,第二种方法随机安排8个工人,即n1=12,n2=8 ,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间,2008年8月,两个总体均值之差的估计 (例题分析),解: 根据样本数据计算得 自由度为:,两种方法组装产品所需平均时间之差的置信区间为 0.192分钟9.058分钟,2008年8月,两个总体均值之差的区间估计 (匹配样本),2008年8月,两个总体均值之差的估计 (匹配大样本),假定条件 两个匹配的大样本(n1 30和n2 30) 两个总体均值之差d=1-2在1- 置信水平下的置信区间为,2008年8月,两个总体均值之差的估计 (匹配小样本),假定条件 两个匹配的小样本(n1 30和n2 30) 两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1- 置信水平下的置信区间为,2008年8月,两个总体均值之差的估计 (例题分析),【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表 。试建立两种试卷分数之差d=1-2 95%的置信区间,2008年8月,两个总体均值之差的估计 (例题分析),解: 根据样本数据计算得,两种试卷所产生的分数之差的置信区间为6.33分 15.67分,2008年8月,两个总体比例之差区间的估计,2008年8月,1. 假定条件 两个总体服从二项分布 可以用正态分布来近似 两个样本是独立的 2. 两个总体比例之差1- 2在1-置信水平下的置信区间为,两个总体比例之差的区间估计,2008年8月,两个总体比例之差的估计 (例题分析),【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以90%的置信水平估计城市与农村收视率差别的置信区间,2008年8月,两个总体比例之差的估计 (例题分析),解: 已知 n1=500 ,n2=400, p1=45%, p2=32%, 1-=95%, z/2=1.96 1- 2置信度为95%的置信区间为,城市与农村收视率差值的置信区间为6.68%19.32%,2008年8月,两个总体方差比的区间估计,2008年8月,两个总体方差比的区间估计,1. 比较两个总体的方差比 用两个样本的方差比来判断 如果S12/ S22接近于1,说明两个总体方差很接近 如果S12/ S22远离1,说明两个总体方差之间存在差异 总体方差比在1-置信水平下的置信区间为,2008年8月,两个总体方差比的区间估计 (图示),2008年8月,两个总体方差比的区间估计 (例题分析),【例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果: 男学生: 女学生: 试以90%置信水平估计男女学生生活费支出方差比的置信区间,2008年8月,两个总体方差比的区间估计 (例题分析),解:根据自由度 n1=25-1=24 ,n2=25-1=24,查得 F/2(24)=1.98, F1-/2(24)=1/1.98=0.505 12 /22置信度为90%的置信区间为,男女学生生活费支出方差比的置信区间为0.471.84,2008年8月,4.4 样本容量的确定,估计总体均值时样本容量的确定 估计总体比例时样本容量的确定 估计两个总体均值之差时样本容量的确定 估计两个总体比例之差时样本容量的确定,2008年8月,估计总体均值时样本容量的确定,2008年8月,估计总体均值时样本容量n为 样本容量n与总体方差2、边际误差E、可靠性系数Z或t之间的关系为 与总体方差成正比 与边际误差成反比 与可靠性系数成正比,估计总体均值时样本容量的确定,其中:,2008年8月,估计总体均值时样本容量的确定 (例题分析),【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?,2008年8月,估计总体均值时样本容量的确定 (例题分析),解: 已知 =2000,E=400, 1-=95%, z/2=1.96 12 /22置信度为90%的置信区间为,即应抽取97人作为样本,2008年8月,估计总体比例时样本容量的确定,2008年8月,根据比例区间估计公式可得样本容量n为,估计总体比例时样本容量的确定,E的取值一般小于0.1 未知时,可取最大值0.5,其中:,2008年8月,估计总体比例时样本容量的确定 (例题分析),【例】根据以往的生产统计,某种产品的合格率约为90%,现要求边际误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?,解:已知=90%,=0.05, Z/2=1.96,E=5%,应抽取的样本容量为,应抽取139个产品作为样本,2008年8月,估计两个总体均值之差时 样本容量的确定,2008年8月,设n1和n2为来自两个总体的样本,并假定n1=n2 根据均值之差的区间估计公式可得两个样本的容量n为,估计两个总体均值之差时 样本容量的确定,其中:,2008年8月,估计两个总体均值之差时样本容量的确定 (例题分析),【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班12=90 ,普通班 22=120 。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查?,English,2008年8月,估计两个总体均值之差时样本容量的确定 (例题分析),解: 已知12=90,22=120,E=5, 1-=95%,z/2=1.96,即应抽取33人作为样本,2008年8月,估计两个总体比例之差时 样本容量的确定,2008年8月,设n1和n2为来自两个总体的样本,并假定n1=n2 根据比例之差的区间估计公式可得两个样本的容量n为,估计两个总体比例之差时 样本容量的确定,其中:,2008年8月,估计两个总体比例之差时样本容量的确定 (例题分析),【例】一家瓶装饮料制造商想要估计顾客对一种新型饮料认知的广告效果。他在广告前和广告后分别从市场营销区各抽选一个消费者随机样本,并询问这些消费者是否听说过这种新型饮料。这位制造商想以10%的误差范围和95%的置信水平估计广告前后知道该新型饮料消费者的比例之差,他抽取的两个样本分别应包括多少人?(假定两个样本容量相等),2008年8月,估计两个总体比例之差时样本容量的确定 (例题分析),解: E=10%, 1-=95%,z/2=1.96,由于没有的信息,用0.5代替,即应抽取193个消费者作为样本,2008年8月,4.5 假设检验,一、 假设检验的基本问题 二、一个正态总体参数的检验 三、两个正态总体参数的检验 四、假设检验中的其他问题,2008年8月,假设检验在统计方法中的地位,2008年8月,一、假设检验的基本问题,(一)假设问题的提出 (二)假设的表达式 (三)两类错误 (四)假设检验中的值 (五)假设检验的另一种方法 (六)单侧检验,2008年8月,假设检验的概念与思想,2008年8月,什么是假设? (hypothesis), 对总体参数的的数值所作的一种陈述 总体参数包括总体均值、比例、方差等 分析之前必需陈述,我认为该地区新生婴儿的平均体重为3190克!,2008年8月,什么是假设检验? (hypothesis testing),事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立 有参数假设检验和非参数假设检验 采用逻辑上的反证法,依据统计上的小概率原理,2008年8月,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,2008年8月,假设检验的过程,2008年8月,假设检验的步骤 提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,2008年8月,提出原假设和备择假设, 什么是原假设?(null hypothesis) 待检验的假设,又称“0假设” 研究者想收集证据予以反对的假设 3. 总是有等号 , 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克),为什么叫0假设?,2008年8月, 什么是备择假设?(alternative hypothesis) 与原假设对立的假设,也称“研究假设” 研究者想收集证据予以支持的假设总是有不等号: , 或 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克),提出原假设和备择假设,2008年8月, 什么检验统计量? 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,2008年8月,规定显著性水平 (significant level), 什么显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,2008年8月,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 得出拒绝或不拒绝原假设的结论,2008年8月,假设检验中的小概率原理,2008年8月,假设检验中的小概率原理, 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,2008年8月,假设检验中的两类错误 (决策风险),2008年8月,假设检验中的两类错误,1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta),2008年8月,H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程,2008年8月, 错误和 错误的关系,2008年8月,影响 错误的因素,1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平 当 减少时增大 3. 总体标准差 当 增大时增大 4. 样本容量 n 当 n 减少时增大,2008年8月,假设检验中的 P 值,2008年8月,什么是P 值? (P-value),是一个概率值 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积 被称为观察到的(或实测的)显著性水平 H0 能被拒绝的的最小值,2008年8月,双侧检验的P 值,2008年8月,左侧检验的P 值,2008年8月,右侧检验的P 值,2008年8月,利用 P 值进行检验 (决策准则),单侧检验 若p-值 ,不拒绝 H0 若p-值 /2, 不拒绝 H0 若p-值 /2, 拒绝 H0,2008年8月,双侧检验和单侧检验,2008年8月,双侧检验与单侧检验 (假设的形式),2008年8月,双侧检验 (原假设与备择假设的确定),属于决策中的假设检验 不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格 我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立 建立的原假设与备择假设应为 H0: = 10 H1: 10,2008年8月,双侧检验 (显著性水平与拒绝域 ),2008年8月,双侧检验 (显著性水平与拒绝域),2008年8月,双侧检验 (显著性水平与拒绝域),2008年8月,双侧检验 (显著性水平与拒绝域),2008年8月,单侧检验 (原假设与备择假设的确定),将研究者想收集证据予以支持的假设作为备择假设H1 例如,一个研究者总是想证明自己的研究结论是正确的 一个销售商总是想正确供货商的说法是不正确的 备择假设的方向与想要证明其正确性的方向一致 将研究者想收集证据证明其不正确的假设作为原假设H0 先确立备择假设H1,2008年8月,单侧检验 (原假设与备择假设的确定),一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立 研究者总是想证明自己的研究结论(寿命延长)是正确的 备择假设的方向为“”(寿命延长) 建立的原假设与备择假设应为 H0: 1500 H1: 1500,2008年8月,单侧检验 (原假设与备择假设的确定),一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立 研究者总是想证明自己的研究结论(废品率降低)是正确的 备择假设的方向为“”(废品率降低) 建立的原假设与备择假设应为 H0: 2% H1: 2%,2008年8月,单侧检验 (原假设与备择假设的确定),某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验 检验权在销售商一方 作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的 备择假设的方向为“”(寿命不足1000小时) 建立的原假设与备择假设应为 H0: 1000 H1: 1000,2008年8月,单侧检验 (显著性水平与拒绝域),2008年8月,左侧检验 (显著性水平与拒绝域),2008年8月,左侧检验 (显著性水平与拒绝域),2008年8月,右侧检验 (显著性水平与拒绝域),2008年8月,右侧检验 (显著性水平与拒绝域),2008年8月,二、 一个正态总体参数的检验,(一)检验统计量的确定 (二)总体均值的检验 (三)总体比例的检验 (四)总体方差的检验,2008年8月,一个总体参数的检验,2008年8月,总体均值检验,2008年8月,总体均值的检验 (检验统计量),总体 是否已知?,2008年8月,总体均值的检验 (2 已知或2未知大样本),1. 假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 使用Z-统计量 2 已知: 2 未知:,2008年8月,2 已知均值的检验 (例题分析),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2008年8月,2 已知均值的检验 (例题分析),H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,2008年8月,2 已知均值的检验 (小样本例题分析),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验,2008年8月,2 已知均值的检验 (小样本例题分析),H0: 1020 H1: 1020 = 0.05 n = 16 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,2008年8月,2 未知大样本均值的检验 (例题分析),【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,2008年8月,2 未知大样本均值的检验 (例题分析),H0: 1200 H1: 1200 = 0.05 n = 100 临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时,决策:,结论:,2008年8月,总体均值的检验 (2未知小样本),1. 假定条件 总体为正态分布 2未知,且小样本 2. 使用t 统计量,2008年8月,2 未知小样本均值的检验 (例题分析),【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。,双侧检验,2008年8月,2 未知小样本均值的检验 (例题分析),H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,说明该机器的性能不好,决策:,结论:,2008年8月,2 未知小样本均值的检验 (例题分析),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),单侧检验!,2008年8月,均值的单尾 t 检验 (计算结果),H0: 40000 H1: 40000 = 0.05 df = 20 - 1 = 19 临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,不能认为制造商的产品同他所说的标准不相符,决策:,结论:,2008年8月,总体比例的检验 (Z 检验),2008年8月,适用的数据类型,2008年8月,一个总体比例检验,假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 Z 统计量,0为假设的总体比例,2008年8月,一个总体比例的检验 (例题分析),【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.05),双侧检验,2008年8月,一个总体比例的检验 (例题分析),H0: = 14.7% H1: 14.7% = 0.05 n = 400 临界值(s):,检验统计量:,在 = 0.05的水平上不拒绝H0,该市老年人口比重为14.7%,决策:,结论:,2008年8月,总体方差的检验 (2 检验),2008年8月,方差的卡方 (2) 检验,检验一个总体的方差或标准差 假设总体近似服从正态分布 检验统计量,2008年8月,方差的卡方 (2) 检验 (例题分析),【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05),绿色 健康饮品,绿色 健康饮品,双侧检验,2008年8月,方差的卡方 (2) 检验 (例题分析),H0: 2 = 1 H1: 2 1 = 0.05 df = 25 - 1 = 24 临界值(s):,统计量:,在 = 0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,2008年8月,三、两个正态总体参数的检验,(一)检验统计量的确定 (二)两个总体均值之差的检验 (三)两个总体比例之差的检验 (四)两个总体方差比的检验 (五)检验中的匹配样本,2008年8月,两个正态总体参数的检验,2008年8月,独立样本总体均值之差的检验,2008年8月,两个独立样本之差的抽样分布,2008年8月,两个总体均值之差的检验 (12、 22 已知),1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 检验统计量为,2008年8月,两个总体均值之差的检验 (假设的形式),2008年8月,两个总体均值之差的检验 (例题分析),双侧检验!,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2= 50公斤,x1= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),2008年8月,两个总体均值之差的检验 (例题分析),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 32,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,在 = 0.05的水平上拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,2008年8月,两个总体均值之差的检验 (12、 22 未知且不相等,小样本),检验具有不等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等12 22 检验统计量,其中:,2008年8月,两个总体均值之差的检验 (12、 22 未知但相等,小样本),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 = 22 检验统计量,2008年8月,两个总体均值之差的检验 (例题分析),单侧检验,【例】 “多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论