




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、西安石油大学经管院第六章 抽样推断总体样本指标抽出讲授内容第一节 抽样推断的意义和作用第二节 抽样推断中的基本概念第三节 抽样误差第四节 抽样估计的方法第五节 抽样的组织方式 第六章 抽样推断本章学习目的通过本章的学习,要求掌握抽样推断的基本概念和一般原理;抽样误差的形成原因及其影响因素,抽样平均误差的计算;极限误差的含义、计算;概率度、概率的含义;总体参数的估计等。本章重点、难点 重点:有关抽样推断的基本概念,抽样误差概念的理解、抽样平均误差的计算及影响因素,总体平均数和总体成数的区间估计的方法、必要样本容量的确定。 难点:抽样平均误差的计算、区间估计的方法及样本容量的确定。抽样极限误差、概
2、率度、置信度等指标之间的关系。本章要解决的问题指出全及指标落在这一区间的概率保证程度根据样本指标估计全及指标的区间范围:区间估计应具备的三个要素: 抽样指标 抽样的极限误差 概率保证程度区间估计必须记住的两个公式:或样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有一个已知的不为零的中选机会。第一节 抽样推断的意义和作用一、抽样推断的概念及特点含义:抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性的估计和判断,从而达到对总体现象的认识的一种方法。 特点: 1.它是由部分来推断总体的 2.按照随
3、机的原则抽取调查单位3.抽样误差是不可避免的,但可以事先计算并加以控制 第一节 抽样推断的意义和作用1.在无法或很困难进行全面调查的情况下,可以应用抽样法来了解全面情况, 二、抽样推断的作用有些现象的总体过大,单位过于分散; 具有破坏性和损耗性的检查和试验 2.应用抽样法不但比全面调查有更大的优越性,并可对全面调查的结果加以补充和订正。有些现象可以进行全面调查,但它费时费力、参加人员多、登记性误差大,若用抽样法可省时、省力、及时取得统计资料。第一节 抽样推断的意义和作用可以对全面调查的结果加以补充和订正。3.用于生产过程中产品质量的检查和控制4.可以对总体的某种假设进行检验 第二节 抽样推断中
4、的基本概念一、全及总体和样本总体(一)全及总体(母体、总体)概念:是我们所要了解,认识的对象的全体。它是由具有某种同性质的许多单位构成的集合体。第一节 抽样推断的意义和作用全及总体的单位数用N表,N总是很大的。种类: 按所研究标志的性质不同变量总体属性总体变量总体:对于一个总体,若被研究的标志属于数量标志,则把这个总体称为变量总体。 属性总体:对于一个总体,若被研究的标志属于品质标志,则把这个总体称为属性总体。 第二节 抽样推断中的基本概念(二)样本总体(样本、子样)样本:它是我们所要观察的对象,是从全及总体中随机抽取出来的,代表全及总体的那部分单位所组成的整体样本个数:从总体中可能抽取的样本
5、数目。样本容量:样本中所包含的单位数叫样本容量,通常用n表示。 根据样本单位数的多少不同,样本分为: 大样本:小样本:对于一个问题,全及总体是唯一确定的。而样本总体则不然,从一个全及总体中可能抽出许多个样本。 是唯一确定的总体样本 不是唯一确定的n30n30第二节 抽样推断中的基本概念(一)全及指标 根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性或特征的综合指标叫全及指标,又称总体参数。 一个总体常常有多个参数,它们从各个不同的角度反映总体的分布情况和数量特征。1.变量总体的全及指标 由于变量总体各单位的标志可以用数量来表示,所以可以计算全及总体的平均数 和标准差二、全及指标和
6、抽样指标第二节 抽样推断中的基本概念2.属性总体的全及指标 由于各单位的某些标志不能用数值表示,而只能用一定的述语来描述,所以,全及指标常用成数指标P来表示具有某种属性的单位数占总体单位数的比重;Q表示不具有某种属性的单位数占总体单位数的比重。是非标志的平均数和标准差: 实际中,有时把总体的全部单位分为具有某一属性的单位和不具有某一属性的单位两组,这种用是、不是,有、没有表示的标志叫是非标志。第二节 抽样推断中的基本概念由于是非标志只有两个标志表现,所以用1表示具有某种属性的单位的标志值,用0表示不具有某种属性的单位的标志值。总体单位数用N表示,N1表示具有某种属性的单位,N0表示不具有某种属
7、性的单位,则N=N1+N0 ,N1和N0所占的比重可表示为:第二节 抽样推断中的基本概念第二节 抽样推断中的基本概念全及指标的特点:全及指标所反映的总体范围是确定的,指标的计算方法是已知的,具体指标数值是唯一的,但却又是未知的,只能通过抽样指标进行推断、估算。(二)抽样指标 根据样本总体中各个单位的标志值或标志特征计算的指标,又被称为统计量变量总体: 第二节 抽样推断中的基本概念和全及指标相对应,抽样指标也有抽样平均数、抽样成数P和样本标准差S属性总体:第二节 抽样推断中的基本概念指标 总体参数 (全及指标)指标 统计量(抽样指标)变量总体 变量样本 属性总体 属性样本 性质性质是随机变量,可
8、计算出,但不唯一 是唯一确定的、但未知第二节 抽样推断中的基本概念(一)按取样方式不同抽样方法分重复(置)抽样不重复(置)抽样重复抽样:从总体N个单位中,要随机抽取一个容量为n的样本,每次从总体中抽取一个单位,把它看作一次试验,每次抽出一个单位后,把结果登记下来,又重新放回后,参加下一次抽选,连续进行几次试验构成一个样本。 重复抽样的特点: 重复抽样由n次相互独立的试验构成;每次试验是在相同的条件下进行的(总体单位相等);每个单位中选的机会在各次都是完全一样的。 三、抽样方法和样本的可能数目 第二节 抽样推断中的基本概念【例】总体有A、B、C、D四个单位,要从中随机重复抽取两个单位构成一个样本
9、。第一个单位为A,第二个可能为A、B、C、D;第一个单位可能是A、B、C、D中的任何一个,第一个抽定后,每一个单位均可搭配四个样本,则样本的可能数目为: AA、AB、AC、ADDA、DB、DC、DDCA、CB、CC、CDBA、BB、BC、BD44=42=16一般地说,从总体N单位中,随机重复抽取n个单位构成一个样本,则共可抽取Nn个样本。第二节 抽样推断中的基本概念不重复抽样:从总体N单位中,要抽取一个容量为n样本,每次从总体中抽取一个单位,不再放回参加下一次的抽选,连续进行n次抽取,就构成了一个样本。不重复抽样的特点:样本是由几次连续抽取结果构成,实质上等于一次同时从总体中抽取n个样本单位。
10、连续n次抽选的结果不是相互独立的,第一次抽取的结果影响下一次的抽取,每抽一次,总体的单位就少一个;每个单位的中选机会在各次是不相等的。第二节 抽样推断中的基本概念【例】总体有A、B、C、D四个单位,用随机不重复的方法从中抽取两个单位构成一个样本,则全部可能的样本数为: AB、AC、ADCA、CB、CDBA、BC、BDDA、DB、DC第一个单位有四种抽法,可能是A、B、C、D中的任一个,而第一个单位选定后,第二个单位只有三种抽法,所以全部可能的样本数目为43=12种。一般地说,从总体N个单位中,随机不重复抽取n个单位构成一个样本,则共有样本为: 第二节 抽样推断中的基本概念(二)抽样方法根据对样
11、本要求考虑顺序的抽样不考虑顺序的抽样考虑顺序的抽样:从总体N个单位中抽取n个单位构成样本,不但要考虑样本各单位的组成成份,而且要考虑各单位的中选顺序。 不考虑顺序的抽样:从总体N个单位中抽取n个单位构成一个样本,只考虑样本各单位的构成成份如何,而不考虑各单位的中选顺序。 (三)互叉抽样的样本数目第二节 抽样推断中的基本概念1.考虑顺序的不重复抽样的样本数目(不重复排列数) (即前面不重复抽样的数目) 样本的可能数目记作 Nn样本的可能数目102104第二节 抽样推断中的基本概念.考虑顺序的重复抽样的样本数目(即前面重复抽样、可重复排列数) Nn 样本的可能数目102104因为一个组合的样本,进
12、行排列可有n!个样本 第二节 抽样推断中的基本概念3.不考虑顺序的不重复抽样的样本数目(不重复组合数)样本的可能数目记作样本的可能数目记作 4.不考虑顺序的重复抽样的样本数目(可重复组合数)样本的可能数目记作 Nn样本的可能数目102104!)1()1(!)!(!nnNNNnnNNnACnNnN+-=-=L第二节 抽样推断中的基本概念Nn样本的可能数目102104从以上例子可看到:重复抽样比不重复抽样的样本数目多得多;样本容量增大,则样本的数目也增多。第二节 抽样推断中的基本概念第三节 抽样误差(一)概念 在统计调查中,调查资料与实际情况不一致而产生的两者之间的偏离称为统计误差。这里误差是指抽
13、样指标与总体指标之差的绝对值。 一、抽样误差的意义第三节 抽样误差登记性误差:由于观察、登记、计量、计算上等差错引起的误差。代表性误差:由于样本的结构不足以代表总体的结构而产生的误差。系统性误差:抽取样本单位时,由于违背了随机原则,而有意识地选取较好或较差的单位而产生的样本的代表性不强所引起的误差。也叫非随机性误差。第三节 抽样误差系统性误差和登记性误差都是抽样工作中由于技术,思想工作等所造成的误差,若采取措施是可以预防和避免的。由于被抽选的样本各种各样,只要被抽中的样本内部各单位被研究标志的构成比例与总体有差别,就会出现或大或小的随机性误差,它是抽样调查方法所固有的,是不可避免的,但可以设法
14、加以控制。 随机性误差:是指随机抽样的偶然因素使样本各单位的 结构不足以代表总体各单位的结构,而引起的抽样指标和总体指标之间的差距。也叫抽样误差。第三节 抽样误差抽样组织方式抽样组织方式抽样方法总体标准差样本容量(二)影响抽样误差大小的因素抽样 误差第三节 抽样误差1.样本的单位数n在其它条件不变的情况下,样本的容量越多,抽样误差就会愈小,反之抽样误差就愈大。当n=N时,抽样指标等于总体指标,无误差。2.总体被研究标志的变异程度当总体各单位标志值相等时,则标志变异程度为最小值0,抽样指标完全等于总体指标,抽样误差也就不存在了。在其它条件不改变时,总体被研究标志的变异程度愈小,则抽样误差也愈小。
15、 第三节 抽样误差3.抽样的方法 抽样方法不同,抽样误差也不同,一般来说,重复抽样的误差比不重复抽样的误差要大些。 4.抽样调查的组织方式不同的抽样组织方式,其误差也不同。一般来说,按照等距抽样手类型抽样方法组织抽样调查,由于经过分类或排队,可以使样本的结构与总体的结构类似,因而抽取相同数目的样本容量,其误差要比纯随机抽样小些。第三节 抽样误差二、抽样平均误差(一)含义抽样成数的平均数等于总体成数,E(P)=P,因而通常用抽样平均数或抽样成数的标准差,作为各自的抽样平均误差。由于抽样平均数的平均数等于总体平均 E()=抽样平均误差是反映抽样误差一般水平的指标。设 为抽样平均数的平均误差, 为抽
16、样成数的平均误差,M为全部可能的样本数目,则 第三节 抽样误差【例】某小组有A、B、C、D四个工人为总体,其年龄分别为20、30、40、50岁,从中抽取2人构成一个样本。在重复抽样的条件下,样本的可能数目为42=16个;在不重复抽样的打件下,样本的可能数目为43=12个。下表中红体字为不重复抽样。 总体平均数和总体标准差第三节 抽样误差序号样本变量值样本平均数平均数的离差离差的平方1AA 20 2020152252AB 20 3025101003AC 20 40305254AD 20 5035005BA302025101006BB 30 30305257BC 30 4035008BD30 50
17、405259CA40 203052510CB 40 30350011CC 40 404052512CD 40 50451010013DA 50 20350014DB 50 304052515DC 50 40451010016DD 50 505015225合计16 12560 4200 01000 500第三节 抽样误差样本平均数的平均数抽样平均误差在重复抽样条件下: 不重复抽样条件下:从以上计算结果可以看出:第三节 抽样误差样本平均数的平均数等于总体平均数抽样指标的标准差小于总体的标准 重复抽样的平均误差大于不重复抽样的平均误差上述计算公式能明确地说明抽样平均误差的实质及意义,但它只有理论意义
18、,不能据以实际计算。因为: 连续抽取全部可能出现的样本,并计算出样本指标是不可能的,因此要计算全部可能样本平均数的标准差也是不可能的。全及总体的平均数资料是未知的,抽样推断的目的就是要对它进行估计。 第三节 抽样误差(二)抽样平均误差的简捷计算公式1. 平均数的抽样平均误差重复抽样: 不重复抽样: 第三节 抽样误差重复抽样平均误差公式证明如下: 第三节 抽样误差则上式为:相互独立: 在重复抽样条件下,第三节 抽样误差是不知道的,可以用样本方差一般总体方差 用上例验证简捷公式:重复抽样: 不重复抽样: 和前面定义公式结果一样。S2来代替。第三节 抽样误差2.抽样成数的平均误差 (当N很大时)第三
19、节 抽样误差【例1】在某高校中,随机抽选了400名学生,发现戴眼镜的学生有80人,占20%,计算抽样平均误差。 解:说明抽样平均误差为2%(有的样本成数与总体成数之间的误差大,有的小,但平均来说,误差为2%)。【例2】一批食品罐头共60000桶,随机抽查了300桶,发现其中有6桶不合格,求合格品率的抽样误差。解:第三节 抽样误差不重复抽样: 重复抽样: 由上看出,当N很大时, 第三节 抽样误差三、抽样极限误差(一)抽样极限误差的意义在进行抽样估计时,应根据研究对象的变异程度及分析任务的要求确定一个最大可以充许的误差范围。我们把这种可以允许的误差范围称为抽样极限误差。它等于样本指标可允许变动的上
20、限或下限与总体指标之差的绝对值。抽样误差范围的实际意义是要求被估计的全及指标 或P落在抽样指标一定范围内,即 或 的范围内。第三节 抽样误差 区间 分别称为总体平均数的置信区间、总体成数的置信区间。(二)抽样极限误差的概率度抽样实际误差是无法计算,抽样平均误差可以计算。基于概率估计的要求,抽样极限误差通常需要以抽样平均误差 为标准单位来衡量。用极限误差除以 得相对数z,表示极限误差范围为抽样平均误差的z倍。一般把z称为概率度。第三节 抽样误差这样,估计的概率保证程度(把握度)与联系起来,将转化为z,实际上是将一般正态分布转化为标准正态分布的过程。在大样本条件下,不论总体是否是正态分布,抽样指标
21、都服从或逼近正态分布。正态分布的密度函数为: 它的分布不仅取决于 ,而且也取决于(一般正态分布)第三节 抽样误差概率积分表都是根据标准正态分布密度函数编制的。怎样将一般正态分布转化为标准正态分布?令证明第三节 抽样误差而这里,随机变量不是x,而是 , 服从正态分布这时一般正态分布转化为:第三节 抽样误差【例】要估计某乡粮食亩产量和总产量,从该乡2万亩粮食作物中抽取400亩,求得其平均亩产量为400公斤,粮食亩产量的标准差为=80公斤。如果确定抽样极限误差为5公斤,试估计该乡粮食亩产量的置信区间。上式表示,在 一定时,Z增大,误差范围也增大,估计的可靠程度增大, Z是估计可靠程度的一个参数。第三
22、节 抽样误差即该乡粮食亩产量在4005公斤的范围内,即在395405公斤之间。也可表示为:4001.25解第三节 抽样误差一、抽样估计的置信度(概率保证程度,把握度)第四节 抽样估计的方法抽样估计的置信度:表明抽样指标和总体指标之间的误差不超过范围的概率保证程度。它是概率度的函数。置信度一般用F(z)表示:常用的 与对应的概率度Z如下表: 概率面积概率度Z0.800.900.950.991.281.641.962.58一般抽样估计,其概率保证程度应达到90%-95%,对于特别重大的问题,为了保证估计稳妥可靠,概率保证程度可以提出为99%,即把误差范围扩大到2.58对于一项估计先提出估计可靠性的
23、要求,然后利用概率积分表查出对应的z,根据 得出第四节 抽样估计的方法99f(X)第四节 抽样估计的方法95.4568.282 对一项估计值首先提出极限误差 ,然后根据求出Z,根据概率积分表查Z对应的 ,常用的Z值的对应的概率各证程度如下表:概率度Z1 1.52340.68270.86640.95450.99730.9999一般来说,极限误差在1-2 ,即概率度为1到2之间,但对于许多需要避免作错误判断的采计,可以把误差范围扩大到3 ,以提高估计的可靠性。第四节 抽样估计的方法二、总体参数的估计(点估计,区间估计)(一)点估计(定值估计)1.含义:用抽样指标的值直接作为总体指标的估计值,如用抽
24、样平均数据下接作为相应总体的平均数的估计值,以抽样成数的实际值作为相应总体成数的估计值等。优点: 点估计方法的优点:简便易行,原理直观。 第四节 抽样估计的方法缺点: 没有指出抽样估计的误差以及在一点误差范围内的概率保证程度有多大,估计有一定的风险性,要解决这个问题,就必须采用总值参数的区间估计方法。有效性无偏性优良估计量的标准一致性2.优良估计量的标准 第四节 抽样估计的方法(2)无偏性用抽样指标估计总体指标,要求抽样指标的平均数等于被估计的总体指标。只有:第四节 抽样估计的方法(1)一致性用抽样指标估计总体指标要求:当样本的单位数充分大时,抽样指标也充分地靠近总体指标,即随着样本单位的无限
25、增加,抽样指标与总体指标之差的绝对值为任意小的可能性也趋于必然。就是说虽然每一次的抽样指标和总体指标之间都可能有误差,但在多次反复的估计中,各个抽样指标的平均数应该等于总体指标,即抽样指标的估计平均来说是没有偏误的。证明如下:设总体的平均数: 样本的平均数: 第四节 抽样估计的方法在重复抽样条件下:每个单位被抽中的概率均为n个随机变量算术平均数的数学期望等于n个随机变量各自的数学期望的算术平均数。是相互独立的,第四节 抽样估计的方法3.有效性(最小方差性)用抽样指标的估计总体指标要求作为优良估计量的方差应该比其它估量的方差小。则称 较 为有效估计量 第四节 抽样估计的方法第四节 抽样估计的方法
26、抽样极限误差概率保证程度 区间估计必须具备的三个要素 区间估计须具备的三个要素(二)区间估计抽样指标或p 第一步,抽取样本,计算抽样指标,并计算样本的标准差s、抽样平均误差 第二步,根据 查概率积分表,求概率度z第三步,计算抽样的极限误差,并根据抽样指标和抽样极限误差确定被估计指标的上下限 第四节 抽样估计的方法【例】对一批电子元件进行而用性能检验,按随机重复抽样的方法选取100件作耐用性能试验,所得结果如下表。试在95%的可靠程度下,对该批电子元件的平均耐用时数作出区间估计。耐用时数组中值x原件数fxf900以下900-950950-10001000-10501050-11001100-11
27、501150-12001200以上875957975102510751125117512251263543931875185058503587546225101253525122532580.2517030.256480.25930.25380.254830.2514280.2528730.2532580.2534060.338881.532558.2516350.7543472.2542840.728730.25合 计100105550269475第四节 抽样估计的方法第一步 第二步第四节 抽样估计的方法第三步 根据 查表得z=1.96 第四步 总体平均耐用时数的估计区间为:下限:1055.
28、5-10.17=1045.33(小时)上限:1055.5+10.17=1065.67(小时)结果:我们可以以95%的把握程度使该批电子元件的平均耐用时数在1045.33小时至1065.67小时之间。【例】以例资料为例,设该厂的质量标准规定,元件耐用时数达到1000小时及以上者为合格品,试以95.45的概率保证程度估计该批电子元件的合格品率.第四节 抽样估计的方法解:第一步,计算 第二步 根据 查概率积分表得 z=2第三步 总体成数的估计区间为: 即我们可以以95.45%的概率保证程度使该批电子元件的合格品率落在85.28%至96.72%之间。第四节 抽样估计的方法第一步:抽样指标及抽样平均误差
29、 第二步:根据和抽样指标定出总体指标的置信区间第三步:根据给定的计算z并查表得概率【例】仍用前面资料,对某型号的电子元件进行耐用性能检查,抽查结果如前表,要求耐用时数可允许的误差范围为10.5小时,试估计该批电子元件的平均耐用时数.解:根据 小时,得: 即 则我们可以以95.45%的把握估计该批电子元件的耐用时数在1045小时至1066小时之间。查正态分布概率积分表得: 【例2】按上例,设该厂的产品质量检验标准规定元件而拥有时数达到1000小时以上者为合格品,要求合格品率估计的误差不超过5%,试估计该批电子元件的合格率。解:I 根据已知资料可得:II 根据 得:即 由只1.75查表得F(z)=
30、0.92 则我们可以以92%的概率保证程度使该批电子元件的合格率落在86%至96%之间。 III 求F(z)抽样的组织方式类型抽样简单随机抽样等距抽样整群抽样多阶段抽样第五节 抽样的组织方式一、简单随机抽样抽样误差最小费 用 最 少设计抽样方案时,通常是在误差达到一定要求的条件下选择费用最少的方案(一)简单随机抽样的概念简单随机抽样是不对总体作任何加工整理,直接从总体中随机抽取调查单位的抽样调查方法。简单随机抽样是抽样中最基本的方式。它一般有以下几种取样的方法: 1直接抽选法:直接从调查对象中随机抽取样本单位。 (总体很大,单位很多时) 2抽签法:先给总体的每个单位编上号码,将号码写在纸上,掺
31、和均匀后,从中抽选,抽到哪个就调查哪个单位,直到抽够预先规定的数量为止(单位不很多时) 3随机数字表法:将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。对纯随机抽样调查评价:第五节 抽样的组织方式纯随机抽样是抽样中最基本也是最单纯的方式,从理论上讲,它最符合随机原则,它的抽样误差容易得到理论上的证明,因此,它可以作为更复杂的抽样设计的基础和比较的标准。它一般适合于均匀总体即具有某种特征的单位均匀地分布于总体的各个部分,或各单位标志值之间的差异不很大时。(二)纯随机抽样单位的确定前面已经介绍了纯随机抽样平均数及成数的抽样误差公式,这里仅介绍一下n的确定。一般可以通过抽样极限误
32、差公式。 1.在重复抽样条件下: 第五节 抽样的组织方式抽样成数的单位数为: 2.在不重复抽样条件下:抽样平均数的样本单位数为: 抽样成数的样本单位数为: 抽样平均数的单位数为:第五节 抽样的组织方式二、类型抽样(分层抽样)(一)概念 类型的抽样是先对总体各单位按主要标志分组,然后再从各组中按随机的原则抽选一定的单位构成样本。设总体由N个单位构成,把总体划分为K组,使 样本容量为n的抽样总体,使 这种抽样方法称为类型抽样。 单位构成。然后从每组的 中抽取 个第五节 抽样的组织方式类型抽样的特点:通过分类,可以把总体中标志值或标志特征比较接近的单位归为一组,使各组的分布比较均匀,而且保证每组都有
33、单位中选,这样抽取的样本就具有更大的代表性,因而抽样误差也就相对缩小了,所以在总体各单位标志值大小相差悬殊的情况下,类型抽样比简单随机抽样可以得到更准确的效果。(二)各组样本单位数及抽样平均数的计算1各组样本单位数的确定第五节 抽样的组织方式【例】某地共有居民2万户,按经济收入的高低分为三类,高收入者4000户(20%),中收入者12000户(60%),低收入者4000户(20%)。现要从中抽取200户构成一个样本,则各类型应抽取的样本单位数为:高: 中: 低: 第五节 抽样的组织方式抽样平均数的计算各组的抽样平均数 第i组抽样平均数为:第i组j个单位的标志值之和除以第i组的样本单位数则整个样
34、本的抽样平均数为:第五节 抽样的组织方式【例】调查学生成绩,学生中男生占80%,女20% ,随机抽30人,男生抽24人,女生抽6人,则30名学生的平均成绩为:男生:女生:30名学生:第五节 抽样的组织方式(三)类型抽样的抽样平均误差类型抽样误差和纯随机抽样误差的计算方法只有一个区别:就是用平均组内方差代替总体方差。1平均数的抽样平均误差重复抽样: 其中:第五节 抽样的组织方式不重复抽样 2.成数的抽样平均误差重复抽样: 不重复抽样: 第五节 抽样的组织方式第五节 抽样的组织方式( 四)样本容量的确定重复不重复平均数的样本容量成数的样本容量第五节 抽样的组织方式【例】假设某乡播种小麦20000亩
35、,现根据其地理条件划分为平原和丘陵两类,按2%比例总共抽取400亩进行调查,结果如下表所示。试以95%的概率估计该乡平均亩产量的区间范围。第五节 抽样的组织方式我们有95%的把握使该乡小麦平均亩产量在511.5斤到524.5斤之间按题意,F(z)=95% z=1.96,第五节 抽样的组织方式三 、 等距抽样(机械抽样或系统抽样) (一)概念等距抽样是事先将全及总体各单位按照某一标志排列,然后依固定的顺序和间隔来抽选调查单位的一种抽样组织方式,它是一种不重复抽样的方法。设全及总体有N个单位,现要抽取一个容量为n的样本,可将总体单位按一定标志排队,然后将N划分为几个韵相等的部分,每部分都含个单位,
36、所以间隔是K,第三部分中抽取第i+2k单位在第n部分中抽取第i+(n-1)k个单位,共n个单位组成一个样本。这种相邻样本单位的间隔距离相等的抽样方法叫等距抽样。 第五节 抽样的组织方式如学生按记名册号码排队,职工家计调查按平均工资排队等。按等距调查的抽样方式来抽选调查单位,能够使抽出的调查单位更均匀地分布在全及总体中,因此,它的抽样误差一般较简单随机抽样小。 【例】 N = 20 n = 4第五节 抽样的组织方式按等距调查的抽样方式来抽选调查单位,能够使抽出的调查单位更均匀地分布在全及总体中,因此,它的抽样误差一般较简单随机抽样小。(二)抽样的方法等距抽样排队时,按照所依据的标志不同有两种方法
37、:1.无关标志排队法无关标志排队:对总体单位按照与调查内容无直接关系的标志进行排列。第五节 抽样的组织方式【例1】一个学校有3000名学生,抽取120名进行调查,可利用学生名薄进行排列,从1号排到3000号,抽选间隔是3000/120=25人。先从第一组25人中随机确定第一被抽选人,假定是15号,然后每隔25人抽选1人,则第二间隔中抽第15+25(40)号,第三组中抽第40+25(65)号当第一个单位的位置确定之后,其余各单位的位置也就确定了。【例2】 进行工业产品质量检查,确定按5%的比率抽取时,可按连续生产的时间顺序每20个产品抽取1个(100个抽5个),一直抽到预定的样本单位数为至。这里
38、时间和产品质量没有十分密切的关系。第五节 抽样的组织方式2按有关标志排队法有关标志排队法:对总体单位按照与调查内容有直接关系的标志排队。【例】调查职工生活水平情况时,按照工资排队; 农产量调查,按照总体单位的上年亩产量进行排 队等。按照有关标志排队,考虑到样本的代表性,一般是从第一间隔内容中居中的单位开始抽取。(三)等距抽样误差的计算直接计算等距抽样的平均误差在实践中是一个不容易解决的问题。 第五节 抽样的组织方式若是按无关标志排队时,那么它的准确性近似乎纯随机抽样,则可以按照纯随机抽样条件下不重复抽样的抽样平均误差公式进行计算;若是按照有关标志排队,实质上是运用类型抽样的一些特点,可以使用类
39、型抽样下不重复抽样的公式计算。 若每组内总体方差已知,可用类型抽样法计: 不重复抽样: 第五节 抽样的组织方式但每组内总体方差一般都是未知的。需要用样本方差代替由于等距抽样每组内只抽一个单位,无法计算各组内方差,所以一般也按纯随机抽样公式计。 【例】年终在某储蓄所按定期储蓄存款进行每隔5户的等距抽样,得到如下资料。试以95.45%的概率估计平均定期存款的范围。定期存款 (元)1-100100-300300-500500-800800以上合 计户数(户)581502006214484组中值x50.5200400650950 xf2929300008000040300133001665294996
40、250.531104006272005805432131090415850186.5第五节 抽样的组织方式解:第五节 抽样的组织方式可靠程度为95.45%程度下,所有存户平均定期存款在329.28358.72元之间。根据F(z)=95.45%查正态分布积分表得: Z=2第五节 抽样的组织方式四、整群抽样(一)概念整群抽样:是将总体单位分为若干群,然后以群为单位从中随机抽取一些群,对中选群中的所有单位进行全面调查的一种抽样组织方式。【例】按一个班一个班抽查学生情况,按日期抽查若干天的产品进行质量检查,按一个生产小组抽查农户家庭副业发展情况等。 优点:组织工作方便,确定一群便可以调查许多单位,同时
41、抽中的单位比较集中,调查省时、省力、省财。缺点:抽中的单位比较集中,限制样本在总体中分布的均匀性,所以,在相同的条件下,抽样误差较大,代表性较低(与纯随机抽样相比)。第五节 抽样的组织方式N = 1000R = 10(群)r = 3(群) 100100100100100100100100100100【例】(二)整群抽样的抽样平均数的计算设总体的全部单位划分为R群,每群所包含的单位数为M,现在从总体R群中随机抽取r群组成样本,并对中选的r群的所有M单位进行调查。第五节 抽样的组织方式样本的第i群第j单位的标志值为ij,第i群样本的 平均数为: 则样本的平均数 为:第五节 抽样的组织方式从上式不难
42、看出,整群抽样实质上是以群代替总体单位,以群平均数代替总体单位标志值之后的简单随机抽样。所以抽样平均误差也可按这一方法来求。(二)整群抽样的抽样误差的计算整群抽样实质上是以总体群数R代替总体单位数N,以样本群数r代替样本单位数n,用群平均数的群间方差代替总体方差 后进行计算的群平均数的群间方差的计算方法为:第五节 抽样的组织方式一般都用样本的群间方差代替总体的群间方差;又因为整群抽样一般都采用不重复抽样的方法 ,所以平均数的平均误差 为: 成数的平均误差公式为:式中 p样本成数,P总体成数 第五节 抽样的组织方式【例】设某电器厂为了测定某种电子元件的使用寿命,从连续生产的成品车间所属的三个班组
43、中(三班倒),每天每班随机抽取5分钟的制品进行检验,一个月共收集样本(群)90个,测出样本平均使用寿命的标准差为50小时,试求该月全部电子元件使用寿命的平均误差。解:第五节 抽样的组织方式【例】某厂大量连续生产,为了掌握某月份某种产品的一级品比率,确定抽出5%的产品,即在全月连续生产的720小时中,按每隔20小时(72036=20,7205%=36)抽取1小时的全部产品进行检查。根据抽样资料计算结果,一级品率为85%,各群间的方差为6%,试计算整群抽样的误差,并以95.45%的概率保证程度推断设批产品的一级品率。 解:R=720小时,r=7205%=36小时第五节 抽样的组织方式则该厂产品该月
44、份一级品率在95.45%的概率保证下落在77.04%至92.96%之间。第五节 抽样的组织方式(四)整群抽样的样本群数整群抽样一般采取不重复抽样的方法:平均数的样本群数为: 成数的样本群数为: 第五节 抽样的组织方式五、多阶段抽样(一)概念多阶段抽样:它是将样本单位的抽取工作分为若干个阶段进行,即先从总体中抽取一级单位,再从中选的一级单位中抽取二级单位等,依次进行,到最后阶段才具体抽取到样本单位的组织方式。 【例】要调查某省粮食平均亩产量, 第一阶段:以县为单位,从全省所有的且中抽取 一部分县; 第二阶段:以乡为单位,从中选县的所有乡中抽 取部分乡; 第五节 抽样的组织方式第三阶段:以生产小组
45、为单位,从中选的所有生产小组中抽取部分生产组。第四阶段:以地块为单位,从中选生产组的所有土地中,抽取部分地块进行实割实测,并以样本点实割实测的数据来推断整个省粮食的平均亩产量和总产量。第五节 抽样的组织方式【例】要调查陕西大学生生活情况,从陕西所有高校中随机抽取所高校;从中选高校的所有班级中随机抽取个班;从中选班的所有学生中每班随机抽取名学生构成一个样本。(三阶段)多阶段抽样可以是二阶段、三阶段、也可以是更多的阶段,一般段数不宜太多,二、三个段为宜。下面以两阶段为例。(二)二阶段抽样方法及其误差1概念首先将总体划分为R群、每群含个单位, 第五节 抽样的组织方式第一阶段:从总体R群随机抽取r群,
46、第二阶段:从中选的r群中分别随机抽取mi个单位构成一个样本,这就是两阶段抽样。 其中: 假定R组中各组的单位数相等,均为M,则N=RM,且从各组中抽取的单位数也相等为m,则n=rm两阶段抽样实质上是类型抽样和整群抽样的综合。第五节 抽样的组织方式2两阶段抽样平均数及抽样误差(1)平均数的计算 表示i样本群第j样本单位的标志值,则第i样本群的抽样平均数为: (某个中选群中,中选单位的平均数) 则抽样平均数为:和整群抽样的 一样,只是这里分母是m不是M 第五节 抽样的组织方式【例】从某高校的100个班中随机抽取10个班;从10个班中分别抽取10名学生,则第i个班抽中的学生的平均成绩为:抽中的100
47、名学生的平均成绩为:抽取的10个班代表100个班时会产生一次抽样误差;100名学生代表10个班所有的学生又会产生一次抽样误差。第五节 抽样的组织方式(2)抽样平均误差的计算 在多阶段抽样中,每个阶段都会产生抽样误差,因此多阶段抽样的方差是各阶段抽样方差之和。二阶段抽样的方差实际是整群抽样的误差和类型抽样误差之和。第一阶段:把每个群看成是总体单位,从中随机抽取部分群,样本群与总体群之间会产生一个误差,则抽样方差为: 群间方差:把每个群看成是总体单位,每个群的平均数为群的标志值,求方差即 。第五节 抽样的组织方式第二阶段:把中选的所有群看成总体,从每个群(组)中随机抽取若干个单位,抽中的单位与该群
48、中所有单位的指标之间会产生一个误差,实际上是类型抽样的误差。 不重复抽样: 第五节 抽样的组织方式故,两阶段抽样的平均误差公式为:不重复的抽样: 重复的抽样 :一般阶段抽样都用不重复抽样的方法。第五节 抽样的组织方式【例】要对某林地的木材积蓄量进行抽样调查。先将总体面积的全部(N)地段划分为10群(尺),每群包括5个地段(M),现从10群中随机抽取5群(r),再从中选的各群中抽选60%的地段(即每群抽3个地段)(m)作为样本,见下表资料。解:根据资料,抽样平均数为:各群群内方差分别为:群别木材积蓄量样本平均数离差离差平方192959895-3039092119125131125-6063603
49、63181190199190-909810814258270282270-1201214401445365380395380-150152250225合计10600则群内方差的平均值为: 各群群间方差为: =10666则抽样平均误差为:不重复抽样:返回第三章结束谢谢!End of Chapter 3 本章小结 第一节 抽样推断概述一、抽样推断的概念、特点和作用(一)抽样推断的概念(二)抽样推断的特点 1.根据样本指标来推断总体指标 2.抽样调查是按随机原则抽取样本单位 3.抽样推断误差可以事先计算并加以控制 4.抽样推断是运用概率估计的方法,使抽 样推断的结果具有一定的可靠程度(三)抽样推断的
50、作用 1.对不可能或不必要进行全面调查的场合, 可采用抽样推断的方法. 2.抽样调查和全面调查相结合,可以验证 和补充修正全面调查的资料数据. 3.它可以对生产过程中产品质量的进行检 查和控制. 4.它可以总体的某些假设进行检验,以判 断这种假设的真伪,决定行动的取舍.一、总体和样本 1.总体(全及总体) 变量总体与 属性总体 2.样本(样本总体) 大样本与小样本二、全及指标和抽样指标三、抽样的方法及样本的可能数目 1.重复抽样的特点及其样本的可能数目 2.不重复抽样的特点及其样本的可能数目第二节 抽样推断的几个基本概念一、抽样误差的概念及其来源 登记性误差、代表性误差、系统性误差、 抽样误差
51、的区别。二、抽样平均误差的计算方法(一)抽样平均误差的定义公式 1.样本平均数的抽样平均误差 2.样本成数的抽样平均误差第三节 抽样误差(二)抽样平均误差的计算方法 1.样本平均数的抽样平均误差 重复抽样和不重复抽样条件下 2.样本成数的抽样平均误差 重复抽样和不重复抽样条件下(三)影响抽样(平均)误差的因素 1.总体被研究标志变异程度的大小 2.样本容量的大小 3.抽样方法 4.抽样的组织形式三、抽样极限误差(一)概念(二)计算 样本平均数的抽样极限误差 样本成数的抽样极限误差(三)抽样极限误差的概率度 第三节 抽样估计的方法一、抽样估计的置信度二、总体参数的点估计(一)点估计 1.点估计的
52、概念 2.抽样估计的优良标准 (1)无偏性 (2)一致性 (3)有效性三、总体参数的区间估计(一)区间估计的概念(二)区间估计的三要素 1. 估计值(样本指标) 2. 抽样极限误差 3. 置信度(三)区间估计的方法 1.给定置信度求极限误差 (1)总体平均数区间估计 (2)总体成数区间估计 2.给定极限误差求置信度 (1)总体平均数区间估计 (2)总体成数区间估计一、简单随机抽样(一)简单随机抽样的概念(二)简单随机抽样的方法(三)简单随机抽样样本容量的确定二、类型抽样(一)类型抽样的概念和特点(二)类型抽样的方法(三)类型抽样的平均误差 重复抽样与不重复抽样的平均误差(四)类型抽样样本容量的
53、确定三、等距抽样第四节 抽样的组织方式(一)等距抽样的概念(二)无关标志抽样与有关标志抽样(三)等距抽样的平均误差 (四) 等距抽样样本容量的确定四、整群抽样(一)整群抽样的概念(二)整群抽样的平均误差 (三) 整群抽样样本容量的确定五、多阶段抽样(一)多阶段抽样的概念(二)两阶段抽样的平均误差思考与练习一、思考题(简答题) 二、单项选择题 三、多项选择题 四、填空题 五、计算题 一、思考题 1.什么是抽样推断?它有哪些特点和作用?2.重复抽样和不重复抽样有哪些不同点?为什么重复抽样的误差总是大于不重复抽样的抽样误差?3.什么是抽样平均误差?4.影响抽样误差的因素有哪些?5.什么是抽样极限误差
54、?什么是抽样误差的概率度?8.影响样本容量的因素有哪些?9.说明简单随机抽样和类型抽样的特点,在其他条件一定的情况下,比较二者抽样误差大小。 6.什么是置信度?什么是抽样估计的准确性?他们之间有什么关系?7.抽样估计的三要素是什么?12具体解释优良估计的三个标准是什么? 13.什么是抽样调查?抽样调查的组织方式有哪几种? 11类型抽样、整群抽样分别是如何抽出样本的?比较两种抽样组织方式的特点。 10.抽样误差一般受哪些因素的影响?各因素和抽样误差是什么关系? 二、单项选择题(在每小题的四个备选答案中选出一个正确的答案,并将正确答案的号码填在题干后的括号内) 1.用简单随机抽样方法抽取样本单位,
55、如果要使抽样平均误差降低50,则样本容量需要提高到原来的( )。 A.4倍 B.5倍 C. 2倍 D.3倍 2.抽样平均误差反映了样本指标与总体指标之间的( )A.实际误差 B.实际误差的绝对值 C.平均误差程度 D.可能误差范围3.在其他条件不变的情况下,提高抽样估计的可靠程度,其抽样估计的准确性将( )A.保持不变 B.随之扩大 C.随之缩小 D.无法确定A.重置抽样 B.机械抽样 C.不重置抽样 D.分类抽样4.从总体中随机抽取样本,当抽出一个单位将其序号和标志值记下后,又将其放回到原来的总体中。此抽样方法称为( )5.某厂产品质量检查,按连续生产时间顺序每20小时抽取1小时的全部产品进
56、行检验,这种方式是( )抽样。A.等距 B.类型 C.整群 D.多阶段 6.抽样推断的目的是根据样本指标( ) A.了解总体的基本情况 B.了解同类事物的本质规律性 C. 推断全及总体指标 D.了解事物发展变化的趋势7.在其他条件一定时,增大样本容量,抽样平均误差( )A.不变 B.减少 C.增大 D.两者没有关系8.某市质量监督部门想了解该市所有企业所生产的牛奶制品的质量情况,最好采用( )方式 A.抽样 B.典型 C.重点 D.普查 9.如果样本指标的平均数等于总体指标,这个样本指标就是总体指标的( )估计量。 A.抽样估计的准确性越差,估计的概率保证程度越小 B.抽样估计的准确性越差,估
57、计的概率保证程度越高 C.抽样估计的准确性和估计的概率保证程度无关 D.抽样估计的极限误差越大,估计的概率保证程度越低A.有效 B.一致 C.无偏 D.有偏10.下列正确的是( )。11.某商店要对某型号的节能灯管进行质量检验,应选择( )。 A.普查 B.重点调查 C.典型调查 D.抽样调查12.抽样调查所抽出的调查单位是( )。 A.按随机原则抽选的 B.按随意原则抽选的 C.有意识抽选的 D.典型单位13.抽样误差是指( ) A.调查中由于观察、测量等差错所引起的误差 B.调查中违反随机原则出现的系统误差 C.由于随机抽样的偶然因素而产生的代表性误差 D.人为原因所造成的误差14.在其它
58、条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的抽样平均误差相比( )。 A.前者一定大于后者 B.前者一定小于后者 C.两者相等 D.前者可能大于、也可能小于后者 15.某县为了了解农民收入情况,从全县所有的乡中随机抽中5个乡,然后从中选的5个乡的所有村中分别随机抽选3个村(共抽取15个村),从中选的15个村的所有农民户中分别随机抽选10户(共抽取150户),对中选的所有农民户进行调查,这种调查属于( )。 A.简单随机抽样 B. 等距抽样 C.多阶段抽样 D. 整群抽样 16优良统计量的无偏性是指( ) A.样本指标的平均数等于被估计的总体指标 B.样本指标等于总体指标 C.样本指标
59、与被估计的总体指标的方差最小 D.随着样本容量n的增大,样本指标越来越接 近于被估计的总体指标17.反映抽样指标与总体指标之间离差的最大可能范围的指标是 A.抽样平均误差 B. 抽样误差系数 C. 概率度 D. 抽样极限误差 18.抽样调查所必须遵循的基本原则是( )。随意原则 B. 可比性原则 C.准确性原则 D. 随机原则 19.样本统计量是( )。 A.唯一且已知 B.不唯一但可抽样计算 C.不唯一也不可知 D.唯一但不可知20.抽样推断的目的是( )。 A.以样本指标推断总体指标 B.取得样本指标 C.以总体指标估计样本指标 D.以样本的某一指标推断另一指标三、多项选择题(从每小题的五
60、个备选答案中选出二至五个正确答案,并将正确答案的号码分别填写在题干后的括号内) 1.影响抽样误差的因素有( )A.是有限总体还是无限总体 B.是变量总体还是属性总体 C.是重复抽样还是不重复抽样 D.抽样单位数的多少 E.总体被研究标志的变异程度2.在其他条件不变时,抽样极限误差的大小和置信度的关系是( )A.抽样极限误差的数值愈大,则置信度愈大 B.抽样极限误差的数值愈小,则置信度愈小 C.抽样极限误差的数值愈小,则置信度愈大 D.成正比关系 E.成反比关系3.抽样法可应用在( )A.对抽选的单位进行全面调查 B.对电视机使用寿命的检查 C.对产品的质量进行控制 D.对有破坏性产品的质量检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 台球俱乐部教练情绪管理规章
- 2017-2018学年高中历史人教版必修三试题第六单元20世纪以来中国重大思想理论成果6-16课后知能检测
- 二零二五年度二手车买卖合同解除条件协议
- 二零二五年度校园电脑维修与保养承包协议
- 二零二五年高端商务区保安保洁全面承包管理合同
- 二零二五年度绿色建材工程采购专项合同
- 毕业论文药剂专业范本
- 2025版汽车个人出售合同范本(含车辆交付流程)
- 二零二五年度建筑施工项目管理费标准合同
- 水质科学专业毕业论文
- 三年级科学教材培训心得
- 北师大版二年级数学上册计算题专项复习大全120
- 北京市海淀区2023-2024年五年级上学期数学期末试卷
- 医疗机构人力资源管理制度
- 品管圈PDCA改善项目-提高住院患者出入量记录的准确率
- 餐厅开荒保洁操作技术方案
- 2024年春季小学三年级英语课件教学方法探索
- 部编人教版小学四年级上册语文词语表注音
- DB52T 1781-2024 介入诊疗医务人员辐射防护规范
- 回收黄金合同协议书(2篇)
- 珠宝鉴定信息咨询服务合同
评论
0/150
提交评论