抽样推断 第五章_第1页
抽样推断 第五章_第2页
抽样推断 第五章_第3页
抽样推断 第五章_第4页
抽样推断 第五章_第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样推断第五章第一节抽样推断概述第三节参数估计第二节抽样分布第四节抽样设计第五章抽样推断康师傅矿物质水“太酸”吗?成都消费者尹先生到四川大学华西附二院看望一生病的朋友,并给朋友买去一件康师傅矿物质水。就在他拿出来准备给朋友喝时,邻床一位姓金的先生提醒他说:这种水PH值偏低,呈酸性,不适合常喝,体质较弱的病人更不宜饮用。尹先生对此半信半疑,先后带了两瓶水到四川省人民医院和成都市二医院分别进行PH值检测。两次检测均显示,其PH值仅为5.8~6.2,根本达不到中国《生活饮用水卫生标准(GB5749-2006)》规定的6.5~8.5。10月6日,尹先生要求重庆顶津公司就康师傅瓶装水的“PH值”问题给消费者一个说法,并向记者反映了此事。尹先生的要求合理吗?康师傅矿物质水是真的“太酸”吗?

一、抽样调查及其特点(一)抽样调查的概念第一节抽样推断概述指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会按照随机原则从调查对象(即总体)中抽取一部分单位进行调查,用调查所得指标数值对调查对象相应指标数值作出具有一定可靠性的估计和判断的一种统计调查方法。统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样推断随机原则的实现抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。计算机模拟法是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同按随机原则抽取样本单位以样本的数量特征推断总体的数量特征抽样推断产生抽样误差,但抽样误差可以事先计算并控制抽样推断的特点与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。我国在1994年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。

不可能进行全面调查时有些事物在测量或试验时有破坏性,不可能进行全面调查.例如:灯泡耐用时间试验,电视机抗震能力实验,人体白血球数量的化验等等.不必要进行全面调查时例如:了解某林区有多少树,鱼塘有多少条鱼等。用于生产过程的质量控制例如:在产品成批或大量连续生产过程中,利用抽样调查可及时提供产品质量信息,进行质量控制。抽样推断的应用抽样推断的应用来不及进行全面调查时例如:农产量全面调查的统计资料数字要等收割完毕以后一段时间才能得到,而抽样调查的统计数字在收获的同时就可以得到,一般能早两个月左右,这对于安排农产品的收购,储存和运输等都是有利的.对全面调查资料进行补充修正时例如:有些国家在人口和农业调查中,根据调查项目的粗细要求不同,分别进行普查和抽样调查,有这两种调查所得资料不但便于核对差错,而且可以满足不同的需要.二、抽样推断的基本概念全及总体抽样总体就是调查对象,又称总体或母体,是由许多性质相同的调查单位组成,常用N表示全及总体的单位数目。又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1<n<N。n≥30称为大样本,n

<30称为小样本.n/N称为抽样比.例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。抽样推断的基本概念根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体指标。全及指标全及指标主要有四个:全及平均数总体是非标准差及方差总体标准差及方差全及成数是非标志总体分组单位数变量值具有某一属性不具有某一属性10合计—为研究是非标志总体的数量特征,令指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志是非标志性别:男、女(非男)产品质量:合格、不合格1010是非标志总体的指标具有某种标志表现的单位数所占的成数不具有某种标志表现的单位数所占的成数指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数是非标志总体的指标平均数标准差是非标志总体的指标方差标准差系数【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。是非标志总体的指标解:设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):⒉总体标准差:⒊总体方差:⒋总体成数(全及成数):⒌总体是非标志标准差:⒍总体是非标志的方差:设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则⒈样本平均数(又叫样本均值):又称样本指标、统计量。指根据抽样总体各个单位的标志值或标志特征计算的综合指标,它是随机变量。抽样指标⒉样本单位标志值的标准差:⒊样本单位标志值的方差:为自由度为的无偏估计为的无偏估计⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:为的无偏估计为的无偏估计抽样的基本方法重复抽样从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样不重复抽样每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样.总体单位数N不变,同一单位可能多次被抽中。总体单位数减少n,同一单位只可能被抽中一次。根据取样方式不同,可分为:抽样方法的分类根据对样本的要求不同,可分为:考虑顺序抽样考虑各单位的中选顺序。ABC≠CBA例如:从1,2,3三个数中取两个数排成一个两位数,显然十位数取1,个位数取2,和十位数取2,个位数取1是完全不同的.综合起来共有四种抽样方法考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序抽样不考虑各单位的中选顺序。ABC=CBA例如:从三个产品中抽取两个进行质量检验,第一个选1号产品,第二个选2号产品组成一组,和第一个选2号产品,第二个选1号产品组成一组没有什么差别.样本的可能数目考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样把填湖南风采35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?中特等奖的概率是多少?(0—9选6呢?)不考虑顺序的不重复抽样,抽样调查的理论基础大数定律表明大量随机观象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。

抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布究竟怎样?总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.概率密度函数中心极限定律如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。

一个任意分布的总体X当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布样本均值的抽样分布

与中心极限定理

=50

=10X总体分布n=4抽样分布Xn=16当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值

X也服从正态分布,

X的数学期望为μ,方差为σ2/n。即

X~N(μ,σ2/n)中心极限定理

(centrallimittheorem)的分布趋于正态分布的过程第二节抽样分布

样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样本统计量平均数比率(成数)方差分布的形状及接近总体参数的程度抽样分布从同一总体中,抽取样本容量相同的所有可能样本后,计算每个样本统计量的取值和相应的概率,组成样本统计量的概率分布。(一)样本平均数的分布:由总体中全部样本平均数的可能取值和与之相应的概率组成。二、重复抽样分布注意:统计量的取值不但和样本容量有关,而且和抽样方法有关,以下分别研究重复抽样和不重复抽样的抽样分布。样本的概率分布把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分布。若将样本指标的取值分别记为其相应的概率记为P1,P2,…Pn,将它们按顺序排列起来,可得如下概率分布表。

…………学生ABCDEFG成绩30405060708090按随机原则抽选出4名学生,并计算平均分数。平均数的抽样分布样本均值样本均值样本均值ABCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575样本均值4547.55052.55557.560出现次数1123445样本均值62.56567.57072.575出现次数443211二者均值相等样本均值4547.55052.55557.560出现次数1123445离差-15-12.5-10-7.5-5-2.50样本均值62.56567.57072.575出现次数443211离差2.557.51012.515学生ABCDEFG成绩30405060708090离差-30-20-100102030重复抽样下样本平均数的抽样分布性质:全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的。抽样平均数的标准差反映了样本平均数与总体平均数的平均误差程度,因为这一误差是由于抽样而产生的,故称为抽样平均误差以表示。1.抽样平均误差比总体标准差小得多,仅为总体标准差的,所以用样本平均数来代表总体平均数是更有效的;2.抽样平均误差和总体标准差成正比变化,而和样本单位n的平方根成反比变化。例如,在同一总体中,如果抽样平均误差允许增加一倍,则样本单位数只需要原来的1/4,如果样本容量扩大为原来的9倍,则抽样平均误差缩小2/3。结论抽样平均误差指每一个可能样本的指标值与总体指标值之间平均离差,即一系列样本指标的标准差式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数注意:不要混淆抽样标准差与样本标准差!(二)抽样成数的分布对于是非标志总体,其总体平均数就是总体成数本身,,总体方差。在总体中用重复抽样方法抽取个单位计算样本成数,则样本平均数分布的性质可以推广到抽样成数的分布,即有抽样成数的分布全部可能样本比率的均值等于总体成数,即:从非正态总体中抽取的样本成数,当n足够大时其分布接近正态分布。从正态总体中抽取的样本成数,不论容量大小其分布均为正态分布。样本成数的标准差为总体标准的。样本抽样分布原总体分布抽样误差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高=169.8CM平均身高=174.6CM总平均身高=168.6CM三、不重复抽样分布(一)样本平均数的分布

例:某次调查资料中4个被调查者的月消费为410元、450元、480元、500元,平均月消费为460元,方差1150,用不重复抽样方法抽取2个构成样本,并求样本平均月消费来推断总体的平均月消费。样本平均月消费样本变量410450480500410450480500-430445455430-465475445465-490445475490-样本平均月消费分布样本日平均工资(元)频数频率4304454554654754902222222/122/122/122/122/122/12合计121不重复抽样下样本平均数的抽样分布性质:1.全部可能样本平均数的均值等于总体均值,即:

2.抽样平均误差为重复抽样的平均误差乘以修正因子即抽样平均误差的计算

不重复抽样与重复抽样的平均误差公式相比,多乘了一个修正系数(1-n/N),显然(1-n/N)小于1,所以,不重复抽样的平均误差小于重复抽样的平均误差.当N很大,n相对很小时,(1-n/N)接近于1,对平均误差影响不大.因此,在实际工作中,一般按不重复抽样的方法抽取样本,而按重复抽样的公式计算抽样平均误差.样本成数抽样分布教师是否博士A是B是C否D否E否F是具有博士学位的比率:P=0.5比率的标准差:=0.5从总体中按重复抽样方法随机抽取4人,计算其比率P和标准差样本成数抽样分布样本比率离差样本比率离差ABCDABCEABCFABDEABDFABEFACDEACDF0.50.50.750.50.750.750.250.5000.2500.250.25-0.250ACEFADEFBCDEBCDFBCEFBDEFCDEF0.50.50.250.50.50.50.2500-0.25000-0.25全部可能样本成数的均值等于总体比率,即:从非正态总体中抽取的样本成数当n足够大时其分布接近正态分布。从正态总体中抽取的样本成数不论容量大小其分布均为正态分布。样本成数的标准差为总体标准差的。样本成数的抽样分布学生ABCD成绩60708090均值=75方差

2=125从中按重复抽样方式抽取2人,计算样本的均值及方差S2

。方差的抽样分布A60B70C80D90A60606060006070652550608070100200609075225450B707060652550707070007080752550709080100200C808060701002008070752550808080008090852550D90906075225450907080100200908085255090909000总体成数P可以表现为是非标志的平均数,它的标准差也可以从总体成数推出来。即当N≥500时,有样本成数的分布抽样平均误差的计算例:从某公司1000名营业员中,随机抽取100名营业员,其平均营业额为60百元,标准差为12百元,则抽样平均误差为:重复抽样:不重复抽样:均值分布的数学期望和方差抽样方法 均值 方差 标准差 (1)从无限总体抽样和有限总体放回抽样(2)从有限总体不放回抽样抽样误差抽样误差成数分布的数学期望和方差抽样方法 均值 方差 标准差 (1)从无限总体抽样和有限总体放回抽样(2)从有限总体不放回抽样根据中心极限定理,只要样本足够大,的分布就近似正态分布。(np和nq大于5时)抽样误差抽样误差标准差、样本标准差、样本平均数的标准差及抽样误差的区别与联系标准差(σ)是总体各单位标志值的变异程度指标。它是总体各单位在某一变量上的取值X与该变量的平均值的离差平方加以平均再开方求得。计算公式为:其中N为总体单位总数,即变量值的个数。样本标准差S是样本中各单位在某一变量上的取值X与该变量的样本平均值的离差的平均,其计算公式为:其中n为样本单位数.样本标准差反映抽样总体在某一变量上的差异程度.标准差、样本标准差、样本平均数的标准差及抽样误差的区别与联系样本平均数的标准差则是指:从总体中抽出所有可能的样本,每个样本都由n个单位组成,都有一个样本平均数,这些样本平均数与样本平均数的平均数的离差的平均值.其计算公式为:

根据无偏性原则,式中样本平均数的平均数等于总体平均数.即,,则上式又可以写成:其中M为样本总数.标准差、样本标准差、样本平均数的标准差及抽样误差的区别与联系抽样误差即抽样平均误差,它就是样本平均数的标准差.由于总体平均数X是不可知的,所以仅具有理论意义,实际计算时则是根据样本平均值的标准差与总体方差的关系推算,因此,,此式常用表示,其中n为样本单位数.第三节参数估计

也叫抽样估计,就是根据样本指标数值对总体指标数值作出估计或推断。

参数估计通常,把用来估计总体特征的样本指标叫估计量或统计量,待估计的总体指标叫总体参数。特点1、它在逻辑上运用归纳推理而不是演绎推理。

2、在方法上运用不确定的概率估计方法,而不是运用确定的数学分析方法。3、抽样估计存在抽样误差。统计推断结论是否准确与否,有几个问题:1.对统计推断结论有多大的把握;2.区间估计中的可信度和精度的关系问题;3.得到的结论是否有实际意义;4.统计推断结论正确与否,与我们对总体的了解有关;一、参数估计的基本概念(一)允许误差又称极限误差,指样本统计量与被估计总体参数的离差绝对值可允许变动的范围。只要估计值与被估计值之间的离差不超过允许范围,这种估计都是有效的。例如:估计高一男生身高160厘米,允许误差16厘米,若实际身高在144~176厘米之间都应该认为估计有效。此处,允许误差的区间144~176厘米称为估计区间,允许误差与估计值之比称为误差率,(1-误差率)称为估计精度。注意:允许误差愈小,抽样估计的精度愈高,反之,表明精度愈低。抽样极限误差指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最大可能范围,也称作抽样允许误差。常用△表示。上式表明,样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。由于总体成数和总体平均数是未知的,它要求靠实测的抽样平均数和抽样成数来估计,因而抽样误差的实际意义是希望总体平均数(成数)落在某个已知的范围内。抽样极限误差所以前面的不等式应变换为:在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。即抽样极限误差通常表示为抽样平均误差的多少倍,即

由于z值与样本估计值落入允许误差范围内的概率有关,因此,z也称为概率度。(二)置信度又称估计推断的概率保证程度,表明估计的可靠程度。例如:若要求95%的可靠程度,则表示如果进行多次重复估计,则平均每100次估计将有95次是正确的,只有5次估计错误。95%就称为置信度或称概率保证程度。概率保证程度F(t)也可表示为:α称显著性水平,表示估计值落在区间以外的可能性。在大样本()的条件下,样本平均数的分布接近正态分布,这时可根据概率度t和置信度的对应函数关系通过《正态分布概率表》互相查找。抽样指标和总体指标的误差不超过一定范围的概率大小,称之为概率保证程度,也叫抽样估计的置信度,一般用F(t)表示:置信度z值与相应的概率保证程度存在一一对应关系,常用z值及相应的概率保证程度为:z值概率保证程度1.000.68271.960.95002.000.95453.000.9973在大样本下置信度与Z值的对应关系0.682768.27%包含样本抽样分布曲线原总体分布曲线0.9545样本抽样分布曲线原总体分布曲线95.45%包含置信度与Z值的对应关系0.9973样本抽样分布曲线总体分布曲线99.73%包含置信度与Z值的对应关系问题:第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?估计值的优良标准第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优于另一个?估计值的优良标准:无偏性、有效性、一致性抽样估计量的优良标准设为待估计的总体参数,为样本统计量,则的优良标准为:若,则称为的无偏估计量指样本指标的均值应等于被估计的总体指标无偏性若,则称为比更有效的估计量若越大越小,则称为的一致估计量作为优良的估计量,除了满足无偏性的要求外,其方差应比较小有效性指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值一致性抽样估计量的优良标准学生ABCDEFG成绩30405060708090有效性按随机原则抽选出4名学生,并计算平均分数和中位分数。样本均值4547.55052.55557.560出现次数1123445样本均值62.56567.57072.575出现次数443211样本中位数45505560657075出现次数4385834有效性中位数的抽样分布平均数的抽样分布无偏性有偏无偏一致性学生ABCDEFG成绩30405060708090按随机原则抽选出5名学生,并计算平均分数。样本均值样本均值ABCDEABCDFABCDGABCEFABCEGABCFGABDEFABDEGABDFGABEFGACDEF5052545456585658606258ACDEGACDFGACEFGADEFGBCDEFBCDEGBCDFGBCEFGBDEFGCDEFG60626466606264666870样本均值505254565860出现次数112233样本均值6264666870出现次数32211n=4时的抽样分布n=5时的抽样分布为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量。数理统计证明:抽样估计量的优良标准三、参数估计方法从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量视为总体参数的估计值,称为参数的点估计,又称定值估计。点估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况的抽样分布点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差例:根据某班男生身高服从,样本资料为165,167,169,172,172,175(单位:厘米),试估计和的值。解:由于和S分别是和的优良估计量,而区间估计根据给定的置信度要求,指出总体参数被估计的上限和下限。一般,对于总体被估计参数,找出样本的两个估计量和(其中),使区间()涵盖给估计参数真值的概率为1-α,其中α为介于0-1之间的已知数,即称区间()为总体参数的估计区间,为估计下限,为估计上限,1-α为估计置信度,α为显著性水平。以样本统计量为中心,以抽样平均误差为距离单位,可以构造一个区间,并可以一定的概率保证待估计的总体参数落在这个区间之中。区间越大,则概率保证程度越高。区间估计原理置信区间:是从样本数据计算出来的一个区间。例如:95%的置信区间表示在所有的样本当中,有95%的样本会把总体参数包含在区间之中。68.27%95.45%99.73%抽样极限误差总体平均数的区间估计表达式其中,为极限误差四、常见的参数估计步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即总体平均数的区间估计步骤⒊计算抽样平均误差:重复抽样时不重复抽样时总体平均数的区间估计步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区间估计目标:任务:计算及而转化为求重复抽样不重复抽样未知用代替【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。总体平均数的区间估计按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料解:则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪总体成数的区间估计表达式其中,为极限误差步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。总体成数的区间估计按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数解:则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。总体成数的区间估计目标:任务:计算及而转化为求重复抽样不重复抽样未知用代替样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量确定样本容量的意义找出在限定费用范围内的最大样本容量确定方法推断总体平均数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位⑵不重复抽样条件下:确定方法推断总体平均数所需的样本容量【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:在不重复抽样下:确定方法推断总体成数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的;③取方差的最大值0.25。⑵不重复抽样条件下:确定方法推断总体成数所需的样本容量【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的概率保证程度下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。解样本容量的确定影响样本容量的因素总体各单位标志值的差异程度(即标准差的大小):越大,所需样本容量越多允许的极限误差△的大小:△越大,所需样本容量越小;推断的可靠程度,即置信度:对可靠程度要求越高,所需样本容量越大;抽样方法和抽样组织方式:重复抽样比不重复抽样所需样本容量要多;类型抽样比简单随机抽样所需样本容量多。必要样本容量的影响因素总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。重复抽样条件下:不重复抽样条件下:第四节抽样设计

抽样方案设计的基本原则随机原则——抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位最大抽样效果原则抽样误差最小——在其他条件相同的情况下,选抽样误差最小的方案费用最少——在其他条件相同的情况下,选费用最少的方案设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案简单随机抽样对总体未作任何处理的情况下,然后按随机原则直接从总体中抽出若干单位构成样本抽取样本的具体方法:抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。应用仅适用于规模不大、内部各单位标志值差异较小的总体简单随机抽样的特点1、直接从总体中抽取所要调查的单位,无须分组、分类、排队等处理;2、必须事先对总体中的所有单位进行编码和编号;3、抽取样本时不借助有关标志的辅助信息4、当总体各单位标志值之间差异很大时,采用此方法不能保证样本的代表性。先将总体全部单位按某一标志分类,然后从各类型中按随机原则抽取样本单位组成样本。总体N样本n等额抽取等比例抽取最优抽取······类型抽样实质上是分组法与随机原则的结合。例如,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。类型抽样的优点:能提高样本的代表性;能降低影响抽样平均误差的总方差;组织起来较为方便;类型抽样分组的基本原则:尽量缩小各组内标志值之间的差异,增大组间各标志值之间的差异。样本在各组间的分配方法:等额分配法:每组抽取的单位数一样。等比例分配法:按各组单位的比例分配样本单位。最佳分配法:按各组的方差大小分配样本单位。方差大的组分配较多的样本单位。经济分配法:按各组的方差大小分配样本单位,同时考虑各组抽样调查的费用。实际工作中比较常用的是等比例分配法。类型抽样的样本平均数1.计算各组抽样平均数:2.将各组抽样平均数以各组单位数或样本单位数为权数,计算样本平均数:类型抽样的抽样平均误差一、抽样平均数二、抽样成数【例】某市有250家商店,分大中小三类,现从中等比例抽出50家进行销售额调查,所得资料如下分层各层商店数Ni层权Wi各层抽取数ni各层销售额样本均值(万元)样本方差(万元)大型商店中型商店小型商店25751500.10.30.6515307008001202800698510850合计2501.050____以95.45%的概率保证程度估计该市所有商店的平均销售额。根据题意知:N=250,W1=0.1,W2=0.3,W3=0.6,f1=f2=f3=0.2,1-а=95.45%,t=2总体均值的点估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论