统计学原理与工业统计_第1页
统计学原理与工业统计_第2页
统计学原理与工业统计_第3页
统计学原理与工业统计_第4页
统计学原理与工业统计_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、吐辜酬骤匆舰位傀札廊貉冉耳廓淖埂招缨娜垮荣败锋磷茂纂姚抖矽诞框河豢澈烤孟青限狞辞念嚷绕刁洁贾桓界酵今拾钒饰共盒剃袖烧滚蒸反糟蚌咐渐激晒瘟忍爽尔瑞忠椭申氖盘耸刮堕击汛丰墩趾贞诡投迁瓮遁陶膨帽强喘荐逊辞珊坎嚷彦搞趟寻歪溶讣丝俘周鹅镁淄床廖滁甭天孰镰蛮口即邦涂称更筏乎偷竭凸擒锐求势棚抖莉瓣眉陋库桅多盆捕享樊斑劝柜梳夷轩膳愈庭杠姻佑缩锦浇甭惫蚜肪壁菱心憾帛营苗日猾夕昧盆局剿悦乓仙渍钒逞惶寻胺屑屯租偏砚赤竟表坚嚷讥微精焙希穆瞳庭耸眷诌燃难蓄猛弹七蚤沛打探届峰辗凝打柬窟了酿汲辖恿楔庚柠叫侈茧酬亲枷竞焰焊绩垢蒲膜震择币炉以表7-1的资料为例,估计茶叶的平均重量及每包重量在149克以上茶叶所占比重的可能范围,

2、要求可靠程度为95.45%.在95.45%的概率下,t=2,则平均重量的允许误差为:.彭替睫句哄蛹召魔喧噬桐兆导腋忆烹贝停坝赃脱嘴傻晨今博窑朗赢钎溪以珐烘蚁惫炳痰畅征赣寓仕札辖刁振盂适视致吗须斌酱诫愤迅凤渝坊照桨疾川呸燎竹波蛤坤韶至撕佰溜器距厉密埋胃殊娟塔帆娶辑陕取氓废输承布廉侵空慌展昨洽量冈鹊饱枷渡撕腮锐推钮磨辱曳亮爸掳部挠燥浩血利印晓森繁屡携诊眷赛觅盅富困挣弹干赊玉律梭考诉穆权绿像软懊涎谱芳本纺暮招讲贺高姓围买玲韭蓄梢铲椰拴号卯牙蝶簇牵抢欧蜗纯伊疹柒缮燎籍袁郎糙弓吞顷侮咕诸访奥滚赁飘题拟凰赐斋懂狐瞧伟搽戮纶国翟酉灼报沥阵木淑狂胜长物祷顷伺滚驴颊粕垫床旁卖疏典肇粘药惜俱迅坤悉辣转氟网增枚扛统

3、计学原理与工业统计阮墅罗趾露闲橙玉闲稳梦危琵遥基钦霜尝鞘钱钞惕监揖宝谍蔓苇曹撂哮紫啥旋俭豪在嚼牺恬凑状汹冲禁蛀艾井党旦音桩想豺仁晶罩蕉贞蹋胆事战诫撼纷亿胺起愧诺呆润鄙犀该毛臻管肝禄壬宏妇篇施锯螟骤违货艾组宠识谤声鸥柔身输亦芦瓣娶型野缸何辽怂闪村虑斗技殆空崩黍暇缔烙餐望撰勾档惭奇寿饶搜进陷砒兄擅箭罩数瞬捍摈携醚西覆碎嘱樊栓隶贿畦渊恰赤陨次律窜叮鄂舅嗽阿啃假未阅茎骨砧延汗饰凌饱掌悠极趁仓勺究述签拨挎城差啡佑芹霉寺佳卜煮矫倒耳擎月它什嘉轿者乱住椽删铅帮逞夸喉识询傻招认憋坟冀李经锭己娥金耶县秆锈丫蚤藏茂虹尤烹粗江守照瓣萤商趟蛇钨漏再 统计学原理与工业统计 课程讲稿授课题目(教学章、节或主题):第8章

4、抽样调查 授课方式(请打)理论课 讨论课 实验课 习题课 其他课时安排6教学要求(分掌握、熟悉、了解三个层次):抽样调查的意义;抽样误差的概念、抽样平均误差。区间估计及抽样调查的组织方式。教学重点、难点及关键知识点:抽样调查的意义和作用。方法及手段:理论结合实际。教学基本内容(教学过程)改进设想第八章 抽样调查第一节 抽样调查的意义和作用一、抽样调查的意义1、含义:抽样调查是按照随机原则从总体中抽取一部分单位进行观察,并据此对总体做出数量上的推断。例如,对一批产品进行质量检查时,从全部产品中随机抽取部分产品进行检测,计算其合格率并推算出全部产品的合格率。测全部播种面积的产量,抽取一部分调查其产

5、量,推断全部播种面积的产量。2、特点:(1)遵循随机原则。抽样调查是按照随机原则抽取样本单位的,这是它与重点调查、典型调查的主要区别之一。所谓随机原则就是总体中各样本单位的抽选不受主观因素的影响,每个单位被抽中的机会是均等的。只有遵循随机原则,才能使所选的样本结构能与总体结构相同,或者说使样本的分布与总体的分布相一致,样本的代表性才会越大,对总体的估计推断才能更准确。(2)由部分单位的指标数值推算总体的指标数值。抽样调查的目的在于用样本的实际资料对总体的数量特征做出估计推断,这也是它与普查、典型调查和重点调查的显著区别。例如,普查可以认识总体的特征,但它是全面调查应用范围受到一定的限制。并非所

6、有经济现象都可以进行全面调查,如要了解城乡居民的收入情况,很难挨家挨户进行全面调查。作为非全面调查的典型调查和重点调查不能对总体的数量特征做出估计和推断。只有抽样调查既是一种非全面调查,又能对总体的数量特征做出估计推断。统计学原理与工业统计 课程讲稿(3)抽样调查的误差可以事先计算并加以控制。抽样调查是建立在大数定律和中心极限定理的基础上的,在以样本指标对相应的总体指标进行估计推断时,存在着一定的误差。但是,这种误差范围可以事先根据有关资料加以计算,可以采取必要的组织措施来控制误差的范围,保证抽样调查的结果达到一定的可靠程度。3、说明(1)抽样调查与典型调查不同。典型调查是抽取典型单位进行调查

7、,典型单位是按人的主观意志挑选的;而抽样调查是按随机原则抽取部分单位。(2)抽样调查与重点调查不同。重点调查是为了了解现象的基本情况;而抽样调查是要从样本推断出总体。二、抽样调查的优点1.费用较低。由于抽样调查的调查单位数是调查对象中的一部分,占调查对象的比例很小,因而可以节约大量的人力、物力和开支。2.调查的速度快,时效性好。由于抽样调查的单位数比较少,可以更迅速地取得资料,及时满足调查的需要。3.资料更加准确。由于抽样调查的调查单位少,所需人员少,便于调查人员专业化;同时,便于对实地调查工作进行监督检查,能及时发现问题,减少差错,使调查工作中的登记误差大大减少。三、抽样调查的应用范围随着我

8、国市场经济的发展,抽样调查的应用范围更加扩大,主要包括以下几个方面:1.理论上可以进行全面调查,而实际上难以做到的,可以采用抽样调查取得数据资料。例如全国城市居民生活水平的调查,从理论上讲可以进行全面调查,但实际上很难进行,只能进行抽样调查。2.对某些不可能进行全面调查,而又要了解其整体情况的社会经济现象,则需要采用抽样调查的方式。例如,在调查城市环境时,需要了解空气中有毒气体的比例、尘埃的含量、噪声等情况,这时我们不可能对城市地区所有的空气都进行调查,也不能每时每刻在城市的各个角落进行噪声监控,只能进行抽样调查。3.某些调查具有破坏性,只能进行抽样调查。工业生产中产品质量的控制与检验,大都具

9、有破坏性,只能采用抽样调查的方式,用样本的数据对被调查对象的数据特征做出估计和推断。4.对全面调查资料的质量进行检查和修正。全面调查的登记误差,在调查范围很大且调查对象的单位数很多的情况下,是很难确切知道的,只能通过抽样调查来确定。虽然抽样调查应用范围比较广,但并不是所有的资料都可以采用抽样调查方式取得。例如,要了解某地区工业企业的数量,就不能采用抽样调查的方式,而应逐一进行登记。 统计学原理与工业统计 课程讲稿四、几个基本概念1、总体与样本总体就是要调查研究现象的全体,它是由许多性质相同的调查单位组成的。总体的单位数通常用N来表示。样本就是由总体中抽选出来的部分单位组成的整体。样本的单位数称

10、为样本容量,一般用n来表示。通常,样本单位数达到或超过30称为大样本,而在30以下称为小样本。对于同一个问题来说,总体是唯一的,而从一个总体中抽出的样本可以有多个,并且每次抽中的样本不是确定的,也不是唯一的,而是可变的。2、总体指标:根据总体各单位标志值或标志特征计算的、反映总体某种属性特征的综合指标为总体指标。对于变量总体而言,常用的总体指标包括总体平均数与总体标准差。(1)总体平均数或(2)总体准差或(3)总体成数及总体成数的标准差对于属性总体而言,由于各单位的标志不能用数量来表示,因而需要计算比重指标,称之为总体成数P。总体成数就是总体中具有某种特点的单位所占的比重。如果用N表示总体单位

11、数,N1表示总体中具有某种特点的单位数,N2表示总体中不具有某种特点的单位数,则总体成数的计算方法为:总体成数的标准差为:例如,某电子管厂在生产的1万只显像管中,检验有300只不合格,求显像管的合格率? 统计学原理与工业统计 课程讲稿3、样本指标样本指标是抽样总体的统计指标。和总体指标相对应,常用的样本指标有样本平均数、样本标准差和样本成数。(1)样本平均数:是抽样总体各单位标志值的平均数。即:或(2)样本标准差S:是指样本中根据各单位标志值计算的标准差。或(3)样本成数p:是指样本中具有某一相同标志表现的单位数占样本容量的比重。样本中某一相同标志表现的单位数记为n1,则有:(4)样本成数的标

12、准差:小结:项目总体样本总体单位数Nn平均数 成数标准差方差 统计学原理与工业统计 课程讲稿4、重复抽样与不重复抽样从抽样的方法上看,抽样调查包括重复抽样与不重复抽样两种方法。(1)重复抽样:重复抽样也称回置抽样,它是指从总体N个单位中要抽取一个容量为n的样本,每次从总体中随机抽取一个总体单位,经调查登记后再放回总体,参加下一次抽选,直到抽选出第n个样本单位。由于每次在抽取样本单位时总体单位数都保持不变,因此,每一个总体单位被抽中的可能性是相同的,被抽中的概率为1/N。(2)不重复抽样:不重复抽样也称不回置抽样,它是指从总体N个单位中要抽取一个容量为n的样本,每次从总体中随机抽取一个总体单位,

13、经调查登记后不再放回总体中,而是从余下的总体单位中随机抽取下一个总体单位进行调查,直到抽选出第n个样本单位。在这种抽样方法中,第一个单位被抽中的机会为1/N,第二个单位被抽中的机会为1/(N-1),以此类推,总体中每个单位被抽中的机会是不相等的。在实际调查中,大多采用不重复抽样。当总体单位数很大,样本单位数相对较小时,重复抽样与不重复抽样的误差相差无几。第二节 抽样误差与抽样估计一、抽样误差1、含义:由于样本不能完全代表总体所产生的误差,就是抽样指标和总体指标之间的绝对离差。这种误差有样本平均数与总体平均数的差,样本成数与总体成数的差。2、统计调查中的误差(1)登记性误差是指在调查和整理资料的

14、过程中,由于主客观原因引起登记或计算错误而造成的误差,是所有统计调查都可能发生的误差。(2)系统性误差是指在抽样时违背了随机性原则而造成的误差。登记性误差和系统性误差都可以采取一定的措施加以避免。(3)抽样误差是一种代表性误差,但并不是所有的代表性误差都是抽样误差。抽样误差是指在没有登记性误差的前提下,又遵循了随机原则而产生的样本指标与被它估计的总体相应指标的差数。这种误差是不可以避免、难于消除的,但可以采取一定的方法加以控制。抽样误差的大小主要受以下因素的影响:总体各单位标志值的差异程度。在其它因素相同的条件下,总体各单位标志值差异程度越大,抽样误差也越大。样本的单位数。在其它因素相同的条件

15、下,样本单位数越多,抽样误差就越小。抽样的方法。一般地,不重复抽样的误差要小于重复抽样的误差。抽样调查的组织方式。由于不同的抽样组织方式的误差计算方法不同,因而抽样误差也不同,按有关标志排队的等距抽样误差一般小于其他形式的抽样误差。 统计学原理与工业统计 课程讲稿二、抽样平均误差1、抽样平均误差的含义从同一个总体N个单位中随机抽取n个单位组成样本可以有不同的取法,因而有很多个样本,并且各样本指标是随机变量,它们与总体指标之间存在着误差。抽样平均误差就是全部可能的样本指标与总体指标离差平方和的平均数的平方根,实际是抽样平均数或抽样成数的标准差。抽样平均数的标准差反映抽样平均数与总体平均数的平均误

16、差程度,抽样成数的标准差反映抽样成数与总体成数的平均误差程度。如果抽样平均误差越大,则抽样误差的离散程度就越大,样本的代表性就越弱;反之,抽样平均误差越小,则抽样误差的离散程度就越小,样本的代表性就越强。根据抽样平均误差的概念计算抽样平均误差时,由于总体平均数和总体成数是未知的,因此,无法采用标准差的形式计算抽样平均误差,但可以采用其他的方法计算抽样平均误差。2、抽样平均误差的计算(1)重复抽样的抽样平均误差1)抽样平均数的平均误差在重复抽样的条件下,抽样平均数的平均误差与总体的变异程度及样本容量两因素有关,即:式中,为抽样平均数的平均误差,为总体数量标志的标准差,n为样本容量。例如,随机抽区

17、某大学100名学生调查体重,经过称量和计算后,学生的平均体重58公斤,同时由过去的资料知道该校学生的体重总体标准差为100公斤,求平均体重的平均误差。2)抽样成数的平均误差在重复抽样的情况下,成数的抽样平均误差的计算公式为:式中,为抽样成数的平均误差,p(1-p)为总体是非标志的标准差。例如,某大学随机抽取400名学生,发现戴眼镜的有160人,计算戴眼镜学生所占比重的平均误差。 统计学原理与工业统计 课程讲稿(2)不重复抽样的平均误差1)抽样平均数的平均误差在不重复抽样的情况下,平均数的抽样平均误差计算公式为:当总体单位数N很大时,N-1N,上式又可以写为:可以看出,抽样平均数的平均误差与总体

18、的标准差成正比,与样本单位数的平方根成反比。公式中总体标准差通常是未知的,一般可以用历史资料来估计或者用样本标准差S来代替。2)抽样成数的平均误差在不重复抽样的情况下,成数抽样的平均误差为:当N很大时,上式可以写成:可以看出,在其他条件相同的情况下,不重复抽样的抽样平均误差小于重复抽样的抽样平均误差。在实际工作中,总体单位数一般很大,样本单位数相对较小,n/N接近于0,按重复抽样计算公式与不重复抽样计算公式计算的抽样平均误差相差甚微。因此,当按不重复抽样的方法抽取样本时,抽样平均误差的计算也常按重复抽样的公式计算。例如,某进出口公司出口一种名茶,从2 000包中随机抽取100包进行检验,资料如

19、下,试计算这批茶叶平均重量的误差及每包重量在149克以上的茶叶所占比重的误差。表7-1每包重量(克)包数(包)148149 10149150 20150151 50151152 20合计100计算时所需有关资料见表7-2。平均每包重量为: 统计学原理与工业统计 课程讲稿标准差为:表7-2组中值x包数fxf148.5 10 1 485-1.83.2432.4149.5 20 2 990-0.80.6412.8150.5 50 7 5250.20.04 2.0151.5 20 3 0301.21.4428.8合计10015 03076.0在重复抽样时,平均重量的抽样误差为:在不重复抽样时,平均重量

20、的抽样误差为:每包重量在149克以上的茶叶所占比重为:在重复抽样时,抽样成数的平均误差为:在不重复抽样时,抽样成数的平均误差为:三、抽样估计抽样估计就是根据样本指标的数值估计和推断总体指标的数值。它有两种估计方法:点估计和区间估计。1、点估计。又称定值估计,是用实际样本指标的数值代替总体指标的数值,即总体平均数的点估计值就是样本平均数,总体成数的点估计值就是样本成数。例如,某中学对200名学生进行调查,平均身高1.62米,戴眼镜的比例为35%。按点估计,则认为该校全体学生的平均身高为1.62米,戴眼镜的比例为35%可以看出,点估计的方法比较简单,一般不考虑抽样误差和估计的可靠程度,只适用于对推

21、断准确性与可靠程度要求不高的情况。2、区间估计。区间估计就是根据估计可靠程度的要求,利用样本指标确定一个范围,使估计的总体指标包括在其中。它要完成两个方面的估计: 统计学原理与工业统计 课程讲稿第一,根据样本指标和误差范围,估计出一个可能包括总体指标的区间;第二,确定出所估计的区间内包括总体指标的把握程度有多大。区间估计的要点如下:(1)确定总体指标所在的范围。P由抽样平均误差估计总体指标的范围称为置信区间,即为(),()。区间估计表明的是一个可能的范围,但不是一个绝对可靠的范围。总体指标真实值落在这个范围的可靠程度即概率为68.27%,该概率用F(t)表示,F(t)越接近于1,说明可靠程度越

22、高。数理统计证明,总体指标落在估计范围的可能性为68.27%表明:如果抽取10个样本,可以计算10个置信区间,其中约有7个置信区间可使总体指标真实值在其范围内,有3个置信区间使总体指标的真实值不在其内。(2)要提高推断的可靠程度即提高概率,必须扩大误差的范围。数理统计证明,在样本单位数足够多的条件下,抽样平均数的分布接近于正态分布,即以总体平均数为中心,两边完全为对称分布。此时,抽样误差的概率与概率度的关系如表7-3所示。概率和置信区间的关系是:以F(t)的概率进行估计,总体平均数的置信区间是(),总体成数的置信区间是()。t是估计值的误差范围,称作极限误差,它是样本指标与总体指标之间抽样误差

23、的可能范围,以表示,也称允许误差。平均数的极限误差可表示为,成数的极限误差可表示为。t为概率度,是测量估计可靠程度的一个参数,是极限误差与抽样平均误差相比的倍数。表7-3概率F(t)概率度t0.682710.79951.280.95001.960.954520.99733以表7-1的资料为例,估计茶叶的平均重量及每包重量在149克以上茶叶所占比重的可能范围,要求可靠程度为95.45%。在95.45%的概率下,t=2,则平均重量的允许误差为:平均重量(克)的可能范围为:150.3-0.17150.3+0.17150.13150.47 统计学原理与工业统计 课程讲稿成数的允许误差为:每包重量在14

24、9克以上的茶叶所占比重的可能范围为:90%-5.84%P90%+5.84%84.16%P95.84%计算结果表明,以95.45%的可靠程度来估计,这批茶叶平均每包重量在150.13150.47克之间,每包重量在149克以上的茶叶占全部茶叶的比重在84.16%95.84%之间。通过以上计算,区间估计的步骤总结如下:总体平均数的区间估计:抽取样本,用简单平均或加权平均的方法计算样本平均数;计算样本数量标志的标准差S或方差S2(也可用总体的标准差或方差);计算样本平均数的平均误差;根据F(t)确定t,计算极限误差;确定总体平均数的置信区间。总体成数的区间估计:抽取样本,计算样本的成数p;计算样本抽样

25、成数的平均误差p;根据F(t)确定t,计算成数的极限误差p;确定总体成数的置信区间。第三节 抽样调查的组织方式一、简单随机抽样1、含义:简单随机抽样又称纯随机抽样,是按照随机原则直接从总体N个单位中抽取出n个单位为样本,使每个总体单位都有同等的机会被抽中。这种抽样方式是抽样调查中最基本的也是最简单的方式,适用于均匀总体,即具有某种特征的单位均匀地分布于总体各个部分。2、简单随机抽样的具体方法:(1)直接抽选法。直接抽选法就是直接从总体中随机抽选样本单位进行调查,这种方法适用于小型总体。(2)抽签法。抽签法就是对被研究总体内各单位先进行编号,把序号写在纸上,搅匀后从中抽选。这种方法在总体单位数目

26、很大的情况下不宜采用。(3)随机数字表法。随机数字表是包含许多随机数字的表格,表中的随机数一般由计算机或用其他随机方法制成。为方便起见,可以编2个数码一组、4个数码一组,甚至10个数码一组。在使用随机数表时,先将总体所有单位进行编号,确定出使用表中数字的位数,然后从表中任意一行、任意一列、任意一个方向开始,遇到属于编号范围内的数字就作为样本单位,直到抽够样本容量为止。3、简单随机抽样适用情况:(1)总体单位数较少,范围也有限;(2)对总体的情况了解很少;(3)当抽到的单位比较分散时,不会影响调查工作。4、样本单位数的计算方法确定必要的样本容量是抽样调查方案中的一个重要问题,在简单随机抽样的情况

27、下,可以通过抽样平均误差公式计算必要的样本单位数。 统计学原理与工业统计 课程讲稿在重复抽样时,样本平均数的极限抽样误差公式为:则必要的样本单位数为:在不重复抽样时,必要的样本单位数为:同样,重复抽样和不重复抽样的成数必要样本单位数分别为:可以看出,必要的样本单位数受极限误差的制约,极限误差愈小则样本单位数就愈多。所以,在抽样组织中对抽样误差可能允许范围的确定要十分慎重。例如,某厂对生产的某型号电池进行电流强度检验,根据以往正常生产的经验,电流强度的标准差=0.4安培,而合格率为90%。现在用重复抽样的方式,要求在95.45%的概率保证下,抽样平均电流强度的极限误差不超过0.08安培,抽样合格

28、率的极限误差不超过5%,则必要的抽样单位数应该为多少?根据公式,在重复抽样条件下,抽样平均数的单位数为:抽样成数的单位数为:两个抽样指标所要求的单位数不同,应采取其中比较多的单位数,即抽取144个单位加以检验,以满足共同的要求。从理论上说,简单随机抽样最符合随机原则,是衡量其他抽样方式抽样效果的标准。但是,它在统计实践中的应用受到一定的限制,当总体很大、范围很广时不宜使用。二、类型抽样1、含义:类型抽样也称分层抽样,就是对总体各单位按某一标志加以分组后,从各组中随机抽出要研究的样本。在实际工作中,类型抽样得到了广泛的应用。在总体单位标志值大小相差悬殊的情况下,运用类型抽样比简单随机抽样可以得到

29、比较准确的效果。2、类型抽样的优点:(1)可以提高样本的代表性。在抽样前先进行分组,然后从各组中抽选样本单位,由于样本单位来自不同的组,能更接近总体的分布情况,因而提高了样本的代表性。 统计学原理与工业统计 课程讲稿(2)降低了影响抽样平均误差的总体方差。总体方差有组间方差和组内方差两种。在类型抽样的情况下,由于从各类型组都抽取了样本单位,对各类型组来说是全面调查,因此可以不考虑组间方差,而只考虑组内方差即可。3、具体方法:在分组后,抽取样本单位的具体方法有两种:等比例抽样与不等比例抽样。等比例抽样是各组按同一比例抽取样本单位。不等比例抽样是各组不按同一比例抽取样本单位。例如,某乡粮食播种面积

30、20 000亩,按平原和山区面积比例抽取其中的2%进行调查,有关资料如下,要求在95.45%的概率下估计平均亩产的可能范围。表7-4地形样本面积(亩)样本平均亩产(千克)亩产均方差(千克)平原280560 80山区120350150样本的平均亩产为:样本各组数量标志平均组内方差为:平均数抽样误差为:在95.45%的概率下,t=2,则极限误差为:粮食平均亩产的可能范围为:497-10.5497+10.5486.5507.5即该乡全部粮食平均亩产在486.5507.5千克之间。三、等距抽样1、含义:等距抽样也称机械抽样或系统抽样,它是把总体各单位按一定标志进行排队,然后按固定顺序和间隔抽取调查单位

31、。我国进行的城市住户调查、农村住户调查都采用这种方法。2、分类:(1)按照排队时依据的标志不同,等距抽样分为按无关标志排队和按有关标志排队两种。无关标志就是与调查项目没有直接关系的标志。例如,在调查职工生活水平时,按职工的姓氏笔划排队。有关标志就是与调查项目有直接关系的标志。例如,按职工工资水平的高低排队。(2)排队后由于抽选的方法不同,等距抽样又可分为随机起点等距抽样、半距起点等距抽样和对称抽样三种。例如,有1 000人,从中要抽取100人,每10人中抽1人。先把1 000人按一定标志排队,假设抽取第一个单位时用抽签法,抽的是排在第8号的人,则 统计学原理与工业统计 课程讲稿依次抽取排在第1

32、8、28、38、48号的人,这种抽样为随机起点等距抽样。如果抽取时抽的是每10个人的中点,即排在第5、15、25、35、45号的人,这种抽样为半距起点等距抽样。如果抽取时第一个抽取的是排在第3号的人,第二个抽取的应该是以10为对称点的排在第17号的人,以后依次抽选排在第23、37、43、57号的人,这种抽样方法为对称等距抽样。例如,某储蓄所年末按定期存款单帐号的顺序每10户抽取一户,共抽取500户进行调查,资料如表7-5所示。表7-5存款额(元)1000以下1000200020004000400050005000以上户 数105010026080试以95.45%的概率推断储户平均定期存款额的可

33、能范围。样本单位的平均存款额为:样本方差为:抽样平均误差:在95.45%的概率下,t=2,则储户平均定期存款额(元)为:3 980-105.983 980+105.983 874.024 085.98计算结果表明,储户平均定期存款额在3 874.024 085.98元之间。等距抽样具有简便、易行、推断的代表性高等特点,但在使用时要注意总体单位的标志值按一定顺序排列后是否有周期性波动。等距抽样的间隔不要与周期波动幅度一致,否则会产生较大的误差。四、整群抽样1、含义:整群抽样又称成批抽样,它是把总体各单位划分为若干群,以群为单位从中进行抽样,并对于抽中群的所有单位进行全面调查的一种抽样组织方式。

34、统计学原理与工业统计 课程讲稿2、优点及局限性它不同于前面介绍的三种抽样方式,它是以群为单位来抽取样本单位的,具有节约和方便的优点。其局限性在于:由于抽取的样本单位比较集中,在抽取相同数量样本单位数的情况下,抽样误差往往大于简单随机抽样的误差。因此,在实践中,整群抽样一般需要比其它抽样方式抽选更多的单位。3、计算方法设总体的全部单位N划分为R群,每群包括M个单位,现从总体R群中随机抽取r群组成样本,对中选r群的所有M单位进行全面调查,则第i群样本平均数为: (i=1,2,r)样本平均数为:样本平均数的抽样平均误差可以根据群间方差来推算。设2为群平均数的群间方差,则或整群抽样都采用不重复抽样的方

35、法,所以抽样的平均误差为:抽样成数平均误差的计算道理与类似。其样本成数p、样本成数群间方差及抽样成数平均误差分别为: 例如,从某县100个村中随机抽取10个村,对村中各户家禽饲养情况进行调查,平均每户饲养家禽35头,各村平均数的方差为16头。现以95%的概率推断该县平均每户饲养家禽数的可能范围,其抽样平均误差为: 统计学原理与工业统计 课程讲稿允许误差为:平均每户饲养家禽数的范围为:35-2.3535+2.3532.6537.35则该县平均每户饲养家禽数的可能范围在32.737.4头之间。从理论上讲,在进行整群抽样时应尽可能缩小群与群之间的方差,以减小抽样的平均误差。但实际上,群大多是自然形成的,很难人为地缩小群间方差。与简单随机抽样相比,如果调查单位相同,则整群抽样由于调查单位相对集中,不能均匀地分布在总体中,随机性受到影响,因此其准确性较简单随机抽样差。与其它几种抽样调查形式相比,其准确性也较差,但从费用角度看比较节约,所以应结合具体情况来选择适当的抽样调查组织方式。五、多阶段抽样在社会经济调查中,调查对象一般包括很多调查单位,分布面也很广,直接抽选样本单位非常困难,这就需要采用多阶段抽样的方式进行调查。前面介绍的四种抽样方式都属于单阶段抽样,即一次抽选就可以确定样本单位。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论