版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章抽样调查
第一节抽样调查概述
第二节抽样预计
第三节抽样组织形式11/114
(一)抽样推断含义
抽样调查是按随机标准,从全部研究对象中抽取一部分单位进行观察,并依据样本实际数据,对总体数量特征做出含有一定可靠程度预计和判断,从而到达对全部研究对象认识一个统计方法。其中心问题是怎样依据已知部分资料来推断未知总体情况。第一节抽样调查概述一、抽样调查含义22/114(二)抽样推断特点1.抽样推断是非全方面调查2.抽样推断是按随机标准抽选调查单位。3.抽样推断是用样本指标数值去推算总体指标数值。
4.抽样推断中产生抽样误差,能够事先计算并加以控制。
33/114二、抽样调查主要内容(一)随机抽样:按照随机标准从总体中抽取部分单
位组成样本过程。
(二)统计预计:依据随机抽取部分单位特征来对总体分布函数、分布参数或数字特征等进行推测估算过程。(三)假设检验:依据经验或认识,提出某一假设,并判断该假设正确性过程。44/114三、抽样推断作用(一)处理了无法进行全方面调查或极难进行全方面调查问题(二)能够补充或修正全方面调查数据
(三)能够节约调查费用和调查时间55/114
四、抽样推断包括基本概念(一)总体和样本1.全及总体(总体、母体)它是指调查对象全部单位,是由含有某种共同性质许多单位组成。组成总体单位称为总体单位,总体单位数通惯用N表示。66/1142.抽样总体(样本、子样)是指在总体中按随机标准抽取那一部分单位所组成集合体。组成样本单位称为样本单位,样本单位数亦称样本容量,通惯用n表示。样本单位数总是大于1而小于总体单位数N,即1<n<N。77/114样本单位数n相对于总体单位数N要小得多。
统计把n/N称为抽样百分比。样本单位数到达或超出
30个(n≥30)称为大样本,而在30个以下(n<30)称为
小样本。社会经济现象抽样调查多取大样本,而自然试验观察则多取小样本。以很小样原来推断很大总体,这是抽样推断法主要特点。88/114(二)总体指标和抽样指标1.总体指标总体指标是指依据总体各单位标志值计算出来,反应总体某种属性或特征综合指标,亦称为总体参数。因为总体是惟一确定,所以,根据总体计算总体指标也是惟一确定。惯用总体指标有:总体平均数、总体成数、总体标
准差和总体方差。99/114
(1)总体平均数代表总体单位数量标志普通水平指标,它表明变量
变动集中趋势,通惯用表示。其中:
X1,X2,…Xn为总体中每一个调查单位取值
N是总体单位数
∑是总和符号1010/114(2)总体成数当总体一个现象有两种表现时,其中含有某一个表现单位数占总体单位数目标比重,叫总体成数,用P或Q表示。其计算公式为:N代表总体单位数;
N1代表含有某一个表现总体单位数;
No代表含有另一个表现总体单位数;
P、Q代表成数。1111/1141212/114〔例1〕某企业生产10000件产品中,有500件
为不合格品。则
产品不合格率
P=/N=500/10000=5.0%
产品合格率
Q=1—P=1-5.0%=95%1313/114(3)总体标准差和总体方差。
表示单位之间标志值变异程度指标,叫做总
体标准差,又称总体均方差(标准差)。总体标准差平方称为总体方差。其计算公式为:1414/1142.抽样指标
抽样指标是指依据抽样总体各单位标志值计算综合指标,又称样本指标。惯用抽样指标有:抽样平均数、抽样成数、抽样总体标准差和抽样总体方差。1515/114(1)抽样平均数。
代表样本单位数量标志普通水平指标称抽样平
均数或样本平均数。1616/114(2)抽样成数。
在抽样总体中,一个现象有两种表现时,其中含有
某一个表现单位数占抽样总体单位数比重,叫
做抽样成数,亦称样本成数。用p或q表示。其计算
公式为:1717/114同总体成数1818/114[例5.2)从某企业生产产品中,抽样检验了
100件产品,其中有5件不合格,则:
样本产品不合格率:
样本产品合格率
1919/114(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度指标,叫做抽样
总体标准差。抽样总体标准差平方称为抽样总体方
差(简称样本方差)。其计算公式为:2020/114一个总体能够抽取许多个样本,而样本不一样,
抽样指标数值也各不相同。可见,抽样指标数
值不是惟一确定。因为抽样指标是样本变量函数,是随机可变变量。也就是说,由样本观察值所决定统计量是随机变量。2121/114
(三)重复抽样和不重复抽样1.重复抽样(重置抽样)采取这种方法抽取样本单位特点是:同一单位有屡次重复被抽中机会,而且总体单位数目始终不变,每个单位抽中或抽不中机会在各次都是相同。2222/114
2.不重复抽样(不重置抽样)采取这种方法抽取样本单位特点是:同一单位只有一次被抽中机会,而且总体单位数目伴随样本单位数目抽取次数增多而愈变愈少。每个单位抽中或抽不中机会在各次是不一样。2323/114第二节抽样预计一、抽样误差概念1.由样本得到预计值与被预计总体未知真实特征值之差,就是误差。或样本指标数值与总体指标数值之间差数。2.抽样误差就是指按随机标准抽样时,单纯由不一样随机样本得出不一样预计量而产生误差。2424/114抽样误差是随机变量。抽样误差愈小,表示样本代表性愈高;反之,样本代表性就愈低。4.抽样误差是不能消除,但能够把它控制出所允许范围以内。2525/114二、抽样平均误差
(一)抽样平均误差含义
抽样平均误差是指一个抽样方案全部可能样本
某统计量与总体对应指标离差平均值。纯随机抽样平均误差定义关系式以下:2626/114上式表明了抽样平均误差含义,并不能作为计算公式。因为:1.在现实抽样中,我们只能取得一个样本,不可能也没必要取得全部全部可能样本,所以抽样平均误差也不可能经过全部样原来直接计算。2.统计量分布律中我们已经知道:统计量是以总体对应指标为期望值,抽样平均误差实质上就是该统计量在其概率分布中标准差。2727/114(二)抽样平均误差计算1.抽样平均数平均误差(1)在重复抽样条件下总体方差已知,样本平均数服从正态分布,其抽样平均数平均误差计算公式为:2828/114由上式能够看出,抽样平均数平均误差就是抽样平均数标准差。抽样平均误差和总体标准差是成正比,与样本单位数平方根成反比。所以,要想降低抽样平均误差以提升抽样指标代表性,只能增大样本单位数n,因为总体标准差是不能改变。2929/114(2)在不重复抽样条件下,抽样平均数平均误差计算公式为:
当总体单位数N很大时,公式中N—1能够用N代替。3030/114在实际计算时,不重复抽样抽样平均数平均误
差可用下式计算:3131/1142.成数平均误差统计成数(比重)是一个结构相对数,它实际属于是非标志平均数特例。统计上习惯以1表示“是”,以0表示“非”。p为1概率,q=1—p为0概率。成数方差是P(1-P)其特点为,最大值为0.25(0.5×0.5),即当两种表现总体单位各占二分之一时,它变异程度最大。3232/114在重复抽样条件下,其计算公式为:在不重复抽样条件下,其计算公式为:3333/114当N很大时,以N代替N—1,则可简化为:3434/114[例3〕某企业生产一批灯泡,共1000只,从中随机抽取100只,测其寿命平均为1000小时,样本标准差为60小时,计算其抽样误差。
按重复抽样计算:3535/114按不重复抽样计算:3636/114〔例5.4〕某企业有员工10000人,从中随机抽选1000人调查电脑拥有率,发觉50家有,问这一调查抽样误差为多少?解:p=50/1000=0.05按重复抽样计算:3737/114按不重复抽样计算:
3838/114(三)极限误差
极限误差是指抽样推断中依一定概率确保下误
差最大范围。1.抽样平均数极限误差:3939/1142.抽样成数极限误差:4040/1144141/114(四)抽样预计可靠程度
抽样极限误差通常是以抽样平均误差为标准单位来衡量,即:4242/114抽样极限误差也能够表示为抽样平均误差若干倍,其倍数即概率度t:4343/114同理:4444/114〔例5.5〕某农场种植小麦5000亩,收获前夕随机抽取
25亩进行实割实测,测得平均亩产500千克,标准差为
50千克,试求全部5000亩小麦平均亩产在480千克至
520千克之间概率。
4545/114三、影响抽样误差原因
(一)抽样单位数目标多少
(二)总体被研究标志变异程度
(三)抽样方法
(四)组织形式不一样
4646/114四、抽样预计(一)点预计和区间预计。
点预计也叫定值预计,它是以抽样得到样本指标作为总体指标预计值。区间预计是依据一定准确度和可靠程度要求,用样本指标和抽样误差去推断总体指标可能范围一个预计方法。4747/1141.依据给定抽样极限误差范围,求出对应可信度F(t)2.依据给定可信度F(t),求出对应抽样极限误差范围(二)区间预计两种模式:4848/114例1,已知:x=80,
2=40,n=10,P(t)=0.95,在重复条件下对总体平均数进行预计。解:u=2t=1.96=tu=3.92x-<X<x+,80-3.92<X<80+3.92点预计:总体平均数为80区间预计:以95%概率确保总体平均数在76.08-83.92之间例2,已知:x=80,
2=40,n=10,=4,在重复条件下对总体平均数进行预计。解:u=2,t=/u=2点预计:总体平均数为80区间预计:以95.45%概率确保总体平均数在76-84之间4949/114例3,某单位从全部职员中随机抽取196名进行调查,得知整年平均收入为8600元,标准差为840元。其中,有存款职员为147人。要求在95.45%概率确保程度下,分别对全部职员每人年平均收入和存款职员比重进行区间预计。解:因为没有全及总体(N)资料,只能用重复抽样计算(1)ux=840/(196)1/2=60
x=2*60=1208480~8720(2)up=3.1%
p=6.2%68.8%~81.2%5050/114例4,某外贸企业出口一个茶叶,要求每包规格不低于150克。现在用不重复抽样方法抽取其中1%进行检验,其结果以下:每包重量(克)包数148~14910149~15020150~15150151~15220(1)以99.73%概率确保程度预计这批茶叶平均每包重量范围,方便确定平均重量是否到达规格要求。(2)以一样概率确保预计这批茶叶合格率范围。5151/114解:(1)列出计算表组中值(x)包数(f)xf(x-x)2f148.510148532.4149.520299012.8150.55075252151.520303028.8累计1001503076抽样平均数150.3样本标准差0.876抽样平均误差0.087
=0.26在99.73%概率确保程度下,150.04~150.56,到达规格要求。5252/114(2)样本成数p=70%抽样平均误差up=4.6%
=tup=3*4.6%=13.8%以99.73%概率确保程度预计,该批茶叶合格率在56.2%~83.8%之间。5353/114例5某糖厂有一台自动包糖机,包装重量为50
kg。现对包装白糖重量进行检验,每生产10袋抽取
1袋。某日糖厂共包装300袋,抽取30袋资料以下,若依据质量要求,每袋糖极限误差小于120g,试预计该机器包装精度。5454/114重量(kg)x袋数f49.449.649.850.050.250.450.650.813575441累计305555/114(1)计算样本平均数和标准差,并推算平均误差:
5656/114(2)依据给定极限误差△=0.12kg,计算总体
平均数上限和下限:5757/114(3)5858/114(4)点预计:该包装机平均包装重量为
50.1kg,误差小于120g可靠程度为95.45%
区间预计:在95.45%可靠程度下,预计该包装机包装平均重量在49.98-50.22kg之间。5959/114例6某企业设计一个新式产品,为了预测销
路,随机抽取了900人进行了调查,结果有720人
表示能够购置。假如要求极限误差不超出3.5%,
试预计该产品能够销售比率。
(1)依据样本资料,计算样本成数及平均误差:6060/114(2)依据给定极限误差3.5%,计算:6161/114(4)点预计:预计该产品销售率为80%,
其误差小于3.5%可靠程度为99%。
区间预计:在99%确保程度下,预计该产品销售率在76.5-83.5%之间。6262/114例7从全校近万名学生中,随机抽取100名学生
平均身高为160cm,依据计算,学生身高标准
差为3cm。现要求可信度要到达95.45%,试对全
体学生平均身高进行预计。6363/114(2)依据给定可信度F(t):95.45%,查概率表t=2
(3)计算极限误差和平均身高上下限:
上限=160+0.6=160.6cm
下限=160-0.6=159.4cm6464/114(4)点预计:该校学生平均身高为160cm其误差
小于0.6cm可靠性为95.45%。
区间预计:在95.45%确保程度下,该校学生平均身高为159.4—160.6cm之间。6565/114第三节抽样组织形式
一、抽样组织方式
抽样组织方式按抽样时对总体加工整理形式不一样,分为简单随机抽样、类型抽样、等距抽样和整群抽样。6666/114(一)简单随机抽样1.简单随机抽样含义简单随机抽样又称为纯随机抽样,它是不对总体做任何加工整理,直接从总体中抽取调查单位抽样方式。必须满足以下两条要求:①代表性,即要求样本分布与总体分布相同;②独立性,即要求样本各个单位相互独立。6767/1142.简单随机抽样方法(1)抽签法。适适用于总体单位数较少总体。
(2)随机数表法。适适用于大规模社会经济调查。
(3)简单随机抽样平均误差6868/114(二)类型抽样1.类型抽样含义类型抽样又称为分层抽样或分类抽样,它是将总体单位先按一定标志分组,然后在各组中随机抽取样本抽样组织方式。主要标准是:分组时应使组内差异尽可能小,使组间差异尽可能大。6969/1142.类型抽样方法(1)等百分比抽样:按一样抽样比n/N。(2)不等百分比抽样多指某类单位在总体中占比重过小时,对其按百分比抽不到或只能抽到极少数量,为了确保样本中各类单位代表性而采取不等百分比抽样方法。7070/114(三)等距抽样1.等距抽样概念等距抽样又称为机械抽样或系统抽样。它是先将总体各单位按相关标志或无关标志进行排列,再按照固定次序和间隔来抽选样本单位一个抽样组织形式。等距抽样是不重复抽样,通常能够确保被抽取单位在总体中均匀分布,缩小各单位之间差异程度,提升样本代表性。7171/1142.抽样方法(1)无关标志排队法:就是指总体单位采取与调查项目没相关系标志进行排队方法。
(2)相关标志排队法:就是总体单位采取与调查项目相关标志进行排队方法。7272/114(四)整群抽样1.整群抽样含义
是先将总体各单位划分成若干群,再以群为单位从中随机地抽取出若干群来,对被抽中群全部单位进行调查一个抽样组织形式。7373/1142.抽样方法首先对所要研究总体依据需要划分出群单位;其次把各群按时间次序或空间次序排列编号;最终可按筒单随机抽样或等距抽样方法抽取样本群。7474/114(五)阶段抽样两阶段抽样:假如先将总体进行分组,从中随机抽出一些组,然后再从中选组中随机抽取总体单位。
多阶段抽样:假如将整体进行多层次分组,然后依次在各层次中随机抽取,直到抽取到总体单位。7575/114多阶段抽样优点是:1.便于组织抽样。它能够直接按现行行政区划或地理区域划分阶段抽样单元,从而简化抽样框编制。2.能够取得各阶段单元调查资料,依据最初级资料进行逐级抽样推断,得到各级调查资料。3.多阶段抽样方式比较灵活,各阶段抽样组织方式应以前述四种方式为依据进行选择。7676/114二、样本容量确实定(一)确定抽样样本容量必要性样本容量就是抽样数目。在抽样调查中样本容量越多,抽样误差越小。抽样数目越多,抽样调查费用也越高,而且还会影响到调查时效性。确定样本容量时,应在确保满足抽样调查对数据预计准确度和概率把握程度(置信度)下,尽可能缩小抽样数目,即确定必要抽样数目。7777/114(二)影响样本容量原因1.总体被研究标志变异程度总体被研究标志变异程度大,则应抽取较多样本单位;总体被研究标志变异程度小,则可抽取较少样本单位。7878/1142.允许误差范围
即要求预计精度。假如允许误差范围小,即
要求准确度高,应抽取较多样本单位;反之应抽取较少样本单位。
3.抽样推断可靠程度
抽样推断要求可靠程度越高,则应抽取样本单位越多;要求可靠程度越低,则应抽取样本单位越少。7979/114(三)必要抽样数目标计算在简单随机抽样中,必要抽样数目标计算公式有:1.重复抽样条件下(1)平均数必要抽样数目公式:8080/114(2)成数必要抽样数目公式8181/114〔例5.9〕对某型号电子元件10000只进行耐用性能调查。依据以往抽样测定,求得耐用时数标准为600小时。试在重复抽样条件下:①概率确保程度为68.27%,元件平均耐用时数误差范围不超出150小时,要抽取多少元件做检验?8282/114(2)依据以往抽样检验知道,元件合格率为95%,合
格率标准差为21.8%,要求在99.73%概率确保
下,允许误差不超出4%,试确定重复抽样所需抽取
元件数目是多少?8383/1142.在不重复抽样条件下(1)平均数必要抽样数目公式:8484/114(2)成数必要抽样数目公式:8585/114抽样推断习题课8686/114(一)判断题1.抽样调查着眼点就在于对样本数量特征认识。()2.极限抽样误差总是大于抽样平均误差。()3.扩大抽样误差范围,能够提升推断把握程度;缩小抽样误差范围,则会降低推断把握程度。()8787/1144.总体指标是随机变量,样本指标也是随机变量,
所以二者之间会产生误差。()
5.缩小抽样误差范围,则抽样调查准确度就会提升。()
6.依据样本总体各单位标志值或标志特征计算综合指标称为样本指标。()
7.纯随机抽样就是遵照随意性标准抽选样本。()8888/1148.不一样抽样组织方式下,计算抽样平均误差应该采取不一样公式。()利用区间预计方法,能够依据样本预计值x和p,准确地推断出总体参数x和p所在范围。()因为抽样调查中现有登记误差又有抽样误差,所以只有登记误差全方面调查准确性高。()8989/11411.抽样误差在抽样推断中是不可防止。()
12.重复抽样抽样误差一定大于不重复抽样抽样误差。()9090/114(二)单项选择题1。在抽样推断中,抽取样本必须遵照()①随意标准②随机标准③可比标准④对等标准2.能够事先加以计算和控制误差是()①抽样误差②登记误差③系统性误差④测量误差3.极限误差与抽样平均误差数值之间关系为(①前者一定小于后者②前者一定大于后者③前者一定等于后者④前者既能够大于后者,也能够小于后者9191/1144.抽样调查主要目标在于()①计算和控制抽样误差②了解全及总体单位情况③用样原来推断总体④对调查单位作深入研究。5.某企业连续性生产,为检验产品质量,在24小时中每隔30分钟取下一分钟产品进行全部检验,这是()①整群抽样②简单随机抽样③类型抽样④纯随机抽样9292/1146.在抽样调查中()
①现有登记误差,也有代表性误差
②既无登记误差,也无代表性误差
③只有登记误差,没有代表性误差
④没有登记误差,只有代表性误差
7.在抽样调查中,防止误差是()①登记误差②系统性误差③计算误差④抽样误差8.置信区间大小表示了区间预计()①可靠性②准确性③显著性④及时性9393/1149.抽样推断中概率确保程度表示了区间预计()①显著性②准确性③可靠性④规律性10.抽样平均误差反应了样本指标与总体指标之间()①可能误差范围②平均误差程度③实际误差④实际误差绝对值9494/11411.样本指标和总体指标()
①前者是个确定值,后者是个随机变量
②前者是个随机变量,后者是个确定值
③二者均是确定值
④二者均是随机变量
12.对标志变异程度较大总体进行抽样调查时,宜采取()
①纯随机抽样②等距抽样③类型抽样④整群抽样9595/11413.在抽样前,需对全及总体单位一一编列序号抽样组织方式是()①纯随机抽样②机械抽样③类型抽样④整群抽样14.抽样平均误差是()①全部样本指标平均数②全部样本指标平均差③全部样本指标标准差④全部样本指标标志变异系数9696/11415.成数方差最大值,是当P值趋近于()
①0.1②0.9③0.8④0.516.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差()①前者小于后者②前者大于后者③二者相等④无法确定哪一个大17.在其它条件保持不变情况下,抽样平均误差()①伴随抽样数目标增加而加大②伴随抽样数目标增加而降低③伴随抽样数目标降低而降低④不会随抽样数目标改变而变动9797/11418.允许误差反应了样本指标与总体指标之间()
①抽样误差平均数②抽样误差标准差
③抽样误差可靠程度④抽样误差可能范围19.从名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数抽样平均误差为()①0.24%②4.85%③4.97%④以上都不对9898/114(三)多项选择题1.抽样调查特点是()①按随意标准抽取样本②按随机标准抽取样本③由部分推断总体④能够事先计算并控制抽样误差⑤缺乏科学性和可靠性2.简单随机化抽取调查单位时其方法有()①纯随机抽样②等距抽样③重复抽样④不重复抽样⑤整群抽样9999/1143.假设从6个人总体中随机抽取2个人进行调查()①样本指标是随机变量②总体指标是随机变量③样本指标是唯一确定④总体指标是唯一确定⑤样本指标是样本变量函数4.抽样调查中抽样误差是()①不可防止②能够防止③能够事先计算并加以控制④抽样预计值与总体参数值之差⑤受总体标志变动程度影
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030家居照明产品行业市场供需现状与发展潜力分析评估规划分析报告
- 第五课+在和睦家庭中成长+课件-2026届高考政治一轮复习统编版选择性必修二法律与生活
- 小学数学趣味题目与解题技巧
- 上海市高中英语阅读理解模拟卷
- 2026年节能建筑电气设计的教育和培训
- 幼儿体育活动与健康促进方案
- 预制混凝土块护坡施工方案
- 电力规划培训课件
- 2026年电气安全改造项目的实施流程
- 2026年工业下的电气传动系统设计
- 护理核心制度内容精要
- 俱乐部转让合同模板(3篇)
- 光伏系统的安装工程监理实施细则
- 教练员劳务合同范本
- 贵港市利恒投资集团有限公司关于公开招聘工作人员参考题库附答案
- 腰椎OLIF手术课件
- 2025西藏林芝市消防救援支队政府专职消防员招录8人备考题库附答案解析
- 2025年农业投资入股协议(生态)
- 2025贵州铜仁市“千名英才·智汇铜仁”本地引才413人备考考试题库及答案解析
- 漫画委托创作协议书
- (2025年)功能性消化不良中西医结合诊疗专家共识解读课件
评论
0/150
提交评论