抽样调查期末复习题_第1页
抽样调查期末复习题_第2页
抽样调查期末复习题_第3页
抽样调查期末复习题_第4页
抽样调查期末复习题_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、简答题

1.为什么分层抽样常在全国范围抽样调查中被采用?

答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行

推算。(3分)

(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。(3分)

(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估

计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。(2

分)

(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。

2.整群抽样的优缺点是什么?

答:整群抽样可以简化抽样框的编制。

样本单元比较集中,实施调查便利,且能节约费用。缺点是:当群内具有一定的相似性,而

不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。

3.简述分层的原则及如何选择分层标志?

答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。此时,应

以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分

层应做到“层内差异大,层间差异小二

最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较

大线性相关的指标作为分层标志。这个标志可以是调查指标的前期指标,也可以完全是另一

个变量。

4.为什么多阶抽样常在大型抽样调查中被采用?

答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同

时乂避免了对小单元过多调青造成的浪贽,充分发挥抽样调杳的优点。(2)由于多阶抽样是

分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的

初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的

抽样框,从而大大降低「编制抽样框的工作量。所以多阶抽样常用于大范围的目抽样单元为

各级行政单位的情况。对于大型调查中,抽样框变动非常频繁的情况,特别适合用多阶抽样。

2、简单随机抽样

【例1.1]我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计

总体平均水平并给出置信度为95%的区间估计。如表

简单随机样本的指标值

序号i12345678910

%45204661508

解:依题意。N=100,n=10,f=——=0.1

100

计算样本均值及样本方差为:

_1s50U

>=一>:行=5

io

21</_、2172..

s=—;'()。一)')=—%I1O911

〃-1M9

因此对总体平均水平的估计为:

Y=y=5

对的方差及标准差的估计为:

V(rd)=-1--^fS2_=-1--^0-1x19.11^1.72

n10

^(y)=7v(r)«1.3115

由置信度95%对应的t=1.96,因此,可以以95%的把握说总体平均水平大约在

5±1.96X1.3115之间,即2.4295〜7.570之间。

【例1.2](续例1.1〉如果采取放回抽样,则相应结果为多少?

解:由上例知了==噂=5,s?=」■;•之(必一》)2=铮4]9.11

10〃-1普9

、1,1

v(y)=-52=—xl9.11=1.911

•n10

s(y)=ylv(y)=1.3824

由置信度95%对应的%_〃/,=1.96,因此,可以以95%的把握说总体平均水平大约

在5±1.96x1.3824即[2.2905,7.7095]之间。

【例1.3】某销售公司希望了解全部3000家客户对该公司的综合满意程度,决定用电

话来调查一个简单随机样本。这时,销售公司希望以95%的把握保证客户满意的总体比例P

在样本比例p±10%的范闱内,但对总体比例P无法给出一个大致的范围。这时,应该调查

多少个客户,才能保证对总体比例估计的要求?(P30)

解:由该问题给出的条件:N=3000,d=10%=0.1,置信度95%,对应的〃“2=196,

由于无法得到P的初始估计值,因此取使方差达极大值的P=0.5,得到最保守的〃:

乂乙2s2_1.96x0.5x0.5

【例1.4】某居民区共10000户,欲估计该居民区的用水量。采用简单随机抽样抽选了100

户,得样本均值为12.5吨,样本方差为1252吨。

(1)估计该居民区的总用水量的置信度95%的置信区间。

(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20乐试问应抽多少户作样

本?(P31)

解:⑴

y=A^=125000

4s=35206.25

s(h=Ns(y)=N

V的置信度为95%的置信区间为:

Y-uaS(y),Y+u(K)=[55995.75,194004.25]

1-1―

22

y=7^=125000

s(户)=Ns(力=NJ上』s=N心=35383.612

Vnyjn

(2)

渊置信度为95%的置信区间为:

Y-uas(K),y+«(y)=[55648.12,194351.88]

I----1----

〃=1-a/2;=7695工77()

°(万¥

n=—^=714.9^715

1+国

N

3、不等概率抽样

【例2.1]某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个

养猪专业户上年末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与

各养猪专业户上年末生猪存栏头数成正比的概率从中抽取30户进行调查,调查结果见表

6.3。己知全县养猪专业户上年末生猪存栏数为9542头,试估计该县养猪专业户生猪出栏总

头数

某县养猪专业户年生猪出栏头数调查样本资料(单位:头)

iyiXiK

1157511402582119124

22313412321862226160

39371317692337215

42915214261562421104

584515114925749

63118516362212643336

7241331725145271896

829173185332830177

913741938288

1019872042304

注:,表示养猪专业户样本编号,/%表示各专业户生猪上年末存栏数,£表示各专业户调查年生猪出栏头数,

其中第2、19号专业户被抽中两次.

解:根据题中所给资料,〃=3(),M0=9542

9542〃5

—>—=----(—+区x2+…+见)才56163卜头)(P56,3.1.2)

n占网30152330

可力)=7彳£(乂-心了

n(n-\),=|z,.

_/y卢_】〃/)2

95422r/7556163,13456163,。17756163

=------(-----------)-+(------------x2+..-+(------------xr21

30x29159542239542309542

x2806070

阳%)="%)=1575(头)(P583.1.5)

4、分层随机抽样

【例3.1】某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居

民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是

城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为

2546元。求全市年平均户收入的置信度为90%的置信区间。(P75)

解:根据已知条件有:

23560148420八。/”

W=------=0.1370,1%=------=0.8630

1171980-171980

四二X%%=卬值+也无

ft=l

=().1370X15180+0.8630x9856=10585.39

2

v(JiZ)=yVV,上/■s;=20260.6756

/=1〃i

历J=142.34(元)

故全市年平均户收入M置信度粉0%的置信区间为:

兀一〃/(%),%+〃s(y)=L10585.39±1.645x142.34],EP[10351.24,10819.54]

1——1asl

【例3.2]在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。调查

结果如表所示。试以95%的置信度估计总体中会计算机者占的比例。(P75)

计算机使用情况调查

样本中会使用计算机

层人数入样人数

的人数

30岁以下77817124

30-35岁7497

6812

89

36〜40岁977922

II

41-45岁462742

45岁以上4

536650

总计35050320

解:由表中数据得到:

]八=0.3380,p2=0.1765,凸=0.2472,/%=0.2620,p,=0.0800,

叱=0.2220,吗=0.2139,%=0.2790,%=0.1320,%=0.1531

则—=之以==0.2286

由于抽样比很小,故可以忽略不计。估计量的方差为

)=£卬/(1一/”.丁-0.000534

h=i/一1

P置信度为95%的置信区间为:

=[18.33%,27.39%]

5、样本量在各层的分配

【例3.3]调查某地区的2850户居民奶制品年消费支出,以居民户为抽样单元,根据

经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,样本

量为40,若按比例分配和Neyman分配时,各层样本量应为多少?

样本户奶制品年消费支出

样本户奶制品年消费支出

层居民户总数

12345678910

12001040011015104080900

24005013060801005516085160170

375018()26011()014060200180300220

415005035150203025103()25

解:由表得

N、=200,M=400,M=750,N、=1500,N=2850

4=n2=%=&=1。

N

Wl=侍=0.070=0.14035,W3=0.26316,%=0.52632,

/=令=0.05,f2=0.025,f3=0.0133,/4=0.0067

各层样本均值及方差为

%=39.5,$;=_!_^£(九一片尸«1624.722

同理可得

%=105,%=165,y4=24

s;=2166.667,学=8205.556,s:=193.333

从而

73.56194(元)

h=\

按比例分配时,各层样本量为(P82)

〃1="〃=2.81,n.=VV2/?=5.61,/?3=Wyn=10.53,n4==21.05

即各层样本量分别为36,10,21o

对十Neyman分配,

200

gl=V1624.722=2.8286,J2166.667=6.5330

28502850

75078205.556=23.8380,W岛=史&&93.333=7.3181

2850।2850

即2吗%=40.51775,从而

/»=|

_小-28286

«2.79

40.51775

同理有n2=6.45,叼=23.53,n4=7.23

即各层样本量分别为3,6,24,7o

【例3.4]某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)

的开支,在全校8000名学生中抽出了一个200人的简单随机样本。根据学生科的统计,本

科生人数为全校学生的70%,调查最近一个学期课外进修支出(单位:元)的结果如表

在校学生课外进修开支调查结果

样本均值(以)/元样本标准差(.)/元

层(力)层权()样本量(nh)/人

本科生0.7120253.4231.00

研究生0.380329.4367.00

合计1200276.2294.57

试估汁全校学生用于课外进修的平均开支。

解:全校学生用于课外进修的平均开支为:

2

%”=Z叱用=67x253.4+0.3x329.4=276.2(元)

h=l

估计量方差的样本估计为:(P75,4.l.8)

v="381.83

nh=\n力=1

估计的标准差为:

/(%)=19.54(元)

如果是采用简单随机抽样,则

/—、1—J)1—0.025.[

v(y)=———s~=--------x294.57~«423.1

n200

Jy(])=2057(元)

6、比率、回归与差估计

【例4.1】某小区有1920户,从中随机抽取了70户,调杳各户的住房面积(单位:平

方米)和家庭人口,得数据:

7(z)70

%=1821.4,2%=260

l=l;=1

7OZ7070

X-2=52940.7,2茗2=11IO,ZMW=7264.5

I=Ii=ii=i

试对人均住房面积作点估计和置信度为95%的区间估计,

解:由已知条件有:

70

1821.4

/=1=7.01

70260

*=|

70707070

-机)2=E胃-2Az)居+=5637.92

/=1/=1(=11=1

V(心的渐近无偏估计为:

y(x-^x;)2(P36,2.5.2)

i或*=三。卫------------工0.085

tvc2n-\

R的置信度为95%的置信区间为:

R-u%(A),R+u.Ji,(J)=[6.44,7.58]

1----I----

【例4.2】交通运输统计中有三个重要的指标,即运量、周转量与平均运距,三者关系如F:

平均运距二周转量/运量。为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取

32辆货车,记录每辆货车在一个月内的运量Xi(单位吨)与周转量yi(单位吨公里),经计

算得:

n=32,心=5974,2=1244764

;=1J=l

"=295500名「二303968760。春/=61357665

Z=1r=lr=l

试用比估计给出平均运距R估计和其标准差的估计。

32

解:R—=49.4643

1=1

V(用的渐近无偏估计为:

}_f欣)2

v(^)=~1-------------x0.440943

fix2n-\

s(A)=0.664(公里)

【例4.3]某地有规模以下工业企业127个工友固定资产价值6794.5万元,从中随机抽

取20个企业调查工业产值和固定资产价值,资料如表所示。试估计该地区规模以下工业总

产值。

企业固定资产价值及工业产值(单位:万元)

固定资产价值工业产值固定资产价值工业产值

3532.05045.5

4340.27065.0

50

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论