版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、简答题
1.为什么分层抽样常在全国范围抽样调查中被采用?
答:(1)分层抽样不仅能对全国指标进行推算,还可以对各省、自治区、直辖市的指标进行
推算。(3分)
(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施。(3分)
(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估
计误差,而层内的差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。(2
分)
(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。
2.整群抽样的优缺点是什么?
答:整群抽样可以简化抽样框的编制。
样本单元比较集中,实施调查便利,且能节约费用。缺点是:当群内具有一定的相似性,而
不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差。
3.简述分层的原则及如何选择分层标志?
答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。此时,应
以需估计的子总体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分
层应做到“层内差异大,层间差异小二
最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较
大线性相关的指标作为分层标志。这个标志可以是调查指标的前期指标,也可以完全是另一
个变量。
4.为什么多阶抽样常在大型抽样调查中被采用?
答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同
时乂避免了对小单元过多调青造成的浪贽,充分发挥抽样调杳的优点。(2)由于多阶抽样是
分阶段实施的,因此,抽样框也可以分级进行准备,只需编制初级单元的抽样框,对抽中的
初级单元再准备二阶抽样单元的抽样框,以此类推,对抽中的单元再准备下一级抽样单元的
抽样框,从而大大降低「编制抽样框的工作量。所以多阶抽样常用于大范围的目抽样单元为
各级行政单位的情况。对于大型调查中,抽样框变动非常频繁的情况,特别适合用多阶抽样。
2、简单随机抽样
【例1.1]我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计
总体平均水平并给出置信度为95%的区间估计。如表
简单随机样本的指标值
序号i12345678910
%45204661508
解:依题意。N=100,n=10,f=——=0.1
100
计算样本均值及样本方差为:
_1s50U
>=一>:行=5
io
21</_、2172..
s=—;'()。一)')=—%I1O911
〃-1M9
因此对总体平均水平的估计为:
Y=y=5
对的方差及标准差的估计为:
V(rd)=-1--^fS2_=-1--^0-1x19.11^1.72
n10
^(y)=7v(r)«1.3115
由置信度95%对应的t=1.96,因此,可以以95%的把握说总体平均水平大约在
5±1.96X1.3115之间,即2.4295〜7.570之间。
【例1.2](续例1.1〉如果采取放回抽样,则相应结果为多少?
解:由上例知了==噂=5,s?=」■;•之(必一》)2=铮4]9.11
10〃-1普9
、1,1
v(y)=-52=—xl9.11=1.911
•n10
s(y)=ylv(y)=1.3824
由置信度95%对应的%_〃/,=1.96,因此,可以以95%的把握说总体平均水平大约
在5±1.96x1.3824即[2.2905,7.7095]之间。
【例1.3】某销售公司希望了解全部3000家客户对该公司的综合满意程度,决定用电
话来调查一个简单随机样本。这时,销售公司希望以95%的把握保证客户满意的总体比例P
在样本比例p±10%的范闱内,但对总体比例P无法给出一个大致的范围。这时,应该调查
多少个客户,才能保证对总体比例估计的要求?(P30)
解:由该问题给出的条件:N=3000,d=10%=0.1,置信度95%,对应的〃“2=196,
由于无法得到P的初始估计值,因此取使方差达极大值的P=0.5,得到最保守的〃:
乂乙2s2_1.96x0.5x0.5
【例1.4】某居民区共10000户,欲估计该居民区的用水量。采用简单随机抽样抽选了100
户,得样本均值为12.5吨,样本方差为1252吨。
(1)估计该居民区的总用水量的置信度95%的置信区间。
(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20乐试问应抽多少户作样
本?(P31)
解:⑴
y=A^=125000
4s=35206.25
s(h=Ns(y)=N
V的置信度为95%的置信区间为:
Y-uaS(y),Y+u(K)=[55995.75,194004.25]
1-1―
22
或
y=7^=125000
s(户)=Ns(力=NJ上』s=N心=35383.612
Vnyjn
(2)
渊置信度为95%的置信区间为:
Y-uas(K),y+«(y)=[55648.12,194351.88]
I----1----
〃=1-a/2;=7695工77()
°(万¥
n=—^=714.9^715
1+国
N
3、不等概率抽样
【例2.1]某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个
养猪专业户上年末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与
各养猪专业户上年末生猪存栏头数成正比的概率从中抽取30户进行调查,调查结果见表
6.3。己知全县养猪专业户上年末生猪存栏数为9542头,试估计该县养猪专业户生猪出栏总
头数
某县养猪专业户年生猪出栏头数调查样本资料(单位:头)
iyiXiK
1157511402582119124
22313412321862226160
39371317692337215
42915214261562421104
584515114925749
63118516362212643336
7241331725145271896
829173185332830177
913741938288
1019872042304
注:,表示养猪专业户样本编号,/%表示各专业户生猪上年末存栏数,£表示各专业户调查年生猪出栏头数,
其中第2、19号专业户被抽中两次.
解:根据题中所给资料,〃=3(),M0=9542
9542〃5
—>—=----(—+区x2+…+见)才56163卜头)(P56,3.1.2)
n占网30152330
可力)=7彳£(乂-心了
n(n-\),=|z,.
_/y卢_】〃/)2
95422r/7556163,13456163,。17756163
=------(-----------)-+(------------x2+..-+(------------xr21
30x29159542239542309542
x2806070
阳%)="%)=1575(头)(P583.1.5)
4、分层随机抽样
【例3.1】某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居
民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是
城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为
2546元。求全市年平均户收入的置信度为90%的置信区间。(P75)
解:根据已知条件有:
23560148420八。/”
W=------=0.1370,1%=------=0.8630
1171980-171980
四二X%%=卬值+也无
ft=l
=().1370X15180+0.8630x9856=10585.39
2
v(JiZ)=yVV,上/■s;=20260.6756
/=1〃i
历J=142.34(元)
故全市年平均户收入M置信度粉0%的置信区间为:
兀一〃/(%),%+〃s(y)=L10585.39±1.645x142.34],EP[10351.24,10819.54]
1——1asl
【例3.2]在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。调查
结果如表所示。试以95%的置信度估计总体中会计算机者占的比例。(P75)
计算机使用情况调查
样本中会使用计算机
层人数入样人数
的人数
30岁以下77817124
30-35岁7497
6812
89
36〜40岁977922
II
41-45岁462742
45岁以上4
536650
总计35050320
解:由表中数据得到:
]八=0.3380,p2=0.1765,凸=0.2472,/%=0.2620,p,=0.0800,
叱=0.2220,吗=0.2139,%=0.2790,%=0.1320,%=0.1531
则—=之以==0.2286
由于抽样比很小,故可以忽略不计。估计量的方差为
)=£卬/(1一/”.丁-0.000534
h=i/一1
P置信度为95%的置信区间为:
=[18.33%,27.39%]
5、样本量在各层的分配
【例3.3]调查某地区的2850户居民奶制品年消费支出,以居民户为抽样单元,根据
经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,样本
量为40,若按比例分配和Neyman分配时,各层样本量应为多少?
样本户奶制品年消费支出
样本户奶制品年消费支出
层居民户总数
12345678910
12001040011015104080900
24005013060801005516085160170
375018()26011()014060200180300220
415005035150203025103()25
解:由表得
N、=200,M=400,M=750,N、=1500,N=2850
4=n2=%=&=1。
N
Wl=侍=0.070=0.14035,W3=0.26316,%=0.52632,
/=令=0.05,f2=0.025,f3=0.0133,/4=0.0067
各层样本均值及方差为
%=39.5,$;=_!_^£(九一片尸«1624.722
同理可得
%=105,%=165,y4=24
s;=2166.667,学=8205.556,s:=193.333
从而
73.56194(元)
h=\
按比例分配时,各层样本量为(P82)
〃1="〃=2.81,n.=VV2/?=5.61,/?3=Wyn=10.53,n4==21.05
即各层样本量分别为36,10,21o
对十Neyman分配,
200
gl=V1624.722=2.8286,J2166.667=6.5330
28502850
75078205.556=23.8380,W岛=史&&93.333=7.3181
2850।2850
即2吗%=40.51775,从而
/»=|
_小-28286
«2.79
40.51775
同理有n2=6.45,叼=23.53,n4=7.23
即各层样本量分别为3,6,24,7o
【例3.4]某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)
的开支,在全校8000名学生中抽出了一个200人的简单随机样本。根据学生科的统计,本
科生人数为全校学生的70%,调查最近一个学期课外进修支出(单位:元)的结果如表
在校学生课外进修开支调查结果
样本均值(以)/元样本标准差(.)/元
层(力)层权()样本量(nh)/人
本科生0.7120253.4231.00
研究生0.380329.4367.00
合计1200276.2294.57
试估汁全校学生用于课外进修的平均开支。
解:全校学生用于课外进修的平均开支为:
2
%”=Z叱用=67x253.4+0.3x329.4=276.2(元)
h=l
估计量方差的样本估计为:(P75,4.l.8)
v="381.83
nh=\n力=1
估计的标准差为:
/(%)=19.54(元)
如果是采用简单随机抽样,则
/—、1—J)1—0.025.[
v(y)=———s~=--------x294.57~«423.1
n200
Jy(])=2057(元)
6、比率、回归与差估计
【例4.1】某小区有1920户,从中随机抽取了70户,调杳各户的住房面积(单位:平
方米)和家庭人口,得数据:
7(z)70
%=1821.4,2%=260
l=l;=1
7OZ7070
X-2=52940.7,2茗2=11IO,ZMW=7264.5
I=Ii=ii=i
试对人均住房面积作点估计和置信度为95%的区间估计,
解:由已知条件有:
70
1821.4
/=1=7.01
70260
*=|
70707070
-机)2=E胃-2Az)居+=5637.92
/=1/=1(=11=1
V(心的渐近无偏估计为:
y(x-^x;)2(P36,2.5.2)
i或*=三。卫------------工0.085
tvc2n-\
R的置信度为95%的置信区间为:
R-u%(A),R+u.Ji,(J)=[6.44,7.58]
1----I----
【例4.2】交通运输统计中有三个重要的指标,即运量、周转量与平均运距,三者关系如F:
平均运距二周转量/运量。为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取
32辆货车,记录每辆货车在一个月内的运量Xi(单位吨)与周转量yi(单位吨公里),经计
算得:
n=32,心=5974,2=1244764
;=1J=l
"=295500名「二303968760。春/=61357665
Z=1r=lr=l
试用比估计给出平均运距R估计和其标准差的估计。
32
解:R—=49.4643
1=1
V(用的渐近无偏估计为:
}_f欣)2
v(^)=~1-------------x0.440943
fix2n-\
s(A)=0.664(公里)
【例4.3]某地有规模以下工业企业127个工友固定资产价值6794.5万元,从中随机抽
取20个企业调查工业产值和固定资产价值,资料如表所示。试估计该地区规模以下工业总
产值。
企业固定资产价值及工业产值(单位:万元)
固定资产价值工业产值固定资产价值工业产值
3532.05045.5
4340.27065.0
50
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自建房外墙承包合同
- 2026届新高考英语冲刺复习读后续写状语句型
- 绿化养护部年终总结
- 安全培训讲师改进方案课件
- 2024年河北外国语学院单招职业技能测试题库
- 口腔科医生培训课件
- 成人重症超声检查指南更新总结2026
- 县养老事业和养老产业协同发展行动计划
- 医院医疗安全培训课件
- 2.3.1YARN服务组成架构
- 2025年汕头市金平区教师招聘笔试参考试题及答案解析
- T∕ACEF 235-2025 企业环境社会治理(ESG)评价机构要求
- 拆迁工程安全监测方案
- 视频会议系统施工质量控制方案
- 质量环境及职业健康安全三体系风险和机遇识别评价分析及控制措施表(包含气候变化)
- 2025至2030防雷行业项目调研及市场前景预测评估报告
- 2025年护理三基考试卷(含答案)
- 除夕烟火秀活动方案
- 地理中国的工业+课件-2025-2026学年初中地理湘教版八年级上册
- 压力管道安装单位压力管道质量安全风险管控清单
- 2025年广东省高中语文学业水平合格考试卷试题(含答案详解)
评论
0/150
提交评论