版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、简答题
1。为什么分层.抽样常在仝国范围抽样调查中被采用?
答:(1)分层抽样不仅能对全国指标进行推笄,还可以对各省、自治区、直辖市的指标进行推算.(3分)
(2)各个层中分别独立地进行抽样,便于抽样工作的组织实施.(3分)
(3)由于各个地区发展不均衡,导致全国范围内差异较大,分层抽样的层间方差不进入估计误差,而层内的
差异相对小一些,因此分层抽样可以提高估计精度,抽样效率较高。(2分)
(4)样本的分布更均匀,代表性更强,不会出现偏颇的情况。
2.整群抽样的优缺点是什么?
答:整群抽样可以简化抽样框的编制。
样本单元比较集中,实施调查便利,且能节约费用。缺点是:当群内具有一定的相似性,而不同群之间的差别
比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差.
3.简述分层的原则及如何选择分层标志?
答:分层的原则是:一种是为了满足估计各层指标的需要或为了组织实施的便利。此时,应以需估计的子总
体为层或单位自然构成的系统或类为层;另一种是尽可能提高抽样精度,分层应做到“层内差异大,层间差
异小”。
最好直接以调查指标的数值作为选择分层标志,若做不到通常选择一个与调查指标有较大线性相关的指
标作为分层标志。这个标志可以是调查指标的前期指标,也可以完全是另一个变量.
4.为什么多阶抽样常在大型抽样调查中被采用?
答:(1)多阶抽样一方面保持了整群抽样的样本比较集中、便于调查、节省费用等优点,同时又避免了对小
单元过多调查造成的浪费,充分发挥抽样调查的优点。(2)由于多阶抽样是分阶段实施的,因此,抽样框也
可以分级进行准备,只需编制初级单元的抽样框,对抽中的初级单元再准备二阶抽样单元的抽样框,以此类
推,对抽中的单元再准备下一级抽样单元的抽样框,从而大大降低了编制抽样框的工作量。所以多阶抽样常
用于大范围的且抽样单元为各级行政单位的情况。对于大型调查中,抽样框变动非常频繁的情况,特别适合
用多阶抽样。
2、简单随机抽样
【例1.1]我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体平均水平并
给出置信度为95%的区间估计。如表
简单随机样本的指标值
序号
12345678910
i
45204661508
解:依题意。N=100,"10,/=—=().1
100
计算样本均值及样本方差为:
_y50
=5
y=n仁=77107
21</—\2172.
S=-;'()',一)')=—«1O9111
〃-1片9
因此对总体平均水平的估计为:
Y=y=5
对的方差及标准差的估计为:
d\-f-1_01
v(/)=--S2=——xl9.11«1.72
n10
s[Y)=7v(r)«1.3115
由笈信度95%对应的L=1.96,因此,可以以95%的把握说总体平均水平大约在5士1.96x1.3115之间,
即2.4295~7.570之间.
【例1.2](续例1.1)如果采取放回抽样,则相应结果为多少?
I〃SO1,l17?
解:由上例知产曰"送5,FgaW
v(y)=-S2=—xl9.11=1.91l
n10
s(y)=Ji⑴=1.3824
由置信度95%对应的%Y/2=1.96,因此,可以以95%的把握说总体平均水平大约在5±1.96x1.3824即
[202905,7.7095]之间。
【例1.3]某销售公司希望了解全部3000家客户对该公司的综合满意程度,决定用电话来调查一个简单
随机样本。这时,销售公司希望以95%的把握保证客户满意的总体比例P在样本比例p±10%的范围内,但
对总体匕例P无法给出一个大致的范围。这时,应该调查多少个客户,才能保证对总体比例估计的要求?
(P30)
解:由该问题给出的条件:N=3000,d=10%=0.1,置信度95%,对应的%“2=196,由于无法得到P
的初始估计值,因此取使方差达极大值的P二0。5,得到最保守的〃:
1.96x0.5x0,5
七96
0.12
【例1。4】某居民区共10000户,欲估计该居民区的用水量.采用简单随机抽样抽选了100户,得样本均值为
12.5吨,样本方差为1252吨。
(1)估计该居民区的总用水量的竟信度95%的置信区间。
(2)若次年再进行调查,要求置信度95%的估计相对误差不超过20%,试问应抽多少户作样本?(P31)
解:⑴
y=A^=125000
(r)=M(J)=NJ上工=35206.25
Vn
y的置信度为95%的置信区间为:
Y-uas(K),Y+uas(H=[55995.75,194004.25]
L22J
或
y=A55=125000
s(f)=Ns(y)=^N-^==35383.612
Vnyjn
(2)
用勺置信度为95%的置信区间为:
Y-uas(y),y+M(f)=[55648.12494351.88]
1I——
22
k/2S=769.5工770
(万/
==714.9^715
1+国
N
3、不等概率抽样
【例2。1】某县农业局要调查全县养猪专业户全年生猪的出栏头数,并有全县365个养猪专业户上年
末的生猪存栏数,各养猪专业户的饲养规模相差较大,决定以放回方式按与各养猪专业户上年末生猪存栏头
数成正匕的概率从中抽取30户进行调查,调查结果见表6.3O已知全县养猪专业户上年末生猪存栏数为9542
头,试估计该县养猪专业户生猪出栏总头数
某县养猪专业户年生猪出栏头数调查样本资料(单位:头)
i呵i网itni
1157511402582119124
22313412321862226160
39371317692337215
42915214261562421104
584515114925749
63118516362212643336
7241331725145271896
829173185332830177
913741938288
1019872042304
注:i表示养猪专业户样本编号,表示各专业户生猪上年末存栏数,y表示各专业户调查年生猪出栏头数,其中第2、19
号专业户被抽中两次.
解:根据题中所给资料,〃=30,M0=9542
0954275134177、,工、/ncAQ1C
YHH=--—=----------(—i------x2o+••,4------)56163(头)\।Oo,Jo1。)
nMmi3015233()
6/〃)=7=£心-%)2
n(n-\)^z.
二%9("鼠)2
〃5-1)占mtMo
95422r,7556163,2J3456163..17756163
=---------(--------------y+(---------------/X2++(----------------x)2-1
30x29159542239542309542
工2806070
阳晨)=小%)“1575(头)(P58,3.1.5)
4、分层随机抽样
【例3.1】某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随
机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,
标准差为2972元;农村年平均户收入为9856元,标准差为2546元.求全市年平均户收入的置信度为90%的
置信区间。(P75)
解:根据已知条件有:
W尸微二°」37s黑酒3。
/I=I
=0.1370x15180+0.8630x9856=10585.39
v(yv,)=YW/上蜉=20260.6756
1=1勺
见)二142.34(元)
故全市年平均户收入僧信度为90%的置信区间为:
aS(几),见+〃aS(见)=[10585.39±1.645x142.34],即[10351.24,10819.54]
【例3。2]在某行业技术人员巴按年龄分层,调查会使用计算机者所占的比例.调查结果如表所示。试
以95%的置信度估计总体中会计算机者占的比例。(P75)
计算机使用情况调查
样本中会使用计算
层人数入样人数
机的人数
30岁以下77817124
30〜35岁74976812
36~40岁97798922
41〜45岁46274211
45岁以上5366504
息计35050320
解:由表中数据得到:
Pi=0.3380,p2=0.1765,p3=0.2472,p4=0.2620,p5=0.0800,
W,=0.2220,吗=0.2139,%=0.2790,叱=0.1320,%=0.1531
则亿,=1>历=()・2286
A=l
由于抽样比很小,故可以忽略不计。估计量的方差为
Ph(l-Ph)
V(P.J=E^20-A)%().000534
/|=1%一1
P置信度粉5%的置信区间为:
PstaJk),&+Ua=[18.33%,27.39%]
1----1---
5、样本量在各层的分配
【例3。3】调查某地区的2850户居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平
将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,样本量为40,若按比例分配和Neyman
分配时,各层样本量应为多少?
样本户奶制品年消费支出
样本户奶制品年消费支出
层居民户总数
12345678910
12001040011015104080900
161617
24005013060801005585
000
203022
3750180260110014060180
000
415005035150203025103025
解:由表得
N、=200,N2=400,N、=750,N4=1500,N=2850
=n2=%=n4=10
N
w=诗=0.07018,%=0.14035,=0.26316,W4=0.52632,
n
fx=—=0.05,/2=0.025,y3=0.0133,/;=0.0067
NI
各层样本均值及方差为
反」9为二39.=—“4722
同理可得
%=105,%=165,%=24
$=2166.667,s;=8205.556,s:=193.333
从而
%=.卬国=73.56194(元)
/|=1
按比例分配时,各层样本量为(P82)
%=叱〃=2.81,%=卬2〃=5.61,%=卬3〃=10-53,n4=W4n=21.05
即各层样本量分别为3,6,10,21o
对于Neyman分配,
W.5.=222-71624.722=2.8286,卬凡二^-12166.667=6.5330
285()-2850
1%小=78205556=23.8380,W4s4=、/193.333=7.3181
28502850
L
即=403775,从而
ft=l
型」=40><①巳会.79
40.51775
A=1
同理有0=6.45,n,=23.53,n4=7.23
即各层样本量分别为3,6,24,7O
【例3.4】某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校
8000名学生中抽出了一个200人的简单随机样本。根据学生科的统计,本科生人数为全校学生的70%,调
查最近一个学期课外进修支出(单位:元)的结果如表
在校学生课外进修开支调查结果
样本均值(为)/样本标准差(%)/
层(力)层权(W〃)样本量(%)/人
元元
本科生0.7120253.4231.00
研究生0.380329O4367o00
合计1200276.2294.57
试估汁全校学生用于课外进修的平均开支.
解:全校学4用于课外进修的平均开支为:
2
亍呻=Z叱I%=°-7X253.4+0.3X329.4=276.2(元)
力=i
估计量方差的样本估计为:(P75,4。1.8)
v(%,)=4之卬由+1£(1_吗)”=381.83
nh=\〃/»=1
估计的标准差为:
/(%“)=19.54(元)
如果是采用简单随机抽样,则
v(y)=———s~=--------x294.57~*423.1
n200
.(》)-20.57(元)
6、比率、回归与差估计
【例4.1】某小区有1920户,从中随机抽取了70户,调查各户的住房面积(单位:平方米)和家庭人
口,得数据:
7070
=1821.4,>二260
/=1i»l
707070
=529407》:=1110,2),'=7264.5
片1
试对人均住房面积作点估计和置信度为95%的区间估计o
解:由已知条件有:
70
Zx
R=i=l嘿“3
70
70707070
2(乂-定,)2=£乂2-2比y/i+Z巧2=5637.92
i=l/=1/=1
V(心的渐近无偏估计为:
2
y(y.-Av.)(P36,2o5o2)
v<A)=^-4-•—--------------x0.085
nxn-1
A的置信度刈5%的置信区间为:
R-u.\v(»,R+u〃=[6.44,7.58]
ci~I--
22
【例4。2】交通运输统计中有三个重要的指标,即运量、周转量与平均运距,三者关系如下:平均运距二周转
量/运量.为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取32辆货车,记录每辆货车在一个
月内的运量乩(单位吨)与周转量-(单位吨公里),经计算得:
3232
〃二32,工七二5974,Zxj=1244764
Z=lj=l
323232
ZB=295500,>;=303968760(12»=61357665
/=1r=l!=1
试用比估计给出平均运距R估计和其标准差的估计。
32
八工
解:宠=得一=49.4643
1=1
v(a)的渐近无偏估计为:
1f-展>
v(K)=-g•上-----------x0.440943
nx2n-\
.•.s(黄)=0.664(公里)
【例4。3]某地有规模以下工业企业127个工友固定资产吩值6794。5万元,从中随机抽取20个企业
调查工业产值和固定资产价值,资料
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预算有限的小微企业如何用技术平权实现高性价比精准引才
- 干细胞治疗与细胞免疫联合策略
- 干眼高危人群术后泪河高度监测策略
- 尊睿无界课件
- 帕金森病嗅觉障碍的嗅觉训练个体化调整策略应用效果评价-1
- 市场策略转型:精准医学从产品到服务
- 医疗信息化在医疗资源优化配置中的应用
- 医疗市场营销策略与成果汇报
- 医疗信息化系统构建策略
- 临床护理安全与质量提升
- 成人泌尿造口护理(TCNAS+49─2025)
- 电镀供货合同范本
- 2025年山西大地环境投资控股有限公司社会招聘116人备考题库完整答案详解
- 《交易心理分析》中文
- 医院成本管控模式的创新与案例分析
- 2025医疗健康纸质行业市场深度记录系统与文件研究评估报告
- 政务大模型发展研究报告(2025年)
- 2025年国家开放大学《马克思主义基本原理》期末考试参考题库及答案解析
- 空管面试高分技巧
- 2025年普通高中学业水平选择性考试(福建卷)历史试题(含答案)
- 院感消毒隔离培训课件教学
评论
0/150
提交评论