抽样技术课后习题参考答案_第1页
抽样技术课后习题参考答案_第2页
抽样技术课后习题参考答案_第3页
抽样技术课后习题参考答案_第4页
抽样技术课后习题参考答案_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样技术课后习题一参考答案

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r,若r=0或r>64则舍

弃重抽。

(2)总体编号1~64,在0~99中产生随机数r,r处以64的余数作为

抽中的数,若余数为0则抽中64.

(3)总体2000CT21000,从1~1000中产生随机数r。然后用r+19999

作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,

按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已

知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考

虑到该样本被抽中的概率。因此(1)中只有1~64是可能被抽中的,

故不是等概的。(2)不是等概的

【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不

同?

2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,

从中简单随机抽取了300户进行,现得到其日用电平均值y?9.5(千瓦时),

s2?206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超

过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300,?9.5,s2?206

2?)?v(N)?N21?fs2?50000V(Y

n

1?

300

*20671706366666300

v(??41308.19该市居民用电量的95%置信区间为

[[Ny?z?(y)]=[475000±1.96*41308.19]

2

即为(394035.95,555964.05)由相对误差公式

u?2v()

W10%

可得1.96*

?n*206?9.5*10%n

即n2862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培

训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是

估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

n

解析:由已知得:N?10000n?200p?0.35f??0.02

N??l?f

p(l?p)?0.0012又有:E(p)?E(p)?p?0.35V(p)?

n?l

该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:

[E(P)?Z?V(P)]

2

??

代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的

支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号12345678

文化支出200150170150160130140100

编号1112131415161718

文化支出150160180130100180100180

9101102401920170120

估计该小区平均的文化支出Y,并给出置信水平95%的置信区间。解析:

由已知得:N?200n?20

120

根据表中数据计算得:y??yi?144.5

20i?l

2120

s?y?y?827.06842?i

20?li?l

2

??

v(y)?

?该小区平均文化支出Y

[132.544,156.456]

In

(l?)s2?37.21808(y)?6.10015nN

2

的95%置信区间为:[y?z?(y)]即是:

故估计该小区平均的文化支出Y=144.5,置信水平95%的置信区间为

[132.544,156.456]o

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年

的粮食产量,得到y=1120(吨),S2725600,据此估计该地区今年的粮食

总产量,并给出置信水平95%的置信区间。解析:由题意知:y=1120f?

n50

??0.1429S2?25600?s?160N350

置信水平95%的置信区间为:[y?z?

2

?f

s]代入数据得:n

置信水平95%的置信区间为:[1079.872,1160.872]*350

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误

差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方

差S2?68,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,

则样本量最终为多少?

NZ7S2

2

解析:简单随机抽样所需的样本量nl?

2

Nd2?Z?S2

2

2

n2?

nl

70%

由题意知:N?1000d?2S?68代入并计算得:nl?61.3036?61

n2?

2

Z??1.96

2

nl

?87.14278770%

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,

则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去

年的总产量为2135吨,抽取10个企业调查今年的产量,得到y?25,这些

企业去年的平均产量为试估计今年该地区化肥总产

x?22o

量。?X2135??21.35N100,?25?解析:由题可知?22,

则,该地区化肥产量均值的比率估计量为Y?Xy25?21.35?24.2624x

?100*24.26?2426??NYR该地区化肥产量总值Y的比率估计量为

所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如

下表:

置信水平95%的置信区间,并比较比估计和简单估计的效率。

lnl??xi?2300?1700???1300)?1580ni?120解析:由题可知

?144.5

??r??144.5??0.091R1580

又R?144,5?1600*?146,3291580

In

S?(yi?)2?826.053?n?li?l2

Sxyln??(yi?)(xi?)?3463.158n?li?lln2?(x?)?8831.579?in?li?l

Sx2

故平均文化支出的95%的置信区间为

[R?Z?2?f2?f2?S?R?2S2),?Z?S?R?2S2)](S?2R(S?2RyxxR?2yxxnn代入数据

得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中

抽取10头,记录重量,3个月后再次测量,结果如下:

的结果进行比较。

lnl解:由题可知,??xi?95???105)?102.6ni?110

lnl??yi?150??170)?163ni?110

lnl2S?(y?)?*1910?212.222?in?li?192

Sxylnl?(y?)(x?)?*1317?146.333?iin?li?19

Sx

2

lnl?(xi?)2?*926.4?106.933?n?li?19

故有?0?

SxySx

2

?

146.333

?1.368

106.933

所以总体均值的回归估计量为

lr???0(?)?163?1,368*(100?102.6)?159.443其方差估计为:

?()?l?f(S2??2S2?2?S)Vlr0x0xy

nlOl?

=(212.222?1.3682*106.933?2*1.368*146.333)

10=1.097l?f2

?()?S而丫

n

17*212.222=

10=19.454

?()?V?()显然Vlr

所以,回归估计的结果要优于简单估

第三单元习题答案(仅供参考)1解:(1)不合适(2)不合适(3)

合适(4)不合适

2.将800名同学平均分成8组,在每一组中抽取一名“幸运星二

=20.1

V()=-

=9.7681-0.2962

=9.4719

=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:n==185.4407

185=n=56,=92,=37

按内曼分配:n=

=175

=33,=99,=43

==0.924根据各层层权及抽样比的结果,可得

()==0.000396981

=1.99%

估计量的标准差为1.99%,比例为9.24%

按比例分配:

n=2663

=479,=559,=373,=240,=426,=586内曼分配:

n=2565

=536,=520,=417,=304,=396,=392

5.解:由题意,有

==75.79

购买冷冻食品的平均支出为75.79元

又由V()=+又n=

V()

=53.8086=7.3354

的置信区间为

95%[60.63,90.95]o

7.解:(1)对

(2)错

(3)错

(4)错

(5)对

8.解:(1)差错率的估计值=70%+30%=0.027估计的方差v()==3.1967

标准差为S()=0.0179o

(2)用事后分层的公式计算差错率为==0.03估计的方差为;v()

=-=2.5726

=0.4,(2)用分别比估计,有=0.65,所以用分别比估计可计算得=6.4。

用联合比估计,有

=0.5,=0.625,所以用联合比估计可计算得=6.5。

第四章习题

4.1

邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为

400个

解:由题意得到N?400,n?4,M?10,f?

1^??Mnn4??0.01N400?i?lnyi?19?20?16?20?1.875(份)10?4

?M??10?1.875?18.75(份)

??M?N??10?400?7500(份)Y

2sbM?n?l?(i?lni?)2

nl?f21?flv()?sb?nMnM2n?l?(i?li?)2

l?0.01(19?18.75)2???(20?18.75)2

??4?14?102

?0.00391875

?)?N2M2v()?4002?102?0.00391875?62700v(Y

于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方

差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。

4.2某工业系统准备实行一项改革措施。该系统共有87个单位,现采

用整群抽

样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工

人对政

(2)在调查的基础上对方案作了修改,拟再一次征求意见,要求估

计比例的允

许误差不超过8%,则应抽取多少个单位做样本?

解:题目已知N?87,n?15,f?

1)由已知估计同意改革的比例nl5?N87

??p?yi?l

n

i?lni?i?M

l?nn646?0.709911?M

i?li?60.733

ll?fln

?)?2?Mi)2?0.008687v(p(yi?pnn?li?l?

此估计量的标准差为

?)?v(p?)?.008687?0.9321s(p

4.3某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。

财务人员

欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清

点,整

)o

nnnlO解:已知N=48,n=10,f=?,由题意得?yi?736,?Mi?365,N48i?li?l

Nn48?则办公费用的总支出的估计为Y??yi??736?3532.8(元)

ni?1101nl群总和均值??yi??736?73.6(元)ni?110

?)?N(l?f)?v(Yn2?(yi?lni?)2

n?l

10)(83?73.6)2?(62?73.6)2?...?(80?73.6)248=?109

1=182.4??3590.49

=72765.44482?(1?

)=269.7507v(Y

?的置信度为95%的置信区间为3532.8?1.96?269.7507,即[3004.089,

则Y

4061.511].

4.4为了便于管理,将某林区划分为386个小区域。现采用简单随机

抽样方法,

估计整个林区树的平均高度及95%的置信区间。

解:由已知得N?386,n?20,f?

n20??0.0518N3866180.8

?5.9091046

整体的平均高度??

?M

i?lni-l

n

?

i

?M

IM?

n

?M

i?l

n

i

?52.3

n

方差估计值v()?v()?

?0.02706

l?fn2

?(V

i?l

i

?Mi)2

n?l

标准方差s()?v()?0.02706?0.1644

在置信度95%下,该林区的树木的平均高度的置信区间为

(?t?/2?s())?(5.909?1.96?0.1644)?(5.5868,6.2312)

4.5某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。

全校共有女

生宿舍200间,每间6人。学生会的同学运用两阶段抽样法设计了抽

样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3

位同学进

解:题目已知N?200,n?10,M?6,m?3,fl?nl0m??0.05,f2??0.5N200M

??p?yi?lni

nm?9?0.310?3

ll?fl?)?2?v(p?nn?lm?(y

i?lni?p?m)?0.005747

?)?v(p)?0.005747?0.0758s(p

在置信度95%下,p的置信区间为

??t?/2v(p?))=(0.3?1.96?0.0758)?(0,151432,0.448568)(p

4.6上题中,学生会对女生勤工助学月收入的一项调查中,根据以往

同类问题的

调查,宿舍间的标准差为Sl=326元,宿舍内同学之间的标准差为

S2=188元。以一位同学进行调查来计算,调查每个宿舍的时间cl为1分

钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为C0

是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生

是多少?

解:由已知条件得到以下信息:

S17326(元)S27188(元)cl?10(分钟)c2?l(分钟)c0?4?60?240

(分钟)

由此得到

2S1?1O6276,S2

2735344,S2

u2S235344?Sl??106276??100385.33M6

mopt?S2cl8810?l???1.82Slc23261

因而取最优的m?2,进一步计算nopt

由于总时间的限制C?480,由关系式

C?c0?cln?c2nm得到480?240?10nopt?2nopt

计算方程得到nopt?20,因而取n?20

则最优的样本宿舍数为20间,最优样本学生数为2。

4.7某居委会欲了解居民健身活动情况,如果一直该居委会有500名

居民,居住

在10个单元中。现先抽取4个单元,然后再样本单元中分别抽出若

干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健

身锻炼的时

(1)简单估计量(2)比率估计量

(3)对两种估计方法及结果进行评价。

解:(1)简单估计

??NYunNM??iini?ln?Y?ii?ln

10?(32?3,75?45?3.4?36?4.5?54?4.17)4

=1650,=

?Y1650则u?u??3.3,M0500

ln?l又u??Yi??660?165,ni?14

?)?所以v(Yu

分别计算N2)??(Y?(l?f)iuli?ln2nn?lN?nMi(l?f2i)s2i?mi?lin22

?(Y??)iu

i?ln2

n?l

5778??192631??[(120?165)2?(153?165)2?(162?165)2?(225?165)2]3

Mi(l?f2i)s2i??mi?lin22322?(l?454)?2.92452?(l?)?2.8362?(l?)?7??454542?(l

?

?

6)?2.2?4628.486

?

22nMi(l?f2i)s2i???mi?i?l??n?)2??(Y?iu2?lN(l?fl)i?lN?v(u)??所以,

M0?nn?ln??

?0.11556?0.046285?0.162

所以标准差s(u)?v(u)?0.402

(2)比率估计

n

?R?y?Mi?l

n

i?lii?i?M

N232?3.75?45?3.4?36?4.5?54?4.17?3,953232?45?36?54

?R)?v(y)??(Y?(l?f)iu

li?ln2

nn?lNnMi(l?f2i)s2i??ni?lmi22?Y其中R?R?MO?Mi?ln

i?lniii?M

?R)?v(y?)v(YR

M02?0.0715

?R)?(yR)?0.0715?0.2647s(y

?R)?0.2647(3)?简单估计标准差s(u)?0.402,比率估计标准差s(y

?比率估计更好

第五章不等概抽样习题答案

5.1解:

分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规

模大小

成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不

放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,

则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不

重复:(1)代码法:由Zi=

MiM

?Ni可假设M0=1000000,则Mi=ZiMO列成数据表

MO

?Mi

i?l

随机数为444703,615432,791937,921813,738207,176266,

405706935470,916904,57891按照范围我们可以知道抽取的PSU9,

PSU16,PSU19,PSU24,PSU18,PSU2,PSU8PSU24PSU23

PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽至U4组和

6组;

综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组(2)

拉希里法:M?=78216,N=25,在口,25]和口,78216]中分别产生(n,m):

(13,38678),M13=40654?38678,入样;

(8,57764),M8=38981<57764,舍弃,重抽;

(23,13365),M23=9066<13365,舍弃,重抽;

(19,38734),M19=69492?38734,入样;

以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为:

2,3,5,6,7,12,13,16,19,24组

5.2解:

由数据可得:

tl=?ylj=20,t2??y2j?25,t3=38,t4=24,t5=21;

j?lj?lMiM2结合t值数据,我们可以推得Z的值

Zl=M15??0.2,Z2=0.16,Z3=0.32,Z4=0.2,Z5=0.12,M025

由公式?ij?

4ZiZj?l?Zi?Zj?

?l?2Zi??l?2Zj???l??

?

?

Zi

i?ll?2Zi

N

????

5.3解:

设:MO=1,则有:Mi?Zi,得到下表:

为103,最后在[1,1000]中产生第三个随机数为982,则它们所对应的

第7、1、10号单元被抽中。5.4解:

利用汉森-赫维茨估计量对总体总值进行估计:

YHH

?

?

lnyil320120290????[??]?2217.006ni?lZi30.1380.0620.121yi??lln???YHH???

??nn?li?l?Zi

?1?320????[?2217.006???60.138???

2

2

2

2

?

v?YHH?

l?120??290?

???2217.006????2217.006?]???10370.3?79254.7?32287.9?

6?0.062??0.121?

=20318.8

?

??

s?YHH?????

??v?YHH??142.5???

5.5解:由题可知

X0??Xi??Xi=2+9+3+2+l+6=23

i?l

i?l

N

6

由?i?n

Xi

得下表:

X0由上表显然有Zi<l/2,于是我们可以采用布鲁尔方法:

?ij?

4ZiZj?l?Zi?Zj?

N

?Zi

?l?2Zi??

l?2Zj??l???l?2Z

i?li?

?

???

⑴?N

Zi

?0.1053?1.7999?0.1764?0.1053?0.0476?0.5455?2.78

l?2Zi?li

XHH

?

?

n?xilnxi

??XHT??ni?lZii?l?i

?

?

?i?nZi

XHH?XHT

另外:

?

V?XHH?

?

?Xi??l???Z?X??i???ni?l?Zi?

N

2

?

V?XHT?

?

??i?j?

N

N

2

代入数据,经计算得到:

??V?XHH??????O?V?XHT???

??

IN

Y?6S??Yi?Y

N?li?l

2

??

2

=11.5

所以有:Vy?

?

?

I?f2

S=10.0625n

?Y?yY?Ny

?

P?y

?

R?

?

yx

????V??Y???Vy?10.

0625

??

?

???

V?Y??N2Vy?251.5625??

?

(2)

由定义有:

?1

YR?XR

N2Sx?5.8?

YR?XR

N

??

IN

S?Yi?Y?N?li?l

2

??

2

?11.5

Syx?

1

Yi?YXi?X?32?N?li?l

????

??211?f?2???2????V?R??2S?2RS?RSyxx??n???X?

????

?V?YRi??X2V?R?

??????

???X???V?YV?R?Ri??????N??????

?

?

2

结合题目已知条件,我们选择的包含概率与Xi成正

比:?i?Zi?P(第i项被选中)2

7?18.49?5?5,76?3?0?l?36?2?36???N???

?V?Y???Zi?YHH?Y???254.71

18??i?l??

?????????

由以上计算结果可以看出:V?YR??V?YHH??V?Y?,比估计在样本量很

小的情

??????

况下即使是最小的方差也远比另外两种估计的方差大,而简单估计又

比PPS汉森

-赫维茨估计略好。

5.7解:已知n=2m=5??yij?340设公司总人数为M0

i?lj?ln

m

由于这个样本是自加权的,所以有:MOnmMOY?y??340?34M0

(分钟)??ijnmi?lj?110?

?y?Y?34(分钟)MO?

所以该公司职工上班交通平均所需时间为34分钟。

21nml2222?????????y?y?y??40?34?10?34?A?60?34?30?34??ijnmi?lj?110??

????1?2440?24410

?sy?y?15.62(分钟)

5.8说明:y6?2561解:由题可

矢口:YHH??Yilll0yill0??????186yi?495299.4(吨)ni?lZilOi?lZilOi?ln???所以,

全集团季度总运量为495299.4吨.

???V?YHH?的一个无偏估计为:??

????YHH??n???Yi?ll?YHH????nn?lZ?i?l?i?2???110??????186yi?YHH??

95183360?90??i?l??2

因为t?/2=2.306所以t?/2=22497.8所以置信度95%的置

信区间为[472894.6,517890.2]

第6章

第2题

⑴证明:将总体平方和按照全部可能的系统样本进行分解,可以得到

(N?l)S???(yrj?Y)???(yrj?yr)+??(Yr?Y)2222

r?lj?l

kkn_kn_knr?lj?lnr?lj?l

?n?(yr?Y)+??(yrj?yr)22

r?lk_r?lj?l

_nkk2kn

?(yr?Y)+??(yrj?yr)2?kr?lr?lj?l

Ilk2(N?1)S2??(yr?Y)?nkkr?l???(yr?lj?lknrj?yr)2_?

根据V(ysy)的定义,且nk?N,有

_lk2(N?l)21kn

S?V(ysy)??(yr?Y)?(yrj?yr)2??Nkr?lNr?lj?l

令S2

wsykn_l(yrj?yr)2???k(n?l)r?lj?l

则有V(ysy)?_(N?l)2k(n?l)2S?SwsyNN

⑵证明:在样本量相同的情况下

(N?l)2k(n?l)21?f2S?Swsy?SV(ysy)?V(ysys)?NNn

(N?l)2N?n2k(n?l)2S?S?Swsy?NNnN

(N?Nn)2k(n?l)2S?Swsy?NN

N?k2k(n?l)2k(n?l)22S?Swsy?(S?Swsy)?NNN

2立即可得到当且仅当Swsy?S2时,系统抽样优于简单随机

抽样。

第3题

?N??40?解:⑴k????????5.7?,k取最接近于5.7而不大于5.7的整数5,

则将该?n??7?

班同学编号1~40,随机起点r=5,则该样本单元序号为5,10,15,

20,25,30,35o

N?5o(2)N?35,n?7,k?n

Sethi对称系统抽样:r?5,入样单元为:5,6,10,16,15,26,20Singh

对称系统抽样:由于n为奇数,则从两个断点开始分层,最后中间

的半层取中间位置的单元,r?5,入样单元为:5,31,10,

26,15,21,18

第4题

解:由题,N=360,k=8,贝!Jn=N/k=45

??1第45?r?l??j号住户的户主为汉族

取Yrj??,

??0第45?r?l??j号住户的户主不为汉族

r?l,2,?,8,j?l,2,?,45,

总体均值Y?0.1972

1845

总体方差S?Yrj?Y??N?lr?lj?l

2

??

2

?0.1588

1

?0.1343?0.2101?0.1768?4?0.2?0.1636??0.17698

N?12k(n?l)2

S?S?r?O则:Vysy?NN

451?f2

?0.125,Vysys?S?0.0031运用简单随机抽样:n=45,f?360n

平均样本内方差S?r2?

??

??

显然:Vysys?Vysy,说明等距样本的精确度较简单随机样本的精确度

要高。

????

第5题

答:⑴欲估计汉族所占比例,选择第⑴种系统抽样的方法好。按照题

给条件排序,

在户口册中每5人中抽1人,且平均每户有5口人,分布较均匀,且

如此抽样,每户人家基本均有1人入样。

(2)男性所占比例与孩子所占比例。采用简单随机抽样的方法较合适,

因为按

题条件排序后,采用等距抽样,若抽得初始单元为1,则男生比例为

1,孩子比例为0,如此,则有较大误差。

第6题

r"群"第j个单元具有所研究的特征?1,若总体中第

解:取Yrj=?

r"群"第j个单元不具有所研究的特征?0,若总体中第

In

则总体比例P的简单估计量为P=P=?yrj?ysy,即对总体比例的估计可

nj?l

A

成对总体均值的估计。

?1,第r"群"第j个单元为男性

①估计男性所占比例:则,取Yrj=?

0,其他?

由题意,系统抽样K=5,n=10,则所有可能样本如下表:

1510

总体均值Y???Yrj?0.48

Nr?lj?l

1510

总体方差S?(Yrj?Y)2?0,2547,??N?lr?lj?l

2

152

平均群内方差S??Srj?0.2489

5j?l

2.r

以行为“系统样本”的系统抽样:k=5,n=10

N?12k(n?l)2N?12k(n?l)2

V(ysy)?S?Swsy?S?S.r?0.02559?0.0256

NNNN

简单随机抽样:n=10,f=20%=0.2_

l?f21?0.2

V(y)?S??0.2547?0.0204?0.0256

nlO

V(ysy)?V(y),说明简单随机抽样精度较高。

?1,第r"群"第j个单元为小孩

②估计孩子所占比例:取Yrj=?

0,其他?

由题意,系统抽样:k=5,n=10,则所有可能样本如下表:

5

1

总体均值Y?

N

2

??Y

r?lj?l

10

rj

?0.48

1510

总体方差S?(Yrj?Y)2?0.2547??N?lr?lj?l

152

平均群内方差S??Srj?0.2134

5j?l

2.r

以行为“系统样本”的系统抽样:k=5,n=10

N?12k(n?l)2N?12k(n?l)2

V(ysy)?S?Swsy?S?S.r?0.0576

NNNN

简单随机抽样:

n=10,f=20%=0.2_

l?f21?0,2

V(y)?S??0.2547?0.0204?0.0256

nlO

V(ysy)?V(y),说明简单随机抽样精度较高。

?1,满足条件

③估计具体某种职业的住户人员的比例:取Yrj=?

?0,不满足条件

由题意,系统抽样K=5,n=10,则所有可能样本如下表:

1510

总体均值Y???Yrj?0.38

Nr?lj?l

1510

总体方差S?(Yrj?Y)2?0.2404??N?lr?lj?l

2

152

平均群内方差S??Srj?0.26

5j?l

2.r

以行为“系统样本”的系统抽样:k=5,n=10

N?12k(n?l)2N?12k(n?l)2

V(ysy)?S?Swsy?S?S.r?0.0016

NNNN

简单随机抽样:

n=10,f=20%=0.2_

l?f2

V(y)?S?0.01923?0.0016

n

V(ysy)?V(y),说明系统抽样精度较高。

第7题

?N?

解:①由题,N=15,n=3,直线等距抽样k=??=5,则所有可能样本如下:

?n?

N

1

总体均值Y?

N

2

?Y

i?l

?8

IN

总体方差S?(Yi?Y)2?20?N?li?l

152

平均样本方差S??Sri?25

5i?l

2.r

则以直线等距抽样:

N?12k(n?l)2N?12k(n?l)2

V(ysy)?S?Swsy?S?S.r?2

NNNN

n

简单随机抽样:n=3,f==l/5=0.2

N

l?f2

V(y)?S?5.3334?2

n

V(ysy)?V(y),说明直线等距抽样的精度较高。

②由题,要求抽样间距k=4,n=3,nk=12<15ysy

In

??yini?l

llk_lknlkn

yrj???yrj?YE(ysy)??yr()??yr???kknkNr?lj?lr?lr?lr?lj?l

k_

所以样本均值不是总体均值的无偏估计。

Iknlkn

当时,

nk=N??yrj???yrj,E(ysy)?Yo

nkr?lj?lNr?lj?l

即当nk=N时,样本均值为总体均值的无偏估计。

第8题

解:由题,N=30,k=5,则n=30/5=6

则按照所给顺序等距抽样,可能样本如下:

由上表数据可得:

1562

总体方差S???Yrj?Y

N?lr?lj?l

??

2

?11,8575本

S?r2?

均样

1

?17.4667?7.4667?6.5667?11.4667?18.9667??12.38675

N?12k(n?l)2

S?S?r?1,14则:Vysy?NN

第七章(仅供参考)

1、根据题中所给表格,可计算各层的权重:

85125140''

wl'??0.17w2??0.25w3??0.28

50050050011040''

w4??0.22w5??0.08

500500(1)根据式(7.1),可得该县棉花平均种植面积为:

??

'

stD??whh?0.17?

h?l

L

4901806442356074101

?0.25??0.28??0.22??0.08?

172528228

?164.27

该县共有2000个村,帮全县的棉花种植总面积为:

?NstD?2000?164.27?328540(2)根据式(7.4),Dts的方差估计为:

11'211L'

v(stD)??(?')whsh?('?)?wh(h?stD)2

nhnNh?lh?lnh

nhlnhl22

由公式sh?(yhj?h)?(?yhj?nh),由表中数据可得:?nh?lj?lnh?lj?l

L

sl?90.6544s2?195.7733s3?1335.6773s4?855.5519s5?14334.1429

第一项:

?(

h?lLll'21111?')whsh?(?)?0,172?90.6544?(?)?0.252?195.7733nhn

hl78525125

111111?)?0.282?1335.6773?(?)?0.222?855.5519?(?)?0.082

2814022110840

?14334.1429?14.1864

第二项:?(

HL'('?)?wh(h?stD)2

nNh?l

1149018064423?(?)?[0.17?(?164.27)2?0.25?(?164.27)2?0.28?(?50020001725

28

56074101164.27)2?0.22?(?164.27)2?0.08?(?164.27)2]228

?16760.9705

因此v(stD)?14.1864?16760.9705?16775.1569

该县种植总面积的抽样标准误差估计为

s()?N?s(ystD)?N(ystD)?259037.8883

22、解:本题首先对S12,S2,S2进行估计

由于比例估计的方差S2?NP(1?P)N?1

故我们可以取S2?P(1?P)进行估计。

根据题意知:Wl?W2?0.5Pl?0.2P2?0.8cl?0.25c2h?10

故总体比例P?W1P1?W2P2?O,5

从而:S12?Pl(l?Pl)?0.2?0.8?0.16

2S2?P2(l?P2)?0.8?0.2?0.16

S2?P(l?P)?0.5?0.5?0.25

(1)根据式(7.10)及式(7.7)

?clf?S?hDhL22?c2h(S??WhSh)?h?l?*CT??n?L?cl??c2hWhfhD?

h?l?

*由题意有CT?300(元)

代入上式有flD?0.16?0.25?0,210810?(0.25?0.16)

0.25?0.210810?(0.25?0.16)f2D?0.16?

n??300?12720.25?(10?0.5?0.2108?2)

?nl?flDnl?flDn?Wl?0.2108?1272?0.5?134

?n2?f2Dn2?f2Dn?W2?0.2108?1272?0.5?134

2112LWhShl此时V(PstD)?⑶S??(?l),依题意??nNnfhDh?l

n?S20.25n?S2

??,而忽略不计,故由于亦可忽略不计NNNNN

2LWhShS21故V(PstD)???(?l)??nnfhDh?l

0.250.5?0.161?[?(?1)]?2127212720.2108

70.000667462

(2)不分层的简单随机抽样,样本量为n?268

l?flllNP(l?P)?P(l?P)??0.5?0.5?0.000932835V(P)?nN?ln268

因此二重分层抽样比不分层的简单随机抽样效率高。

(3)略

3、解:由题知,??602,由表,计算?

??0,9994?568.25,?568,5833,R

22sy.027278836.89,sx?256154.86,syx?256262

所以,该地区年末牛的总头数估计

为:??N?N??1238?568.25?602?744839.1(头)YRDRD568,5833

?的方差估计为:根据式(7.15),YRD

?)?v(N)?N2v()?N2[ls2?(l?l)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论