抽样技术第三版全部课后答案金勇进_第1页
抽样技术第三版全部课后答案金勇进_第2页
抽样技术第三版全部课后答案金勇进_第3页
抽样技术第三版全部课后答案金勇进_第4页
抽样技术第三版全部课后答案金勇进_第5页
已阅读5页,还剩32页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章习题 2.1判断下列抽样方法是否是等概的: ( 1) 总体编号 164,在 099中产生随机数 r,若 r=0或 r64则舍弃重抽。 ( 2) 总体编号 164,在 099中产生随机数 r, r处以 64的余数作为抽中的数, 若余数为 0则抽中 64. ( 3) 总体 2000021000,从 11000 中产生随机数 r。然后用 r+19999 作为被抽 选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的 概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以 计算的。第三,当用样本对总体目标进行估计时,要考虑到 该样本被抽中的概率。 因此( 1)中只有 164 是可能被抽中的,故不是等概的。( 2)不是等概的 【原因】( 3)是等概的。 2.2抽样理论和数理统计中关于样本均值 y 的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 抽样理论 概率统计 定 义 ni iyny 11 ni iyny 11 性 质 1.期望 YCPE NN C N C nn 1i ni1i ii 1yyy 2.方差 i C i ii PyEyyV nN 2 1 nN C i ii C yEynN 12 1 21 Snf 1.期望 n i iynEyE 1 1 n iyE1in1 nn1 2.方差 2 iyEyV 2 1 1 n i iynE nyn1 22 i E 2.3为了合理调配电力资源,某市欲了解 50000 户居民的日用电量,从中简单随 机抽取了 300 户进行,现得到其日用电平均值 y 9.5(千瓦时), 2s 206.试估 计该市居民用电量的 95%置信区间。如 果希望相对误差限不超过 10%,则样本量 至少应为多少? 解:由已知可得, N=50000, n=300, 5.9y , 2062 s 1706366666206*30050000 3001 500001)()( 222 sn fNyNvYV 19.413081706366666( )yv 该市居民用电量的 95%置信区间为 )(y 2 yVzN =475000 1.96*41308.19 即为( 394035.95, 555964.05) 由相对误差公式 y )(vu 2 y 10% 可得 %10*5.9206* n50000n1*96.1 即 n 862 欲使相对误差限不超过 10%,则样本量至少应为 862 2.4某大学 10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所 占的比例。随机抽取了两百名学生进行调查,得到 P=0.35,是估计该大学所有 本科生中暑假参加培训班的比例的 95%置信区间。 解析:由已知得: 10000N 200n 35.0p 02.0 Nnf 又有: 35.0)()( ppEpE 0012.0)1(11)( ppn fpV 该大学所有本科学生中暑假参加培训班的比例 95%的置信区间为: )()( 2 PVZPE 代入数据计算得:该区间为 0.2843, 0.4157 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出, N=200, 现抽取一个容量为 20 的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出 Y ,并给出置信水平 95%的置信区间。 解析:由已知得: 200N 20n 根据表中数据计算 得: 5.144 201 201 i iyy 06842.827 120 1 20 1 22 i i yys 21808.37)1(1)( 2 sNnnyV 10015.6)( yV 该小区平均文化支出 Y 的 95%置信区间为: )(y 2 yVz 即是: 132.544 ,156.456 故估计该小区平均的文化支出 Y =144.5,置信水平 95%的置信区间为 132.544 ,156.456。 2.6 某地区 350 个乡为了获得粮食总产 量的估计,调查了 50 个乡当年的粮食产 量,得到 y =1120(吨), 25602 S ,据此估计该地区今年的粮食总产量,并给 出置信水平 95%的置信区间。 解析:由题意知: y =1120 1429.035050n Nf 25602 S 160s 置信水平 95%的置信区间为: 1y 2 sn fz 代入数据得: 置信水平 95%的置信区间为: 1079.872, 1160.872 2.7 某次关于 1000 个家庭人均住房面积的调查中,委托方要求 绝对误差限为 2 平方千米,置信水平 95%,现根据以前的调查结果,认为总体方差 682S ,是确 定简单随机抽样所需的样本量。若预计有效回答率为 70%,则样本量最终为多少 ? 解析:简单随机抽样所需的样本量 222 22 1 2 2 SZNd SNZn %701 2 nn 由题意知: 1000N 2d 682S 96.12 Z 代入并计算得: 613036.611 n 87142.87%70 12 nn 故知: 简单随机抽样所需的样本量为 61,若预计有效回答率为 70%,则样本量最 终为 87 2.8某地区对本地 100 家化肥生产企业的尿素产量进行调查,一直去年的总产量 为 2135吨,抽取 10个企业调查今年的产量,得到 25y ,这些企业去年的平均 产量为 22x 。试估计今年该地区化肥总产量。 解析:由题可知 22x , 35.211002135 NXX , 25y 则,该地区化肥产量均值 Y 的比率估计量为 26.24242535.21 xyXY 该地区化肥产量总值 Y的比率估计量为 242626.24*100 RYNY 所以,今年该地区化肥总产量的估计值为 2426 吨。 2.9如果在解决习题 2.5 的问题时可以得到这些家庭月总支出,得到如下表: 单位:元 编号 文化支出 总支出 编号 文化支出 总支出 1 200 2300 11 150 1600 2 150 1700 12 160 1700 3 170 2000 13 180 2000 4 150 1500 14 130 1400 5 160 1700 15 150 1600 6 130 1400 16 100 1200 7 140 1500 17 180 1900 8 100 1200 18 100 1100 9 110 1200 19 170 1800 10 140 1500 20 120 1300 全部家庭的总支出平 均为 1600 元,利用比估计的方法估计平均文化支出,给出 置信水平 95%的置信区间,并比较比估计和简单估计的效率。 解析:由题可知 1580130017002300201xn1x n 1i i )( 5.144y 091.01580 5.144 xyrR 又 329.1461580 5.144*1600xyy XR 053.826)(11 1 22 n i i yynS 158.3463)(11 1 n i iixy xxyynS 579.8831)(11 1 22 n i ix xxnS 故平均文化支出的 95%的置信区间为 ,)2(1 2222 xyxR SRSRSn fZy )2(1 2222 xyxR SRSRSn fZy 代入数据得( 146.329 1.96*1.892) 即为 142.621,150.037 2.10某养牛场购进了 120头肉牛,购进时平均体重 100千克。现从中抽取 10头, 记录重量, 3个月后再次测量,结果如下: 单位:千克 编号 原重量 现重量 1 95 150 2 97 155 3 87 140 4 120 180 5 110 175 6 115 185 7 103 165 8 102 160 9 92 150 10 105 170 用回归估计法计算 120 头牛现在的平均重量,计算其方差的估计,并和简单估计 的结果进行比较。 解:由题可知, 6.10210595 101xn1x n 1i i )( 163170150 101yn1y n 1i i )( 222.2121910*91)(11 1 22 ni i yynS 333.1461317* 91)(11 1 ni iixy xxyynS 933.1064.926* 91)(11 1 22 ni ix xxnS 故有 368.1 933.106 333.14620 xxySS 所以总体均值 Y 的回归估计量为 443.159)6.102100(*368.1163)(0 xXyy lr 其方差估计为: )2(1)( 02202 xyxlr SSSn fyV = )333.146*368.1*2933.106*368.1222.212(10120101 2 =1.097 而 21y( Sn fV ) = 222.212*10 120101 =19.454 显然 )()( yVyV lr 所以,回归估计的结果要优于简单估 第三单元习题答案(仅供参考) 1解:( 1)不合适 ( 2)不合适 ( 3)合适 ( 4)不合适 2将 800名同学平均分成 8组,在每一级中抽取一名“幸运星”。 3根据表中调查数据,经计算,可得下表: h 1 10 256 0.3033 0.0391 11.2 2867.2 94.4 2 10 420 0.4976 0.0238 25.5 10710 302.5 3 10 168 0.1991 0.0595 20 3360 355.6 总计 30 844 1 16937.2 = =20.1 V( ) = - =9.7681-0.2962 =9.4719 =3.0777 ( 2)置信区间为 95%相对误差为 10%,则有 按比例分配的总量: n= =185.4407 185 =n =56, =92, =37 按内曼分配: n= =175 =33, =99, =43 4根据调查数据可知: h 1 0.18 0.9 2 0.21 0.933 3 0.14 0.9 4 0.08 0.867 5 0.16 0.933 6 0.22 0.967 = =0.924 根据各层层权 及抽样比 的结果,可得 ( ) = =0.000396981 =1.99% 估计量的标准差为 1.99%,比例为 9.24% 按比例分配: n=2663 =479, =559, =373, =240, =426, =586 内曼分配: n=2565 =536, =520, =417, =304, =396, =392 5解:由题意,有 = =75.79 购买冷冻食品的平均支出为 75.79元 又由 V( ) = + 又 n= V( ) =53.8086 =7.3354 95%的置信区间为 60.63, 90.95。 7解:( 1)对 ( 2)错 ( 3)错 ( 4)错 ( 5)对 8解:( 1)差错率的估计值 = 70%+ 30%=0.027 估计的方差 v( ) = =3.1967 标准差为 S( )=0.0179。 ( 2)用事后分层的公式计算差错率为 = =0.03 估计的方差为; v( ) = - =2.5726 9解:( 1)所有可能的样本为: 第一层 第二层 3, 5 0, 3 8, 15 6, 9 3, 10 0, 6 8, 25 6, 15 5, 10 3, 6 15, 25 9, 15 ( 2)用分别比估计,有 =0.4, =0.65,所以用分别比估计可计算得 =6.4。 用联合比估计,有 =0.5, =0.625,所以用联合比估计可计算得 =6.5。 第四章习题 4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有 4000 户,划分为 400 个 群,每群 10户,现随机抽取 4个群,取得资料如下表所示: 群 各户订报数 ijy iy 1 1, 2, 1, 3, 3, 2, 1, 4, 1, 1 19 2 1, 3, 2, 2, 3, 1, 4, 1, 1, 2 20 3 2, 1, 1, 1, 1, 3, 2, 1, 3, 1 16 4 1, 1, 3, 2, 1, 5, 1, 2, 3, 1 20 试估计平均每户家庭订报份数 及总的订报份数,以及估计量的方差。 解:由题意得到 400N , 4n , 10M , 01.04004 Nnf 故 875.1 410 201620191 1 ni iyMnyY (份) 75.18875.110 yMy (份) 750040010 yNMY (份) ni ib yynMs 1 22 )(1 ni ib yynnM fsnM fyv 1 222 )(1111)( 14 )75.1820()75.1819(104 01.01 222 00391875.0 6270000391875.010400)()( 2222 yvMNYv 于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量方差为 0.00391875。该辖区总的订阅份数为 7500,估计量方差为 62700。 4.2 某工业系统准备实行一项改革措施。该系统共有 87 个单位,现采用整群抽 样,用简单随机抽样抽取 15 个单位做样本,征求入选单位中每个工人对政 策改革措施的意见,结果如下: 单位 总人数 赞成人数 1 51 42 2 62 53 3 49 40 4 73 45 5 101 63 6 48 31 7 65 38 8 49 30 9 73 54 10 61 45 11 58 51 12 52 29 13 65 46 14 49 37 15 55 42 ( 1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。 ( 2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允 许误差不超过 8%,则应抽取多少个单位做样本 ? 解:题目已知 87N , 15n , 8715Nnf 1)由已知估计同意改革的比例 709.0911646 1 1 n i i n i i M y p 733.601 1 ni iMnM 008687.0)(1111)( 1 22 ni ii Mpynn fMpv 此估计量的标准差为 9321.0008687.0)()( pvps 4.3 某集团的财务处共有 48 个抽屉,里面装有各种费用支出的票据。财务人员 欲估计办公费用支出的数额,随机抽取了其中的 10 个抽屉,经过清点,整 理出办公费用的票据,得到下表资料: 抽屉编号 票据数 iM 费用额( iy ,百元) 1 42 83 2 27 62 3 38 45 4 63 112 5 72 96 6 12 58 7 24 75 8 14 58 9 32 67 10 41 80 要求以 95%的置信度估计该集团办公费用总支出额度置信区间( =0.05)。 解:已知 N=48, n=10, f= 4810Nn , 由题意得 736 1 n i iy , 365 1 n i iM , 则办公费用的总支出的估计为 8.3532736 1048 1 ni iynNY (元) 群总和均值 6.73736 1011 1 ni iyny (元) 1 )()1( )( 1 22 n yy n fNYv n i i = 9 )6.7380(.)6.7362()6.7383(10 )48101(48 2222 = 182.4 91 3590.4 = 72765.44 )(Yv =269.7507 则 Y 的置信度为 95%的置信区间为 3532.8 1.96 269.7507,即 3004.089, 4061.511. 4.4 为了便于管理,将某林区划分为 386个小区域。现采用简单随机抽样方法, 从中抽出 20个小区域,测量树的高度,得到如下资料: 区域编号 数目株数 iM 平均高度 iy (尺) 区域编号 数目株数 iM 平均高度 iy (尺) 1 42 6.2 11 60 6.3 2 51 5.8 12 52 6.7 3 49 6.7 13 61 5.9 4 55 4.9 14 49 6.1 5 47 5.2 15 57 6.0 6 58 6.9 16 63 4.9 7 43 4.3 17 45 5.3 8 59 5.2 18 46 6.7 9 48 5.7 19 62 6.1 10 41 6.1 20 58 7.0 估计整个林区树的平均高度及 95%的置信区间。 解:由已知得 386N , 20n , 0518.038620 Nnf 整体的平均高度 909.51046 8.6180yY 1-i n 1i n i ii M yM 3.521 1 ni iMnM 方差估计值 1 )(1)()( 1 2 2 n yMy Mn fyvYv n i ii 02706.0 标准方差 1644.002706.0)()( YvYs 在置信度 95%下,该林区的树木的平均高度的置信区间为 )2312.6,5868.5()1644.096.1909.5()Y(tY /2 )( s 4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女 生宿舍 200间,每间 6人。学生会的同学运用两阶段抽样法设计了抽样方案, 从 200 间宿舍中抽取了 10 间样本宿舍,在每间样本宿舍中抽取 3 位同学进 行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表: 样本宿舍 拍照人数 样本宿舍 拍照人数 1 2 6 1 2 0 7 0 3 1 8 1 4 2 9 1 5 1 10 0 试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。 解:题目已知 200N , 10n , 6M , 3m , 05.020010 1 Nnf , 5.0 2 Mmf 3.0310 9 1 nm y p n i i 005747.0)(1111)( 12 ni i mpynn fmpv 0758.0005747.0)()( pvps 在置信度 95%下, p的置信区间为 )( 2/ pvtp = )0 . 4 4 8 5 6 8,0 . 1 5 1 4 3 2()0758.096.13.0( 4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的 调查,宿舍间的标准差为 1S =326元,宿舍内同学之间的标准差为 2S =188 元。 以一位同学进行调查来计算,调查每个宿舍的时间 1c 为 1分钟,为了调查需 要做各方面的准备及数据计算等 工作,所花费的时间为 0c 是 4 小时,如果 总时间控制在 8小时以内,则最优的样本宿舍和样本学生是多少? 解:由已知条件得到以下信息: 326S1 (元) 188S2 (元) 10c1 (分钟) 1c2 (分钟) 240604c0 (分钟) 由此得到 106276S21 , 35344S22 , 33.100385635344106276S 2212u MSS 82.1110326188m 2112opt ccSS 因而取最优的 2m ,进一步计算 optn 由于总时间的限制 480C ,由关系式 nmcnccC 210 得到 optopt 2n10n240480 计算方程得到 20nopt ,因而取 20n 则最优的样本宿舍数为 20间,最优样本学生数为 2。 4.7 某居委会欲了解居民健身活动情况,如果一直该居委会有 500名居民,居住 在 10个单元中。现先抽取 4个单元,然后再样本单元中分别抽出若干居民, 两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时 间结果如下(以 10分钟为 1个单位): 单元 i 居民人数 iM 样本量 im 健身锻炼时间 ijy 1 32 4 4, 2, 3, 6 2 45 5 2, 2, 4, 3, 6 3 36 4 3, 2, 5, 8 4 54 6 4, 3, 6, 2, 4, 6 试估计居民平均每天用于锻炼的时间,并给出估计的标准差。 ( 1) 简单估计量 ( 2) 比率估计量 ( 3) 对两种估计方法及结果进行评价。 解:( 1)简单估计 ni iini iu YnNyMnNY 11 = )17.4545.4364.34575.332(410 =1650, 则 3.3 5001650Y 0u MY u , 又 165660 411Y 1u ni iYn , 所以 n i i iii n i ui m sfMnNn YYf 1 2 22 2 1 2 12u )1(1 )( n 1(N)Yv( ) 分别计算 192635778 )165225()165162()165153()165120(311 )( 22221 2 n YY n i ui 48.4628 6 2.2) 54 61(54 4 7) 36 41(36 5 8.2) 45 51(45 4 92.2) 32 41(32 )1( 2 222 1 2 22 2 n i i iii m sfM 所以, 162.0046285.011556.0 )1( 1 )( n 1(N1)( 1 2 22 2 1 2 1 2 0 n i i iii n i ui u m sfM n N n YYf M Yv ) 所以标准差 402.0)()( uu YvYs (2) 比率估计 9532.354364532 17.4545.4364.34575.332 1 1 n i i i n i i R M yM y ni i iii n i uiR m sfMnNn YYf yv 1 2 22 2 1 2 12 )1(1 )( n 1(N)( ) 其中 n i i i n i i R R M yM M YY 1 1 0 0715.0)()( 2 0 MYvyv RR 2647.00715.0)()( RR yvys ( 3) 简单估计标准差 402.0)( uYs ,比率估计标准差 2647.0)( Rys 比率估计更好 第五章不等概抽样习题答案 5.1解: 分析题目可知“代码法”与“拉希里法”都是 PPS 抽样(放回的与规模大小 成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样, 故需进一 步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单 元,重新抽取,直到抽到规定的样本量且所有样本党员不重复: ( 1) 代码法:由 iZ = N1i i i 0 i M M M M 可假设 0M =1000000,则 Mi = iZ M0 列成数据表 为: PSU M i 累计 Mi 代码 1 110 110 1 110 2 18556 18666 111 18666 3 62999 81665 1866781665 4 78216 159881 81666159881 5 75245 235126 159982235126 6 73983 309109 235127309109 7 76580 385689 309110385689 8 38981 424670 385690424670 9 40772 465442 424671465442 10 22876 488318 465443488318 11 3721 492039 488319492039 12 24971 517010 492040517010 13 40654 557664 517011557664 14 14804 572468 557665572468 15 5577 578045 572469578045 16 70784 648829 578046648829 17 69635 718464 648830718464 18 34650 753114 718465753114 19 69492 822606 753115822606 20 36590 859296 822607859296 21 33853 893049 859297893049 22 16959 910008 893050910008 23 9066 919074 910009919074 24 21795 940869 919075940869 25 59185 1000054 9408701000054 我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个 随机数为 444703, 615432, 791937, 921813 , 738207, 176266, 405706 935470, 916904, 57891 按照范围我们可以知道抽取的 PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到 第 2组和 24组重复抽取了,故进行重新抽取,抽到 4组和 6组; 综上 所述,抽取的样本为 2, 4, 6, 8, 9, 16, 18, 19, 23, 24组 ( 2)拉希里法: M =78216, N=25,在 1, 25和 1, 78216中分别产生( n,m): ( 13, 38678), M13=40654 38678,入样; ( 8, 57764), M8 =3898157764,舍弃,重抽; ( 23, 13365), M23 =906613365,舍弃,重抽; ( 19, 38734), M19=69492 38734,入样; 以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为: 2, 3, 5, 6, 7, 12 , 13, 16, 19, 24组 5.2解: 由数据可得: t1 = iM j jy1 1 =20, t 2 1 22 25 M j jy , t3 =38, t4 =24, t5 =21; 结合 t值数据,我们可以推得 Z的值 Z1 = 2.0 25501 MM ,Z2 =0.16, Z3 =0.32, Z4 =0.2, Z5 =0.12, 由公式 N i i iji jiji ij Z ZZZ ZZZZ 1 21 12121 14 样本 ij 1, 2 0.273769 1, 3 0.217405 1, 4 0.283079 1, 5 0.243826 2, 3 0.166251 2, 4 0.213142 2, 5 0.243826 3, 4 0.603903 3, 5 0.53546 4, 5 0.243826 5.3 解: 设: 0M =1,则有: ii ZM ,得到下表: i iM 1000iM 累计 1000iM 代码 1 0.104 104 104 1 104 2 0.192 192 296 105 296 3 0.138 138 434 297 434 4 0.062 62 496 435 496 5 0.052 52 548 497 548 6 0.147 147 695 549 695 7 0.089 89 784 696 784 8 0.038 38 822 785 822 9 0.057 57 879 823 879 10 0.121 121 1000 880 1000 1 1000 先在 1,1000中产生第一个随机数为 731,再在 1,1000里面产生第二个随机数 为 103,最后在 1,1000中产生第三个随机数为 982,则它们所对应的第 7、 1、 10号单元被抽中。 5.4 解: 利用汉森 -赫维茨估 计量对总体总值进行估计: 9.322877.792543.10370 6 1 006.2217 121.0 290 006.2217 062.0 120 006.2217 138.0 320 6 1 1 11 006.2217 121.0 290 062.0 120 138.0 320 3 11 22 22 1 1 n i HH i i HH n i i i HH Y Z y nn Yv Z y n Y =20318.8 5.142 HHHH YvYs 5.5解:由题可知 6110 i iNi i XXX =2+9+3+2+1+6=23 由 0X Xn ii 得下表: i 指标值 iX 包含概率 i iZ 1 2 0.1739 0.087 2 9 0.7826 0.3913 3 3 0.2609 0.1304 4 2 0.1739 0.087 5 1 0.087 0.0435 6 6 0.5217 0.2609 由上表显然有 iZ 1/2,于是我们可以采用布鲁尔方法: N i i iji jiji ij Z ZZZ ZZZZ 1 21 12121 14 经计算可得下表: 样本 ij 1, 2 0.0068 1, 3 0.0153 1, 4 0.0097 1, 5 0.0046 1, 6 0.0397 2, 3 0.1607 2, 4 0.1046 2, 5 0.0512 2, 6 0.3613 3, 4 0.0153 3, 5 0.0074 3, 6 0.062 4, 5 0.0046 4, 6 0.0397 5, 6 0.0191 附注 : (1) 78.25455.00476.01053.01764.07999.11053.0 211 Ni ii ZZ ( 2) 样本 jiZZ ji ZZ 1, 2 0.0340 1.2613 1, 3 0.0133 0.2174 1, 4 0.0076 0.174 1, 5 0.0038 0.1305 1, 6 0.0227 0.3479 2, 3 0.051 0.5217 2, 4 0.034 0.4783 2, 5 0.017 0.4348 2, 6 0.1021 0.6522 3, 4 0.0113 0.2174 3, 5 0.0057 0.1739 3, 6 0.034 0.3913 4, 5 0.0038 0.1305 4, 6 0.0227 0.3479 5, 6 0.0113 0.3044 验证 : ni iiHH ZxnX 11 iini iiHT nZxX 1 HTHH XX 另外: 2 1 2 1 1 N i N ij j j i iijjiHT i iN i i HH XXXVXZXZnXV 代入数据,经计算得到: HTHH XVXV 0 5.6 解: i iy ix iR 1 10 7 1.43 2 9 5 1.8 3 5 3 1.67 4 2 1 2 5 4 2 2 平均 6 3.6 1.78 由题可计算出 : (1) i iY iY iP iR 1 10 50 10 1.43 2 9 45 9 1.8 3 5 25 5 1.67 4 2 10 2 2 5 4 20 4 2 6Y N i i YYNS 1 22 11 =11.5 所以有: 21 Sn fyV =10.0625 xyRyPyNYyY 5625.2510625.10 2 yVNYVyVYV ( 2) 由定义有: 32118.5 5.11111 1 2 1 22 XXYYNSS YYNSRXYRXNY i N i iyxx N i iRR 所以得到下表: i RiY RiY R 1 5.148 25.74 1.43 2 6.48 32.4 1.8 3 6.012 30.06 1.67 4 7.2 36 2 5 7.2 36 2 RVNXYVRVXYV SRSRSn f X RV RiRi xyx 2 2 2 2 2 2 2 11 所以有下表: i RiYV RiYV RV R 1 1296 51.84 4.6 1.43 2 1846.8 73.872 5.7 1.8 3 1717.2 68.688 5.3 1.67 4 2041.2 81.648 6.3 2 5 2041.2 81.648 6.3 2 ( 3) 结合题目已知条件,我们选择的包含概率与 iX 成正比: PZii (第 i项被选中) i iZ iy HHY 2 YYS 1 7/18 10 25.7 18.49 2 5/18 9 32.4 5.76 3 3/18 5 30 0 4 1/18 2 36 36 5 2/18 4 36 36 18 3623610376.5549.18721 YYZYV HHNi i254.71 由以上计算结果可以看出: YVYVYV HHR ,比估计在样本量很小的情 况下即使是最小的方差也远比另外两种估计的方差大,而简单估计又比 PPS 汉森 -赫维茨估计略好。 5.7 解:已知 n=2 m=5 340 1 1 n i m j ijy 设公司总人数为 0M 由于这个样本是自加权的,所以有: 001 10 3434010 MMynmMY n i m j ij (分钟) 34 0 MYy (分钟) 所以该公司职工上班交通平均所需时间为 34分钟。 2442440101 34303460341034401011 2222 1 1 2 n i m j ij yynmy 62.15 yys (分钟) 5.8 说明 : 25616 y 解 :由题可知 : 4.495299186 1011011 10 1 10 11 i ii i in i i iHH yZyZYnY (吨 ) 所以 ,全集团季度总运量为 495299.4吨 . HHYV 的一个无偏估计 为 : 95183360186901111 10 1 2 1 2 i HHi n i HHi iHH YyYZYnnY 因为 2/t =2.306 所以 2/t 95183360 =22497.8 所以置信度 95%的置信区间为 472894.6 , 517890.2 第 6章 第 2题 证明:将总体平方和按照全部可能的系统样本进行分解,可以得到 k r n j rj YySN 1 1 2_2 )()1( k r n j rrj yy1 1 )( + k r n j r YY1 1 2_ )( k r r Yyn 1 2_ )( + k r n j rrj yy1 1 2_ )( k r r Yyk nk 1 2_ )( + k r n j rrj yy1 1 2_ )( k r r Yyk 1 2_ )(1 2)1(1 SNnk k r n j rrj yy1 1 2_ )( 根据 )(_syyV 的定义,且 Nnk ,有 )(_syyV k r r Yyk 1 2_ )(1 2)1( SNN k r n j rrj yyN 1 1 2_ )(1 令 2wsyS k r n j rrj yynk 1 1 2_ )()1( 1 则有 )(_syyV 2)1( SNN 2)1( wsySNnk 证明:在样本量相同的情况下 )(_syyV )(_sysyV 2)1( SNN 2)1( wsySNnk 21 Snf 2)1( SNN 2SNnnN 2)1( wsySNnk 2)( SN nNN 2)1( wsySNnk 2SN kN 2)1( wsySNnk )()1( 22 w sySSNnk 立即可得到当且仅当 22 SSwsy 时,系统抽样优于简单随机抽样。 第 3题 解: 7.5 740 nNk , k取最接近于 5.7 而不大于 5.7的整数 5,则将该 班同学编号 140,随机起点 r=5,则该样本单元序号为 5, 10, 15, 20, 25, 30, 35。 35N , 7n , 5 nNk 。 Sethi对称系统抽样: 5r ,入样单元为 :5, 6, 10, 16, 15, 26, 20 Singh 对称系统抽样:由于 n 为奇数,则从两个断点开始分层,最后中间 的半层取中间位置的单元, 5r ,入样单元为: 5, 31, 10, 26, 15, 21, 18 第 4题 解:由题, N=360, k=8,则 n=N/k=45 取 1 4 5 1Y 0 4 5 1rj rj 第 号 住 户 的 户 主 为 汉 族 第 号 住 户 的 户 主 不 为 汉 族 , 1,2, ,8r , 1,2, ,45j , 则可能样 本如下表: j r 145 样 本均值 样本 内方差 1 00001100000100000000000000000000000000011 1100 0.1 556 0.134 3 2 00000001001110100001001000000000000001111 1100 0.2 889 0.210 1 3 00000000001111000000000000000000000001111 1100 0.2 222 0.176 8 4 00011100100101000001000000000000000001110 0000 0.2 222 0.176 8 5 00001100101111000000000000000000000000111 1100 0.2 667 0.200 0 6 00001000001101000000000000000000000001111 0100 0.2 000 0.163 6 7 00011110000000000000000000010000000001111 1000 0.2 222 0.176 8 8 00011010000000000000000000010000000011111 1000 0.2 222 0.17

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论