版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、5.1 比估计比估计(gj)一、使用一、使用(shyng)比估计的两种情况比估计的两种情况即即之之比比值值均均值值)体体的的两两个个指指标标总总量量(或或所所需需估估计计的的目目标标值值是是总总,1.比值(bzh)(或比率)XYXYR 第1页/共42页第一页,共43页。 例例: :绝对贫困绝对贫困以上以上勉强度日勉强度日小康小康富裕富裕最富裕最富裕以下以下消费性总支出金额消费性总支出金额食品支出金额食品支出金额恩格尔系数恩格尔系数所占的比例。即:所占的比例。即:性总支出金额中性总支出金额中指食品支出金额在消费指食品支出金额在消费恩格尔系数恩格尔系数6 . 06 . 05 . 05 . 04 .
2、 04 . 03 . 03 . 0: XYR金金额额平平均均每每户户消消费费性性总总支支出出平平均均每每户户食食品品支支出出额额尔尔系系数数一一个个国国家家或或地地区区的的恩恩格格 第2页/共42页第二页,共43页。城乡居民家庭人均收入及恩格尔系数年份城镇居民家庭人均可支配收入(元)农村居民家庭人均纯收入(元)城镇居民家庭恩格尔系数 (%)农村居民家庭恩格尔系数(%)1978343.4133.657.567.71980477.6191.356.961.81985739.1397.653.357.819901510.2686.354.258.819954283.01577.750.158.620
3、006280.02253.439.449.120016859.62366.438.247.720027702.82475.637.746.220038472.22622.237.145.620049421.62936.437.747.2200510493.03254.936.745.5200611759.53587.035.843.0第3页/共42页第三页,共43页。元元以以上上)(元元)(元元)(元元)(:的的每每盒盒最最高高价价格格范范围围是是若若会会购购买买,您您所所能能承承受受)不不会会()会会(,您您会会不不会会购购买买?假假如如市市场场上上有有奶奶酪酪出出售售11410938625
4、41.221.1,其他元高价格范围是人会购买且能承受的最,第,其他人会购买奶酪,第人,设总体有元者所占的比例。能承受的最高价格在要估计会购买的人中,05410154iYiXNii 例: “筛选(shixun)性”问题XYXYRNiiNii 11因此,要估计的是因此,要估计的是第4页/共42页第四页,共43页。 例例:1802:1802年,法国年,法国(f u)(f u)的的LaplaceLaplace受政府委托进行受政府委托进行法国法国(f u)(f u)人口的估计与推算。推算方法如下:人口的估计与推算。推算方法如下:已知)已知)总体的出生人口数总体的出生人口数总体的人口总数总体的人口总数(X
5、YR 2.利用辅助变量的信息改进估计(gj)的精度35.28 样样本本的的出出生生人人口口总总数数样样本本的的人人口口数数RRXY 即总体的人口总数即总体的人口总数已知已知的比估计量:的比估计量:XXRYYR, 第5页/共42页第五页,共43页。利用辅助变量的信息(xnx)改进估计的精度XRYXYR ,因此,因此已知已知的比估计量:的比估计量:XXRYYR, 第6页/共42页第六页,共43页。已知已知的比估计量:的比估计量:XXRYYR, XYR 比比值值估估计计量量已知已知的比估计量:的比估计量:XXRYYR, 计计估估比比第7页/共42页第七页,共43页。 比估计的使用条件(tiojin)
6、:(1)调查变量与辅助变量间有正线性相关关系,且大致呈正比例; (如果辅助变量与调查变量间有负线性相关关系,则要采取乘积估计。)(2)估计 或Y时 ,一般要求辅助变量的总体总量或均值是已知的。(3)适用面广,可以用于简单随机抽样,也可用于分层随机抽样、整群抽样、多阶抽样等;Y第8页/共42页第八页,共43页。二、简单二、简单(jindn)随机抽样下的比估计随机抽样下的比估计1.比值估计量:比值估计量:XYR xy 对对于于简简单单随随机机抽抽样样第9页/共42页第九页,共43页。Xxy XRYR 的比估计量:的比估计量:及及YY . 2xyR 对对于于简简单单随随机机抽抽样样XxyXRYR 第
7、10页/共42页第十页,共43页。2.2.比估计的性质比估计的性质(xngzh)(xngzh): 对于简单随机抽样对于简单随机抽样RREnxyR )() 1 (大时,大时,是有偏的。但当是有偏的。但当1)(1)()()2(122 NRXYXnfRVRMSENiii)2(1)2(122222222xyxyxxyySRSSRSXnfSRRSSXnf 第11页/共42页第十一页,共43页。证明(zhngmng):RREnXXRYXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大时,当)()()()(大时,当0) 1 ( 第12页/共42页第十二页,共43页。11)()(111001)
8、()()()()2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(则,对每个总体单元,令)()(又)()(第13页/共42页第十三页,共43页。)2(1)2(11)()(2)(11)()(11)(1)()(2222222212222122122xyxyxxyyNiiiiiNiiiNiiiSRSSRSXnfSRRSSXnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE第14页/共42页第
9、十四页,共43页。(3)比估计(gj)的方差估计(gj)1)(1)()(122NRXYXnfRVRMSENiii)2(1)(22221xxyysRsRsXnfRvRVX )(的的渐渐近近无无偏偏估估计计为为已已知知时时,当当 NiiiRXYN12)(11估计估计可用可用 niiixRyn12)(11)2(12222xxyySRRSSXnf 11122 nxRyXnfniii)(第15页/共42页第十五页,共43页。)2(111)(22221221xxyyniiisRsRsxnfnxRyxnfRvRVXxX )()(的渐近无偏估计为的渐近无偏估计为,则,则代替代替未知时,用未知时,用当当第16页
10、/共42页第十六页,共43页。例:某小区有例:某小区有19201920户,从中随机抽取了户,从中随机抽取了7070户,户,调查各户的住房面积(单位:平方米)和家调查各户的住房面积(单位:平方米)和家庭人口庭人口(rnku)(rnku),得数据:,得数据: 试对人均住房面积作点估计和置信度为试对人均住房面积作点估计和置信度为95%95%的区间估计。的区间估计。7264.5xy1110 x52940.7,y260 x1821.4,y701iii701i2i701i2i701ii701ii 第17页/共42页第十七页,共43页。 解:解:01. 72604 .1821701701 iiiixyR08
11、5. 011)(1222 nxRyxnfRvRVniii)()(的渐近无偏估计为:的渐近无偏估计为:92.56372)(7012270170127012 iiiiiiiiiixRxyRyxRy 58. 744. 6%952121,)(,)(的置信区间为:的置信区间为:的置信度为的置信度为 RvuRRvuRR 第18页/共42页第十八页,共43页。3.3.比估计比估计(gj)(gj)与简单估计与简单估计(gj)(gj)的比较的比较21)()2(ySnfyVyY 的方差为:的方差为:的简单估计的简单估计)2(1)() 1 (222xyxyRRSRSSRSnfyVyYn 的的方方差差为为:的的比比估
12、估计计足足够够大大时时,当当02(12(11)()(21222222)得:)得:()(xyxxyxyyRSRSSRnfSRSSRSnfSnfyVyV 单估计更精确。单估计更精确。,即比估计较相应的简,即比估计较相应的简,则,则特别若特别若212/2/2 yxyxyxyxCCCCYSXSSRS 第19页/共42页第十九页,共43页。4.估计(gj)R时样本量的确定:VXSnNnnVXNSVXSnRxyNSSXnfRVnVRdddNiiidd2200022221222211111,,其中解得:)(,其中)(大时,当的方差上限为如果估计。未知时,也可由)(由的样本,抽一个容量为也可以通过试点调查时计
13、,可以通过以往的资料估,xXxRynsnSniiidd122211第20页/共42页第二十页,共43页。估计(gj) 时样本量的确定:2222/10002222/12222/12/1122211111,1dSnNnnNdSdSnYVdRxyNSSnfYVnddddRNiiiddR,其中解得:)()(,其中)(大时,当的绝对误差限为如果置信度为Y第21页/共42页第二十一页,共43页。例:某公司有1000名职工,为了估计职工今年与去年病假工时的比率,要抽一个(y )容量为n的简单随机样本进行调查。先随机抽了10人作试点调查,数据如下:编号去年病假工时今年病假工时11213224253151543
14、03253236626247101281516902101412第22页/共42页第二十二页,共43页。希望以置信度95%,使估计R的绝对误差不超过0.01,应抽容量为多大的样本?已知公司职工去年(qnin)病假工时为16300。解:05. 1178187101101iiiixyR4245,4066,4463178,18710110121012101101iiiiiiiiiiixyxyxy由试点调查的数据得:第23页/共42页第二十三页,共43页。5222/1210122701221011012101210603. 296. 101. 03 .1610001630016300474. 3)(9
15、1265.312)(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd第24页/共42页第二十四页,共43页。例:审计员想估计一个医院的财产的现在价值。从计算机存储的记录里查到,医院的财产有2100项,共计价值950000元。为了估计现在的价值,拟在2100项目中随机抽取n项。因为没有信息可用来确定(qudng)n,先随机抽了15项,获得数据整理如下: 试确定(qudng)n,使估计量的绝对误差不超过500元(置信度为95%)。表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyx
16、x27.4560,19.4522, 5 .23754.4706, 0 .24215115121511512151第25页/共42页第二十五页,共43页。解:表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .2421511512151151215198. 00 .2425 .237151151iiiixyR第26页/共42页第二十六页,共43页。406210050415041504)2100500(4444. 796. 100222222/10NnnndSnd4444. 7)(1412218
17、.1042)(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy第27页/共42页第二十七页,共43页。三、分层随机抽样下的比估计 在大样本时, 1. 分别比估计:若 各层的样本量比较大时,各层可分别进行(jnxng)比估计,再进行(jnxng)加权平均,所得估计量称为分别比估计。 LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhRsLhhhhLhRhhLhhhRsSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)()()(方差第28页/共42页第二十八页,共4
18、3页。2. 联合比估计:若 某些层的样本量比较小时,可以采用联合比估计。对两个指标先求总体均值或总和的分层估计,然后用它们(t men)构造比估计,所得估计量称为联合比估计。 LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1)(方差第29页/共42页第二十九页,共43页。5.2 回归估计回归估计Linear regression 估计精度就比较高。为常数)。这时,用比(可以认为又比较大,相关系数的回归直线通过原点,关于如果。估计其实质是用,已知的比估计量:简单随机抽样中aaxyxyXYxyXXxyYYiiiiR)(的特征数呢?的信息来估计调查指标如何
19、利用辅助指标,的回归直线不通过原点关于如果yxxyii第30页/共42页第三十页,共43页。1.简单随机抽样中的回归估计量:对于简单随机抽样,总体均值和总体总和(zngh)的回归估计量分别为:lrlrYNYXxXbyY)(已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性质:记为以后)(的回归估计为时,当)(的回归值时,事先给定常数)若(据结构:具有一元线性回归的数与假定1000第31页/共42页第三十一页,共43页。YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性质)(即回归估计为比估计)(时,当计)(即回归估计为
20、差估(时,当计)(即回归估计为简单估时,当)(的回归估计为时,事先给定常数若110:00000)()(:性质22002212xxyylrSSSnfyV第32页/共42页第三十二页,共43页。)的无偏估计。()是()(性质:)()()()(去估计均值的回归估计就是用样本或者说:(,其中(换个角度:证明:)()(:性质lrxxyylrxxyyNiiiNiiiZlriiiniiniiilrxxyylryVsssnfyvSSSnfXXYYNnfYXXYNnfSnfyVYzYxXyzzznxXynxXyySSSnfyVi22002220022102102011002200221211111111)1)(
21、1)212第33页/共42页第三十三页,共43页。,即总体残差方差。)(的相关系数。与为数,的(有限)总体回归系关于为其中)()(且)达到最小值,(时,)()(当的最佳值)定理:(NiiNiiiyylrlrxxyNiiNiiieNEYYNSxyxyBSnfyVyVBSSXXXXYY12122222min2121001)(1111第34页/共42页第三十四页,共43页。证明(zhngmng):)()(时,当)(得)(令)()(22min2020220022002110, 021ylrxxylrxxylrxxyylrSnfyVBSSdyVdBSSdydVSSSnfyV第35页/共42页第三十五页,
22、共43页。)(21)(2121211,1122212212222121yxyyxxyyniiiniieelrylrlrlrlrniiniiiiiiiibssnnlblnxxbyynyynssnfyvnSnfyVyMSEnYyEnxXbyyYxxxxyybBBxyxy)()()(其中样本残差)(大时性质:当)()()(大时,性质:当)(大时,性质:当)(的回归估计为:)()(一般是未知的,本回归系数。根据样本计算时,为样)若(据结构:具有一元线性回归的数与假定第36页/共42页第三十六页,共43页。例:总体由75308个农场组成,设yi为第i个农场养牛(yn ni)的头数, xi为第i个农场的面
23、积。已知农场平均面积为31.25英亩,选取一个样本容量为2055的简单随机样本。经计算得: 试估计每个农场平均养牛(yn ni)头数及标准差。763.10073375525.35717915.27410065.30,53.12xxxyyylllxy第37页/共42页第三十七页,共43页。解:355. 0 xxxyllb74.12)65.3025.31(355. 053.12)(xXbyylr187.0)()(035.0)(2111)(2lrlrxyyyelryvysbllnnfsnfyv标准差为第38页/共42页第三十八页,共43页。二、分层随机抽样下的回归估计 在大样本时, 1. 分别回归估计:若 各层的样本量比较大时,各层可分别进行回归估计,再进行加权平均,所得(su d)估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026西安西开精密铸造有限责任公司招聘2人考试备考题库及答案解析
- 2026锦泰财产保险股份有限公司四川分公司招聘罗江支公司经理等岗位5人笔试备考题库及答案解析
- 2026年重庆工程学院单招职业适应性测试题库附答案详细解析
- 2026上半年北京门头沟区事业单位招聘45人笔试备考题库及答案解析
- 2026中国移动万源分公司招聘27人考试备考题库及答案解析
- 2026广西北海银滩开发投资股份有限公司招聘1人笔试备考题库及答案解析
- 2026届湖南长沙明德旗舰第二学期期末初三联考语文试题含解析
- 2025-2026学年陕西省西安市陕西师大附中初三下期中考试(英语试题文)含解析
- 2026届湖南省长沙市雅实校初三下期第一次月英语试题含解析
- 竞争环境下企业发展策略
- DB46∕T 626-2024 黎家宴服务规范
- 吉林省长春市2025年中考真题语文试卷(含答案)
- 51testing:2024年软件测试行业现状调查报告
- 工业机器人维护和保养课件
- 灌排渠道设计规范
- 医院放射科竞聘演讲
- 三年级数学下册口算练习题(每日一练共12份)
- 心脑血管病防治知识讲座
- 2025至2030中国有机芝麻行业产业运行态势及投资规划深度研究报告
- 废品回收处置投标方案(3篇)
- 2025年辽宁中考英语试题及答案
评论
0/150
提交评论