版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 中国地质大学(武汉)经济管理学院 课 题:简单估计量和联合回归估计量精度的比较 专 业:统计学 班级序号:088111 学生姓名:黄佳 容莲子 刘青 指导老师:余国合老师 简单估计量和联合回归估计量精度的比较 摘 要 分层抽样技术在实际中应用非常广泛,有时分层抽样会与其他抽样方法如简单随机抽样等方法结合反复使用。当总体单位之间差异较大时,运用简单随机抽样进行估计往往会产生较大的误差。但如果对总体单位进行分类,从每个子总体中抽取少量样本单位,就能很好的代表子总体的特征,从而提高对整个总体估计的精度。本文使用抽样分层技术,简单估计量和联合回归估计,通过2001年世界碳强度的相关数据对2002年世
2、界碳强度做出估计。结果表明分层抽样中的联合回归估计对世界碳强度的估计精度较高。 关键词: 分层抽样 简单估计量 联合回归估计 The precision comparison between the simple estimator and the united regression estimator Abstract Stratified sampling method is widely applied in the actual. Sometimes ,compared with other sampling methods such as simple random sampling
3、 method can also be used. When there are big difference between each units of the population. Useing the simple random sampling to estimate tends to have large error. But if we want to classify the population,we need to extract a small amount of samples from each sub-population unit.Thus can master
4、the characteristics of the population. So we can improve the accuracy of the overall estimator. This article use the stratification sampling technology, simple estimator and the united regression estimator.We estimate the 2002 worlds carbon intensity by the 2001 world carbon intensity . The result s
5、hows that the united regression estimator of a stratified sampling can get good precision . Key Words:Stratified sampling;simple estimator;the united regression estimator 序 言 碳强度是指单位GDP的二氧化碳排放量。碳强度高低不表明效率高低。一般情况下,碳强度指标是随着技术进步和经济增长而下降的。计算公式=二氧化碳排放总量/GDP。碳排放强度取决于:1,化石能源的碳排放系数;2,化石能源的结构;3,化石能源在能源消费总量中的
6、比例;4,能源强度。碳排放需求主要与经济发展规模和发展水平直接相关,规模越大,水平越高,则需求越大,反之则低。但达到一定水平,碳排放需求则趋于平稳和不断下降。排放需求线即过去某一时点的排放总量。此为京都议定书目标模式,以1990年或附近某一年的排放总量作为排放需求的基准线。基于历史和当前排放而线性外推到某一时点或时段的排放总量。1997年,京都议定书规定,到2010年,所有发达国家的二氧化碳等种温室气体的排放量,要比1990年减少5.2%。第一承诺期是2008年到2012年。京都议定书下谈判主要解决减排目标,即确定京都议定书第2期,发达国家如何减排,发展中国家如何参与。至于中国代表团的具体分工
7、。中国、印度、南非等发展中国家坚持发达国家应到2020年在其1990年的基础上减排40%;而欧盟提出的中期减排方案是20%;日本在鸠山由纪夫上台后的最新立场为25%;美国在奥巴马上台后的最新立场约为4%。在研究2001年世界碳强度的情况下,本文将使用分层抽样方法对2002年世界碳强度进行预测并且评估抽样方法。本文以下安排的结构为:第一部分对抽样方法进行介绍;第二部分对世界碳强度的抽样进行实证研究;第三部分对两种方法进行比较得出结论。 一.抽样方法介绍 (一)样本容量的确定 表一 2002年世界各国碳强度数值0.060.420.661.162.750.100.420.661.193.060.13
8、0.430.671.213.090.140.430.671.243.290.150.440.671.263.520.150.440.681.263.730.170.450.681.283.790.180.460.691.283.920.190.460.691.373.990.210.460.711.424.080.220.460.721.444.310.240.480.741.484.380.240.490.741.504.880.240.490.751.566.390.250.500.771.566.420.250.510.791.606.610.260.510.811.616.920.26
9、0.520.811.618.480.270.530.811.698.670.280.530.831.72 10.140.300.530.841.78 11.990.310.540.851.880.320.540.881.910.340.550.891.920.340.560.901.940.350.560.911.940.350.570.911.950.360.580.942.070.360.590.962.250.360.590.972.250.360.590.972.260.380.610.982.350.380.610.982.380.390.610.992.440.390.621.02
10、2.520.390.621.032.520.400.631.032.540.410.631.072.540.410.641.082.620.420.661.102.74 图一 总体分布折线图 由图一的折线图可以看出,可将总体大致可以分为三层,第一层从185,第二层从86149,第三层从150181。 总体的方差为:S2=3.253778571,总体的均值E(Y)=1.4。经多次试验,我们取变异系数为CV(E(y)=0.2,然后利用公式:=3.253778571/(0.2)2*(1.4)2=41.50227769 接着我们再利用公式:=33.76105782 我们取n0=34,这样就确定了样本量
11、。 (二)各层样本量的分配分层抽样中,解决层样本容量的配置问题,既是实施分层抽样调查的前提,也是保证抽样精度和效率的关键因素。样本容量的分配可以看作是连续给一层减少同时给另一层增加一个样本单元使得层估计的样本和总体相应样本的方差减少的一种方法。在对层进行划分时,通常考虑使层内单位的标志值相近,层间单位差异尽可能大,达到提高抽样估计精度的目的。分层抽样中样本量的分配有比例分配、最优分配和尼曼分配三种。比例分配即按层的层权进行分配,即,该种方法可以体现公平原则;最优分配是指在总费用给定的条件下,使得估计量方差达到最小,或是在给定估计量方差的条件下,使总费用最小;尼曼分配时最优分配的特例,是每层抽样
12、费用都相同的情况下,得到的层样本量,公式为。尼曼分配适合层间变化较大的样本。 本题按比例分配对总的样本量进行分配,n1=(34/181)*85=15.96685083,我们取n1=16;n2=(34/181)*63=11.83425414,我们取n2=12,n3=(34/181)*31=5.82320442,我们取n3=6。这样每一层的样本量也确定了。 (三)样本的抽取 确定每层样本量之后,就使用产生随机数的方法进行抽取样本的过程。本文使用的方法是在SPSS中产生随机数来抽取各层的样本。 由上面确定总的样本数为34个。第一层样数是从1-85个数之间随机第三层样本数是在150-181个数之间随机
13、抽取6个。我们用SPSS完成样本的选取,具体步骤如下: (1)首先点“数据”里面的“选择个案”,出来窗口如下: (2)再点“随机个案样本”,出来窗口如下: 由于第一层是在1-85个数之间抽取16个数,所以上面选择“精确”按钮,第二层和第三层的样本的选取同第一层样本的选取一样的步骤。这样我们就完成了样本的抽取。 二.抽样方法的实证 (一)简单估计量 步骤: (1)计算出所抽样本的每层的层权Wh,如下: W1=16/34=0.470588235 W2=12/34=0.352941176 W3=6/34=0.176470588 (2)计算每层样本的均值E(yh) ,结果如下: 0.06 第一层均值:
14、0.3418750.150.190.210.220.240.280.30.360.360.380.430.530.560.590.610.69 第二层均值:1.30250.710.810.881.031.071.261.441.611.941.942.252.52 第三层均值:3.9116666672.622.754.314.886.39 由上表可知: E(y1)=0.341875 E( y2)=1.3025 E(y3)=3.911666667 (3)利用简单估计量的公式计算出总体均值的估计,如下: =1.310882353 (4)计算估计量的精度,如下: 样本离差离差平方和1-0.28187
15、50.0794535162-0.1918750.0368160163-0.1518750.0230660164-0.1318750.0173910165-0.1218750.0148535166-0.1018750.0103785167-0.0618750.0038285168-0.0418750.00175351690.0181250.000328516100.0181250.000328516110.0381250.001453516120.0881250.007766016130.1881250.035391016140.2181250.047578516150.2481250.0615
16、66016160.2681250.07189101617-0.61250.3751562518-0.59250.3510562519-0.49250.2425562520-0.42250.1785062521-0.27250.0742562522-0.23250.0540562523-0.04250.00180625240.13750.01890625250.30750.09455625260.63750.40640625270.63750.40640625280.94750.8977562529-1.39166671.93673620430-1.29166671.66840286431-1.
17、16166671.349469522320.39833330.158669418330.96833330.93766938342.47833336.142135946 将上面表格中的数值汇总得:第一层离差平和0.41384375第一层方差0.025865234第二层离差平和3.101425第二层方差0.258452083第三层离差平和12.19308333第三层方差2.032180556 综上可以得到: = =0.101208565 所以用简单估计得到的精度为:=0.318132936 (二)联合回归估计 (1)调查变量y与辅助变量x的样本分层表:样本x样本y 第一层 第二层第三层 第一层 第
18、二层 第三层0.060.712.720.060.692.520.160.791.840.150.712.620.190.892.840.190.812.750.210.864.310.210.884.310.231.064.880.221.034.880.221.076.390.241.076.390.271.250.281.260.291.440.31.440.371.640.361.610.321.830.361.940.411.920.381.940.422.190.432.250.520.530.620.560.610.590.590.61 根据上表并由和可以得到:样本()样本量()抽
19、样比()层权()均值()均值()第一层160.1882352940.470588235 0.3431250.341875第二层120.18750.352941176 1.3041666671.3025第三层60.1875 0.176470588 3.833.9116667 (2)求辅助变量样本x的第一、二、三层的离差和离差平方得:第一层第二层x的离差x的离差平方x的离差x的离差平方-0.2831250.080159766 -0.5941666670.353034028-0.1831250.033534766 -0.5141666670.264367361-0.1531250.023447266
20、 -0.4141666670.171534028-0.1331250.017722266 -0.4441666670.197284028-0.1131250.012797266 -0.2441666670.059617361-0.1231250.015159766 -0.2341666670.054834028-0.0731250.005347266 -0.0541666670.002934028-0.0531250.002822266 0.1358333330.0184506940.0268750.000722266 0.3358333330.112784028-0.0231250.0005
21、34766 0.5258333330.2765006940.0668750.004472266 0.6158333330.3792506940.0768750.005909766 0.8858333330.7847006940.1768750.0312847660.2768750.0766597660.2668750.0712222660.2468750.060947266第三层x的离差x的离差平方-1.111.2321-1.993.9601-0.990.9801 0.480.2304 1.051.1025 2.566.5536 并由上表可以得到:样本x离差平方和方差()第一层0.442743
22、750.027671484第二层2.6752916670.222940972第三层14.05882.343133333 (3)求调查变量样本y的第一、二、三层的离差和离差平方可得:第一层第二层y的离差y的离差平方y的离差y的离差平方-0.2818750.079453516-0.61250.37515625-0.1918750.036816016-0.59250.35105625-0.1518750.023066016-0.49250.24255625-0.1318750.017391016-0.42250.17850625-0.1218750.014853516-0.27250.0742562
23、5-0.1018750.010378516-0.23250.05405625-0.0618750.003828516-0.04250.00180625-0.0418750.001753516 0.13750.01890625 0.0181250.000328516 0.30750.09455625 0.0181250.000328516 0.63750.40640625 0.0381250.001453516 0.63750.40640625 0.0881250.007766016 0.94750.89775625 0.1881250.035391016 0.2181250.047578516
24、 0.2481250.061566016 0.2681250.071891016第三层y的离差y的离差平方-1.39166671.936736204-1.29166671.668402864-1.16166671.349469522 0.39833330.158669418 0.96833330.93766938 2.47833336.142135946 并由上表可以得到:样本y离差平方和方差()第一层0.413843750.025865234第二层3.1014250.258452083第三层12.193083332.032180556 (4)求调查变量样本y和辅助变量样本x第一、二、三层的对
25、应离差积可以得到:x与y的对应离差积 第一层第二层第三层0.0798058590.3639270841.5447500370.0351371090.304643752.5704167330.0232558590.2039770831.1500500330.0175558590.1876604170.1911999840.0137871090.0665354171.0167499650.0125433590.054443756.3445332480.0045246090.0023020830.0022246090.0186770830.0004871090.10326875-0.00041914
26、10.335218750.0025496090.392593750.0067746090.8393270830.0332746090.0603933590.0662183590.066193359 并由上表可以得到:样本x与y离差积之和协方差()第一层0.424306250.026519141第二层2.8725750.23938125第三层12.81772.136283333 综上可以得到:=0.938157279;=0.000414913 所以用联合回归估计得到的抽样标准误为:=0.020369425 四.结论 通过对两种方法的比较,其简单估计量分配抽样的精度为0.318132936,联合回归估计量的精度为0.020369425。直观可以看出该题用联合回归估计方法更好。就该题而言首先我们对数据进行排序,使得相近的数据为一组得以满足层内单位具有相同性质
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年短视频达人肖像合同协议
- 2025关于企业租赁车辆合同范本
- 2025年短视频创作者坑位收益合同协议
- 2025年工业管道保温施工行业发展趋势与节能潜力报告
- 2025年京津冀低空经济「交通圈」航空产业国际合作与交流报告
- 2025年共享办公保险保障范围深度评估报告
- 2025关于花卉的购销合同
- 2025年低空经济监管沙盒制度下无人机产业可持续发展报告
- 2025年少儿主持口才培训行业细分市场与教学质量评估路径报告
- 2025年无人机电力巡检与输电线路检测研究报告
- GB/T 2504-1989船用铸钢法兰(四进位)
- GB/T 18916.1-2021取水定额第1部分:火力发电
- GB 17568-2008γ辐照装置设计建造和使用规范
- 妊娠与肾脏疾病-陶冶主任课件
- 新形态一体化教材建设的探索与实践课件
- 2022年石家庄交通投资发展集团有限责任公司招聘笔试试题及答案解析
- 四川大学经济学院党政办公室工作人员招考聘用2人【共500题附答案解析】模拟检测试卷
- 《园林花卉学》课后题及答案
- 全国连片特困地区分县名单
- GB∕T 25997-2020 绝热用聚异氰脲酸酯制品
- 《工程量确认单》word版
评论
0/150
提交评论