




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
限额以下批发零售贸易业餐饮业抽样调查方法及相关问题TDO-0089-PTT1998Documentnumber限额以下批发零售贸易业餐饮业抽样调查方法及相关问题TDO-0089-PTT1998Documentnumber:PBGCG-08限额以下批发零售贸易业、餐饮业抽样调查方法及相关问题冯士雍关键词:商业调查;区域抽样;分层多阶PPS抽样;二相抽样;样本追加;估计批发零售贸易业与餐饮业是国内经济的重要组成部分。我国目前对这两个行业的统计调查采用全面调查与抽样调查相结合的方法,即对限额以上的经营单位采用报表制度,而对限额以下的单位(包括个体经营单位)采用抽样调查。限额以下批发零售贸易业、餐饮业抽样调查的目的是运用抽样调查方法,系统地调查和整理限额以下批发零售贸易业、餐饮业有关资料,为进行市场管理和宏观调控以及国民经济核算提供准确、可靠的统计数据。笔者受国家统计局贸易外经司的委托,着手对此项抽样调查方案进行了修订,准备2002年起在部分省、直辖市与自治区中试行。本文主要介绍此项抽样调查的主要特点、选用的抽样及估计方法及其相关的其它问题,但不详细涉及方案中的具体技术细节(例如总体目标量的估计,包括方差估计公式),这些将另文介绍。商业抽样调查的特点为表达简单起见,以下将批发零售业与餐饮业调查简称为商业调查。商业调查的主要内容是贸易业商品销售额及餐饮营业收入和商品零售额(核心指标),以及其他相关指标。商业调查有以下几个特点:总体在不断变化,缺乏完善的名录框商业调查中,基本抽样单元是商场、商店、摊位等经营单位。经营单位(或商业网点)散布面广、数量多,而且由于市场客观变化的原因或经营单位(个人)主观的原因,变化很快。具体表现在随时会有新生的经营单位,又有原经营单位因改行或停业等原因而消亡。因此商业抽样调查的目标总体是在不断变化之中的。这种不断变化的总体给抽样调查带来两个方面的困难。首先不易获得有关抽样单元(经营单位)完善而适用的名录框。当然从理论或法律上说,一个商业单位(无论是国营、集体还是个体经营,也不管其规模大小)必须在当地工商局进行登记,但是在许多情形,这种登记并不能完全反映实际情况。主要是这种登记的时间有滞后,特别是许多已转行或停业的单位不能及时或根本不到工商局注销。许多地方,根据工商局登记的经营单位名录进行抽样,会有高达20%以上的单位由于种种原因而“找不到”,这就导致严重的无回答。另一方面,那些新生的,没列在名录上的单位又不可能被抽到,因此这类名录框的涵盖误差相当大。变化中的总体对抽样调查的另一个影响是总体大小,即经营单位的总数不确定,而商业调查需要估计的核心指标,正是诸如零售总额之类的总体总量。总体大小不确定必然导致对总体总量的高估或低估。因此,商业调查必须将地理或行政区域作为抽样框采用区域抽样方法,为解决总体大小未知的问题,则应采用二相抽样。经营单位规模差别显着,分布不均匀与工业企业类似,不同商业经营单位的规模差别极为显着:极少数特大型或大型商业单位占据较大份额的销售量,而数量众多的小型单位却仅占销售总额的一小部分。尽管在制度上已考虑到这一特点:采用对限额以上的大型单位进行普查(定期报表),而对限额以下的中小型单位进行抽样调查的统计方法,但是上述规模差别显着的特点在需要进行抽样调查的总体中依然存在,仍然是在制定抽样方案时必须考虑的一个因素。这决定了我们不能简单地采用简单随机抽样或系统抽样的简单估计,用样本平均数来估计总体平均数,而应该充分利用合适的辅助信息采用比估计(或回归估计)或用不等概率抽样,例如与单位的大小(规模)成比例的抽样,即PPS抽样。这样才能提高效率,保证精度。商业单位在地理上的分布也有它的特点:它有明显的“扎堆”效应,不仅城乡之间有明显的差别,就是在城市与农村的不同地域,分布也是极不均匀的。因此商业调查在地域上必须进行仔细的分层。调查指标比较敏感,计量误差大商业调查的主要指标是以零售额为核心的经济指标,对被调查的经营单位而言这些指标都比较敏感,许多经营者都不太情愿将其如实披露。这使得调查的实际操作会很困难,不仅拒访率较高,就是接受调查的话,所得的原始记录的可靠程度也较差,因此这类调查的计量误差较大。由于计量误差大,因此商业抽样调查没有必要抽取很大的样本以求过分降低抽样误差,而必须在调查表设计以及调查的技巧方面下功夫,尽量降低包括计量误差在内的非抽样误差。需要满足多层次的推断我国各级政府都要管经济,各级行政长官对本地经济发展情况特别关注,尤其是对工、商业等与国内生产总值有关的指标更为关心。因此各级政府需要掌握包括商业统计在内的统计数据,这是我国的国情。既然抽样调查可以用来获得所需要的统计数据,因此很自然的要求抽样调查不只是满足总体这个层次的估计,而且也希望满足多个层次估计的需要。从抽样理论上,解决这个问题可以简单地将所有需要估计的子总体都作为层来处理,但这在实际操作上,从人力与财力的负担上,又是不可行的,而且也与抽样调查的初衷相违背。但是在一定程度上解决这个中国的特殊问题,还是有必要而且也是可能的,我们在制定商业抽样调查方案中采用了最近研究的样本追加策略,部分地解决了这个问题。二、抽样调查方案针对前述的商业调查的特点及思路,我们对现有的限额以下批发零售贸易业、餐饮业抽样调查方案作了较大的修订,现将修订后的方案的要点介绍如下。总体划分与抽样方案类型方案以省(直辖市、自治区)为总体,以从事批发零售业和餐饮业的企业单位与个体户的经营单位为基本抽样单元。总体中所有经营单位分成批发零售业和餐饮业两个研究域。抽样方案为分域分层四阶抽样,各阶抽样单元为:第一阶抽样单元:区、县(包括县级市);第二阶抽样单元:市场、街道、乡、镇;第三阶抽样单元:市场内为经营单位(摊位);市场外为居委会与村委会;第四阶抽样单元:市场外的经营单位。为提高抽样精度,每阶抽样中的抽样单元都需按地域或类别进行仔细分层。每阶抽样中对相对较大的经营单位,若有必要都应设立全数调查层,即对这些经营单位进行全数调查,不进行抽样。根据省的具体情况和为满足部分地市的需要,对第一阶抽样,即对区、县的抽样提供了两种抽样方案。第一种称为基本方案,所抽取的样本对省有代表性,可提供省目标量的估计;第二种称追加方案,是在基本方案抽取的样本的基础上,通过区县样本的追加,达到在提供省目标量估计的同时,提供这些地市目标量估计的目的。2)对区县抽样作为初级(一级)抽样单元,区、县抽样是最重要的。与许多抽样方案一样,为提高精度,必须对全省的所有区、县进行非常仔细的分层。我们将省内区(地级市以上城市的市辖区)与县(包括县级市)分成以下六类:一类区、二类区、县级市、一类县、二类县、三类县。其中区的划分标准为区中非农业人口占总人口的比例:比例高于某个水平的为一类区,比例低于这个水平的为二类区。该水平对西部地区省份定为70%,对其他省份定为80%。县类别划分的标准,是以人均GDP的水平分:高于一定水平的为一类县,低于一定水平的为三类县,中间的为二类县。不同省可以有不同的标准。以下是我们所建议的参考标准:东部省份(包括辽宁、山东、江苏、浙江、福建、广东):人均GDP在6000元以上的为一类县;6000元以下,4000元以上的为二类县;4000元以下的为三类县;中部省份(包括黑龙江、吉林、河北、河南、山西、安徽、江西、湖北、湖南、广西、海南):人均GDP在5000元以上的为一类县;5000元以下,3000元以上的为二类县;3000元以下的为三类县;西部省份(包括内蒙古、陕西、宁夏、甘肃、青海、新疆、四川、云南、贵州):人均GDP在3500元以上的为一类县;3500元以下,2000元以上的为二类县;2000元以下的为三类县。对于北京、天津、上海、重庆四个直辖市及宁夏、海南等较小的省(自治区)以及西藏自治区可根据各自情况对区县进行分层。例如京、津、沪三个直辖市分为市区、郊区及郊县三层,或市区、近郊区、远郊区及郊县四层。为使抽样方案同时满足省级与一部分地市级估计的需要,对每个层内区县的抽样采用两种方案,即满足省级估计需要的基本方案及满足地市级估计需要的追加方案。基本方案采用分层随机抽样,即每层按简单随机抽样抽取2〜6个区县。全省样本区县总数控制在10〜30个左右;追加方案适用于省内有部分地市也需要估计的情况。在针对全省的基本方案的样本区县抽取完成后,对于这些地市,应进行区县样本追加。追加方法仍采用分层抽样。由于一个地市中区县数量较少,且同质性较高,因此层数一般小于6,对于层内区县总数小于等于2的层,每个区(县)不管在基本方案中是否已被抽中,一律作为样本区县;当层内区县总数大于2时,若该层中在基本方案中的被抽中的样本区县数不足2个,则在未被抽中的区县中仍按简单随机抽样抽取区县,使该层样本区县数达到2。补充的样本称为追加样本。为估计地市目标量的样本由省级样本中落在该地市的区县及追加样本区县组成,在估计时这两部分样本并不是等同对待,而是有区别的。需要特别指出的是,若对每个地市都需进行估计,则应采用以地市为层的分层抽样。3)样本区县内的抽样方法每个样本区县内的抽样方法是先将样本区、县内所有经营单位按经营场所分成市场内与市场外两层,然后再按类别分层。所有位于市场内的经营单位以市场为二阶抽样单元。对于批发零售业,经营单位又分综合市场与专业市场两类,餐饮业特别集中的(例如餐饮一条街)也作为市场对待;而所有位于市场外的经营单位则以所在地域的街道、乡、镇为二阶抽样单元。其中本区县商业特别集中的街道、乡、镇(例如市辖区内商业特别集中的街道及县城所在的城关镇等)应作为自我代表层处理。其余的按街道、乡、镇的类别(一般情况下不一定三种都有)分层。对市场的抽样按以上年成交额为辅助变量进行分层PPS抽样。通常一个区县内样本市场抽取的个数约为5〜6个,若区县内市场总数低于此数者,即可全数调查。每个市场内各种类别摊位抽取数定为2〜4个。对每个被抽到的市场,市场内按经营单位(摊位)的类别进行分层系统抽样。在每个街道、乡、镇层内,均采用按人口PPS系统抽样方法抽取样本街道、乡、镇,每层中抽取2个街道、乡、镇。(若层内的街道、乡、镇总数小于或等于2时,则不进行抽样,所有街道、乡、镇都必须调查)。每个样本街道、乡、镇内的抽样方法也采用分层抽样。居委会按繁华地区及非繁华地区分为两小层(标准根据各省具体情况另定);村委会则以是否为乡镇以上政府所在地分为两小层。在每个居委会或村委会层内均采用按人口PPS系统抽样方法抽取样本居委会或村委会,每层抽取2个居(村)委会。为解决总体经营单位不断变化,总数难于确定的问题,对每个样本居(村)委会,采用二相调查。第一相调查采用整群抽样,调查内容主要是清点该居(村)委会中经营单位的总数,并对其按规模及经营类别进行必要的分层。第二相调查是对经营单位的实际调查。如果居(村)委会中经营单位总数MW10,则对所有经营单位进行调查;否则,在这些经营单位中按分层随机或分层系统抽样抽取m=10〜15个经营单位进行第二相调查。在对经营单位分层的情形,层内样本按经营单位数的比例分配,每层样本量至少为2。4) 目标量估计及其方差估计思路与方法抽样方案给出了基于基本方案的总体(省)目标量的估计以及基于追加方案对特定地市目标量的估计。两种情形中,由于样本区县内的抽样方法完全相同,因此相应的估计方法也完全相同。这里我们将不涉及具体计算公式,仅将估计的思想与要点作介绍。根据商业调查项目的特点,估计的主要目标量均为总量的形式。另外由于我们在每阶抽样中都作了仔细的分层,其中也包括全数调查层或自我代表层,由于这些层的有关指标只是直接相加,而且全数调查层不产生抽样误差,故只需讨论所有抽样调查层的估计即可。首先讨论样本区县总量的估计。区县总量由市场外总量与市场内总量两部分构成。市场内总量估计比较简单,这里只讨论市场外总量的估计。这需要从样本居(村)委会总量估计计算起,这里又分两种情况:一种是样本居(村)委会经营单位总数不超过10个,不需进行抽样的,总量即是对所有经营单位指标相加;而对经营单位总数超过10个需要整群清点的情况,则根据分层样本平均数结合清点的各类单位总数即可估计所在居(村)委会的总量。由于居(村)委会是按人口为辅助变量的PPS抽样抽得的,故样本街道、乡、镇总量需根据霍维茨-汤普森公式计算估计量。当然上述所有计算都是根据分层计算的。获得每个样本区县的总量估计以后,即可进一步对全省的总量进行估计。根据基本方案,由于区县抽样是按分层随机抽样抽取的,其中分层变量是区县的类别。为使估计更为精确而有效率,我们利用区县上一年的社会消费零售总额作为辅助变量,采用分层联合比估计。这里所以采用联合比估计而不采用分别比估计是因为层内区县样本量都比较小的缘故。根据追加方案,我们采用的是分层条件追加,这种追加方法所需追加样本(区县)数较少,但相应的估计方法比较复杂。主要是需计算每个样本区县的入样概率(或称包含概率),计算过程虽然比较复杂,但是可以求得,在此基础上我们已经获得对经过样本追加的地市总量的具体估计公式。上述所有总量估计的方差估计也可获得,本文就不介绍了。三、其它相关问题1)调查周期本项调查目前规定的调查频率为一年两次,调查月份一般为5月和11月,每次调查时间一周,即连续7天。用这一周的调查数据推算调查月的有关指标。然而我们的目标应该是全年、季度甚至月度的统计。为此目前通常做法是根据历史或经验数据计算每个月份对于调查月指标的相对变化,亦称波动系数,这样以调查月为基准,可得出每个月、每个季度以至全年的指标值。显然这种推算方法不大可靠。另一方面,由于每月进行一次同样规模的抽样调查在经济与人力上既不可行又没必要,因此笔者建议采用分大小样本月的月度调查方法,即在固定月份(如5月与11月)执行方案规定的样本量较大的调查,称为大样本月调查,而在其余月份执行样本量较小的调查,称为小样本月调查。为了提高效率,小样本月中的样本既不是与大样本月独立地从总体中抽出,也不完全是大样本月中的一个子样本,最佳方式是由大样本月中的一个小的子样本再加上从总体中除大样本月之外部分抽取的一个独立小样本组合而成。这样,小样本月的样本由两个部分组成:从大样本月样本中抽取的小的子样本称为拼配样本,其余部分称为非拼配样本。将这两部分样本结合起来,并根据大小样本月的所有调查数据,可以进行小样本月的指标估计。这种估计要比仅用小样本月调查结果进行估计更为精确,效率较高。2)样本量正如在第一节中所述的,由于商业调查的非抽样误差,特别是计量误差比较大,因此,就商业调查而言,非抽样误差非常重要,过多地为降低抽样误差而增加样本量没有太大的必要。对于定期调查的抽样误差要求,按现定标准,即95%置信水平下,核心指标的相对误差限为15%,是一个可接受的标准。在确定具体样本量时,主要关键在于对方案的设计效应(deff)的估计,由于新方案尚未执行,设计效应的数值不好估计,但在初阶段,可按2〜4估计(与具体的分层及样本在各阶抽样中的分配有关)。在获得按新方案执行的调查数据后,可根据实际计算的方差估计对设计效应进行估计,最后调整所需要的样本量。3)调查表调查表设计是获得精确原始数据的关键之一,有些调查指标由于较为敏感,因此既要讲究询问方式,同时又要对这类数据进行检验。为此应该增加少量与核心指标相关,但不太敏感的指标,用作数据收集以后对核心指标的审核和离群值的检测,对经审核发现问题的项目,即审核失效,应进行插补。这方面有大量工作需要做。4)建立统计信息系统批发零售贸易业、餐饮业抽样调查作为国家规定的定期抽样调查的一项重要内容,从总体资料的积累、样本抽取、数据的录入与处理(包括编码、审核、插补和离群值的检测与处理等)、估计及汇总表的产生等等,工作量都比较大,因此建议将上述过程进行程序化,开发相应的计算机系统,即统计信息系统,这对促进此项统计调查的是十分有利的。参考文献[1]国家统计局,《国家统计调查制度》,2001.国家统计局贸易外经司,《中国贸易统计抽样调查实践》,中国统计出版社,1996.梁小筠,汪健兵《上海市小型商业企业抽样调查研究》,《统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中doing公开课课件
- 小区园林景观绿化工程施工方案
- 高一河流地貌课件
- 北京市八年级上学期期中考试英语试卷含参考答案 (5份)
- 离婚子女抚养费及全面生活支持协议范本
- 离婚协议书中子女抚养权变更争议诉讼协议范本集锦
- 留学语言学校申请咨询服务协议
- 成人职业素养培训咨询服务合同
- 家电维修管理制度规范
- 如何高效备考考研复试
- 走进焊接 课件 2.1百花齐放推陈出新-焊接方法
- (2025)中国汉字听写大赛全部试题库及答案
- 卵巢癌的课件
- 北京市律师协会律师办理法律尽职调查业务操作指引
- (2025年标准)会员销售协议书
- 2025至2030中国专业图片存档和通信系统(PACS)行业项目调研及市场前景预测评估报告
- 妇产科临床路径培训课件
- 编辑出版校对试题及答案
- 2025一级造价工程师《案例分析(土建、安装)》学霸笔记
- 化工仪表基础知识培训课件
- 2025人教版八年级英语上册课文原文及翻译
评论
0/150
提交评论