大数据在CPI统计中的应用研究_第1页
大数据在CPI统计中的应用研究_第2页
大数据在CPI统计中的应用研究_第3页
大数据在CPI统计中的应用研究_第4页
大数据在CPI统计中的应用研究_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,大数据在CPI统计中的应用 以1号店价格指数为例,2018/1/20,2,主要内容,城乡居民购买并用于日常生活消费的商品和服务项目的价格。 调查内容按用途划分为八大类、262个基本分类。 包括食品、烟酒、衣着、家庭设备用品及维修服务、医疗保健 和个人用品、交通和通信、娱乐教育文化用品及服务、居住。,2018/1/20,3,居民消费价格(CPI)统计简介,调查内容,分类固定国家规定代表品抽样地方自定,消费量较大的消费项目。 价格变动具有较强的代表性。 同基本分类下代表品异质性越大越好。 合格产品。注册商标、产地、规格等级等标识齐全。,2018/1/20,4,居民消费价格(CPI)统计简介,抽样原则,2014年,上海CPI代表品共抽选1300多种,调查方法:采用定人、定点、定时的方法直接采集代表品价格。 调查频率:与居民生活密切相关、价格变动频繁的商品,五天一次。 一般性商品(服务),每月2-3次。 政府统一定价或价格稳定的商品(服务),每月一次。 报告周期:月度,每月10日前公布上月数据。,2018/1/20,5,居民消费价格(CPI)统计简介,方法频率,2014年,上海每月采集价格笔数为35000多笔,权数测算:主要根据居民家庭消费支出资料,辅以典型调查。 权数五年固定不变。 计算方法:先计算代表品月度时点平均价格变动幅度,代表品之间 几何平均得出基本分类月度变动幅度,基本分类以上按 逐级拉氏加权平均得出各级分类月度变动幅度。,2018/1/20,6,居民消费价格(CPI)统计简介,计算方法,抽样代表性:代表品、网点抽选仍以重点、典型性为主。 抽多少,怎么抽? 权数变动性:五年固定,拉氏加权计算。 消费结构变动如何体现? 计算科学性:代表品之间几何平均计算。 相当与等权计算? 数据及时性:月度指数存在滞后性。 如何反映短期波动?,2018/1/20,7,居民消费价格(CPI)统计简介,疑惑和挑战,2018/1/20,8,大数据物价统计的应用现状及比较,应用现状,每日网上价格指数:美国麻省理工学院对全世界海量网上零售 价格进行价格指数计算,每天抓取70多个国家的50万条价格信息。 淘宝网价格指数:阿里巴巴公司基于淘宝网、天猫网、支付宝等 网络平台的数据,推出网络购物消费价格指数。 谷歌搜索数据CPI:国内学者通过谷歌搜索平台选取对CPI相关系数 高的几十个关键词,跟踪测算出搜索CPI指数。,2018/1/20,9,大数据物价统计的应用现状及比较,应用比较,统计方法比较,2018/1/20,10,大数据物价统计的应用现状及比较,应用比较,统计功能比较,2018/1/20,11,大数据物价统计的应用现状及比较,应用比较,不足比较,以现行CPI编制框架为基础,确保数据可比性和衔接性 充分利用大数据,改进现行CPI不足: 抽样代表性? 代表品抽选更有依据 权数变动性? 权数设置更为灵活 计算科学性? 计算方法更加多样 数据及时性? 指数周期更趋高频 ,2018/1/20,12,1号店价格指数编制方法及实例,编制思路,2018/1/20,13,1号店价格指数编制方法及实例,分类体系,方法: 以1号店现有的后台商品分类体系(三级分类目录)为基础 两大原则: 代表性 体现营运状况及线上销售特点 稳定性 不应频繁变动,确保指数延续性,实例:分类筛选过程: 第三级目录数量较大(1500多个)、稳定性不高 不符基本要求的分类,如集团消费、团购消费、购物卡、礼品等 消费未成气候的分类,如生鲜食品、服装、交通工具、珠宝饰品等 消费量大、有特色分类,如休闲速食食品、进口食品、母婴产品、 厨卫清洁 、家居用品等 研究初期,不宜纳入过大规模的分类目录,2018/1/20,14,1号店价格指数编制方法及实例,分类体系,实例:分类筛选结果:10个一级分类45个二级分类,2018/1/20,15,1号店价格指数编制方法及实例,分类体系,2018/1/20,16,1号店价格指数编制方法及实例,代表品选取,方法: 将各二级分类下所有在报告期有销售的商品按销售额大小排序 几种方案: 全部选取 可比性问题,带入奇异值 固定数量 排位前n个的选取为代表品 固定金额 累加销售额达到该类别总销售额固定比例的前n个 选取为代表品,实例: 使用固定金额的方法,比例定为七成。 优点:有足够的代表性 有足够的稳定性 留出一定数量作为备用 最终选取结果:各二级分类下的平均代表品数量在 100个左右, 食品、厨卫清洁等商品繁多的分类在200-300个。,2018/1/20,17,1号店价格指数编制方法及实例,代表品选取,2018/1/20,18,1号店价格指数编制方法及实例,权数设置,方法: 代表品权数:该商品在报告期或基期的销售额占同分类下 所有代表品销售额的比重 分类权数:该分类在报告期或基期的销售额占上级分类总 销售额的比重,2018/1/20,19,1号店价格指数编制方法及实例,计算过程,方法: 代表品平均价格 : ,t期均价=销售总额/销售量 代表品环比指数: ,t期指数=t期均价/t-1期均价,2018/1/20,20,1号店价格指数编制方法及实例,计算过程,方法: 基本分类环比指数 : 派氏指数,报告期权数 拉氏指数,基期权数 费雪指数,综合权数,2018/1/20,21,1号店价格指数编制方法及实例,计算过程,方法: 逐级分类环比指数: 派氏指数,报告期权数 拉氏指数,基期权数 费雪指数,综合权数,实例:,2018/1/20,22,1号店价格指数编制方法及实例,计算过程,代表品 环比 权数拖把 92.3 40百洁布 101.5 15扫帚 100.2 25脸盆 103.4 10浴帘 104.8 10,几何平均100.3,2018/1/20,23,1号店价格指数编制方法及实例,计算过程,方法: 链式法推算其他指数 定基指数t-1期定基指数 t期环比指数 同比指数t期定基指数 / t-x期定基指数, x为周期,2018/1/20,24,1号店价格指数编制方法及实例,数据筛选,方法: 指标筛选产品编码、分类编码、商品名、计量单位、规格信息 销售时间、销售价格、销售量 奇异剔除赠品价格、极低极高价格等,2018/1/20,25,1号店价格指数编制方法及实例,数据处理,方法: 主要是代表品缺失或变动时的价格延续性处理,一般需要寻找新代 表品继续进行价格跟踪,但新老代表品间的价格需要进行过渡处理。 现行CPI统计中常用方法:替代法、备用虚拟法 大数据物价统计方法:后备代表品更替法 其他方法:主要特征折算法、成本因素分解法、 Hedonic回归法等,实例:现行CPI备用虚拟法,2018/1/20,26,1号店价格指数编制方法及实例,数据处理,实例:1号店价格指数后备代表品更替法,2018/1/20,27,1号店价格指数编制方法及实例,数据处理,签署战略合作协议,数据保密协议。 统计局提供编制方法,1号店负责实际测算操作。 测算结果由统计局负责评估。 定期以1号店名义发布指数,统计局协助数据分析,宣传推广。,2018/1/20,28,数据比较评估,合作模式,利用1号店的销售数据测算8个月有关商品分类的环比价格指数。 分别使用拉氏指数、派氏指数、费雪指数方法测算出三套结果。 其中乳制品、饮料、厨房调料、大家电、奶粉系列等12类与现行 CPI口径一致,可进行比较。,2018/1/20,29,数据比较评估,测算情况,拉氏和派氏指数结果比较,2018/1/20,30,数据比较评估,指数比较,波动一致性很高,涨跌一致性不高,拉氏指数权数固定为基期,无法体现权数结构变化。 派氏指数使用报告期权数,结构变化较大时会影响指数平稳性。 费雪指数综合使用基期和报告期权数,充分汲取两者优势。,2018/1/20,31,数据比较评估,指数比较,拉氏、派氏、费雪指数与CPI差异度比较,2018/1/20,32,数据比较评估,指数评估,1号店分类指数与CPI的差异度较小,与CPI衔接性较强。 费雪指数优于拉氏、派氏指数。 样本量偏少,无法深入评估。,2018/1/20,33,数据比较评估,指数评估,长期数据测算,加入同比指数,更好的比较评估。 加快测算周期频率,加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论