




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据要素定价研究的影响因素与原则综述目录TOC\o"1-2"\h\u3863数据要素定价研究的影响因素与原则综述 118270(一)基于场景的数据要素定价的对象 113973(二)数据产品定价的影响因素 27350(三)数据要素定价的主要原则 4(一)基于场景的数据要素定价的对象数据并非都是生产要素,要发挥数据作为生产要素在资源配置中的作用,应该区分哪种形式的数据可以作为生产要素。一般而言,数据是指任何以电子或者其他方式对信息的记录。数据是具有外在表现形式和内在价值的符号介质。外在表现形式上,数据以二进制形式被存储在计算机等存储介质中,这体现数据的物理属性;又通过图像、声音等一定格式被人类感知,体现出数据的存在属性英国DAMA工作组(2016):《DAMA数据管理知识体系指南》,CSDN,。内在价值体现上,数据反应一定事实、具有一定意义国家工业信息安全发展研究中心:《2020-2021年中国数据要素市场发展报告》,https://,是信息的形式化体现,表现出数据的信息属性。结合数据的三个属性,经过加工的数据主要体现为电子书和在线音乐等数字产品,以及数据集和数据报告等数据产品(Pei,英国DAMA工作组(2016):《DAMA数据管理知识体系指南》,CSDN,国家工业信息安全发展研究中心:《2020-2021年中国数据要素市场发展报告》,https://数据要素参与到社会生产经营活动并带来经济效益,具有劳动对象和生产要素的双重属性。一方面,数据作为劳动对象,通过采集、加工、存储、流通、分析环节,具备了价值和使用价值。也就是说,数据要素是价值化和商品化的数据,除了用于交易,也可以在非交易场景下有价值体现,带来经济效益。比如,数据作为企业内部生产要素帮助提升最终产品或服务的性能或生产效率(Mülleretal,2018),数据要素加工后形成数据产品直接进行交易,能够给数据提供方、数据需求方和数据经纪人带来收益和效用(Meierhofer,2019)。另一方面,数据作为生产要素,与人才、资金、技术等传统生产要素融合联动,提升资源配置效率,实现全要素数字化转型。数据要素定价主要指的是对数据资源通过加工形成的、用于交易的数据产品和服务进行定价。数据产品指经过抓取、重新格式化、清洗、加密和其他处理后的数据产品和服务,如数据集和由数据集衍生的信息服务(Yuetal,2017;Pei,2020)。在数据要素市场中,根据加工精细程度和传输技术手段的不同,目前数据产品和服务主要包括数据包、数据API、数据报告和数据应用产品。其中,数据包是指采取网络爬虫、众包等合法手段对数据进行采集后,再进行打包出售的源数据或标准化、结构化数据集。数据API指利用API接口技术,通过程序对元数据进行隔离,根据用户提交的购买请求,由程序从元数据中抽取、调用数据反馈给用户。数据报告是对数据进行清洗、分析、建模、可视化等操作后形成的处理结果。另外,针对具体应用场景,服务商有目的地搜集和整理数据,提供数据产品和服务。本文从生产要素的角度讨论数据要素定价,主要是基于应用场景和交易场景,综述国内关于数据产品和服务定价机制的文献。(二)数据产品定价的影响因素任何产品的价格都受成本、价值和供求关系的影响,数据产品也不例外。数据产品具有很高的固定成本和几乎为零的边际成本(Shapiro&Varian,1998)。一方面,从原始数据到产生数据产品,经历了数据生成、数据采集、数据分析和数据交换四个环节(Faroukhietal,2020),各环节都消耗了大量人力和物力。例如,庞大的数据量和不同应用场景对数据清晰程度的要求差异使修复所有检测到的脏数据的计算成本过高(Chenetal,2015)。另一方面,如果数据是作为经济活动的副产品产生的,其边际成本非常低(Farboodietal,2019);而且数据产品具有可复制性和非竞争性,可复制性指买方可以很容易地生成原始数据的新副本,并以较低的价格转售(Adleretal,2016);非竞争性指多个主体同时使用相同的数据时,并不会减少其他人可用的数据量,这容易产生数据盗版问题(Jones&Tonetti,2019)。所以,价格等于边际成本的成本定价法会使数据产品成为低价商品,数据生产者前期的高额投资无法收回。然而,成本可以作为数据产品价格区间的下限(Adleretal,2016)。数据产品的价值主要受数据质量和数据量的影响(Heckmanetal,2015)。数据质量的影响指标主要包括完整性、独特性、时效性、准确性和一致性(Immonen,2015)。完整性是指数据要尽可能涵盖被记录对象的所有相关指标,包括数据体量大、数据属性多样、数据采集时间连贯、数据关系完备等(Pérez-Ponsetal,2019)。独特性衡量是否存在重复数据,若数据重复性较高,会导致后续分析结果失真。时效性决定了决策在特定时间内是否有效,包括原始数据的时效性、数据应用的时效性和数据的期权价值。准确性表示数据被记录的精准程度,即数据规范无差错,是数据质量的核心(Sukumaretal,2015)。一致性指数据集内部或者数据集之间的格式和内容等方面的一致性,以上五个指标与数据价值成正比。此外,各指标之间的复杂互动会影响数据质量,进而影响数据价值(Yuetal,2017),例如,一个特定数据集的及时性的提高可能会以牺牲其完整性为代价。因此,数据提供者会产生额外的成本,以提高及时性,同时保持完整性(Heckmanetal,2015)。一般情况下,数据量越大越有利于数据整合,而整合数据的价值大于整合之前各部分数据的价值之和(Goodhueetal,1992)。更准确地说,影响数据要素价值的是数据集包含的信息量(Maoetal,2019),判断数据集包含的信息量大小的常用工具是信息熵(Lietal,2017)。但是,Moody&Walsh(1999)提出,一旦信息量超过某个最佳点,决策绩效就会下降,Bajarietal(2019)利用从亚马逊获得的零售销售数据,用实证方法证实了这个结论。Kameletal(1997)则认为,价值和信息量之间有高度的非线性关系,在某些情况下,第一比特信息的价值可能是下一个比特的几千倍,然后信息价值可能成为常数,甚至缓慢下降。数据产品和服务的层次和协调性影响价值。影响买家购买数据意愿的数据层次,体现在技术含量、稀缺性、数据维度等方面。数据产品和服务的技术含量越高,其价值也越高(Yuetal,2012);而稀缺性表示数据资产拥有者对数据的独占程度,如果某类数据仅由一个机构掌握,其所蕴含的商业信息价值很高;数据维度越多,适用的范围也越广,应用价值就越高。数据要素具有协调性或协同性,不同类型的数据组合在一起会提高价值,不同数据集或数据产品的组合会产生不同的增量价值(Zhengetal,2017),这使得数据产品无法向普通产品一样事前确定统一价格,而且可能会产生套利风险。数据要素具有公共产品和准公共品属性。作为准公共品的数据要素,具有一定的非竞争性或非排他性,数据要素在绝大多数情况下具有完全的非竞争性,可以重复使用,但其非排他性则存在不确定性。Yan&Haksar(2019)提出,掌握大规模数据量或高信息含量的数据时,数据拥有者倾向于囤积数据,而不是分享,此时数据要素具有高度排他性。数据要素的排他性会影响其交易和定价,比如,数据拥有者可以建立数据库,向第三方机构出售数据使用权,利用排他性获得收入(Varian,2018)。数据要素具有非常复杂的外部性,整个数字经济的主导商业模式就是基于外部性基础上的交叉补贴定价,因此很多数字产品和服务本身都是免费的(Lietal,2017),这使得作为其背后生产要素的数据估值非常困难。商品的价格由价值来决定,供求关系影响商品的价格,均衡价格是供求曲线的交叉点。考虑数据市场的信息不对称和竞争性,用供求模型来决定数据产品的价格可以满足公平原则,并提供最优分配(Nguyenetal,2016)。从需求方来看,影响数据价值的因素主要有数据性质、潜在和实际效用,以及数据所有者的分享意愿(Bergemann&Bonatti,2019);从供应方来看,包括数据质量以及数据由谁生产和收集(Belleflamme,2018)。数据要素的异质性显著,包括数据结构异质性(Koutrisetal,2013)、数据搜集主体不同、价值高度依赖使用场景(Short&Todd,2017)、市场分割导致的异质性价值,以及买方异质性(Bergemannetal,2018)等,很难有一套统一的定价公式。(三)数据要素定价的主要原则数据定价的基本原则是选择定价方法和模型的重要依据,主要包括真实性、收入最大化、避免套利、公平性、保护隐私和计算效率等原则。真实性指的是买家都是利己的,并且只愿意支付使买家的真实效用价值最大化的价格(Pei,2020)。真实性原则在拍卖机制中得到体现(Agarwaletal,2019),Jiaoetal(2018)提出了一个数据服务提供商和数据消费者之间基于拍卖的数据交易模型,该模型采用贝叶斯利润最大化机制,满足了真实性、收入最大化和计算效率原则。另外,反向拍卖机制也体现了真实性原则。在一个真实的反向拍卖中,提交真实估值是任意卖家最大化预期收益的最佳选择(Yangetal,2012)。收入最大化和成本最小化是优化定价模型的两个主要目标。收入最大化在数据定价中被广泛考虑,比如,在拍卖模型中,卖方以收入最大化为原则确定拍卖的数量(Goldbergetal,2001),查询定价追求无套利和收入最大化目标,据此建立定价算法(Koutrisetal,2012)。对普通商品来说,利润最大化的条件是边际成本等于边际收益,在竞争市场上,往往通过低价策略来获取竞争优势。但是数据产品的收入最大化条件与普通商品不同,主要受以下特征的影响(Maoetal,2019):一是数据的可复制性和边际成本几乎为零,很容易被低价转售;二是数据集的价值取决于提供的信息量,不一定受数据量影响;三是数据的外部性,即数据包含的信息可能因为数据价格的公布而泄露;四是数据有时效性,一些应用场景要求在数据实际产生之前确定数据的价格;五是买方异质性和信息不对称。价格歧视策略(版本控制)被认为是实现数据市场上卖方收入最大化的定价策略(Bergemannetal,2018;Lietal,2019)。数据产品市场可以提供比普通产品更丰富的产品版本,因为数据产品的买家重视不同的维度,并且关注数据在特定场景下的应用(Bergemann&Bonatti,2019)。避免套利主要指参与者无法通过不同市场的价格差异获利。无套利性是查询定价的核心原则(Li&Miklau,2021)。查询定价的无套利性可以被分解为无信息套利和无捆绑套利,无信息套利指如果数据集Q1的范围包含在数据集Q2的范围内,Q2的价格应该不低于Q1;无捆绑套利指消费者不应该能够通过分解一组查询并在单独的交互中分别询问每个查询来获得价格优势(Li&Miklau,2021)。Koutrisetal(2012)研究了基于查询的定价,设计了一种满足卖方收入最大化、无套利和公平分配的定价算法,如果预先设定价格的几个视图之间不存在套利情况,就存在唯一的定价函数,能满足无套利和无折扣条件。Zhengetal(2017)对移动人群感应数据进行查询定价,同时满足捕捉数据的不确定性、无套利和收入最大化三个因素。Li&Raghunathan(2014)则认为,在对个人敏感数据的交易设置某些查询时,数据卖方必须接受一些套利的风险,以便制定合理的价格。公平性指多个卖方合作参与交易时,产生的收益能够在卖家之间公平分配。Shapley(1953)提出了公平分配应具备的四个条件:一是平衡性,即收益应完全分配给所有卖家;二是对称性,对收益做出同等贡献的卖家应获得同等份额的分配;三是零要素,如果一个卖家的数据对集体的收益没有贡献,那么这个卖家就不应该得到任何分配;四是可加性,如果一个卖家的数据可用于两个任务t1和t2,并分别有v1和v2的收益,那么对应的分配应该是v1+v2。Jiaetal(2019)认为,Shapley值是用于数据产品收益公平分配的最佳工具。保护隐私越来越成为数据交易和定价的重要原则。在数据要素交易市场上,有三个主体的信息容易被泄露,即网络平台用户的个人信息、数据提供方的经营信息以及第三方交易平台的信息,例如,机器学习模型的训练和预测服务样本通常来自存储在云服务器上包含敏感信息的用户内容,存在隐私泄露风险(Koushanfaretal,2019),消费者将查询发送至云服务器,获得的预测结果也可能包含敏感数据。保护隐私的方法包括出售脱敏后的数据或者建立去中心化的数据交易平台,使用在无权限区块链上运行的保护隐私的智能合约实现买卖双方的直接交易(Hynesetal,2018)。出售脱敏数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防疫项目合同协议书
- 装修侵权和解协议书
- 车位打包购买协议书
- 食品供应免责协议书
- 长期外聘讲师协议书
- 餐厅管理委托协议书
- 音响安装合同协议书
- 部门车位分配协议书
- 超市供货转让协议书
- 除尘设备技术协议书
- 2024年四川西华师范大学招聘辅导员笔试真题
- 2025年武汉铁路局集团招聘(180人)笔试参考题库附带答案详解
- 2025届云南省曲靖市高三第二次教学质量检测生物试卷(有答案)
- 农产品供应链应急保障措施
- 2024年中国农业银行安徽蚌埠支行春季校招笔试题带答案
- 2025年2月21日四川省公务员面试真题及答案解析(行政执法岗)
- 国家开放大学汉语言文学本科《中国现代文学专题》期末纸质考试第一大题选择题库2025春期版
- 山东大学《军事理论》考试试卷及答案解析
- 面向非结构化文本的事件关系抽取关键技术剖析与实践
- 《国别和区域研究专题》教学大纲
- 2025年日历表含农历(2025年12个月日历-每月一张A4可打印)
评论
0/150
提交评论